Hay demasiados conocimientos. ¿Qué hacer?
Fecha de publicación: 2026-01-08
Abundancia de información
La velocidad de generación de lo nuevo
El ritmo de la vida moderna es varias veces — o incluso órdenes de magnitud — más rápido que el de generaciones anteriores. Antes las noticias se transmitían de boca en boca; luego llegaron los periódicos, la radio y la TV; ahora están las redes sociales.
Antes, la fuente de información operativa eran las personas que te rodeaban (familiares, amigos, interlocutores casuales, espías, al fin y al cabo); luego fueron especialistas (periodistas, reporteros — y de nuevo, espías); ahora es cualquiera con un smartphone en el bolsillo.
Antes la gente discutía sus ideas en un círculo reducido y decidía cuáles merecían gastar papel y difundirlas. Hoy cualquiera puede publicar un artículo, un vídeo o incluso un tuit — y hacerse conocido públicamente si tiene suerte (o mala suerte).
Sobrecarga de conocimiento
El ser humano moderno se ve obligado a vivir en flujos de información abrumadores. Desde la infancia nos dicen que “el conocimiento es poder”, pero no nos enseñan a distinguir el conocimiento útil del inútil. Como resultado, intentamos ser “aún más fuertes”, saber lo máximo posible — y ya no damos abasto.
“Hay que correr con todas tus fuerzas para permanecer en el mismo lugar; y si quieres llegar a otro, debes correr al menos el doble de rápido.” (Alicia en el País de las Maravillas)
Tememos perdernos algo importante (FOMO) y nos sobrecargamos. Además, todos los que quieren vendernos algo “útil” (según ellos) intentan entrar en nuestra mente por cualquier medio. Y luego está la publicidad — claro.
La especialización es inevitable
Hace apenas 40 años, una persona podía ensamblar el hardware de un ordenador (ZX Spectrum) y escribir un programa en BASIC. Luego vino la separación entre hard & soft, después entre administradores y programadores, entre sistemas y aplicaciones, entre escritorio y web, entre frontend y backend, entre React y Angular.
Así es como los humanos intentamos adaptarnos al crecimiento explosivo de la información e incorporarnos a sus corrientes. Cada uno elige un rumbo en el que quiere — o necesita — desarrollarse (“correr con todas tus fuerzas para permanecer en el mismo lugar”).
¿Qué hay en nuestras cabezas?
Una visión del mundo personal
Así como una LLM difiere de otra, cada persona difiere de las demás. Pero, a diferencia de una LLM, cada persona construye su propia visión del mundo (VM). Desde la infancia interpretamos la realidad a través de los sentidos disponibles (vista, oído, olfato, tacto, etc.) y formamos una VM coherente (o no tanto), pero individual.
Y esa visión no es estática: cambia con el tiempo. Aparece algo nuevo, se olvida algo viejo. La edad, las lesiones, las enfermedades — todo esto afecta el tamaño y la integridad de la VM.
Por qué los pensamientos ajenos no se “transfieren” tal cual
No tenemos forma de conocer directamente los pensamientos de otra persona. En ese sentido somos sistemas cerrados. Nuestra experiencia personal es multimodal: una combinación de señales de todos los canales sensoriales disponibles. Y estos canales no son intercambiables: hoy no se puede trasplantar el globo ocular de una persona a otra y restaurar la visión.
La única manera de conocer los pensamientos de alguien es que los comunique. El conocimiento pasa de una persona a otra mediante códigos (lenguaje, escritura, gestos) o mediante demostración (“¡señálamelo!”). Al hacerlo, el conocimiento del “emisor” se integra en la VM existente del “receptor” y puede resultar muy distinto del original. Por ejemplo, nuestro gesto de asentir con la cabeza para “sí” significa “no” para los búlgaros.
Integrar nueva experiencia
Cualquier conocimiento nuevo (o su conjunto) es solo un fragmento respecto a nuestra VM. Puede integrarse solo si existen “ganchos” a los que agarrarse: el nuevo fragmento debe contener detalles familiares que nos permitan ubicarlo dentro de nuestra VM, que es galácticamente grande en comparación con el fragmento que se integra.
Los habitantes locales africanos pueden explicarnos por qué es mejor no salir de casa después del atardecer, pero si no entendemos su idioma, esa información no nos ayudará. ¿Y si estaban contando una historia de una caza exitosa hace un par de días? Quién sabe. Sus “ganchos” no tienen de qué agarrarse. En nuestra VM, nuestros “enganches” tienen otra forma que sus “ganchos”.
Si bajamos al lenguaje de los gestos, entonces sí: hay más posibilidades de entendimiento. Es un lenguaje bastante universal para nuestra especie. Es limitado, pero expresivo. Por ejemplo, un contacto rápido, brusco y contundente de un puño cerrado con la nariz del interlocutor expresa desacuerdo en todas las culturas.
Transferencia de conocimiento
Codificación y decodificación del conocimiento
En la mayoría de los casos, la transferencia de conocimiento (fragmentos de VM) entre personas ocurre a través del lenguaje, escrito o hablado. Así se puede transferir conocimiento a través de distancias (radio) o del tiempo (mensajes en botellas y pinturas rupestres).
Pero en la mayoría de los casos el conocimiento se deforma en la transmisión, especialmente cuando hay que codificar/decodificar mediante texto. Intenta describir con palabras el cielo al atardecer. Ahora intenta describir el cielo al atardecer a una persona ciega.
Me parece que solo los matemáticos resolvieron bien este problema: transferir conocimiento sin deformación a través del texto. Pero ni ellos son todopoderosos. No han derivado, por ejemplo, la fórmula del amor.
¿Para qué intercambiar conocimiento?
Al principio — para sobrevivir (estos hongos se pueden comer, estos otros solo una vez), y luego — para mejorar la calidad de vida (nunca comas nieve amarilla). La experiencia directa de una persona está limitada por sus capacidades — físicas, psicológicas y materiales — y el intercambio de conocimiento es valioso porque el conocimiento no se enajena al compartirlo.
Así podemos superar nuestros límites y construir nuestra VM a partir de fragmentos de la experiencia de otros, devolviendo la nuestra y enriqueciéndonos mutuamente. Como dice el dicho: es mejor vivir entre ricos y sanos que entre pobres y enfermos.
Por qué leemos el mismo texto de manera distinta
Depende de nuestro nivel de preparación y de la VM de cada lector. El autor codifica un fragmento de su VM en un texto e introduce ruido y desviaciones respecto al fragmento original. Los filósofos del pasado llamaban a las “palabras” “sombras de ideas”. Las palabras no pueden transmitir las ideas del autor en toda su plenitud.
La facilidad con la que un lector asimila y acepta un texto depende tanto de la cantidad de “ganchos” que el autor dejó en el texto — ganchos con los que el lector puede tirar del fragmento hacia su VM — como de la configuración de la VM del lector.
Si la VM del lector ya contiene la idea descrita (el fragmento del autor), basta con uno o dos “ganchos” no muy evidentes para integrarla. En ese caso, incluso la torpeza expresiva del autor puede no ser un obstáculo para la comprensión.
Si el autor “lo masticó y lo puso en tu boca”, pero el lector no tiene base para engancharse, no habrá integración en la VM del lector en absoluto.
La atención es un recurso que se gasta
Por qué leer se volvió más difícil
En la universidad, los profesores a menudo aconsejaban usar ediciones no tan recientes de los libros de texto: se consideraban “más comprensibles”. Un buen ejemplo es la “Aritmética” de Leonty Magnitsky. En un libro de menos de 700 páginas, en el siglo XVIII se explicaban aritmética, bases de álgebra, geometría, trigonometría, navegación y astronomía: todo lo que se requería para una persona matemáticamente educada de aquella época.
Hoy el volumen de conocimiento correspondiente a una “persona matemáticamente educada” ha crecido muchas veces y está disperso en innumerables libros y cursos. Leer no se volvió más difícil: hay más que leer. Eso es lo que aumenta la carga y crea la sensación de dificultad.
Pagamos el conocimiento con atención
Las personas no pueden tomar un libro, hojearlo y luego recitarlo palabra por palabra. Al menos yo no he conocido a nadie así. Quizá alguien tenga memoria fotográfica, pero eso no es comprensión.
Cuando leemos ficción, las tramas se integran en nuestra VM mediante “ganchos” universales: las emociones. No hay tantas y todas son bien conocidas. El arte del escritor consiste en usar esas emociones para integrar automáticamente una trama en la VM del lector.
Pero cuando hay que integrar la tabla de multiplicar en la VM, entonces hay que esforzarse. Hay que entender qué quería decir el autor, para qué te sirve, y luego pensar cómo hacer que “se quede contigo”, si es que te hace falta.
El trabajo mental prolongado, igual que el físico, agota. Si físicamente nos debilitamos, mentalmente nos embotamos. Trabajando intelectualmente sin descanso, cada vez vemos peor los “ganchos” de los nuevos fragmentos que hay que integrar. En el límite, el texto se convierte en “ruido blanco”: leemos palabras, pero no vemos ningún sentido detrás de ellas. Para recuperar la capacidad de “ver ganchos”, necesitamos hacer una pausa y hacer algo sin pensar mucho. Eso se llama un hobby. A veces — alcoholismo.
¿Por qué medir el gasto de atención?
Por la misma razón por la que medimos el consumo de combustible de un coche. Sin combustible el coche no anda; sin atención, una persona deja de funcionar adecuadamente en el mundo. Puede intentar cruzar las vías delante de un tren a toda velocidad.
No tenemos manera de medir con precisión el gasto de atención, pero el hecho de que el trabajo mental intenso canse más rápido que el trabajo ligero sugiere que la atención (la capacidad de concentrarse y pensar con eficacia) es un recurso que se gasta — y puede gastarse a diferentes velocidades.
Si queremos ser más eficaces en el trabajo intelectual, debemos tener esto en cuenta — aunque todavía no sepamos cómo medirlo con precisión.
Transferencia estructurada de conocimiento
Un libro no es solo texto
Un libro es una forma clásica de transferir conocimiento. Y, con su ejemplo, se pueden observar técnicas de estructuración establecidas:
- Título: un marcador corto que distingue un libro de otro.
- Reseña: por lo general uno o dos párrafos en letra pequeña en la primera o la última página, cerca de los datos editoriales, que transmiten muy brevemente el contenido del libro.
- Índice: lista de partes, capítulos y secciones. Especialmente importante para literatura técnica.
- Prefacio: texto del autor, editor, traductor o incluso alguien externo, que permite entender a grandes rasgos de qué trata el libro y por qué puede ser útil.
- Contenido: el texto principal.
Diferentes niveles de entrada
Esta estructura de “transferencia de conocimiento” se formó para minimizar el gasto de atención.
- Dos personas pueden sincronizarse en una conversación solo por el título del libro si conocen bien su contenido (o al menos su reputación).
- La reseña es necesaria cuando un título del tipo “Cangrejos en pelea” no da idea del tema del libro: ¿cocina o artes marciales?
- El índice es un nivel que revela en forma de tesis la posición del autor. Son “ganchos” que pueden atrapar a alguien con una VM similar. O no, lo cual también es un marcador.
- El prefacio es la parte que yo solía saltarme siempre. Pero nunca necesité motivación adicional para empezar a leer.
- El contenido — sin comentarios.
Ordené estos niveles según el aumento del gasto de atención requerido para familiarizarse con el conocimiento que se transmite.
¿Hay que leerlo todo?
No, en absoluto. Cada uno construye su VM a partir de los fragmentos que considere necesarios. Es una realidad objetiva causada por la abundancia de información, la necesidad de especialización y el gasto de atención para construir la VM.
Los lectores de Habr, por ejemplo, son muy diferentes. Por muy bueno o malo que sea un artículo, casi siempre habrá alguien que lo vote negativo y alguien que lo guarde en marcadores tras encontrar algo útil.
Cada uno elige lo que es importante y necesario. La tarea del autor es dar la oportunidad al mayor número posible de personas diferentes de sincronizarse con el fragmento descrito de la VM del autor (además de manipulación y entretenimiento — pero eso es más popular en plataformas distintas de Habr).
Personalización mediante el seguimiento de la atención
Personalización clásica por intereses declarados
En Habr (y en muchos otros sitios), para reducir la carga cognitiva, se pide al lector que indique en su perfil una lista de intereses y luego se forma un feed personalizado de publicaciones.
Además, los lectores pueden calificar las publicaciones (+/-) y comentar. Esto también es una manifestación de interés y puede servir como marcador para evaluar la calidad y relevancia del “fragmento de VM” publicado.
Personalización moderna por comportamiento
Los autores saben cómo son las estadísticas de Habr; para los demás, aquí están:
El último artículo resultó mejor que el “promedio del hospital”.
El comportamiento del lector en la página permite estimar sus “inversiones de atención” personales en esa publicación. La evaluación agregada de todos los lectores le da al autor cierta retroalimentación sobre lo (in)exitosa que fue su siguiente obra.
El análisis del comportamiento del lector también permite a los algoritmos estimar los intereses reales y actuales del usuario, que pueden diferir significativamente de los intereses declarados en el perfil. Precisamente el análisis del comportamiento es lo que personaliza el feed en TikTok, por ejemplo.
Publicaciones y lectores como trayectorias que se cruzan
Así como a los lectores les importa encontrar información relevante, a los autores les importa encontrar a su lector relevante. Hoy muchos lectores votan negativo artículos sin leerlos, solo porque “es basura de redes”. Pero comprimir sentidos con LLM puede ser bastante efectivo — espero que lo sea para este texto.
Así que, si para llegar a la audiencia adecuada necesito estructurar mi publicación como (título / resumen / índice / prefacio / texto), para que los algoritmos de la plataforma puedan emparejarme con los “lectores correctos”, lo haré.
La coincidencia de intereses de lectores y autores es un win-win para todos: lectores, autores y la plataforma.
Cómo de esto surge el “co-conocimiento”
Por qué ya no hay — y no habrá — un canon común
En el modelo educativo al que estamos acostumbrados existe un canon común: un corpus de conocimiento que “debería tener toda persona educada”. Bueno, antes existía al menos. Ahora es más bien “todo físico como Dios manda”, “todo biólogo como Dios manda” o “todo frontend como Dios manda”. (Sobre frontend, por supuesto, exagero: ahí no hay normas en absoluto.)
Nuestro deseo de “correr con todas tus fuerzas para permanecer en el mismo lugar” nos obliga a invertir nuestra atención finita (pero renovable) en el conocimiento que consideramos más prometedor (especialización). Y en esas áreas estrechas pero prometedoras (como AGI) nos interesan las opiniones de personas al menos algo conocedoras, no de todo el mundo.
Sí, todavía existen las venerables Nature y Science, pero también existe el más democrático ArXiv, y muchas ideas — como el vibe coding — se lanzan a través de redes sociales. Hoy importa no solo “montarse en la ola” del trend, sino mantenerla el mayor tiempo posible — e idealmente crear tendencias tú mismo.
El corpus básico de conocimiento debería estar en toda persona educada, pero hoy la “superestructura” (especialización) tira más fuerte que la “base”.
Coincidencias parciales en lugar de acuerdo total
Cuando no hay canon y hay que crear tendencias por cuenta propia, se vuelve importante la capacidad de las personas para cooperar, también intelectualmente. Hay que encontrar compañeros de pensamiento y “excavar la veta de oro” juntos (o lo que te parezca una veta). Al fin y al cabo, intercambiar ideas hace que la comunidad sea más rica (si ignoramos el costo de atención de asimilarlas).
En estas condiciones, adquiere valor la capacidad de separar ideas/conocimiento de sus portadores. Dos personas diferentes pueden compartir algunas ideas y desarrollarlas juntas, y otras ideas pueden obligarlas a romper cualquier relación para evitar una recodificación potencial.
Puedes ser cristiano o budista, hincha del Spartak o del Zenit, comer carne o ser vegano, y aun así interesarte, por ejemplo, en el desarrollo agéntico basado en especificaciones y “cavar” en esa dirección juntos. Solo hace falta saber negociar. Como los Rothschild con los Rockefeller, por ejemplo.
Pensamiento colectivo como efecto colateral
A escala, el análisis de estas coincidencias parciales en fragmentos de VMs personales produce vectores de desarrollo de los intereses (especializaciones) de toda la comunidad. Ya nos movemos en esa dirección: newsletters por email, X/Twitter, Meta/Facebook, StackOverflow, Habr, reddit, Medium, WhatsApp, Telegram, ... miles de ellos.
Ya nos agrupamos por intereses en muchos recursos, compartimos ideas, las discutimos e incluso las evaluamos. Las ideas viven su propia vida dentro de nosotros. Como dijo el colega @Kamil_GR: “Todos somos solo instrumentos de narrativas que luchan por el derecho al sustrato.” (c)
Y, por cierto, las narrativas se sienten muy bien tanto en la inteligencia humana como en la artificial. La palabra “narrativa”, por ejemplo, entró en mi vocabulario cotidiano gracias a ChatGPT: antes no la usaba en absoluto.
Resumen: construimos “castillos en el aire”
La narrativa como “semilla” de conocimiento
Una narrativa es conocimiento envuelto en palabras (texto o habla). Ni siquiera es el conocimiento mismo, sino la posibilidad de que aparezca en otra conciencia. El conocimiento se reproduce mediante narrativas si cae en condiciones adecuadas.
El mismo conocimiento puede “empaquetarse” de distintas maneras: texto / prefacio / índice / resumen / título. Al “desempaquetar” narrativas de distintos niveles de densidad, la probabilidad de que el conocimiento “germine” en otra mente es inversamente proporcional a la “densidad del empaquetado”. Es más difícil extraer conocimiento de un resumen que de un prefacio, y si no se puede extraer del texto principal, es un desastre. O el empaquetado es malo, o las condiciones son inadecuadas.
Compresión del conocimiento
Es difícil exponer el conocimiento en detalle (por ejemplo, escribir esta publicación). Para comprimir una publicación en un “prefacio” o en un “resumen”, se puede usar una LLM.
En principio, cualquier publicación (narrativa) en cualquier plataforma (Habr, Medium, Nature, Science, ArXiv, ...) puede comprimirse con una LLM a un tamaño cómodo para la percepción (una narrativa más compacta). Un tamaño que permita al lector hacerse una idea del original con un costo de atención razonable. Ese costo depende de los intereses actuales del lector y de su VM, que reacciona a los “ganchos” de la narrativa.
Embeddings como huella de la “semilla”
Cada forma de empaquetado del conocimiento (narrativa) puede convertirse en un embedding y esos embeddings estarán muy cerca unos de otros, aunque no coincidirán exactamente debido a la diferencia de detalle.
También estarán cerca los embeddings de narrativas de conocimiento similar. Cuanto más denso es el empaquetado, más precisamente los embeddings hablan de similitud/diferencia entre narrativas (y, por ende, conocimientos). Con esos embeddings se pueden agrupar narrativas de distintas densidades. En teoría, estos agrupamientos deberían ser muy parecidos para cada densidad, pero, como se dice, el diablo está en los detalles.
Contabilizar el gasto de atención
Estructurar la exposición (narrativas de distinta densidad) permite construir una jerarquía de acceso a la narrativa más detallada (la publicación completa): de títulos a resúmenes, prefacios y texto principal. El paso de un nivel a otro aumenta el gasto de atención y sirve como marcador del interés del lector.
Con estos marcadores se puede estimar el interés de los lectores de manera similar al tiempo de lectura o al scroll del texto.
Perfil de intereses del usuario
Los marcadores de atención de un usuario, de acuerdo con su VM, pueden obtenerse automáticamente cuando lee artículos. La suma de embeddings de los artículos que le interesan por niveles da un vector de sus intereses actuales (por cada nivel por separado, claro).
Y ese vector funciona incluso mejor que un clasificador o las etiquetas, porque no requiere acciones adicionales del lector: es pura métrica de comportamiento.
Un modelo para todos
Si suponemos que para calcular embeddings en distintas plataformas se usa el mismo modelo con los mismos ajustes, entonces se pueden comparar embeddings para encontrar publicaciones similares en significado.
Más aún, un vector de intereses de un usuario de una plataforma (por ejemplo, Habr) puede utilizarse en otra plataforma (ArXiv). Y viceversa.
Si estas ideas te parecen interesantes, puedes discutirlas conmigo en privado. Gracias por leer.