viernes, 23 de junio de 2023

A thousand brains, de Hawkins

 Este es un libro interesante, pero de los que consiguen cabrearme. Y es una pena, porque seguro que el enfado que me genera hace que disfrute algunas cosas menos de lo que debería. El libro pretende explicar cómo funciona el cerebro, y formula alguna tesis interesante, desde luego. No sólo de cómo funciona nuestra mente, sino también de aplicaciones a la inteligencia artificial. Y además lo hace de forma amena, y muy clara.

El problema es que el autor (no sé si influirá el hecho de ser un "founder" exitoso de Silicon Valley) plantea sus teorías con una seguridad y convencimiento que no se corresponde con los datos. De hecho, las llama "descubrimientos", como si realmente hubiera confirmado algo. El libro está trufado de comentarios como:

p51. I didn't yet understand how neurons could do this, but I knew it must be true.

p73. Although there are many details we don't yet understand, I am confident that the overall framework - that concepts and thinking are based on reference frames - will withstand the test of time.

En las p.52 y ss. explica de dónde viene su convencimiento, con argumentos que a mí no me convencen :). Para alguien que se muestra tan preocupado con las creencias falsas (como, según él, las religiones), resulta un poco chocante esta fé y este carácter profético de algunas de sus afirmaciones :).

No es que sus teorías no puedan ser ciertas, por supuesto...es que debería tener algo más de humildad hasta que se confirmen. Si a eso se le une que las aparentemente valiosísimas publicaciones en las que han contrastado estas teorías con la comunidad científica parecen estar todas en Frontiers (al menos las que menciona en el libro), la demanda de humildad se hace más relevante aún.

Como digo, no es que sus teorías no puedan ser ciertas. Pero para contrastarlas formula modelos de simulación basados en sus hipótesis, que realmente lo que están haciendo es mostrar que un determinado algoritmo puede emular algunos posibles comportamientos del cerebro o tareas determinadas, pero sin poder demostrar si realmente es así como funciona la cosa.

En todo caso, sobre la esencia interesante del libro: Hawkins propone la teoría de que el neocortex construye un modelo de la realidad, y formula continuamente predicciones basadas en ese modelo. El mecanismo que plantea para estas predicciones es de hecho muy parecido al de ChatGPT.

p47. A prediction occurs when a neuron recognizes a pattern, creates a dendrite spike, and is primed to spike earlier to other neurons. With thousands of distal synapses, each neuron can recognize hundreds of patterns that predict when the neuron should become active.

Estos procesos tienen lugar en las columnas corticales, de las que hay millones (por eso lo llama Thousand Brains, porque dice que cada columna cortical es un cerebro en miniatura). En esas columnas se construyen marcos de referencia, que se aprenden, y que se establecen mediante las conexiones sinápticas, de forma que se van reforzando o desconectando según aprendemos y olvidamos:

p50. The brain builds models of the world by associating sensory input with locations in reference frames.

Y estas columnas son muy similares entre sí, por lo que su función básica debe ser muy similar, no sólo para la percepción, sino también para todo aquello que conocemos como inteligencia. El hecho de que la función sea similar permite que podamos aprender casi cualquier cosa.

p69. Therefore, Mountcastle deduced that there must be some basic function that underlies everything the neocortex does - not just perception, but all the things we think of as intelligence.

En este contexto, pensar es moverse en un marco de referencia: de nuevo, el funcionamiento básico de estas tareas aparentemente tan distintas es esencialmente igual.

p80. If all knowledge is stored this way [in reference frames], then what we commonly call thinking is actually moving through a space, through a reference frame.

Ahora bien, ¿y si tenemos miles de columnas haciendo esto, como terminamos con una única percepción o pensamiento? Hawkins dice que las columnas votan para alcanzar un consenso. Y que las conexiones entre hemisferios precisamente están para esto (algo que no encaja demasiado bien con lo que yo entendía sobre esto). Sinceramente, esto parece más una aplicación de redes bayesianas para explicar el cerebro que al revés...

Cosas que no terminan de encajarme en su teoría:

- El proceso que explica para la percepción, la situación y la inteligencia en general, que como vemos es muy similar (marcos de referencia construidos por las columnas corticales) no me parece exclusivo de los mamíferos. Una hormiga o un escarabajo deben tener procesos similares para orientarse, pero no tienen neocortex.
- Relacionado con lo anterior: si el mecanismo parece tan sencillo, ¿no es sorprendente que sólo los primates hayan alcanzado este nivel de inteligencia?
- ¿Cómo explicamos el instinto, los patrones/modelos preformados que tenemos en el cerebro?
- Lo de que hay un marco de referencia tiene mucho sentido (por ejemplo, en el aprendizaje es importante romper los marcos mentales preexistentes para construir otros nuevos, si queremos que el aprendizaje sea efectivo). Pero, ¿por qué esto tiene que ser una característica del hardware (todas las columnas corticales lo tienen) en lugar de un elemento de software)?
    - Esto es parecido, pero no igual, a la idea de que el cerebro reconoce y busca patrones (modelos de la realidad)
    - Y que más que desviaciones,lo que identifica son cambios de voltaje, etc, cuando nos desviamos del patrón (es decir, que la predicción no es necesaria)


En la segunda parte del libro Hawkins se dedica a la inteligencia artificial. Y comienza por sus limitaciones, bastante sensatas:

p120. Deep learning networks have to be fully trained before they can be deployed. And once they are deployed, they can't learn new things on the go. ...The biggest reason that today's AI systems are not considered intelligent is they can only do one thing, whereas humans can do many things. In other words, AI systems are not flexible.

Pero, de nuevo, tarda poco en desinflarse la cosa. Para empezar, porque define la inteligencia y la conciencia (es que, según él, las máquinas serán capaces de replicar), de una forma un poco estrecha en mi opinión

p134. Instead, intelligence is determined by how a machine learns and stores knowledge about the world. We are intelligent not because we can do one thing particularly well, but because we can learn to do practically anything. The extreme flexibility of human intelligence requires the attributes I described in this chapter: continuous learning, learning through movement, learning many models, and using general-purpose reference frames for storing knowledge and generating goal-oriented behaviors.

In the future, I believe almost all forms of machine intelligence will have these attributes, although we are a long way from that today.
 

Hawkins dice (p.143) que las emociones están en el "viejo cerebro", y que por tanto no son imprescindibles para que una máquina sea consciente o inteligente. Creo que esto es un error muy gordo. Se ve que todavía no ha leído a Damasio...

p146. When creating intelligent machines, there is no reason we should replicate all the functions of the human brain. The new brain, the neocortex, is the organ of intelligence, so intelligent machines need something equivalent to it. When it comes to the rest of the brain, we can choose which part we want and which parts we don't.

Pero a él le sirve para descartar cualquier dilema moral asociado a las máquinas: si no tienen emociones, no pasa nada por apagarlas. Esto también es muy gordo en mi opinión: asocia todos los comportamientos morales a las emociones, y no al neocortex...Claro, como define la inteligencia y la conciencia de modo tan estrecho, sus máquinas inteligentes no son capaces de nada terrible.

p167. Why would we design a machine that accepts our first request but ignores all others after that? Pues porque eso es la inteligencia!!! Lo otro es otra cosa. ¿O es que este hombre no ha tratado con personas?

Tampoco le parece posible la inteligencia suprahumana. Pero esto me parece incoherente con todo lo demás que cuenta: ¿Por qué le parece tan difícil?¿Porque aprender lleva tiempo? Pero, y si hay aprendizaje distribuido?¿Y si se carga en una máquina todo el aprendizaje que ya tenemos?¿No decía antes que sería muy fácil clonar las máquinas?

El tema de la conciencia en particular creo que Hawkins lo trata demasiado ligeramente. Para él, un ser consciente es un ser que percibe y que piensa. Claro, así por supuesto que dice que las máquinas pueden ser conscientes. Pero eso no es la definición habitual de ser consciente, una definición que va mucho más allá de la mera percepción o del razonamiento lógico. De hecho, una cosa es la apariencia de conciencia (que es más bien de lo que habla Hawkins) y otra la conciencia real. Aquí un  buen resumen de lo que es la conciencia en The Economist, donde plantean la hipótesis de Crick y Koch de que la conciencia no está en el neocortex, y de que en parte está basada en la sincronización de las ondas cerebrales (y no por tanto en meras conexiones físicas) https://www.economist.com/schools-brief/2015/09/12/the-hard-problem?

p138. For me, the sense of awareness - the sense of presence, the feeling that I am an acting agent in the world - is the core of what it means to be conscious. It is easily explained by the activity of the neurons and I see no mistery in it.

p144. At some point in the future, we will accept that any system that learns a model of the world, continually remembers the states of that model, and recalls the remembered states will be conscious.

Una cosa es ser un reduccionista (aunque sea romántico como Koch), que piensa que todo se puede, o se podrá explicar, por las bases bioquímicas de nuestro cuerpo...y otra pensar que esto es tan fácil como aplicar un marco de referencia.

Por ejemplo, no me convence su explicación de los colores (como un ejemplo de qualia): según él (p.140) los colores se aprenden igual que el resto, moviendo los objetos y entendiendo cómo la luz se refleja de forma distinta en ellos. Pero, ¿y cuando vemos un color iluminado por una luz de temperatura anómala, y tenemos que corregir internamente hasta acostumbranos y ver el verdadero color? No tengo claro que eso se resuelva con un reference frame, porque entonces lo veríamos bien a la primera (una vez aprendido).

Tampoco me gusta su discusión sobre si estamos en una simulación o no (p.174). Porque lo que discute es nuestra percepción o representación de la realidad, no una simulación de la misma.

Y por último, me pone nervioso su aparente incoherencia entre lo chupao que está esto de entender la conciencia, y lo que vamos a tardar en tener máquinas inteligentes y conscientes. Antes decía que todavía nos falta mucho, pero luego...

p145. It seems inevitable to me that we will overcome any remaining obstacles and enter the age of machine intelligence in this century, probably in the next two to three decades

[Pero no era que estábamos "a long way from that"? No tenemos ni idea de cómo funciona de verdad el cerebro, más allá de una teoría, y en 20-30 años lo vamos a resolver?]

Y, para rematar, sin demasiado soporte en todo lo anterior, más bien apoyándose poco más que en la teoría del gen egoísta de Dawkins (que le escribe el prólogo, y no queda demasiado bien cuando dice que este es un libro espectacular...), Hawkins se pone a filosofar y a darnos recetas sobre cómo salvar el mundo de su destrucción. Estas reflexiones son curiosas, pero, de nuevo, no se apoyan en nada sólido. Y parecen inspiradas por una necesidad de buscarle sentido a su existencia, para lo que creo que se va demasiado lejos. No hace falta colonizar nuevos planetas, ni dejar un legado a las próximas especies inteligentes, para que nuestra vida tenga sentido, la verdad. Parece una forma de buscar una trascencencia similar a la que ofrecen las religiones, pero sin ellas...

p187. The shortsighted actions of the old brain, when paired with the globe-altering technologies of the neocortex, have become an existential threat to humanity.

p203. Obtaining the details needed to recreate you in a computer is so difficult that we might be never be able to do it.

Vamos, que seguramente nunca podamos replicar el cerebro humano. Pero no era que en 20-30 años? Por otra parte, en toda esta sección sobre "uploading the brain", duplicarnos, y demás, debería haberse leído primero a Parfit...O cuando dice en p.210 que "being lost forever is the same as never existing"

p206. Uploading the brain at first sounds like a great idea....But making a copy of ourselves by uploading our brain into a computer will not achieve immortality any more than having children will [De nuevo, porque no entiende que consciousness va más allá de su definición]



No hay comentarios: