"Cuando analizamos la IA y la ciencia, surgen preguntas muy diferentes. En este caso, es necesario actuar con cautela debido a las afirmaciones exageradas e imprudentes que suelen amplificarse en los medios de comunicación." Noam Chomsky
CJ Polychroniou (CJP): Como disciplina científica, la inteligencia artificial (IA) se remonta a la década de 1950, pero en las últimas dos décadas ha ido incursionando en todo tipo de campos, incluidos la banca, los seguros, la fabricación de automóviles, la música y la defensa. De hecho, se ha demostrado que el uso de técnicas de IA supera en algunos casos las capacidades humanas, como en una partida de ajedrez. ¿Es probable que las máquinas se vuelvan más inteligentes que los humanos?
Noam Chomsky (NC): Sólo para aclarar la terminología, el término “máquina” aquí significa programa, básicamente una teoría escrita en una notación que puede ser ejecutada por una computadora, y un tipo de teoría inusual en formas interesantes que podemos dejar de lado aquí.
Podemos hacer una distinción aproximada entre la ingeniería pura y la ciencia. No hay una frontera clara, pero es una primera aproximación útil. La ingeniería pura busca producir un producto que pueda tener alguna utilidad. La ciencia busca la comprensión. Si el tema es la inteligencia humana o las capacidades cognitivas de otros organismos, la ciencia busca la comprensión de esos sistemas biológicos.
Según tengo entendido, los fundadores de la IA (Alan Turing, Herbert Simon, Marvin Minsky y otros) la consideraban una ciencia, parte de las ciencias cognitivas que entonces estaban surgiendo, que utilizaba nuevas tecnologías y descubrimientos en la teoría matemática de la computación para avanzar en la comprensión. Con el paso de los años, esas preocupaciones se han desvanecido y han sido desplazadas en gran medida por una orientación ingenieril. Las preocupaciones anteriores ahora se descartan comúnmente, a veces con condescendencia, como GOFAI (buena IA a la antigua usanza).
Siguiendo con la pregunta, ¿es probable que se diseñen programas que superen las capacidades humanas? Tenemos que ser cuidadosos con la palabra “capacidades”, por razones a las que volveré. Pero si tomamos el término para referirnos al desempeño humano, entonces la respuesta es: definitivamente sí. De hecho, existen desde hace mucho tiempo: la calculadora en un ordenador portátil, por ejemplo. Puede superar con creces lo que los humanos pueden hacer, aunque sólo sea por falta de tiempo y memoria. Para sistemas cerrados como el ajedrez, se comprendió bien en los años 50 que tarde o temprano, con el avance de las capacidades informáticas masivas y un largo período de preparación, se podría diseñar un programa para derrotar a un gran maestro que está jugando con un límite de memoria y tiempo. El logro años después fue más bien una estrategia de relaciones públicas para IBM. Muchos organismos biológicos superan las capacidades cognitivas humanas de maneras mucho más profundas. Las hormigas del desierto que viven en mi patio trasero tienen cerebros minúsculos, pero superan con creces las capacidades de navegación humanas, en principio, no sólo en el desempeño. No existe una Gran Cadena del Ser con los humanos en la cima.
Los productos de la ingeniería de inteligencia artificial se están utilizando en muchos campos, para bien o para mal. Incluso los más sencillos y conocidos pueden ser muy útiles: en el área del lenguaje, programas como el de autocompletar, transcripción en vivo, traductor de Google, entre otros. Con una potencia informática mucho mayor y una programación más sofisticada, debería haber otras aplicaciones útiles, también en las ciencias. Ya ha habido algunas: la asistencia en el estudio del plegamiento de proteínas es un caso reciente en el que la tecnología de búsqueda masiva y rápida ha ayudado a los científicos a lidiar con un problema crítico y recalcitrante.
Los proyectos de ingeniería pueden ser útiles o perjudiciales. Ambas preguntas surgen en el caso de la IA de ingeniería. El trabajo actual con modelos de lenguaje grandes (LLM), incluidos los chatbots, proporciona herramientas para la desinformación, la difamación y el engaño a los desinformados. Las amenazas se acentúan cuando se combinan con imágenes artificiales y réplicas de voz. Con diferentes preocupaciones en mente, decenas de miles de investigadores de IA han pedido recientemente una moratoria del desarrollo debido a los posibles peligros que perciben.
Como siempre, hay que sopesar los posibles beneficios de la tecnología frente a sus costos potenciales.
Cuando analizamos la IA y la ciencia, surgen preguntas muy diferentes. En este caso, es necesario actuar con cautela debido a las afirmaciones exageradas e imprudentes que suelen amplificarse en los medios de comunicación. Para aclarar las cuestiones, consideremos casos, algunos hipotéticos y otros reales.
Mencioné la navegación de los insectos, que es un logro asombroso. Los científicos que estudian los insectos han avanzado mucho en el estudio de cómo se logra, aunque la neurofisiología, un tema muy difícil, sigue siendo esquiva, junto con la evolución de los sistemas. Lo mismo se puede decir de las asombrosas hazañas de las aves y las tortugas marinas que viajan miles de kilómetros y regresan infaliblemente a su lugar de origen.
Supongamos que Tom Jones, un defensor de la ingeniería de inteligencia artificial, llega y dice: “Todo su trabajo ha sido refutado. El problema está resuelto. Los pilotos de aerolíneas comerciales obtienen los mismos resultados o incluso mejores todo el tiempo”.
Si tan solo nos molestáramos en responder, nos reiríamos.
Tomemos el caso de las hazañas marineras de los polinesios, que todavía viven entre las tribus indígenas, que se valían de las estrellas, el viento y las corrientes para hacer que sus canoas aterrizaran en un lugar determinado a cientos de kilómetros de distancia. Este también ha sido el tema de muchas investigaciones para averiguar cómo lo hacían. Tom Jones tiene la respuesta: “Dejen de perder el tiempo; los buques de guerra lo hacen todo el tiempo”.
La misma respuesta.
Pasemos ahora a un caso real: la adquisición del lenguaje. En los últimos años se ha llevado a cabo una extensa y muy esclarecedora investigación que demuestra que los bebés tienen un conocimiento muy rico del lenguaje (o los lenguajes) del entorno, mucho más allá de lo que demuestran en su ejecución. Esto se logra con pocas pruebas y, en algunos casos cruciales, ninguna. En el mejor de los casos, como han demostrado estudios estadísticos minuciosos, los datos disponibles son escasos, en particular cuando se tiene en cuenta la frecuencia de rangos ("ley de Zipf").
Entra Tom Jones: “Han refutado sus descubrimientos. Sin prestar atención a sus descubrimientos, los LLM que escanean cantidades astronómicas de datos pueden encontrar regularidades estadísticas que permiten simular los datos con los que están entrenados, produciendo algo que se parece bastante al comportamiento humano normal. Los chatbots”.
Este caso es diferente a los demás. En primer lugar, es real. En segundo lugar, la gente no se ríe; de hecho, muchos se quedan asombrados. En tercer lugar, a diferencia de los casos hipotéticos, los resultados reales están muy lejos de lo que se afirma.
Estas consideraciones plantean un problema menor con el actual entusiasmo por los LLM: su total absurdo, como en los casos hipotéticos en que lo reconocemos de inmediato. Pero hay problemas mucho más graves que el absurdo.
Una de ellas es que los sistemas LLM están diseñados de tal manera que no nos pueden decir nada sobre el lenguaje, el aprendizaje u otros aspectos de la cognición, una cuestión de principio, irremediable. Si se duplican los terabytes de datos escaneados, se añaden otros billones de parámetros, se utiliza aún más energía de California, y la simulación del comportamiento mejorará, al tiempo que se revela más claramente el fracaso en principio del enfoque para producir algún tipo de comprensión. La razón es elemental: los sistemas funcionan igual de bien con lenguajes imposibles que los bebés no pueden aprender como con aquellos que adquieren rápidamente y de forma prácticamente reflexiva.
Es como si un biólogo dijera: “Tengo una nueva y excelente teoría sobre los organismos. Enumera muchos que existen y muchos que no pueden existir, y no puedo decirles nada sobre la distinción”.
De nuevo nos reiríamos. O deberíamos hacerlo.
No es Tom Jones, sino que se refiere a casos reales. Persistiendo en su radical alejamiento de la ciencia, Tom Jones responde: “¿Cómo puedes saber algo de esto hasta que hayas investigado todos los idiomas?” En este punto, el abandono de la ciencia normal se hace aún más claro. Por igualdad de argumentos, podemos descartar la genética y la biología molecular, la teoría de la evolución y el resto de las ciencias biológicas, que no han tomado muestras de más que una pequeña fracción de organismos. Y, por si fuera poco, podemos descartar toda la física. ¿Por qué creer en las leyes del movimiento? ¿Cuántos objetos se han observado realmente en movimiento?
Además, está la pequeña cuestión de la carga de la prueba. Quienes proponen una teoría tienen la responsabilidad de demostrar que tiene algún sentido, en este caso, demostrar que no es válida para los lenguajes imposibles. No es responsabilidad de otros refutar la propuesta, aunque en este caso parezca bastante fácil hacerlo.
Centremos nuestra atención en la ciencia normal, donde las cosas se ponen interesantes. Incluso un solo ejemplo de adquisición de un lenguaje puede ofrecer una valiosa perspectiva sobre la distinción entre lenguajes posibles e imposibles.
Las razones son sencillas y conocidas: todo crecimiento y desarrollo, incluido lo que se denomina “aprendizaje”, es un proceso que comienza con un estado del organismo y lo transforma paso a paso hasta etapas posteriores.
La adquisición del lenguaje es un proceso de este tipo. El estado inicial es la dotación biológica de la facultad del lenguaje, que obviamente existe, aunque se trate, como creen algunos, de una combinación particular de otras capacidades. Esto es muy improbable por razones que ya se han comprendido, pero no es relevante para lo que nos ocupa aquí, así que podemos dejarlo de lado. Es evidente que existe una dotación biológica para la facultad humana del lenguaje. Es una obviedad.
La transición se produce hasta un estado relativamente estable, que sólo cambia superficialmente: el conocimiento de la lengua. Los datos externos desencadenan y configuran parcialmente el proceso. Estudiando el estado alcanzado (conocimiento de la lengua) y los datos externos, podemos sacar conclusiones de gran alcance sobre el estado inicial, la dotación biológica que hace posible la adquisición del lenguaje. Las conclusiones sobre el estado inicial imponen una distinción entre lenguas posibles e imposibles. La distinción es válida para todos aquellos que comparten el estado inicial: todos los humanos, hasta donde se sabe; no parece haber diferencias en la capacidad de adquirir el lenguaje entre los grupos humanos existentes.
Todo esto es ciencia normal y ha conseguido muchos resultados.
Los experimentos han demostrado que el estado estable se alcanza en gran medida muy temprano, entre los tres y los cuatro años de edad. También está bien establecido que la facultad del lenguaje tiene propiedades básicas específicas de los humanos, por lo que es una verdadera propiedad de la especie: común a los grupos humanos y, en aspectos fundamentales, un atributo humano único.
En este esquema se omiten muchas cosas, en particular el papel de la ley natural en el crecimiento y el desarrollo; en el caso de un sistema computacional como el lenguaje, los principios de eficiencia computacional. Pero esa es la esencia del asunto. Una vez más, ciencia normal.
Es importante tener clara la distinción que hace Aristóteles entre posesión de conocimiento y uso de conocimiento (en la terminología contemporánea, competencia y desempeño). En el caso del lenguaje, el estado estable que se obtiene es la posesión de conocimiento, codificado en el cerebro. El sistema interno determina una serie ilimitada de expresiones estructuradas, cada una de las cuales podemos considerar como la formulación de un pensamiento, cada una externalizable en algún sistema sensoriomotor, generalmente el sonido, aunque podría ser un signo o incluso (con dificultad) el tacto.
El sistema codificado internamente se accede en el uso del conocimiento (ejecución). La ejecución incluye el uso interno del lenguaje en el pensamiento: reflexión, planificación, recuerdo y mucho más. Estadísticamente hablando, ese es, con mucho, el uso abrumador del lenguaje. Es inaccesible a la introspección, aunque podemos aprender mucho sobre él mediante los métodos normales de la ciencia, desde “afuera”, metafóricamente hablando. Lo que se llama “habla interna” es, de hecho, fragmentos de lenguaje externalizado con el aparato articulatorio silenciado. Es solo un reflejo remoto del uso interno del lenguaje, asuntos importantes que no puedo abordar aquí.
Otras formas de uso del lenguaje son la percepción (análisis) y la producción, esta última involucrando fundamentalmente propiedades que siguen siendo tan misteriosas para nosotros hoy como cuando Galileo y sus contemporáneos las miraban con asombro y admiración en los albores de la ciencia moderna.
El objetivo principal de la ciencia es descubrir el sistema interno, tanto en su estado inicial en la facultad humana del lenguaje como en las formas particulares que asume en la adquisición. En la medida en que se comprenda este sistema interno, podremos proceder a investigar cómo entra en el desempeño, interactuando con muchos otros factores que intervienen en el uso del lenguaje.
Los datos de desempeño brindan evidencia sobre la naturaleza del sistema interno, particularmente cuando se refinan mediante experimentos, como en el trabajo de campo estándar. Pero incluso la recopilación de datos más masiva es necesariamente engañosa en aspectos cruciales. Se limita a lo que se produce normalmente, no al conocimiento del lenguaje codificado en el cerebro, el objeto primario bajo investigación para quienes quieren comprender la naturaleza del lenguaje y su uso. Ese objeto interno determina infinitas posibilidades de un tipo que no se utilizará en el comportamiento normal debido a factores irrelevantes para el lenguaje, como las limitaciones de la memoria de corto plazo, temas estudiados hace 60 años. Los datos observados también incluirán mucho que se encuentra fuera del sistema codificado en el cerebro, a menudo el uso consciente del lenguaje en formas que violan las reglas con fines retóricos. Se trata de verdades obvias que conocen todos los trabajadores de campo, que dependen de técnicas de obtención de información con informantes, básicamente experimentos, para producir un corpus refinado que excluya restricciones irrelevantes y expresiones desviadas. Lo mismo ocurre cuando los lingüistas se utilizan a sí mismos como informantes, un procedimiento perfectamente sensato y normal, común en la historia de la psicología hasta el presente.
Si nos adentramos más en la ciencia normal, nos damos cuenta de que los procesos y elementos internos del lenguaje no se pueden detectar mediante la inspección de los fenómenos observados. A menudo, estos elementos ni siquiera aparecen en el habla (o en la escritura), aunque sus efectos, a menudo sutiles, sí se pueden detectar. Esa es otra razón por la que la restricción a los fenómenos observados, como en los enfoques de LLM, limita drásticamente la comprensión de los procesos internos que son los objetos centrales de la investigación sobre la naturaleza del lenguaje, su adquisición y su uso. Pero eso no es relevante si se ha abandonado la preocupación por la ciencia y la comprensión en favor de otros objetivos.
En el ámbito científico, durante milenios se han llegado a conclusiones mediante experimentos (con frecuencia, experimentos mentales), cada uno de los cuales es una abstracción radical de los fenómenos. Los experimentos están impulsados por la teoría y buscan descartar los innumerables factores irrelevantes que intervienen en los fenómenos observados, como el desempeño lingüístico. Todo esto es tan elemental que rara vez se lo analiza. Y resulta familiar. Como se ha señalado, la distinción básica se remonta a la distinción de Aristóteles entre posesión de conocimiento y uso de conocimiento. La primera es el objeto central de estudio. Los estudios secundarios (y bastante serios) investigan cómo se utiliza en el desempeño el sistema de conocimiento almacenado internamente, junto con los numerosos factores no lingüísticos que intervienen en lo que se observa directamente.
También podríamos recordar una observación del biólogo evolucionista Theodosius Dobzhansky, famoso principalmente por su trabajo con la Drosophila: cada especie es única, y los humanos somos los más únicos de todos. Si nos interesa entender qué tipo de criaturas somos –siguiendo el mandato del Oráculo de Delfos hace 2.500 años– nos interesará principalmente lo que hace que los humanos seamos los más únicos de todos, principalmente el lenguaje y el pensamiento, estrechamente entrelazados, como reconoce una rica tradición que se remonta a la Grecia clásica y la India. La mayor parte de la conducta es bastante rutinaria, por lo tanto, hasta cierto punto predecible. Lo que nos proporciona una verdadera visión de lo que nos hace únicos es lo que no es rutinario, que sí encontramos, a veces mediante la experimentación, a veces mediante la observación, desde los niños normales hasta los grandes artistas y científicos.
Un último comentario a este respecto. La sociedad se ha visto acosada durante un siglo por campañas corporativas masivas para fomentar el desdén por la ciencia, temas bien estudiados por Naomi Oreskes, entre otros. Empezó con corporaciones cuyos productos son asesinos: plomo, tabaco, amianto, más tarde combustibles fósiles. Sus motivos son comprensibles. El objetivo de una empresa en una sociedad capitalista es el beneficio, no el bienestar humano. Eso es un hecho institucional: si no juegas el juego, estás fuera, y serás reemplazado por alguien que sí lo haga.
Los departamentos de relaciones públicas de las empresas reconocieron desde el principio que sería un error negar la evidencia científica cada vez mayor de los efectos letales de sus productos. Eso sería fácil de refutar. Es mejor sembrar dudas, fomentar la incertidumbre, el desprecio por esos trajes de cabeza puntiaguda que nunca han pintado una casa pero que vienen desde Washington a decirme que no use pintura con plomo, destruyendo mi negocio (un caso real, fácilmente multiplicable). Eso ha funcionado demasiado bien. Ahora mismo nos está llevando por un camino de destrucción de la vida humana organizada en la Tierra.
En círculos intelectuales, la crítica posmoderna de la ciencia, desmantelada por Jean Bricmont y Alan Sokal, pero que todavía sigue muy viva en algunos círculos, ha producido efectos similares .
Tal vez sea poco amable plantear esta pregunta, pero creo que es justo preguntar si los Tom Jones y aquellos que repiten acríticamente e incluso amplifican sus proclamaciones descuidadas están contribuyendo a las mismas tendencias nefastas.
CJP : ChatGPT es un chatbot que funciona con lenguaje natural y utiliza inteligencia artificial para permitir conversaciones similares a las humanas. En un artículo reciente en The New York Times , junto con otros dos autores, usted descartó los nuevos chatbots como una moda porque simplemente no pueden igualar la competencia lingüística de los humanos. Sin embargo, ¿no es posible que las futuras innovaciones en IA puedan producir proyectos de ingeniería que igualen e incluso superen las capacidades humanas?
NC: El crédito por el artículo debe atribuirse al autor real, Jeffrey Watumull, un excelente matemático, lingüista y filósofo. Los dos coautores mencionados fueron consultores que están de acuerdo con el artículo pero no lo escribieron.
Es cierto que los chatbots no pueden, en principio, igualar la competencia lingüística de los humanos, por las razones que hemos repetido anteriormente. Su diseño básico les impide alcanzar la condición mínima de adecuación para una teoría del lenguaje humano: distinguir los lenguajes posibles de los imposibles. Como se trata de una propiedad del diseño, no podrá ser superada por futuras innovaciones en este tipo de IA. Sin embargo, es muy posible que futuros proyectos de ingeniería igualen e incluso superen las capacidades humanas, si nos referimos a la capacidad humana de actuar, al desempeño. Como se ha mencionado anteriormente, algunos lo han hecho desde hace tiempo: las calculadoras automáticas, por ejemplo. Más interesante aún, como se ha mencionado, los insectos con cerebros minúsculos superan las capacidades humanas entendidas como competencia.
CJP: En el artículo mencionado anteriormente también se observó que los proyectos de IA actuales no poseen una facultad moral humana. ¿Este hecho obvio hace que los robots de IA sean una amenaza menor para la raza humana? Creo que el argumento podría ser que los hace incluso más.
NC: Es un hecho evidente, entendiendo la “facultad moral” en sentido amplio. A menos que se controle cuidadosamente, la ingeniería de IA puede plantear graves amenazas. Supongamos, por ejemplo, que se automatizara la atención de los pacientes. Los errores inevitables que se superarían mediante el juicio humano podrían dar lugar a una historia de terror. O supongamos que se eliminara a los humanos de la evaluación de las amenazas determinadas por los sistemas automatizados de defensa antimisiles. Como nos informa un registro histórico impactante , eso sería el fin de la civilización humana.
CJP: Los organismos reguladores y de aplicación de la ley en Europa están expresando su preocupación por la propagación de ChatGPT, mientras que una ley de la Unión Europea presentada recientemente intenta abordar la IA clasificando dichas herramientas según su nivel de riesgo percibido. ¿Está de acuerdo con quienes están preocupados por que ChatGPT represente una amenaza pública grave? Además, ¿realmente cree que se puede detener el desarrollo de herramientas de IA hasta que se puedan introducir salvaguardas?
NC: Puedo simpatizar fácilmente con los esfuerzos por controlar las amenazas que plantea la tecnología avanzada, incluido este caso. Sin embargo, soy escéptico sobre la posibilidad de hacerlo. Sospecho que el genio ya salió de la botella. Los actores maliciosos, institucionales o individuales, probablemente puedan encontrar formas de evadir las salvaguardas. Esas sospechas, por supuesto, no son motivo para no intentarlo y para ejercer vigilancia.
*Artículo publicado por primera vez en la revista Common Dreams