El jueves, el renombrado investigador de IA Andrej Karpathyanteriormente de OpenAI y Tesla, tuiteó una propuesta alegre que grandes modelos de lenguaje (LLM) como el que corre ChatGPT algún día podría modificarse para operar o transmitirse al espacio, potencialmente para comunicarse con vida extraterrestre. Dijo que la idea era «sólo por diversión», pero con su perfil influyente en el campo, la idea puede inspirar a otros en el futuro.

Karpatía de buena fe en IA casi hablan por sí solos, recibiendo un doctorado de Stanford como científico informático Dr. Fei-Fei Li en 2015. Luego se convirtió en uno de los miembros fundadores de OpenAI como científico investigador, luego se desempeñó como director senior de IA en Tesla entre 2017 y 2022. En 2023, Karpathy se reincorporó a OpenAI durante un año y se fue en febrero pasado. el esta publicado varios tutoriales de gran prestigio Cubre conceptos de IA en YouTube y cada vez que habla de IA, la gente escucha.

Más recientemente, Karpathy ha estado trabajando en un proyecto llamado «llm.c» que implementa el proceso de capacitación para OpenAI’s 2019 GPT-2 LLM en C pura, acelerando drásticamente el proceso y demostrando que trabajar con LLM no necesariamente requiere entornos de desarrollo complejos. El enfoque simplificado del proyecto y el código base conciso despertaron la imaginación de Karpathy.

«Mi biblioteca llm.c está escrita en C puro, un lenguaje de sistemas de bajo nivel muy conocido donde tienes control directo sobre el programa», dijo Karpathy a Ars. «Esto contrasta con las típicas bibliotecas de aprendizaje profundo para entrenar estos modelos, que están escritas en bases de código grandes y complejas. Por lo tanto, una ventaja de llm.c es que es muy pequeño y simple y, por lo tanto, mucho más fácil de certificar como Space. -seguro.»

Nuestro embajador de IA

En su divertido experimento mental (titulado «Claramente, los LLM algún día deben funcionar en el espacio»), Karpathy sugirió un plan de dos pasos en el que, inicialmente, el código para los LLM se adaptaría para cumplir con rigurosos estándares de seguridad, similares a «El poder de las 10 reglas«adoptado por la NASA para el software espacial.

Esta primera parte la consideró seria: «Reforzamos llm.c para que pase los estándares de código y las guías de estilo de la NASA, certificando que el código es súper seguro, lo suficientemente seguro para ejecutarse en el espacio», afirmó. escribió en su publicación X. «En principio, el entrenamiento/inferencia de LLM debería ser súper seguro: es solo una matriz fija de flotadores y un bucle de dinámica único, acotado y bien definido sobre él. No hay necesidad de que la memoria crezca o se reduzca de manera indefinida. para recursividad, o algo así.»

Esto es importante porque cuando el software se envía al espacio, debe funcionar bajo estrictos estándares de seguridad y confiabilidad. Karpathy sugiere que su código, llm.c, probablemente cumpla con estos requisitos porque está diseñado teniendo en cuenta la simplicidad y la previsibilidad.

En el paso 2, una vez que este LLM se considerara seguro para las condiciones espaciales, en teoría podría usarse como nuestro embajador de IA en el espacio, similar a iniciativas históricas como la mensaje de arecibo (un mensaje de radio enviado desde la Tierra al cúmulo globular Messier 13 en 1974) y Disco de Oro de la Voyager (Dos discos de oro idénticos enviados en las dos naves espaciales Voyager en 1977). La idea es empaquetar los «pesos» de un LLM (esencialmente los parámetros aprendidos del modelo) en un archivo binario que luego podría «despertarse» e interactuar con cualquier tecnología alienígena potencial que pueda descifrarlo.

«Lo imagino como una posibilidad de ciencia ficción y algo interesante en lo que pensar», dijo a Ars. «La idea de que no somos nosotros los que podemos viajar a las estrellas, sino nuestros representantes de la IA. O que lo mismo podría ser cierto para otras especies».

Author

Write A Comment