Por: Wired. 18/09/2024
La informática de Stanford asegura que el siguiente paso para la IA son los “grandes modelos del mundo”, dotados de conocimientos de tridimensionalidad. Los inversionistas apuestan fuertemente por su empresa emergente.
Según los expertos en tecnología obsesionados con el mercado y los escépticos profesionales, la burbuja de la inteligencia artificial (IA) ha estallado y el invierno ha vuelto. Fei-Fei Li, la apodada “madrina de la IA”, apuesta por lo contrario. Actualmente tiene licencia de baja parcial en la Universidad Stanford, California, para cofundar una empresa llamada World Labs.
Aunque la IA generativa actual se basa en el lenguaje, ella ve una frontera en la que los sistemas construyen mundos completos con la física, la lógica y la riqueza de detalles de nuestra realidad tangible. Es un objetivo ambicioso y, a pesar de los pesimistas que afirman que el progreso de la inteligencia artificial se ha estancado, World Labs se encuentra en la vía rápida de financiamiento. Aún falta un año para que la empresa tenga un producto, y no está nada claro si funcionará bien cuando llegue, pero los inversionistas han aportado 230 millones de dólares. Al parecer, valoran la incipiente empresa en mil millones de dólares.
Li es una persona reservada a la que le incomoda hablar de sí misma. Pero se las ingenió para integrar su experiencia como inmigrante que llegó a Estados Unidos a los 16 años, sin dominar el idioma, y superó obstáculos para convertirse en una figura clave de esta tecnología fundamental. En el camino hacia su puesto actual, también ha sido directora del Stanford AI Lab y jefa científica de IA y aprendizaje automático en Google Cloud.
Hace aproximadamente una década, Li ayudó a la IA a dar un giro con la creación de ImageNet, una base de datos a medida de imágenes digitales que permitió a las redes neuronales ser significativamente más inteligentes. En su opinión, los grandes modelos de lenguaje (LLM, por sus siglas en inglés) actuales necesitan un impulso similar para que la inteligencia artificial pueda crear mundos reales, ya sean simulaciones realistas o universos totalmente imaginarios.
Los futuros escritores que aspiran a ser el nuevo George R.R. Martin podrían componer sus mundos soñados en forma de mensajes, en lugar de prosa, que el usuario podría renderizar y por los que podría deambular: “Para las computadoras, el mundo físico se ve a través de cámaras y el cerebro detrás de ellas. Convertir esa visión en razonamiento, generación e interacción final implica comprender la estructura, la dinámica física del mundo real. Y esa tecnología se llama inteligencia espacial“, puntualiza Li. World Labs se autodenomina empresa de inteligencia espacial, y su destino ayudará a determinar si ese término se convierte en una revolución o en un chiste.
¿Inteligencia espacial?
Sí, y Li lleva años obsesionada con ella. Mientras todo el mundo se volvía loco con ChatGPT, ella y un antiguo alumno, Justin Johnson, charlaban entusiasmados por teléfono sobre la próxima iteración de la IA: “La próxima década consistirá en generar nuevos contenidos que saquen la visión por computadora, el aprendizaje profundo y la inteligencia artificial del mundo de internet y los integren en el espacio y el tiempo”, describe Johnson, que ahora es profesor adjunto en la Universidad de Michigan.
Li decidió crear una empresa a principios de 2023, tras una cena con Martín Casado, un pionero de las redes virtuales que ahora es socio de Andreessen Horowitz. Esta empresa de capital de riesgo (VC) es famosa por su adhesión casi mesiánica a la IA. Casado considera que la inteligencia artificial sigue un camino similar al de los videojuegos, que empezaron con texto, pasaron a gráficos en 2D y ahora cuentan con deslumbrantes imágenes en 3D. La inteligencia espacial impulsará el cambio. Con el tiempo, “podrías tomar tu libro favorito, introducirlo en un modelo y, literalmente (sic), meterte en él y ver cómo se desarrolla en tiempo real, de forma envolvente”. Casado y Li coinciden en que el primer paso para conseguirlo es pasar de los LLM a los grandes modelos del mundo o large world models.
Li empezó el equipo con Johnson como cofundador. Casado propuso a otras dos personas: una fue Christoph Lassner, que había trabajado en Amazon, Meta’s Reality Labs y Epic Games. También es el inventor de Pulsar, un esquema de renderizado que dio lugar a una célebre técnica llamada “3D Gaussian Splatting”. Suena a grupo alternativo en una fiesta de togas del MIT, pero en realidad es una forma de sintetizar escenas, no objetos aislados. La otra sugerencia de Casado fue Ben Mildenhall, creador de una potente técnica llamada NeRF, “neural radiance fields” (campos de radiancia neural, traducido al español), que transmuta imágenes de píxeles 2D en gráficos 3D. “Llevamos objetos del mundo real a la realidad virtual (RV) y conseguimos que parecieran perfectamente reales”, señala. Mildenhall dejó su puesto como investigador científico sénior en Google para unirse al equipo de Li.
Uno de los objetivos obvios de un large world model sería proporcionar un sentido físico a los robots. Eso es lo que planea World Labs, pero no por ahora. La primera fase consiste en construir un modelo con un profundo conocimiento de la tridimensionalidad, la fisicalidad y las nociones de espacio y tiempo. Después vendrá una fase en la que los modelos admitan la realidad aumentada. Finalmente, la empresa podrá dedicarse a la robótica. Si esta visión se cumple, los modelos del mundo mejorarán los automóviles autónomos, las fábricas automatizadas e incluso los robots humanoides.
Un largo camino por recorrer
No será de la noche a la mañana, World Labs promete un producto en 2025. Cuando pregunté a los fundadores en qué consistiría exactamente el producto, quiénes serían los clientes previstos y cómo ganaría dinero World Labs, insistieron en que están empezando. “Hay muchas limitantes que superar, muchas incógnitas. Pero somos el mejor equipo del mundo para resolver estos enigmas”, comentó Li.
Casado es un poco más específico. Para recalcar que un modelo puede ser una plataforma que otros utilizan directamente o que aloja otras aplicaciones, pone de ejemplo a ChatGPT o a Claude de Anthropic. Los clientes pueden ser empresas de videojuegos o estudios de cine. Para ilustrar un poco, Pixar gasta infinitos recursos para simular el pelaje de los monstruos o el movimiento del agua. Imagina hacer eso con una indicación de una sola frase.
World Labs no es la única empresa que se dedica a lo que algunos llaman IA física. Jensen Huang, CEO de Nvidia declaró a principios del año que, “la creación de modelos básicos para robots humanoides en general es uno de los problemas más apasionantes de la inteligencia artificial actual”. Hace poco WIRED escribió sobre una empresa llamada Archetype que también perseguía esa línea. Pero Casado insiste en que la ambición, el talento y la visión de World Labs son únicos: “He invertido casi 10 años y nunca me había topado con un equipo como este”. Es habitual que un inversionista de capital de riesgo aumente sus apuestas, pero en este caso está poniendo algo más que dinero. Por primera vez desde que se convirtió en un VC, es un miembro del equipo a tiempo parcial, pasando un día a la semana en la compañía.
También participan otras empresas de capital de riesgo, como Radical Ventures, NEA y la rama de capital de riesgo de Nvidia, así como una lista de inversionistas en la que figuran Marc Benioff, Reid Hoffman, Jeff Dean, Eric Schmidt, Ron Conway; y el padrino de la IA Geoff Hinton, siempre respaldando a la madrina de este campo. Susan Wojcicki, ex CEO de YouTube, también invirtió antes de su prematuro fallecimiento el mes pasado.
¿Puede toda esta gente inteligente estar equivocada?
Claro que sí. No hace falta entrecerrar demasiado los ojos para ver cómo las promesas de World Lab se solapan con una palabra de moda reciente que se desveló de forma bastante dramática: el metaverso. Los fundadores de World Lab sostienen que esa tendencia efímera fue prematura, un bache basado en un hardware prometedor que no tenía el contenido interactivo adecuado. Según lo retrata el equipo, los grandes modelos de mundos podrían resolver ese problema. Presumiblemente, ninguno de esos mundos visualizaría la IA como algo estancado en un borrador.
Artículo originalmente publicado en WIRED. Adaptado por Alondra Flores.

Meta pone fin a las inversiones sin freno para el metaverso, según informe
Reality Labs, la unidad de Meta enfocada en el metaverso, pretende reducir costos específicamente en el área de hardware.
LEER EL ARTÍCULO ORIGINAL PULSANDO AQUÍ
Fotografía: Wired