El desafío: enseñar a las máquinas a entender el mundo físico
Mientras la mayoría de las aplicaciones de IA se centran en procesamiento de texto o imágenes estáticas, existe una frontera menos explorada pero cada vez más financiada: el entrenamiento de máquinas para que comprendan y se muevan dentro del espacio físico en tiempo real. General Intuition, la startup neoyorquina fundada por Pim de Witte (quien previamente lideró Medal, una plataforma de videos de videojuegos), está en conversaciones para levantar aproximadamente USD 300 millones a una valuación ligeramente superior a USD 2.000 millones.
Esta nueva ronda de inversión llega solo ocho meses después de su lanzamiento independiente desde Medal, cuando la startup cerró una ronda seed de USD 134 millones. El respaldo proviene de inversores de alto perfil, incluyendo Jeff Bezos y Eric Schmidt, además de firmas como Khosla Ventures y General Catalyst.
World models: el diferenciador clave
La propuesta de General Intuition no es construir chatbots o generadores de imágenes, sino "world models": sistemas de IA capaces de percibir, anticipar e interactuar en entornos reales. El motor de esta capacidad es un dataset único: 2 mil millones de videos anuales generados por 10 millones de usuarios activos mensuales en Medal.
"El razonamiento espacial-temporal en primera persona —el tipo de perspectiva que obtienes jugando videojuegos— es el material de entrenamiento perfecto para enseñarle a máquinas cómo navegar el mundo físico", explicaría el enfoque de la compañía. A diferencia de otros competidores en el espacio de world models (como Runway, Decart o World Labs), General Intuition no vende los modelos mismos; los agentes entrenados son el producto final. Este giro estratégico es crucial: no compite en un mercado saturado de herramientas de generación, sino en uno de automatización autónoma.
El atractivo del dataset de Medal ya había capturado la atención de OpenAI, que intentó adquirir la plataforma anteriormente. Fuentes sugieren que otros grandes laboratorios de IA también se han acercado.
De los videojuegos a la manufactura y logística
Si bien el primer foco de General Intuition es claramente el entrenamiento de agentes para videojuegos y robótica (sectores natural y técnicamente cercanos al gaming), la compañía está construyendo los cimientos para algo más ambicioso: la IA encarnada (embodied AI) que transformará sectores con presencia física.
La manufactura, la logística y el retail son industrias donde un sistema capaz de entender dinámicas espaciales en tiempo real podría generar saltos de productividad significativos. Imagina agentes que no solo procesan órdenes, sino que entienden cómo mover un palet en un almacén congestionado o cómo navegar una línea de producción con obstáculos dinámicos.
El panorama competitivo se calienta rápidamente. Google acaba de integrar datos de Google Maps a su modelo Genie 3, permitiendo simulaciones más realistas. Pero General Intuition tiene una ventaja: un dataset generado por usuarios interactuando en primeras persona, no mapas estáticos.
Qué significa para los líderes tecnológicos
Para un decisor evaluando herramientas de automatización y IA, esta inversión masiva en world models y agentes espaciales señala un cambio en el mercado. Los próximos agentes de IA que llegarán a producción no solo leerán correos o analizarán bases de datos: navegarán y actuarán en espacios físicos.
La compañía planea invertir los nuevos fondos en ampliar su capacidad de cómputo para lanzar un nuevo producto antes de finales del verano o principios del otoño. Vigilar estos lanzamientos podría revelar oportunidades tempraneras para integrar IA espacialmente consciente en operaciones de manufactura, logística o incluso en la automatización de tareas que hoy requieren presencia humana.
Este es el tipo de tecnología en el que el capital está votando hoy. Los que entienda esto a tiempo podrán posicionarse para una ventaja competitiva en el próximo ciclo de automatización.