Google Acaba de Resetear la Carrera de la IA: Por Dentro de Gemini 3.5 Flash y Omni
Si parpadeaste, puede que te lo hayas perdido: Google subió al escenario del Shoreline Amphitheatre y, sin hacer ruido, pasó la página sobre lo que se suponía que significaban “IA rápida” e “IA creativa”. Gemini 3.5 Flash y Gemini Omni no son simples saltos de versión — son una declaración sobre hacia dónde se dirigen los próximos 12 meses de la IA. Aquí está el desglose completo, en español claro.
El número que lo dice todo: 900 millones
Antes de meternos en los modelos, una sola cifra enmarca todo. Google reportó que Gemini pasó de 400 millones de usuarios en el I/O del año pasado a más de 900 millones de usuarios mensuales, distribuidos en más de 230 países y 70 idiomas. Más que duplicarse en un solo año no es una nota al pie — es la presión que hizo que estos anuncios se sintieran menos como experimentos y más como despliegues a escala planetaria.
Gemini 3.5 Flash: el modelo “rápido” que dejó de ser un compromiso
Durante años, el trade-off en IA fue simple e irritante: podías tener un modelo inteligente o uno rápido, rara vez ambos. Gemini 3.5 Flash es el intento de Google de borrar ese trade-off.
Lo que realmente hace
La propuesta es que Gemini 3.5 Flash combina inteligencia de frontera con la capacidad de realizar tareas agénticas — y los benchmarks respaldan la ambición. Según Google, supera a Gemini 3.1 Pro en benchmarks de programación, agénticos y multimodales. Léelo de nuevo: el nuevo modelo “rápido” le gana al modelo “pro” de gama insignia del trimestre pasado en lo difícil.
La velocidad es genuinamente absurda
En términos de tokens de salida por segundo, se reporta que Gemini 3.5 Flash es 4 veces más rápido que otros modelos de frontera. Y lo hace siendo más barato — aproximadamente entre un tercio y la mitad más barato que antes. Más rápido y más inteligente y más barato es la trifecta que la industria sigue prometiendo y rara vez entrega completa.
Por qué “agéntico” es la palabra que importa
El cambio más importante aquí no es la velocidad — es la autonomía. Google enmarca a toda la familia Gemini 3.5 como una combinación de inteligencia de frontera con acción. El modelo está construido para tareas agénticas de largo horizonte: puede planificar, construir e iterar para resolver problemas reales como desarrollar nuevas aplicaciones, mantener bases de código o preparar documentos financieros. Incluso puede actuar como una plataforma para desplegar equipos de subagentes — es decir, un modelo orquestando muchos trabajadores más pequeños — y genera UIs web y gráficos más ricos e interactivos en el proceso.
En resumen: esto no es un chatbot que responde una pregunta. Es un trabajador que termina un proyecto.
Dónde puedes usarlo hoy
Gemini 3.5 Flash se está desplegando en la app de Gemini, Google Search, Google Antigravity 2.0 y la API de Gemini. El hermano mayor, Gemini 3.5 Pro, está actualmente en pruebas y se espera para el próximo mes con el mismo enfoque.
Una línea de tiempo rápida (para que los números de versión tengan sentido)
| Modelo | Lanzamiento |
|---|---|
| Gemini 3 | Noviembre 2025 |
| Gemini 3.1 | Febrero 2026 |
| Gemini 3.5 Flash | Mayo 2026 |
| Gemini 3.5 Pro | Esperado el próximo mes |
La cadencia cuenta su propia historia: aproximadamente un lanzamiento mayor cada tres meses. La carrera no se está desacelerando — se está acumulando.
Gemini Omni: el modelo que convierte “cualquier entrada” en “cualquier salida”
Si Gemini 3.5 Flash es el caballo de trabajo, Gemini Omni es el espectáculo — y posiblemente el más conceptualmente radical de los dos.
Lo que lo hace diferente
La mayoría de las herramientas de IA de video generan video desde cero. Omni hace algo más extraño y más poderoso: es una nueva clase de modelos multimodales que pueden reformar metraje real de la vida real en algo que, francamente, de otra forma sólo existiría dentro de tu cabeza. Le das imágenes, audio, video o sólo texto describiendo tu visión, y construye — y crucialmente, piensa la historia analizando múltiples aspectos juntos en lugar de sólo renderizar fotogramas.
Demis Hassabis, CEO de Google DeepMind, lo enmarcó directamente en el escenario: el objetivo a largo plazo de Omni es generar cualquier tipo de salida a partir de cualquier tipo de entrada. La primera versión, Gemini Omni Flash, se lanzará este verano.
Las características que destacaron
- Edición conversacional. Puedes refinar videos usando lenguaje natural hasta que el resultado coincida con tu visión — editando personajes, fondos y elementos, incluso por comandos de voz.
- Avatares que eres tú. Sube una versión digital de ti mismo y crea videos con personajes que se ven y suenan como tú, insertados en escenas de acción.
- Física del mundo real. Google enfatizó que los videos generados siguen la física de la vida real — el modelo entiende la gravedad, la energía cinética e incluso la dinámica de fluidos. Esta es la diferencia entre “video con IA” y “video que se siente real”.
Cómo lo conseguirás en la práctica
Omni se despliega junto al nuevo modelo Flash en la app de Gemini para suscriptores de pago en los planes Google AI Plus, Pro y Ultra. También estará disponible a través de Flow, la herramienta de creación cinematográfica con IA de Google. Y — la jugada de distribución ingeniosa — podrás usarlo gratis para crear Remixes de YouTube Shorts existentes, incluido dentro de YouTube Create.
Una pregunta abierta que Google aún no ha respondido: si los creadores podrán restringir el remezclado con IA de su propio contenido. Esa es una historia que vale la pena seguir.
El elenco de apoyo: Spark y un look totalmente nuevo
Esto no se trató sólo de dos modelos.
Gemini Spark fue presentado como un agente 24/7 — un asistente persistente que trabaja en segundo plano en lugar de sólo cuando abres la app.
La propia app de Gemini también recibió un rediseño completo llamado Neural Expressive: un nuevo lenguaje de diseño con animaciones fluidas, colores vibrantes, retroalimentación háptica y nueva tipografía, construido alrededor de un cuadro de prompt en forma de pastilla. Se está desplegando ahora en Android, iOS y la web.
Entonces, ¿qué significa esto realmente?
Quita el pulido del keynote y tres cosas destacan:
- El trade-off velocidad-vs-inteligencia está muriendo. Cuando el modelo “rápido” le gana al modelo “pro” del trimestre pasado, el viejo modelo mental de elegir uno u otro ya no se sostiene.
- La IA está pasando de responder a hacer. “Agéntico”, “largo horizonte”, “equipos de subagentes” — el vocabulario ha cambiado porque el producto ha cambiado. La vara ahora es la finalización de tareas, no la calidad de la respuesta.
- La IA creativa se está unificando. La apuesta de Omni es que un modelo manejando texto, imagen y video de forma nativa supera a juntar herramientas especializadas. Si esa apuesta funciona, la era de hacer malabares con cuatro apps creativas distintas puede estar terminando.
¿Está todo probado? No — muchos de estos son los benchmarks del propio Google, y las pruebas del mundo real siempre cuentan una historia más desordenada que una diapositiva de keynote. Las evaluaciones independientes de las próximas semanas serán el veredicto real. Pero como dirección de viaje, la trayectoria es inconfundible.
Los modelos siguen volviéndose más rápidos. Las tareas siguen volviéndose más grandes. Y la brecha entre “describe lo que quieres” y “aquí lo tienes, terminado” sigue achicándose.
¿Quieres un análisis más profundo de alguna pieza en particular — los benchmarks de coding agéntico, el motor de física de Omni o cómo se compara 3.5 Flash con sus rivales? Eso es todo un post aparte.