Google da el mayor salto en su estrategia de inteligencia artificial con Gemini 3

Este modelo, más multimodal, razonador y orientado a agentes, llega desde el primer día a la Búsqueda, la app de Gemini, Workspace, Vertex AI y la plataforma de desarrollo Antigravity

Trae mejoras en razonamiento profundo, planificación, creación de interfaces generativas y capacidades agénticas para automatizar tareas complejas.

La fragilidad de las barreras éticas en la inteligencia artificial: así de fácil es engañar a los chatbots más populares

Gemini 3

Google ha presentado Gemini 3, su modelo de inteligencia artificial más potente hasta la fecha, que estará disponible en España desde hoy mismo.

El anuncio marca el inicio de lo que la compañía denomina la "era Gemini 3", una nueva etapa en la que la inteligencia artificial no solo responde preguntas, sino que anticipa necesidades, razona con mayor profundidad y ejecuta tareas complejas de forma autónoma.

Sundar Pichai, consejero delegado de Google y Alphabet, ha destacado que este lanzamiento representa "un paso decisivo" en la evolución de la inteligencia artificial. "En solo dos años, la IA ha pasado de simplemente leer texto e imágenes a leer el ambiente", ha afirmado Pichai en una nota publicada con motivo del lanzamiento.

La familia Gemini, que comenzó su andadura hace casi dos años, cuenta ya con 2.000 millones de usuarios mensuales en Vista Creada con IA y más de 650 millones en la aplicación Gemini. Además, 13 millones de desarrolladores han creado soluciones utilizando estos modelos generativos, lo que da una idea del alcance que ha logrado la tecnología de Google en el mercado de la inteligencia artificial.

Dos versiones para diferentes necesidades

Gemini 3 se presenta en dos variantes principales. La primera es Gemini 3 Pro, que ya está disponible en versión preliminar y que Google describe como su modelo más versátil para uso cotidiano. Esta versión llega con soporte para 30 nuevos idiomas, incluyendo catalán, euskera y gallego, lo que amplía significativamente su accesibilidad en el mercado español.

La segunda versión es Gemini 3 Deep Think, un modo de razonamiento mejorado que lleva las capacidades del modelo aún más lejos. Esta variante está diseñada para abordar problemas especialmente complejos que requieren un análisis más profundo. Inicialmente, Google dará acceso a evaluadores de seguridad antes de ponerlo a disposición de los suscriptores de Google AI Ultra en las próximas semanas.

Para utilizar Gemini 3 Pro, los usuarios simplemente deben seleccionar la opción "Thinking" en el menú desplegable de modelos dentro de la aplicación Gemini, disponible tanto en escritorio como en dispositivos móviles.

Mejoras sustanciales en razonamiento y comprensión

Los avances técnicos de Gemini 3 son notables, aunque Google ha procurado hacer que estas mejoras se traduzcan en beneficios prácticos para los usuarios. El modelo ha alcanzado 1.501 puntos en LMArena, una clasificación de referencia en el sector que evalúa el rendimiento de los modelos de IA. Esta puntuación supera en 50 puntos al anterior líder, que casualmente era su predecesor, Gemini 2.5 Pro.

Demis Hassabis y Koray Kavukcuoglu, máximos responsables de Google DeepMind, han afirmado que Gemini 3 representa "otro gran paso hacia la inteligencia artificial general" y lo han calificado como "el mejor modelo del mundo en comprensión multimodal". Esto significa que puede procesar y entender simultáneamente texto, imágenes, vídeo, audio y código, sintetizando información de todas estas fuentes para ofrecer respuestas más completas y precisas.

Una de las características más destacadas es su capacidad de razonamiento a nivel doctoral. En pruebas especializadas como Humanity's Last Exam, Gemini 3 Pro alcanza un 37,5% de aciertos sin usar herramientas adicionales, mientras que la versión Deep Think eleva esta cifra al 41%. En GPQA Diamond, otra prueba que mide el razonamiento científico avanzado, los resultados son del 91,9% y 93,8% respectivamente.

Pero más allá de los datos técnicos, lo que notarán los usuarios es que las respuestas del modelo son más directas, mejor estructuradas y más útiles. Según Google, Gemini 3 "prefiere ofrecer información valiosa en lugar de recurrir a clichés y halagos", actuando como un verdadero colaborador que no solo dice lo que queremos oír, sino lo que necesitamos saber.

Casos de uso: desde recetas familiares hasta análisis deportivo

Las aplicaciones prácticas de Gemini 3 son variadas y sorprendentes. Un ejemplo concreto que destaca Google es el de preservar recetas familiares. Imaginemos que tenemos recetas escritas a mano por nuestros abuelos en distintos idiomas o dialectos. Gemini 3 puede descifrar esa caligrafía, traducir el contenido y crear un libro de cocina familiar digital que podemos compartir con otros familiares, manteniendo viva una tradición culinaria.

Para estudiantes y profesionales que necesitan aprender sobre nuevos temas, el modelo puede analizar artículos académicos extensos, vídeos largos de clases o tutoriales, y generar material de estudio interactivo. Por ejemplo, puede crear tarjetas didácticas, visualizaciones científicas o incluso código para simulaciones que ayuden a comprender mejor conceptos complejos. En el material de presentación, Google muestra cómo Gemini 3 puede programar una visualización del flujo de plasma en un tokamak (un dispositivo de fusión nuclear) y, al mismo tiempo, escribir un poema que capture la física de la fusión.

También hay aplicaciones más cotidianas y sorprendentes. Un ejemplo curioso es el análisis deportivo personal: Gemini 3 puede examinar vídeos de tus partidos de pickleball (un deporte de raqueta similar al tenis), identificar áreas de mejora en tu técnica y generar un plan de entrenamiento personalizado para mejorar tu forma física general.

Casos de uso concretos de Gemini 3

Entre los casos de uso concretos, Google plantea ejemplos como:

Digitalizar cuadernos familiares o documentos antiguos: Gemini 3 puede descifrar recetas manuscritas, combinarlas con material audiovisual y generar libros de cocina o recopilaciones personalizadas.

Estudiar temas complejos: a partir de artículos académicos, vídeos de conferencias o tutoriales, el modelo genera resúmenes interactivos, tarjetas de estudio y visualizaciones programadas por él mismo.

Mejorar en actividades deportivas: analizando vídeos de partidos, identifica patrones de juego y áreas de mejora, y genera planes de entrenamiento personalizados.

Simplificar tareas administrativas: desde clasificar automáticamente el correo electrónico hasta organizar un itinerario de viaje completo, gestionando reservas, presupuestos y planificaciones diarias.

Interfaces generativas: respuestas que se adaptan a cada pregunta

Una de las novedades más innovadoras de Gemini 3 es lo que Google denomina "interfaces generativas" o "generative UI". Se trata de una capacidad completamente nueva que permite al modelo crear experiencias visuales e interactivas personalizadas para cada consulta, en lugar de limitarse a mostrar texto en un formato estático.

Josh Woodward, vicepresidente de Google Labs, explica que esta tecnología representa "un nuevo tipo de interfaz que se adapta a tus necesidades, diseñando la respuesta perfecta para tu pregunta específica". En la práctica, esto significa que cuando haces una pregunta a Gemini 3, el modelo no solo piensa en el contenido de la respuesta, sino también en cuál es la mejor manera de presentártela.

Google ha implementado esta funcionalidad en dos formatos experimentales. El primero es Visual Layout, que genera diseños inmersivos al estilo de una revista, con fotografías, módulos interactivos y elementos visuales que invitan a explorar la información. Por ejemplo, si pides "planifica un viaje de 3 días a Roma el próximo verano", recibirás un itinerario visual que puedes explorar de forma interactiva, ajustando elementos según tus preferencias.

El segundo formato es Dynamic View, que va aún más allá al diseñar y programar una interfaz de usuario personalizada en tiempo real. Si preguntas, por ejemplo, "explícame la galería de Van Gogh con contexto vital de cada obra", Gemini 3 creará una experiencia interactiva donde puedes tocar, desplazarte y aprender de formas que el texto estático no permite. Es como si el modelo diseñara una pequeña aplicación web específicamente para responder a tu pregunta.

Estas interfaces generativas también llegan al buscador de Google a través del Modo IA. Ahora, cuando realizas búsquedas complejas, puedes recibir herramientas interactivas creadas al momento. Por ejemplo, si estás investigando sobre hipotecas, Gemini 3 puede generar una calculadora de préstamos personalizada directamente en los resultados de búsqueda para que compares diferentes opciones. O si estás aprendiendo sobre el problema de los tres cuerpos en física, puede crear una simulación interactiva donde manipular variables y observar cómo se desarrollan las interacciones gravitacionales.

Elizabeth Hamon Reid, vicepresidenta de ingeniería de Búsqueda en Google, ha subrayado que esta es "la primera vez que lanzamos un modelo Gemini en Búsqueda desde el primer día", señalando la confianza de la compañía en las capacidades del nuevo modelo.

Nuevas interfaces generativas

Visual layout: crea una página con apariencia de reportaje ilustrado, ideal para organizar información de viajes, recetas o explicaciones de temas complejos.
Dynamic view: genera herramientas interactivas y miniaplicaciones: desde galerías explicativas hasta interfaces educativas que incluyen menús seleccionables, simulaciones o líneas temporales.

Gemini Agent: un asistente que actúa por ti

Otra funcionalidad destacada es Gemini Agent, una herramienta experimental que representa el siguiente paso en la evolución de los asistentes virtuales. A diferencia de los chatbots tradicionales que simplemente responden preguntas, Gemini Agent puede llevar a cabo tareas complejas de múltiples pasos de forma autónoma, actuando en nombre del usuario.

Las aplicaciones prácticas son inmediatas. Imagina que tienes la bandeja de entrada del correo electrónico desbordada. Puedes simplemente pedirle a Gemini Agent que "organice mi bandeja de entrada" y el sistema priorizará automáticamente los mensajes importantes, creará borradores de respuesta para tu aprobación y archivará lo que no sea urgente. Todo esto ocurre bajo tu supervisión: Gemini está diseñado para solicitar confirmación antes de realizar acciones críticas como hacer compras o enviar mensajes.

Un caso de uso más complejo sería la planificación de viajes. Podrías darle una instrucción como: "Investiga y ayúdame a reservar un SUV de tamaño medio para mi viaje de la próxima semana por menos de 80 dólares al día usando los detalles de mi correo electrónico". Gemini Agent localizará la información de tu vuelo en tu bandeja de entrada, comparará opciones de alquiler de coches dentro de tu presupuesto y preparará la reserva para que la confirmes.

Esta funcionalidad se basa en los aprendizajes del Project Mariner, un proyecto de investigación de Google sobre agentes autónomos. Inicialmente, Gemini Agent estará disponible para suscriptores de Google AI Ultra en Estados Unidos, antes de extenderse a otros mercados.

Google Antigravity: revolucionando el desarrollo de software

Para los desarrolladores, Google ha presentado Google Antigravity, una plataforma completamente nueva que reimagina cómo se crea software en la era de la inteligencia artificial. El nombre no es casual: sugiere la idea de "despegar" del trabajo tedioso para elevarse a un nivel más creativo y estratégico.

La plataforma transforma el concepto tradicional del entorno de desarrollo integrado (IDE). Mientras que hasta ahora los asistentes de IA eran herramientas dentro del kit de un programador, en Google Antigravity los agentes de IA se convierten en colaboradores activos que trabajan de forma autónoma en el editor de código, el terminal y el navegador simultáneamente.

La experiencia tiene dos modos. El primero es la vista Editor, un entorno de desarrollo de IA de última generación que resultará familiar a cualquier programador, con autocompletado inteligente, comandos en línea y un agente funcional en el panel lateral.

El segundo es la vista Manager, más innovadora, que invierte el paradigma: en lugar de tener agentes integrados dentro de las herramientas, las herramientas están integradas en los agentes. Esta vista funciona como un centro de control donde puedes generar, orquestar y observar múltiples agentes trabajando en paralelos en diferentes espacios de trabajo.

Un ejemplo práctico ayuda a entender las posibilidades: imagina que estás desarrollando una aplicación de seguimiento de vuelos. En lugar de programar cada funcionalidad manualmente, puedes describir lo que quieres y el agente de Google Antigravity planificará de forma autónoma el proyecto, programará la aplicación completa y validará su funcionamiento utilizando el navegador para probar cada característica. Todo esto ocurre mientras tú supervisas el proceso y puedes intervenir en cualquier momento para dar feedback o ajustar el rumbo.

Los resultados en pruebas de programación son impresionantes. Gemini 3 lidera la clasificación WebDev Arena con 1.487 puntos y alcanza un 76,2% en SWE-bench Verified, una prueba que mide la eficacia de los agentes en tareas reales de ingeniería de software. En Terminal-Bench 2.0, que evalúa la capacidad del modelo para operar un ordenador a través del terminal, obtiene un 54,2%.

Google Antigravity está disponible sin coste en su versión de vista previa pública para MacOS, Windows y Linux. Además, Gemini 3 se ha integrado en numerosas plataformas de terceros como Cursor, GitHub, JetBrains, Manus, Replit y Cline, lo que permitirá a los desarrolladores utilizar el modelo dentro de sus flujos de trabajo habituales.

'Vibe coding': programar con lenguaje natural

Relacionado con las capacidades de desarrollo, Google introduce un concepto llamado "vibe coding" (programación por vibración o intuición), que representa un cambio fundamental en cómo creamos aplicaciones. La idea es simple pero poderosa: el lenguaje natural se convierte en el único código que necesitas conocer.

Logan Kilpatrick, responsable de producto de Google AI Studio y la API de Gemini, explica que Gemini 3 Pro "desbloquea el verdadero potencial del vibe coding". Gracias a mejoras significativas en seguimiento de instrucciones complejas y uso profundo de herramientas, el modelo puede traducir una idea de alto nivel en una aplicación completamente interactiva con una sola indicación.

Los casos de uso son diversos y creativos. Puedes construir un juego retro completo con una sola instrucción. O crear una página de inicio interactiva a partir de notas de voz desestructuradas. O incluso diseñar una aplicación funcional a partir de un boceto dibujado en una servilleta. Google muestra en sus demostraciones cómo un usuario puede simplemente dibujar a mano alzada en una pantalla lo que quiere que haga una aplicación, y Gemini 3 no solo comprende las instrucciones dibujadas, sino que actúa inteligentemente basándose en su comprensión de la pantalla y sus elementos.

Esta capacidad tiene implicaciones importantes para democratizar la creación de software. Ya no es necesario conocer lenguajes de programación complejos para materializar una idea; basta con describirla con claridad.

Aplicaciones empresariales: de la sanidad a la logística

Saurabh Tiwary, vicepresidente y director general de Cloud AI en Google, ha destacado las aplicaciones de Gemini 3 en el entorno empresarial a través de Gemini Enterprise y Vertex AI. Las capacidades multimodales del modelo permiten casos de uso que antes eran impensables o requerían soluciones muy especializadas.

En el sector sanitario, por ejemplo, Gemini 3 puede analizar rayos X y resonancias magnéticas simultáneamente para asistir en diagnósticos más rápidos. La capacidad del modelo para comprender imágenes médicas complejas y correlacionarlas con información textual de historiales clínicos puede ayudar a los profesionales sanitarios a identificar patrones que podrían pasar desapercibidos.

En el ámbito de la manufactura y la industria, el modelo puede analizar transmisiones de registros de máquinas para anticipar fallos de equipos antes de que ocurran. Esto permite implementar estrategias de mantenimiento predictivo que reducen el tiempo de inactividad y los costes operativos.

Para empresas de medios de comunicación y podcasting, Gemini 3 puede generar automáticamente transcripciones y metadatos para contenido de audio, facilitando la catalogación y búsqueda de material. En el sector legal y financiero, puede realizar análisis de contratos, evaluación de riesgos y planificación financiera con un nivel de profundidad y precisión mejorado.

La ventana de contexto de un millón de tokens es especialmente valiosa para empresas. Esto significa que el modelo puede procesar y analizar cantidades enormes de información simultáneamente: códigos fuente completos, bibliotecas de documentos extensas o conjuntos de datos masivos, todo en una sola consulta.

El precio para desarrolladores y empresas es de 2 dólares por millón de tokens de entrada y 12 dólares por millón de tokens de salida (para indicaciones de hasta 200.000 tokens). Para contexto, un millón de tokens equivale aproximadamente a 750.000 palabras, mucho más de lo que la mayoría de aplicaciones necesitarán procesar en una sola interacción.

Casos de uso empresariales

Análisis multimodal para diagnósticos: combinar imágenes médicas (como rayos X o MRI), informes clínicos y datos de sensores para apoyar evaluaciones más rápidas.
Procesamiento de enormes volúmenes de datos operativos: como logs de maquinaria, imágenes de líneas de producción o llamadas de clientes, integrados en un único panel comprensible.
Planificación financiera: agentes capaces de analizar varios escenarios, procesar conjuntos de datos heterogéneos y generar informes comparativos.
Automatización de cadenas de suministro: desde previsión de demanda hasta optimización de rutas y ajustes en stock.
Evaluación contractual y legal: análisis de documentos extensos, resúmenes comparativos y detección de cláusulas sensibles.

Rediseño de la aplicación y mejoras en la experiencia de compra

Junto con las capacidades técnicas, Google ha renovado completamente el diseño de la aplicación Gemini. La nueva interfaz presenta un aspecto limpio y moderno que facilita iniciar conversaciones y encontrar contenido creado previamente.

Una de las novedades es la carpeta My Stuff (Mis cosas), donde los usuarios pueden localizar fácilmente todas las imágenes, vídeos e informes que han generado con Gemini. Eso soluciona un problema común de los asistentes de IA: la dificultad para recuperar contenido creado en sesiones anteriores.

La experiencia de compra también ha recibido mejoras sustanciales. Ahora, cuando realizas búsquedas relacionadas con productos, Gemini integra listados de productos, tablas comparativas y precios directamente desde Shopping Graph de Google, que incluye más de 50.000 millones de listados de productos. Esto convierte a Gemini en una herramienta útil no solo para obtener información, sino también para tomar decisiones de compra informadas.

Seguridad y desarrollo responsable

Google ha puesto especial énfasis en destacar que Gemini 3 es "el modelo más seguro hasta la fecha" de la compañía y que se ha sometido al "conjunto de evaluaciones de seguridad más exhaustivo de todos los modelos de IA de Google".

Las mejoras en seguridad son concretas. El modelo muestra menor tendencia a la adulación excesiva (esas respuestas demasiado complacientes que a veces dan los asistentes de IA), mayor resistencia a inyecciones de indicaciones maliciosas (intentos de manipular al modelo para que haga cosas no deseadas) y mejor protección contra el uso inadecuado en ciberataques.

Para garantizar la seguridad, Google ha colaborado con expertos de primer nivel y ha proporcionado acceso anticipado a organismos reguladores como el AISI del Reino Unido. También ha obtenido evaluaciones independientes de empresas especializadas en seguridad de IA como Apollo, Vaultis y Dreadnode.

Esta aproximación rigurosa a la seguridad es especialmente importante dado que Gemini 3 tiene capacidades agénticas: puede realizar acciones de forma autónoma, lo que requiere salvaguardas robustas para prevenir comportamientos no deseados o peligrosos.

Disponibilidad y precios para usuarios

Gemini 3 Pro está disponible desde hoy para diferentes tipos de usuarios:

Para usuarios generales: Se puede acceder gratuitamente a través de la aplicación Gemini en escritorio, móvil y web móvil. Los suscriptores de Google AI Pro y Ultra disfrutarán de límites de uso más altos. Google también está extendiendo su oferta de un año gratuito de Google AI Pro a estudiantes universitarios en Estados Unidos.
Para el Modo IA en Búsqueda de Google: Inicialmente disponible para suscriptores de Google AI Pro y Ultra en Estados Unidos, con planes de extenderlo a todos los usuarios estadounidenses próximamente.
Para desarrolladores: Acceso a través de Google AI Studio (con límites de uso gratuitos), la API de Gemini, Vertex AI para empresas, Google Antigravity y la CLI de Gemini. Los desarrolladores que necesiten mayor volumen pueden contratar planes de pago.
Para empresas: Disponible en Gemini Enterprise y Vertex AI.

En cuanto a Gemini 3 Deep Think, el modo de razonamiento avanzado, Google se está tomando más tiempo para realizar evaluaciones de seguridad adicionales y recoger opiniones de evaluadores antes de lanzarlo a los suscriptores de Google AI Ultra en las próximas semanas.

Una evolución progresiva

Para entender la magnitud del avance que supone Gemini 3, resulta útil repasar brevemente la evolución de la familia Gemini. La primera generación (Gemini 1) amplió los tipos de información que podían procesarse y su cantidad, permitiendo a los modelos trabajar con múltiples modalidades. Gemini 2 sentó las bases de las capacidades agénticas y amplió los límites del razonamiento, lo que permitió abordar tareas e ideas más complejas. De hecho, Gemini 2.5 Pro lideró la clasificación de LMArena durante más de seis meses.

Gemini 3 combina todas estas capacidades previas con un salto cualitativo en razonamiento y comprensión contextual. Como señala Pichai, la IA ha evolucionado de "simplemente leer texto e imágenes a leer el ambiente", captando matices, intenciones y contextos de forma mucho más sofisticada.

Próximos pasos

Google ha dejado claro que esto es solo el comienzo de la era Gemini 3. La compañía tiene previsto lanzar más modelos de la serie Gemini 3 próximamente, aunque no ha dado detalles específicos sobre qué novedades traerán o cuándo estarán disponibles.

Lo que sí está claro es la ambición de Google. En palabras de Sundar Pichai: "En esta nueva etapa, seguiremos ampliando las fronteras de la inteligencia, los agentes y la personalización para que la IA sea realmente útil para todos".

La compañía se posiciona claramente en la carrera por desarrollar lo que se conoce como inteligencia artificial general (AGI), sistemas de IA con capacidades cognitivas comparables a las humanas en una amplia variedad de tareas.

Por ahora, millones de usuarios en España y en todo el mundo pueden empezar a experimentar con Gemini 3 Pro y descubrir por sí mismos si estas mejoras se traducen en una experiencia notablemente superior, sí, más allá de comunicados de prensa o puntuaciones de las pruebas técnicas, tienen de verdad una utilidad práctica en el día a día de las personas.