Google lanza Gemini, su modelo de IA "más avanzado"

Google ha anunciado este miércoles 6 de diciembre de 2023 el lanzamiento de Gemini, su lenguaje de Inteligencia Artificial «más avanzado» y «más capaz», resultado del trabajo colaborativo a escala de múltiples equipos de Google, incluidos DeepMind y Google Research.

Según informa la compañía en una nota de prensa enviada a los medios de comunicación, ha optimizado Gemini 1.0, la primera versión del modelo, en tres diferentes tamaños, que son los siguientes:

Gemini Ultra: es el modelo «más potente y de mayor tamaño, para tareas de gran complejidad»
Gemini Pro: es el «mejor modelo para escalar en una amplia gama de tareas»
Gemini Nano: se trata de su «modelo más eficiente para ejecutar tareas directamente en un dispositivo»

Como explica Google, «Gemini es un modelo de IA multimodal, lo que significa que puede generalizar y comprender, operar y combinar a la perfección distintos tipos de información, como texto, imágenes, audio, vídeo y lenguajes de código».

Asimismo, explica que también es su «modelo más flexible hasta el momento, capaz de ejecutarse de manera eficiente en todo, desde dispositivos móviles hasta centros de datos». Por ello prevé que «Gemini mejorará significativamente la forma en que los desarrolladores y clientes empresariales construyen y escalan con IA».

Después de esta noticia, recordamos que Google anunció hace unos meses la expansión de Bard a países como España.

Gemini, lenguaje de Inteligencia Artificial de Google multimodal nativo

Según explica la nota de prensa de Google, «hasta ahora, el enfoque para crear modelos multimodales implicaba entrenar componentes separados para diferentes modalidades y luego unirlos para imitar parte de dichas funcionalidades». En su opinión, «a veces, estos modelos pueden ser buenos para realizar determinadas tareas, como describir imágenes, pero tienen dificultades con un razonamiento más conceptual y complejo».

Por eso, la compañía afirma que ha creado Gemini «para que fuera multimodal de forma nativa: entrenado desde el principio en diferentes modalidades». Luego, defiende que lo ha perfeccionado «con datos multimodales adicionales para perfeccionar aún más su eficacia».

«Esto ayuda a Gemini a comprender y razonar perfectamente sobre todo tipo de entradas desde cero, mucho mejor que los modelos multimodales existentes, y sus capacidades son de última generación en casi todos los dominios», explica.

De cara a este lanzamiento, la compañía informa de que ha estado probando «rigurosamente» sus modelos Gemini y evaluando su desempeño en una amplia variedad de tareas. «Desde la comprensión de imágenes naturales, audio y video hasta el razonamiento matemático; el desempeño de Gemini Ultra supera los resultados actuales de última generación en 30 de los 32 puntos de referencia académicos, ampliamente utilizados en la investigación y en el desarrollo de grandes modelos de lenguaje», apunta.

Usuarios del lenguaje de Inteligencia Artificial Gemini

El comunicado de prensa de Google también detalla que Gemini 1.0 «ya está disponible en una amplia gama de productos y plataformas».

Para consumidores

Bard con una versión afinada de Gemini Pro está disponible desde el 6 de diciembre de 2023 en inglés en más de 170 países y territorios, «lo que supone la mayor mejora de calidad de Bard desde su lanzamiento, con mejoras en el resumen, brainstorming, escritura y planificación».
Google también está incorporando Gemini en Pixel 8 Pro, impulsando nuevas funciones como Resumir en la Grabadora y Respuesta Inteligente en Gboard.
En los próximos meses, Gemini estará disponible en más productos y servicios como Search, Ads, Chrome y Duet AI.

Para desarrolladores

A partir del 13 de diciembre de 2023, los desarrolladores y clientes (empresas) podrán acceder a Gemini Pro mediante la API de Gemini a través de Google AI Studio y Vertex AI.
- Google AI Studio es una herramienta gratuita para desarrolladores basada en la web que ayuda a los desarrolladores y clientes empresariales a crear prototipos y lanzar aplicaciones rápidamente con una clave API;
- Cuando es el momento de tener una plataforma de IA totalmente administrada, Vertex AI «permite la personalización de Gemini con control total de datos y se beneficia de funciones adicionales de Google Cloud para seguridad empresarial, privacidad y gobernanza y cumplimiento de datos».

Los desarrolladores de Android también podrán crear con Gemini Nano, el modelo de Google «más eficiente para tareas en el dispositivo, a través de AICore. AICore es una nueva capacidad del sistema, disponible en Android 14, a partir de dispositivos Pixel 8 Pro».
Gemini Ultra estará disponible a través de un programa de acceso anticipado para desarrolladores, socios y empresas seleccionadas, con el objetivo de «recibir comentarios y mejores, antes de abrirlo a desarrolladores y empresas de manera más extendida a principios del año que viene».
- A principios del próximo año, Google lanzará Bard Advanced, «una nueva experiencia de IA de vanguardia que da acceso a nuestros mejores modelos y capacidades, comenzando con Gemini Ultra».

La nota de prensa concluye afirmando que el lanzamiento de Gemini es «un hito importante en el desarrollo de la IA y el comienzo de una nueva era en Google a medida que continúa innovando de forma rápida y responsable las capacidades de sus modelos». «Hemos logrado grandes avances en Gemini hasta la fecha y estamos trabajando para ampliar aún más sus capacidades para versiones futuras», finaliza.