La carrera por tener la mejor inteligencia artificial (IA) continúa y en esta ocasión, Google ha anunciado su nuevo modelo de IA “más avanzado que ha desarrollado hasta la fecha”. Se trata de Gemini, un modelo de IA multimodal que podría convertirse en el rival directo de ChatGPT, el chatbot de la compañía OpenAI.
De acuerdo con un comunicado del gigante tecnológico, los encargados de la creación de Gemini fueron Google Deep Mind y Google Research.
“Esto es un hito importante en el desarrollo de la Inteligencia Artificial y el comienzo de una nueva era para Google, a medida que continúa innovando rápidamente y avanzando de manera responsable en las capacidades de cada uno de los nuevos modelos. Hasta el día de hoy, la compañía ha alcanzado grandes progresos con ‘Gemini‘ y seguirá trabajando arduamente para ampliar aún más sus capacidades para versiones futuras”, declaró el gigante tecnológico en su comunicado.
¿Cómo funciona Gemini?
Gemini, al ser un modelo de IA multimodal, tendrá la capacidad de “generar y comprender, operar y combinar a la perfección diferentes tipos de información, incluyendo texto, imágenes, audios, videos y lenguajes de programación”, informó Google en su comunicado.
De acuerdo con la compañía, el modelo será flexible, ya que los usuarios podrán usarlo desde cualquier dispositivo, ya sea un teléfono móvil o hasta en centros de datos.
Google informó que el modelo de Gemini está optimizado en tres dimensiones diferentes:
- Gemini Ultra: el modelo de mayor capacidad y tamaño para tareas complejas
- Gemini Pro: el mejor modelo para escalar una amplia gama de tareas
- Gemini Nano: el modelo más eficiente para tareas en dispositivos móviles.
Lo que hace diferente a Gemini de otros modelos, según detalló Google en su comunicado, es que de forma nativa fue entrenado en diferentes modalidades, con el fin de que cumpliera con todas las tareas de forma óptima. Es decir, puede describir imágenes, por ejemplo, y a su vez hacer un razonamiento conceptual y complejo sin ningún problema.
Además, para comprobar su rendimiento, se le realizaron varias pruebas al modelo con diferentes tareas como comprender imágenes, audio, video e incluso razonamiento matemático. Al final, los resultados arrojaron que el “desempeño de Gemini Ultra supera 30 de los 32 puntos de referencia académicos ampliamente utilizados en la investigación y el desarrollo de grandes modelos lingüísticos”, informó Google.
¿En dónde puedo usar Gemini?
Gemini 1.0 (la primera versión de este modelo) ya está disponible a partir de hoy para usuarios en más de 170 países y territorios, pero específicamente en inglés. Además, vale la pena destacar que el modelo estará disponible también en el dispositivo de Google, Pixel 8 Pro, el cual podrá ejecutar Gemini Nano.
Por otro lado, para clientes y desarrolladores estará disponible a partir del 13 de diciembre a través de la API de Gemini en Google AI Studio y en Vertex AI de Google Cloud. La herramienta de AI Studio será gratuita y le permitirá a los desarrolladores crear prototipos y lanzar aplicaciones de forma más rápida y sencilla. Por su parte, Vertex AI permitirá una personalización de Gemini.