Google muestra su nueva IA Gemini
Google está lanzando lo que considera su modelo de inteligencia artificial más grande y capaz este miércoles, ya que la presión sobre la compañía aumenta para que explique cómo monetizará la inteligencia artificial.
El modelo de lenguaje grande, Gemini, incluirá una suite de tres tamaños diferentes: Gemini Ultra, su categoría más grande y capaz; Gemini Pro, que se escala para realizar una amplia variedad de tareas; y Gemini Nano, que se utilizará para tareas específicas y dispositivos móviles.
Por ahora, la compañía planea licenciar Gemini a clientes a través de Google Cloud para que lo utilicen en sus propias aplicaciones. A partir del 13 de diciembre, los desarrolladores y clientes empresariales podrán acceder a Gemini Pro a través de la API de Gemini en Google AI Studio o Google Cloud Vertex AI. Los desarrolladores de Android también podrán construir con Gemini Nano. Gemini también se utilizará para alimentar productos de Google como su chatbot Bard y la experiencia generativa de búsqueda, que intenta responder a las consultas de búsqueda con texto de estilo conversacional (SGE aún no está ampliamente disponible).

Las empresas podrían utilizarlo para un compromiso más avanzado en el servicio al cliente a través de chatbots y recomendaciones de productos, así como para identificar tendencias para aquellas empresas que deseen publicitar productos. Gemini también podría utilizarse para la creación de contenido si una empresa quiere desarrollar campañas de marketing o contenido de blogs, así como para aplicaciones de productividad que deseen resumir reuniones o generar código para desarrolladores.
La empresa dio ejemplos que incluyen mostrar cómo Gemini puede tomar una captura de pantalla de un gráfico y analizar cientos de páginas de investigación para luego actualizar el gráfico. Otro ejemplo fue analizar una foto de los deberes de matemáticas de una persona e identificar respuestas correctas y señalar las incorrectas.
Gemini Ultra es el primer modelo que supera a expertos humanos en MMLU (comprensión masiva del lenguaje multitarea), que utiliza una combinación de 57 temas como matemáticas, física, historia, derecho, medicina y ética para evaluar tanto el conocimiento del mundo como las habilidades para resolver problemas, según indicó la compañía en una publicación de blog el miércoles. Supuestamente, puede entender la sutileza y el razonamiento en temas complejos.
Durante la conferencia telefónica de ganancias del tercer trimestre de Google en octubre, los inversionistas hicieron más preguntas a los ejecutivos sobre cómo convertirán la inteligencia artificial en ganancias reales.
En agosto, Google lanzó un «experimento temprano» llamado Search Generative Experience, o SGE, que permite a los usuarios ver cómo sería una experiencia generativa de inteligencia artificial al usar el motor de búsqueda; la búsqueda sigue siendo un centro importante de beneficios para la empresa. El resultado es más conversacional, reflejando la era de los chatbots. Sin embargo, aún se considera un experimento y aún no se ha lanzado al público en general.
Los inversionistas han estado pidiendo un cronograma para SGE desde mayo, cuando la empresa anunció por primera vez el experimento en su conferencia anual para desarrolladores, Google I/O. El anuncio de Gemini el miércoles apenas mencionó a SGE, y los ejecutivos fueron vagos acerca de sus planes para lanzarlo al público en general, diciendo que Gemini se incorporaría a él «en el próximo año».
«Esta nueva era de modelos representa uno de los mayores esfuerzos científicos e ingenieriles que hemos emprendido como empresa», dijo Pichai en la publicación del blog del miércoles. «Estoy genuinamente emocionado por lo que viene y por las oportunidades que Gemini desbloqueará para las personas en todas partes».
Fuente: cnbc
