Google ha llançat aquesta setmana una nova eina d’intel·ligència artificial (IA) anomenada Gemini, que ha presentat com més potent que qualsevol altra actualment en el mercat, incloent-hi el popular ChatGPT, creat per OpenAI, aliada amb Microsoft.
La companyia subratlla la “multimodalitat” de Gemini, en ser capaç de “raonar amb fluïdesa mitjançant textos, imatges, vídeo, àudio i codis”, a través del que es coneix com el model MMLU, sigles en anglès per a la “comprensió massiva de llenguatge multitasques”.
Gemini es presentarà en tres formats: Nano (la més senzilla, en forma d’aplicació per a telèfons mòbils), Pro i Ultra, aquesta última “la més potent per a tasques de gran complexitat”.
Gemini pot rebre informació visual o auditiva (notes de música, imatges, paraules) i des d’aquí generar contingut propi, que al seu torn pot ser en versió text, àudio o imatges.
En la presentació, Gemini és capaç de detectar errors en un problema matemàtic complex, donar la resposta correcta i explicar els passos fins a arribar a ella; o donar abundant informació sobre un animal (un ànec) a través d’un simple dibuix, incloent-hi la traducció d'”ànec” a cinc llengües.
Igualment, és capaç de “jugar” amb l’usuari en reptes tan populars com “pedra, paper o tisora” o el dels tres gobelets.
Gemini treballa amb els llenguatges de codi més habituals, com Java, Python, C++ i Go, segons els seus creadors, i encara que incorre en alguns errors, Google diu que els sap resoldre quan així se li comunica en el 90% dels casos.
El potencial de Gemini s’aplicarà al seu sistema actual de xat, conegut com a Bard i que funciona ja en diverses llengües, inclòs l’espanyol.
La companyia no ha aclarit com pensa monetitzar la nova eina, i de moment s’ha limitat a anunciar que estarà disponible a partir del 13 de desembre.