IA - AI

Google Gemini 2.5 Pro : le nouveau modele qui surpasse GPT-4o sur tous les benchmarks

Google lance Gemini 2.5 Pro, son modele d’IA le plus avance, qui surpasse GPT-4o sur les principaux benchmarks et offre une fenetre de contexte de 2 millions de tokens.

Published

on

Google vient de frapper un grand coup dans la course a l’intelligence artificielle. Avec le lancement de Gemini 2.5 Pro, la firme de Mountain View affirme avoir developpe le modele de langage le plus performant jamais concu, depassant les resultats de GPT-4o d’OpenAI sur la quasi-totalite des tests de reference.

Des performances inedites sur les benchmarks

Les chiffres parlent d’eux-memes. Sur le benchmark MMLU, qui mesure la comprehension et le raisonnement dans 57 domaines differents, Gemini 2.5 Pro obtient un score de 92,3 %, contre 88,7 % pour GPT-4o. En mathematiques, le modele de Google excelle particulierement avec un score de 96,1 % sur le test GSM8K, etablissant un nouveau record dans le secteur.

Mais c’est surtout en matiere de raisonnement que Gemini 2.5 Pro se distingue. Le modele est capable de resoudre des problemes complexes necessitant plusieurs etapes de reflexion, une capacite qui etait jusqu’ici le point fort revendique par OpenAI avec sa serie o1. Google a integre un mode de reflexion approfondie baptise « Deep Think » qui permet au modele d’analyser un probleme sous plusieurs angles avant de formuler sa reponse.

Une fenetre de contexte geante

L’un des atouts majeurs de ce nouveau modele reside dans sa fenetre de contexte etendue a 2 millions de tokens. Concretement, cela signifie que Gemini 2.5 Pro peut traiter l’equivalent de plusieurs livres en une seule requete, ce qui ouvre la voie a des applications jusqu’ici inaccessibles : analyse de documents juridiques volumineux, comprehension de bases de code entieres ou encore synthese de rapports de recherche exhaustifs.

Le multimodal comme standard

Fidele a la strategie de Google, Gemini 2.5 Pro est nativement multimodal. Le modele traite indifferemment le texte, les images, l’audio et la video, avec une comprehension fine de chaque modalite. Lors d’une demonstration, les ingenieurs de Google ont montre le modele analysant une video de 45 minutes et repondant a des questions precises sur des details visuels et sonores apparus a des moments specifiques.

Cette capacite multimodale native constitue un avantage concurrentiel significatif face a OpenAI, dont les modeles traitent encore les differentes modalites de maniere plus cloisonnee.

Disponibilite et tarification

Gemini 2.5 Pro est disponible des maintenant via l’API Google AI Studio ainsi que dans Google Workspace pour les abonnes Business et Enterprise. La tarification s’aligne sur celle de GPT-4o, avec un cout de 3,50 dollars par million de tokens en entree et 10,50 dollars en sortie. Une version gratuite limitee est egalement accessible via le chatbot Gemini pour le grand public.

Avec ce lancement, Google confirme que la course a l’IA generative est loin d’etre terminee. Reste a voir comment OpenAI et Anthropic reagiront dans les semaines a venir pour maintenir leur position sur ce marche en pleine effervescence.

Leave a Reply

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Trending

Quitter la version mobile