Ce soir, Google organisait son grand raout annuel, Google I/O. Et cette année, le mot à la mode était évidemment IA, avec Gemini 1.5. D'ailleurs, si vous attendiez des nouvelles d'Android 15, mauvaise nouvelle : la nouvelle version de l'OS ne sera détaillée que lors de la seconde journée de la Google I/O 2024.
Sundar Pichai, présent sur scène devant de nombreux développeurs, a bien expliqué que Gemini allait être intégré dans tous les services, comme Google Photos. Une nouvelle fonction, Ask Photos, va permettre d'effectuer des recherches sur le contenu de vos photos de façon simple, en langage naturel.
Sundar Pichai annonce ensuite les Agents, une sorte d'assistant capable d'effectuer certaines tâches pour vous. Un des exemples est le retour d'une paire de chaussures trop petites, avec un assistant qui va effectuer les étapes nécessaires (mais pas aller poster le colis). Google met bien en avant que l'assistant travaille sous notre supervision. Dans Gmail, il sera possible de résumer des emails, si vous recevez un message un peu long.
Projet Astra
Google présente un nouveau produit, le projet Astra. Il s'agit d'un agent pour la vie de tous les jours, qui a été montré avec des lunettes connectées. Quelques exemples montrent l'assistant qui décrit des images, parfois avec un contexte à deviner, comme le chat de Schrödinger.
Google annonce aussi Imagen 3, un générateur d'image qui — enfin — est capable de générer du texte correctement (nous allons croire Google). Dans la même veine, une partie de la conférence met l'emphase sur la musique mais aussi sur la génération de vidéos à partir de texte.
Trilium, la nouvelle génération de TPU
Google annonce son nouveau TPU (Tensor Processing Unit), Trilium, et rappelle qu'Axion, son système sur puce pour les serveurs, existe. Sundar Pichai montre aussi que les serveurs de la société emploient un refroidissement liquide. Trilium, 4,7x plus rapide que les puces actuelles pour l'IA, sera disponible en fin d'année 2024 pour les clients cloud.
Google a sa propre puce pour les serveurs, Axion
Une intégration dans la recherche
Pour la recherche, Google tente de se redéfinir, avec des exemples frappants (en espérant que cette année, ils ne soient pas simulés). Un des exemples montre une personne en train de filmer une platine en posant une question directement au smartphone, et l'IA de Google donne une réponse qui semble correcte. C'est évidemment un cas d'usage un peu particulier, mais l'intégration des outils semble bonne. D'autres exemples montrent que l'IA peut chercher des recettes, par exemple.
De façon plus large, l'idée est de proposer une réponse à une question, sans nécessairement renvoyer l'utilisateur vers des sites Internet, mais aussi de permettre d'améliorer peu à peu une question, en étant de plus en plus précis, en laissant l'IA se débrouiller.
Gemini Live
Google annonce une application Gemini Live, avec laquelle vous pouvez discuter en temps réel. L'intégration du projet Astra, plus tard dans l'année, devrait permettre d'analyser de la vidéo.
En parallèle, la société montre aussi les Gems, qui peuvent se résumer à un Gemini personnalisé pour un usage précis.
Pour les Français, bonne nouvelle : Gemini Advanced arrive en France dans un abonnement à 22 € par mois, qui donne accès aux intégrations liées à Gmail mais aussi à 2 To de stockage dans le cloud.
Une intégration dans Android
Google annonce qu'Android 15 va intégrer Gemini et que la fonction Circle to Search (Encercler pour Rechercher) allait être déployée sur de nombreux appareils (200 millions d'ici fin 2024 selon Google). Gemini Nano (le LLM pas si large, du coup) va être intégré dans plus d'appareils et gagne la possibilité d'analyser des images. De même, dans une présentation très visuelle, il est capable de vous prévenir si un appel est du spam (sinon, les applications Orange font le job).
Astuce : avoir la fonction « Encercler pour chercher » des téléphones Android sur iPhone
Pour une IA responsable
Un des derniers intervenants, nous parle du fait qu'un grand pouvoir implique de grandes responsabilités (à peu près). Google indique que SynthID, qui permet de détecter des images générées par IA, va être adapté pour effectuer la même tâche pour le texte, avec une implémentation open source.
Pour terminer, Sundar Pichai montre que son IA a appris à compter : elle indique qu'il a prononcé le mot IA 120... 121 fois. Une valeur à vérifier une fois le replay de la conférence en ligne.