Open AI et Google se livrent à une bataille de pouvoir pour savoir qui peut fournir les outils d’IA les plus récents et les plus performants.
Mais quels sont les outils d’IA qui l’emportent ?
Découvrons-le.
Dernière mise à jour de ChatGPT
La dernière mise à jour de ChatGPT est une mise à jour d’un modèle appelé GPT-4o. Le o de GPT-4o signifie omni.
Le GPT-4o est censé fonctionner deux fois plus vite et être 50 % moins cher que le modèle précédent, le GPT-4 Turbo. D’après mes premiers essais, la qualité des résultats est légèrement meilleure, car ils sont plus succincts et vont droit au but, ce que de nombreux modèles ne parviennent pas à faire. Les personnes qui utilisent beaucoup le GPT4 remarqueront surtout la différence de coût.
La plus grande nouveauté est que ce modèle sera gratuit et que le ChatGPT gratuit sera mis à jour de GPT3.5 à GPT-4o.
Open AI a également présenté sa nouvelle application de bureau et ses nombreuses applications. Regardez l’exemple ci-dessous d’une personne qui se prépare à un entretien.
Comme vous pouvez le constater, vous pouvez désormais avoir une conversation (presque) régulière avec l’application et vous pouvez interagir avec elle de différentes manières. Vous pouvez également utiliser votre appareil photo pour inclure votre environnement comme source d’information.
Cela pourrait être très utile :
- Traduire des menus/enseignes dans un pays étranger
- Utilisez l’application comme traducteur en temps réel
- Obtenez un retour d’information sur vos devoirs
- Demander conseil dans une situation difficile
- vous aider à garder votre calme si vous vous sentez anxieux
- Vous tenir compagnie lorsque vous vous sentez seul
Bien que cela puisse paraître étrange aujourd’hui, nous verrons certainement des personnes avoir des conversations complètes avec l’application d’IA sur leur téléphone dans un avenir proche.
Les dernières mises à jour de l’IA de Google
Google a également annoncé de nombreuses mises à jour en matière d’IA lors de sa conférence Google IO. La plupart d’entre elles consistent en des intégrations d’IA dans ses produits tels que Google Search, Gmail et Google Meet.
Il y a eu plus de 20 annonces, dont voici la liste :
- Effets musicaux : Un modèle de texte qui transforme les invites textuelles en pistes musicales. Il permet aux utilisateurs d’ajouter et de mélanger différents instruments à l’aide de commandes textuelles.
- Application Gemini : Une nouvelle application disponible sur iOS et Android avec des améliorations importantes de l’IA.
- Aperçus de l’IA dans les recherches : Des aperçus générés par l’IA pour les résultats de recherche, déployés aux États-Unis et bientôt dans le monde entier.
- Demandez des photos dans Google Photos : Recherche assistée par ordinateur dans Google Photos pour trouver des éléments spécifiques tels qu’une plaque d’immatriculation dans les photos.
- Fenêtre contextuelle de Google Gemini : Augmentation de la fenêtre contextuelle pour Google Gemini de 1 million de jetons à 2 millions de jetons pour les développeurs et les utilisateurs avancés.
- Mises à jour de l’espace de travail Google : Nouvelles fonctionnalités d’intelligence artificielle dans Google Workspace, notamment le résumé des e-mails dans Gmail et des réunions dans Google Meet.
- Notebook LM avec génération audio : Outil Notebook LM amélioré avec des capacités de génération audio pour un contenu audio personnalisé à partir de documents textuels.
- Agents d’intelligence artificielle : Agents d’intelligence artificielle dotés de capacités de raisonnement, de planification et de mémoire pour les processus à plusieurs étapes et l’intégration avec d’autres systèmes logiciels.
- Gemini 1.5 Flash de Google DeepMind : un nouveau modèle de langage léger et rapide avec une fenêtre contextuelle d’un million de jetons, disponible à des fins de test dans Google AI Studio.
- Projet Astra : Un assistant de conversation universel doté de capacités de vision pour les tâches quotidiennes.
- Modèle texte-image Imagine 3 : Un nouveau modèle texte-image qui génère des images photoréalistes et permet une édition détaillée.
- Bac à sable de l’IA pour la musique : Une suite d’outils d’IA destinés aux musiciens pour créer de la musique.
- Génération de texte à partir de vidéos (Veo) : Un nouveau modèle de génération de texte à partir de la vidéo, avec des démonstrations préliminaires disponibles et une liste d’attente pour les tests.
- Nouveau matériel (TPU, CPU, GPU) : Annonces de la sixième génération de TPU (Trillium), de CPU ARM personnalisés (Axion) et de GPU Nvidia Blackwell.
- Raisonnement en plusieurs étapes dans la recherche : L’IA traite les requêtes de recherche complexes en les décomposant en étapes et en fournissant des résultats détaillés.
- Panneau S dans Google Workspace : Automatisation de l’IA pour les applications de l’espace de travail, intégration des données des courriels dans des feuilles organisées.
- Coéquipiers IA : Agents d’IA affectés à des tâches spécifiques au sein d’équipes, capables de suivre des projets et de synthétiser des informations.
- Analyse de données dans Gemini Advance : Capacités d’analyse de données alimentées par l’IA pour Gemini Advance, avec la prise en charge de 35 langues et une fenêtre contextuelle de 2 millions de jetons.
- Entourer pour rechercher : Fonctionnalité d’IA permettant aux utilisateurs d’encercler des éléments dans une application pour rechercher des informations ou résoudre des problèmes spécifiques.
- Poly Gemini : un nouveau modèle de langage de grande taille à source ouverte avec des capacités de vision, avec une version prochaine de Gemini 2.
Comme vous pouvez le constater, les mises à jour sont nombreuses. Ils sont tous un peu cool, mais il est difficile de savoir lesquels nous utiliserons vraiment.
S’ils vont de l’avant avec les aperçus d’IA, qu’ils ont déclaré commencer à diffuser cette semaine aux États-Unis, cela pourrait constituer un énorme problème pour les éditeurs sur le web. Il semble que Google ait l’intention de ne plus afficher autant de liens vers des sites web qu’auparavant, mais plutôt de montrer plus de publicités, plus de vidéos, plus de Reddit et, surtout, plus de réponses générées par l’IA.
Si vous souhaitez savoir si une réponse sur Google, ou un message sur Reddit, LinkedIn ou tout autre site web a été généré par l’IA, vous pouvez utiliser un outil de détection de contenu d’IA tel que Winston AI.
Tout ce que vous avez à faire, c’est de copier le texte du site web ou du résultat de la recherche comme suit :
Puis testez-le avec notre application :
Le site web que j’ai testé a obtenu un score de 100 % de texte rédigé par des humains. L’avantage de Winston AI est que nous avons un taux de précision de 99,98 % dans la détection des contenus d’IA.
Chaque secteur est transformé par l’IA et vous pouvez le constater de plus en plus avec ces mises à jour. La musique et les vidéos d’IA se développent à une vitesse fulgurante.
Quelle est la prochaine étape ?
Dans l’ensemble, les mises à jour de Google ne semblent toujours pas avoir le facteur d’attraction de l’Open AI. ChatGPT reste l’outil d’IA le plus célèbre et le plus influent en ligne, et les dernières mises à jour d’OpenAI ne devraient pas changer la donne.
Le rythme du changement est époustouflant, mais vous ne devez pas vous sentir anxieux. Les fonctionnalités et les outils les plus étonnants seront toujours diffusés par le bouche-à-oreille et vous remarquerez les changements qui se produisent peu à peu.