Intro : Google Geminin
L’intelligence artificielle (IA) est plus que jamais omniprésente dans notre vie quotidienne. Ces dernières années, la lutte entre des entreprises comme Google, Microsoft et OpenAI concernant le développement d’outils d’IA générative est devenue très vive. Dès qu’OpenAI a introduit ChatGPT en 2023, Microsoft lui a emboîté le pas avec Copilot (anciennement Bing Chat), et Google lui a rapidement emboîté le pas avec sa propre application de chat, Google Gemini, qui était initialement connue sous le nom de Google Bard, et qui n’est désormais plus utilisée exclusivement pour la génération de texte pour répondre à une requête spécifique ou vous aider à résoudre des problèmes logiciels. Vous pouvez également l’utiliser pour créer et générer des images sur la base d’invites, de requêtes textuelles ou de phrases descriptives que vous saisissez. Voici comment procéder dans les lignes qui suivent..
Créer des photos avec Google Gemini?
Lorsque ChatGPT, Copilot et Gemini feront leurs débuts en 2023, les trois applications seront basées sur ce que l’on appelle des modèles de langage à grande échelle (LaMDA) et se limiteront initialement à simuler des conversations humaines en générant individuellement des scripts de texte pour répondre aux questions et aux invites des humains. améliorer les performances des utilisateurs et effectuer des tâches telles que le débogage et le brainstorming. En septembre 2023, OpenAI a intégré avec succès l’outil de création d’images DALL-E 3 AI dans ChatGPT, afin que les utilisateurs qui s’abonnent au service payant ChatGPT Plus puissent demander au robot de les aider à créer des images IA.
Il a fallu du temps à Google pour enfin lancer son nouvel outil de création d’images Imagen 2 et l’intégrer à Google Bard, et en plus d’être facile à utiliser, ce qui le distingue de ses pairs est qu’il est totalement gratuit. Avec ces mises à jour et améliorations, Google Bard est devenu Google Gemini. Dans cet article, nous vous donnons un guide détaillé sur l’utilisation de l’IA pour créer des photos sur Google Gemini, ainsi que quelques conseils pour obtenir les meilleurs résultats de l’application.
Qu’est-ce que le nouvel outil Imagen 2 de Google Gemini ?
En mai 2022, Google a lancé pour la première fois Imagen, un modèle d’IA capable de créer des images à partir de descriptions textuelles écrites, la même fonction exécutée par plusieurs autres outils d’IA générative tels que DALL-E 2, Midjourney et Stable Diffusion. La première version bêta d’Imagen est intégrée à l’application AI Test Kitchen, permettant aux utilisateurs d’utiliser l’IA pour créer des images de paysages et de personnages de dessins animés. Google a continué à développer et à améliorer ce modèle jusqu’au 13 décembre 2023, date àlaquelle il a annoncé la sortie d’une deuxième version de son outil de conversion de texte en image par IA, appelée Imagen 2.
Comment créer des photos d’IA avec Gemini ?
La version initiale d’Imagen 2 était principalement destinée aux développeurs et aux entreprises, mais grâce à l’intégration de l’outil dans l’application gratuite Google Gemini, qui présente une interface utilisateur simple et intuitive, tout le monde, y compris les personnes non initiées, peut essayer l’outil et l’utiliser pour créer des images d’intelligence artificielle de manière totalement gratuite.
Il vous suffit d’ouvrir l’application Google Gemini sur votre téléphone ou de vous rendre sur gemini.google.com sur le web, de vous connecter à l’aide de votre compte Google et, une fois que vous avez accepté les conditions d’utilisation et de confidentialité, vous accédez automatiquement à la fenêtre de discussion avec le robot.
Dans le champ de texte situé en bas de cette fenêtre, vous pouvez saisir la description du texte que vous souhaitez transformer en image d’IA, précédée du mot « Créer » ou « Générer », afin d’obtenir une image d’IA et non une image qui existe déjà sur les moteurs de recherche, et appuyer sur le bouton « Entrée » après avoir terminé de saisir la description.
Notez que Google Gemini ne peut générer des images d’IA qu’à partir de textes rédigés en anglais. Vous pouvez également saisir vos invites à la voix au lieu de taper le texte manuellement en cliquant sur l’icône du microphone qui apparaît d’un côté du champ de texte. L’application reconnaîtra les mots et les convertira en texte écrit grâce à la fonction de reconnaissance vocale intégrée à Google Gemini.
Que vous saisissiez vos commandes sous forme de texte ou de voix, vous devrez attendre quelques secondes pour que Google Gemini génère les images. Au final, vous obtiendrez quatre images générées par l’IA, parmi lesquelles vous pourrez choisir la meilleure à télécharger et à enregistrer sur votre ordinateur ou votre téléphone. Si les résultats ne sont pas satisfaisants, vous pouvez cliquer sur le bouton « Générer plus » situé juste en dessous des quatre images pour que l’application génère deux images supplémentaires, ou vous pouvez écrire une nouvelle demande dans le champ de texte avec plus de détails et une description plus précise de l’image souhaitée.
Vous pouvez également optimiser les résultats en utilisant une image de référence qui existe déjà sur votre ordinateur ou votre téléphone pour que Google Gemini crée des images similaires, en cliquant sur l’icône « Télécharger une image », qui apparaît d’un côté du champ de texte, puis en localisant l’image de référence sur votre appareil, en sélectionnant l’image que vous souhaitez utiliser et en appuyant sur le bouton « Entrée ».
Google Gemini marque toutes les images qu’il crée d’un filigrane SynthID qui n’est pas visible à l’œil nu, mais qui peut être facilement reconnu par les outils d’intelligence artificielle, ce qui garantit un mécanisme efficace de détection des contenus falsifiés et trompeurs et minimise les abus de la technologie. Si les résultats vous conviennent, vous pouvez télécharger et enregistrer les images sur votre appareil, les partager avec d’autres personnes ou les exporter vers votre adresse électronique.
Pour télécharger l’image sélectionnée, maintenez simplement votre curseur sur l’image, puis cliquez sur l’icône de la flèche orientée vers le bas qui apparaît dans le coin supérieur droit de l’image à télécharger. Vous pouvez également télécharger toutes les images que vous avez obtenues en lot au lieu de les télécharger individuellement en cliquant sur le bouton Partager qui apparaît dans la barre d’outils sous le bouton Générer plus, puis en sélectionnant Télécharger toutes les images.
Conseils importants :
La qualité des résultats obtenus à l’aide de différents outils de création d’images d’IA peut varier, mais il convient de garder à l’esprit certaines remarques lors de l’utilisation de ces outils afin d’obtenir les meilleurs résultats possibles. Dans le cas de la création d’images d’IA à l’aide de Google Gemini, nous pouvons obtenir les meilleurs résultats possibles si nous veillons à respecter les points suivants :
1- Veillez à écrire « Créer » ou « Générer » avant la description du texte que vous souhaitez transformer en image AI, ce qui est une condition préalable pour que l’application n’affiche pas une image déjà existante sur le web au lieu de créer une toute nouvelle image AI.
2- Veillez à ce que les invites comprennent une description précise de l’image à créer par l’IA. Plus vous ajoutez de détails à vos invites, tels que les éléments, les couleurs, l’éclairage et l’angle de la caméra, plus vous avez de chances d’obtenir de meilleurs résultats.
3- Lorsque vous rédigez vos commandes, veillez à mentionner le style artistique ou le type d’image que vous voulez que l’IA crée, par exemple en demandant au robot de créer l’image dans un style de portrait, un style d’art cubiste ou selon le style de l’école influente. Si vous devez créer des peintures, vous pouvez mentionner le nom d’un artiste visuel célèbre afin que l’image soit créée dans un style similaire à celui de ses peintures.
4- Utilisez des images de référence dans la mesure du possible. Au lieu de rédiger une description détaillée, vous pouvez télécharger des exemples d’images similaires à ce que vous souhaitez et demander à Google Gemini d’apporter les modifications nécessaires à l’image.
5- Il est probable que vous n’obtiendrez pas un résultat satisfaisant dès le premier essai. Vous ne devez donc pas vous arrêter à la première série d’images créées par l’application, mais essayer de modifier vos requêtes en les détaillant davantage et en ajoutant des instructions directes à l’application, par exemple en lui demandant d’utiliser des couleurs plus vives ou de donner à l’image un aspect plus réaliste.
6- Actuellement, Gemini ne peut répondre qu’aux demandes en anglais, donc si vous ne connaissez pas suffisamment de phrases et de vocabulaire anglais pour décrire précisément ce que vous voulez, il est préférable d’utiliser un outil de traduction tel que Google Translate, où vous écrivez la description en arabe sur la page Google Translate, puis copiez la traduction que vous avez obtenue en anglais dans le champ de texte de l’application Google Gemini.
Conclusion :
Il est difficile de dire que l’outil Imagen 2 inclus dans l’application Google Gemini est la meilleure façon de créer des photos en utilisant l’intelligence artificielle, car il a encore des capacités limitées par rapport à d’autres outils qui remplissent la même fonction, tels que Dall- E 3 et Midjourney. E3 et Midjourney, par exemple, ne peuvent pas éditer des photos de personnes, mais la chose la plus importante qui distingue cet outil est qu’il est entièrement gratuit, contrairement à Midjourney, qui est l’une des meilleures applications de création de photos à l’aide de l’IA, mais qui est très coûteuse car elle nécessite un abonnement mensuel pour l’utiliser Imagen 2 est intégré à l’application Google Gemini, qui présente une interface utilisateur très simple et est disponible dans plus de 40 langues et dans plus de 230 pays et régions du monde, ce qui rend l’outil facile à utiliser et accessible à tous.