La Révolution de la création assistée par ordinateur

Les images et les vidéos générées artificiellement envahissent le secteur de la communication. Il est essentiel que nous utilisions cette technologie de manière éthiquement responsable, affirme Jens Krahe.

 

La révolution des images générées artificiellement a dépassé le point de non-retour : nous pouvons tous déjà créer des images artificielles  grâce aux générateurs d'images librement accessibles dans DALL-E 2 et Midjourney, ou par le biais de Stable Diffusion en solution open source. A la base de cette révolution, ce qu’on appelle un "prompt" : une description textuelle en anglais qui peut être élaborée par des croquis. On peut supposer que d’ici 3 ans au plus tard, les créations générées par ordinateur feront partie du travail quotidien des agences et des entreprises. Cette technologie fascinante transcende toutes les limites de la créativité visuelle. Non seulement le processus est extrêmement rapide, mais son développement le sera tout autant. Elle met en effet fin à la recherche laborieuse dans des bases de données d'images pour illustrer des présentations PowerPoint ou visualiser des idées créatives et des campagnes dans Photoshop.

 

L'interprétation des mots définira l'image

 

Cela semble si simple de saisir un texte pour générer une image. Cependant, dans la pratique, ce n'est pas aussi simple que cela, car le « prompt » est censé fonctionner de sorte que la technologie utilisée le comprenne et génère l'image attendue. L'ajout d'esquisses ou d'images peut influencer activement la génération de l'image et favoriser la qualité de l’image et son résultat créatif. Pour cela, les créateurs d'images doivent apprendre quelles entrées de texte et quels dessins produisent les meilleurs résultats. 

Cet exercice devient particulièrement difficile lorsqu’on recherche des termes pour illustrer des valeurs de marque abstraites telles que la confiance, la sécurité ou la finalité. C'est la raison pour laquelle il existe des portails tels que "PromptHero", qui fournissent gratuitement des messages-guides issus de partages d’expériences en matière de texte, ou des plateformes telles que "PromptBase", qui est basé sur un modèle d’entreprise.

Mais il faut également savoir qu’un « prompt » dans DALL-E ne donnera pas nécessairement le même résultat dans Midjourney.  En effet, l'image obtenue ne dépend pas uniquement du nombre de termes mentionnés, mais aussi du modèle sous-jacent d’interprétation des termes. Les spécialistes des “prompts” doivent donc se familiariser avec le plus grand nombre possible de systèmes différents.

Comme les “prompts” peuvent aussi concerner la création de vidéos, en plus de mots clés descriptifs et efficaces, des story-boards adaptés seront nécessaires ; ces derniers pouvant significativement  améliorer la qualité. 

À l'avenir, cette technologie pourrait être en mesure de générer des mondes entiers en 3D et prendre part au Metaverse. L'expérience serait comparable à celle d'un Holodeck , qui serait chargé et généré selon la description d’un « prompt ». Même si ici aussi, il serait nécessaire d'entrer des termes corrects. 

 

 

Inconvénients et dangers de la technologie

 

Mais ce monde infini des images et des vidéos générées par ordinateur a aussi sa part d'ombre. Par exemple, les droits d'auteur et les droits d'utilisation des motifs d'images et des séquences filmées préexistants que les systèmes s'approprient pour créer du nouveau matériel n'ont pas encore été clarifiés. D’ailleurs, les droits d'auteur pour les créations demeurent encore flous. À ce jour, seul DALL-E a stipulé que les droits d'image appartiennent au créateur.

Ajoutons à cela que les générateurs d'images ne sont bons qu'à hauteur de leur propre formation ; le processus d'apprentissage des générateurs se basant uniquement sur des données d'images ou de 3D. Aussi il est donc à craindre que les motifs artistiques et les clips vidéo produits soient biaisés, par exemple empreints de préjugés sociaux, excluant certains groupes de population ou dépeignant ces groupes sous un faux jour. 

Les entreprises et les agences ont donc le devoir de collecter leurs propres données impartiales et libres de droits et de les utiliser pour entraîner le modèle. Ces modèles générateurs formés sont connus sous le nom de "diffuseurs" ou "vegans".

 

Le potentiel de cette nouvelle technologie est énorme et les possibilités qu’elle offre ne doivent pas être mises de côté. Il convient cependant de gérer cette technologie de manière responsable, avec les bonnes compétences au sein de l’ équipe, afin que la communication assistée par ordinateur reste attrayante, crédible et diversifiée. 

Elle va révolutionner nos perspectives et apporter des gains d'efficacité, tout comme l'introduction des ordinateurs l'a fait pour l'édition numérique, le traitement de l'image et la typographie.

 

Auteur : Jens Krahe, Managing Partner chez Plan.Net Cologne