Cours à option – Intelligences artificielles génératives

L’évolution rapide de l’intelligence artificielle (IA) a révolutionné la manière dont nous créons, partageons et consommons du contenu sur les réseaux sociaux. Il est nécessaire pour un·e étudiant·e ingénieur·e des médias de comprendre la place de cet outil dans leur futur environnement de travail. C’est ainsi que ce cours à option sur l’utilisation créative d’outils d’IA génératives pour la création de contenu a vu le jour à destination des étudiant·e·s de 3ème année du bachelor en ingénierie des médias. L’objectif est de permettre l’exploration de ces outils afin de mieux appréhender leurs enjeux et limites créatifs, techniques, sociaux et éthiques. Nous vous invitons à découvrir cette approche ainsi que certains des travaux réalisés par les étudiant·e·s accompagnés de leur processus de création et de commentaires issus de leur présentation.

Contrainte: produire du contenu avec l’IA

Le cas d’utilisation du cours exigeait la production de supports de communication destinés aux réseaux sociaux. Les étudiant·e·s ont été encouragé·e·s à donner vie à des produits ou services fictifs en utilisant diverses modalités telles que le texte, l’images, le son/musique et la vidéo. L’IA intervient comme un partenaire créatif, supposé faciliter la génération de contenus attractifs et engageants. À titre expérimental, dans le cadre de ce cours, son utilisation était obligatoire. Il était également demandé aux étudiant·e·s de se positionner sur leur rôle ainsi que celui occupé par l’IA. 

«Dans notre projet, nous avons veillé à ce que l’IA soit un outil complémentaire, aidant à matérialiser nos idées plutôt que de les dicter.» — Groupe 3 «Lego Rap Edition»

Déroulement du cours

Les étudiant·e·s disposaient de 4 journées au total pour se former à l’utilisation de ces outils, mais aussi pour produire leur contenu ainsi qu’un rapport détaillé sur leur périple créatif. Un document Miro recensant l’état de l’art complet des outils était mis à leur disposition, ainsi que des comptes premium donnant accès aux fonctionnalités payantes de certains de ces outils. Cette veille n’est jamais vraiment terminée : l’évolution des outils d’IA est hebdomadaire, ce qui nous a contraint à des mises à jour régulières. L’objectif était de leur permettre de tester ces nouveaux outils, puis d’acquérir un certain degré de maîtrise pour ceux qui s’avèreraient utiles à la réussite de leur projet. 

Vous pouvez consulter ici notre veille, qui évolue constamment

Disponible en consultation sur Miro, cette mindmap fait un état de l’art des outils d’IA à disposition des étudiant·e·s

Au-delà de la pratique créative, le cours incite à une réflexion sur l’utilisation des outils d’IA. Les étudiant·e·s ont réfléchi aux implications de leurs choix d’outils en termes de temps, de créativité, de qualité, d’efficacité, et la courbe d’apprentissage nécessaire à leur maitrise. La dimension éthique était également présente, avec pour but la prise de conscience des responsabilités liées à l’utilisation de ces technologies parfois sujette à la controverse. 

Vous trouverez en fin de page la liste des groupes et enseignants.

Les groupes devaient indiquer les étapes et outils nécessaires à la création de leurs production — Groupe 6 «MC YodelMaster»

Tous les groupes ont été invité à développer un storyboard. Cette étape était indispensable pour planifier les besoins en termes de génération d’image, de son et d’animation. Cette étape était éventuellement assistée par l’utilisation de ChatGPT, ce qui n’enlevait rien à la nécessité de faire des choix, notamment de relecture ou de mise en page nécessaires à la production d’un document complet. De nombreux groupes ont eu des difficultés losqu’il s’agit de conserver une cohérence visuelle ou scénaristique avec de tels outils, ce qui a leur demandé des efforts supplémentaires pour rédiger des prompts robustes. Il devient alors légitime de se demander si l’autonomie et la vision d’ensemble offertes par les outils d’IA restent rentables: vaut-il mieux faire travailler 2 à 3 personnes pendant une journée ou un storyboarder professionnel sur ½ journée ?

Créer un storyboard visuellement et narrativement cohérent avec l’IA peut s’avérer difficile — Groupe 5 «Prohibition Noir»

De la facilité relative et l’efficacité discutable de l’IA

Avec les retours des étudiant·e·s, nous avons constaté des avis mitigés sur les gains en temps que procurent ces IAs. Indéniablement, la célérité de la production d’image ou de texte est saisissante. Mais les résultats aléatoires et le manque de contrôle sur le résultat final sans recourir à des outils traditionnels deviennent à force des freins rédhibitoires. Les étudiant·e·s prennent conscience que le fait de se reposer uniquement sur l’IA en termes de compétences est trop incertain. Bien qu’il s’agisse d’outils complémentaires qui accélèrent le processus de création initial, ils ne peuvent se substituer aux outils professionnels de retouche ou de création de contenu. 

«Nous avons dû produire et trier un grand nombre d’images pour chaque scène, générant parfois jusqu’à dix images par scène pour obtenir le résultat souhaité.» — Groupe 3 «Lego Rap Edition»

Découvrir un outil ne signifie pas le maitriser, et ce malgré leur prise en main relativement simple. De nombreux essais et une utilisation parfois détournée de l’outil sont nécessaires afin d’en tirer le meilleur parti possible.

Le groupe 1 «The Unspoken» a filmé des rushs sur fond vert pour produire le contenu de base et ainsi exploiter au maximum les capacités des outils d’IA

La place pour l’originalité

Qu’il s’agisse d’une orientation politique, morale, linguistique ou stylistique, les modèles de langage ont leur propre signature qui influence les utilisateurs de ces plateformes dans leur processus d’écriture. Il en va de même pour la génération d’image. Par conséquent, on constate une certaine homogénéisation des contenus créés à l’aide de l’IA. Bien qu’elle rende la création de contenu plus rapide et efficace, il faut se demander si l’IA n’a pas pour effet collatéral de limiter leur originalité. Les modèles de langage, en raison de leur programmation et de leur apprentissage à partir de vastes ensembles de données, ont tendance à générer des textes conformes aux tendances et aux normes préexistantes.

«Bien que l’IA facilite la création de contenu, il est crucial de se demander jusqu’à quel point elle influence ou même supplante la créativité humaine.» — Groupe 3 «Lego Rap Edition»

Des travaux pensés pour les réseaux

La création de contenu est liée à son medium de prédilection. Dans le cas de ce cours: les réseaux sociaux. Les élèves devaient donc adapter la mise en forme à une diffusion par ces canaux.

Mise en forme pour un post Instagram d’une image de communication – Groupe 6 «MC YodelMaster»

«Pour créer ce post, nous nous sommes aidés d’Adobe Photoshop, sans l’aide d’IA, et pour incruster la photo dans un post que nous avions modifié au préalable sur Google Chrome à l’aide du mode “Inspecter” (F12 sur le clavier).» — Groupe 6 «MC YodelMaster»

Résoudre des problèmes et gérer son temps face à l’IA

Pour surmonter les difficultés rencontrées, les élèves ont remis en question leur flux de travail, en revoyant fréquemment leurs ambitions à la baisse ou en étant plus pragmatiques pour gagner en efficacité. Il est facile de se laisser submergé ou mystifié par de tels outils. À ce moment, les compétences «de base» de l’ingénieur des médias permet aux étudiant·e·s de se questionner en profondeur, de jauger les difficultés. 

«Une difficulté particulière résidait dans la création de personnages cohérents et dans la réalisation d’une vidéo fluide. Pour surmonter ces obstacles, nous avons adopté une approche pragmatique : simplifier la création en générant un personnage, le découper, puis l’intégrer dans les scènes souhaitées lors du montage.» — Groupe 3 «Lego Rap Edition»

«le temps consacré à cette tâche fut bien plus long que celui imaginé» — Groupe 4 «SCH × Cartier»

Les intelligences artificielles peuvent devenir de véritables gouffres à temps, et leur évolution rapide rend leur maitrise incertaine. Il est indispensable de savoir doser l’investissement nécessaire pour une utilisation efficace et pragmatique. Les outils traditionnels gardent une place privilégiée dans le quotidien des ingénieurs des médias. 

«Il aurait probablement été plus efficace de filmer de courtes vidéos et de les assembler, ou même de réaliser des montages avec Photoshop.» — Groupe 4 «SCH × Cartier»

«Les outils d’intelligence artificielle ne sont pas encore suffisamment précis pour fournir un produit rivalisant avec les professionnels.» — Groupe 2 «The Uno»

Un avantage a cependant été relevé: ces outils ont souvent permis d’éviter d’avoir à organiser un shooting audiovisuel, coûteux. Le contenu obtenu permet également de représenter facilement un brief auprès d’un client, en amont de la planification d’un shooting. 

«Ces outils peuvent être efficaces pour donner des idées et des esquisses convaincantes en peu de temps à des coûts “peu” élevés.» — Groupe 2 «The Uno»

«L’IA permet de s’éviter des tâches telles que l’obtention d’autorisations pour filmer dans certains lieux ou avec certaines personnes, la planification de journées de tournage, la location du matériel professionnel ou encore la réalisation complète d’un montage vidéo.» — Groupe 4 «SCH × Cartier»

Finalement, trouver le prompt adéquat peut s’avérer complexe lorsque l’on débute dans le domaine. Certains groupes ont donc eu recours à ChatGPT pour optimiser le temps de recherche nécessaire pour trouver le prompt le plus efficace correspondant à leurs attentes.

«Nous avons utilisé Chat GPT en lui demandant de rédiger un prompt pour que l’IA comprenne nos intentions. Bien que cela n’ait pas fonctionné pour toutes les demandes, cela nous a été utile pour certaines images.» — Groupe 7 «Cheffe Betty»

La place de l’éthique

L’intégration de l’IA dans la création de contenu soulève des questionnements sociétaux légitimes. Les algorithmes d’IA peuvent par exemple reproduire les biais existants dans les données sur lesquelles ils sont entraînés. Les étudiant·e·s doivent être conscient·e·s de la nécessité d’une représentation équitable et diversifiée dans ces données pour éviter la reproduction de stéréotypes discriminants dans leurs créations.

«L’IA peut être utilisée pour imiter le style artistique d’un peintre, reproduire la voix d’un chanteur ou même simuler la performance d’un acteur. Cela soulève des questions cruciales sur la protection du travail créatif et de la propriété intellectuelle.» — Groupe 5 «Prohibition Noir»

Où se trouve la limite entre s’inspirer d’un style et le reproduire ? Quel est la responsabilité des créateurs face à celle de l’IA ? — Groupe 1 «The Unspoken»

La frontière entre la création humaine et celle générée par l’IA devient chaque jour un peu plus floue. Les créat·eur·rices endossent alors une responsabilité vis à vis de cette ambiguité et doivent garantir une certaine transparence dans leur utilisation de l’IA. La responsabilité éditoriale demeure un enjeu majeur.

«Il devient crucial de développer des mécanismes juridiques et éthiques robustes pour protéger les droits des artistes face à ces avancées technologiques» — Groupe 5 «Prohibition Noir»

Tandis que certains éditeurs entrainent leurs modèles sur des jeux de données «légaux et vérifiables» (par exemple: Adobe Firefly sur les stocks d’images ou d’artistes autorisés), la plupart n’hésitent pas à se servir du travail de nombreux artistes à l’insu de leur plein gré (voir ci-dessous l’encadré sur MidJourney). Pousser à une réflexion sur l’origine des données et la manière dont un modèle d’IA est produit est essentiel pour une utilisation future, plus éthique. 

«Dans le cadre de projets éducatifs ou de démonstration comme le nôtre, il est primordial de clarifier les limites d’utilisation et de reconnaître les créateurs originaux.» — Groupe 3 «Lego Rap Edition»

L’IA remet ainsi en question le travail de nombreux artistes, le plus souvent par le manque d’éthique dans son utilisation et sa création. Même si l’IA devient un partenaire créatif, il est important de réfléchir aux implications sur l’emploi créatif traditionnel. 

Dans le contexte actuel où la frontière entre création humaine et intelligence artificielle (IA) s’estompe, il est essentiel de sensibiliser les étudiants aux implications éthiques de l’utilisation des données personnelles dans leurs projets. Ces potentielles violations des droits se manifestent de diverses manières, souvent en relation avec le traitement et l’analyse des données personnelles.


MidJourney et ses directives malhonnêtes

Une fuite de données de Midjourney, circule depuis le début de l’année 2024. Il s’agit d’une liste comportant pas moins de 16’000 entrées : essentiellement des noms mais aussi des références à des mouvements artistiques ou même à des consoles de jeux vidéo.

Ce qu’il faut bien comprendre, ce sont les conséquences d’un tel pillage : il ne s’agit pas de 16’000 images aspirées par la plateforme mais 16’000 noms ou thématiques artistiques. Midjourney aurait ainsi développé une base de données de périodes, de styles, de genres, de mouvements, de supports, de techniques et de milliers d’artistes afin d’entraîner son générateur de texte-image à base d’intelligence artificielle. Cela implique donc plusieurs millions d’images qui nourriront illégalement la plateforme.

Non, cette image n’a pas été générée par une IA 😉


Conclusion

L’intelligence artificielle, créature numérique protéiforme, s’est immiscée partout. Véritable gangrène ou grande salvatrice, assistante ou remplaçante, gain ou gouffre à temps et argent… Elle s’impose pourtant comme un outil incontournable dans de nombreux milieux, notamment artistiques. 

Dans le cadre de ce cours, les étudiant·e·s ont tenté d’anticiper les changements dans leur paysage professionnel et de développer des compétences complémentaires en lien avec ces changements. La question du temps investi, des compétences et de l’argent demeure centrale dans la profession. 

«L’opportunité de combiner plusieurs techniques pour créer un produit concret et commercialisable s’est avérée extrêmement enrichissante, jetant des bases solides pour notre future vie professionnelle.» — Groupe 5 «Prohibition Noir»

L’intérêt suscité par l’approche empirique, exploratoire et expérimentale du cours semble avoir fait l’unanimité. Ces outils d’IA sont avant tout destinés à assister les futur·e·s ingénieur·e·s des médias, faciliter certaines étapes de travail, stimuler leur créativité, voire ouvrir de nouvelles voies et repenser leur approche de la communication. Ils sont aujourd’hui loin de pouvoir remplacer les compétences «traditionnelles» des métiers créatifs. L’enjeu consiste à acquérir une maitrise suffisante pour pouvoir en faire un usage professionnel tout en trouvant un équilibre entre la qualité, la créativité et l’éthique. 

Groupes :

Groupe 1 : Vincent Dubuis, Rossiny Longo, Nicolas Wunderle

Groupe 2 : Karen Bonfils, Catherine Mauron, Vitor Pinto Da Silva

Groupe 3 : Assefa Raey, Bourgeois Kevin, Masungi Glory, Musta Sami

Groupe 4 : Sophie Aubert, Jasmine Eswaran, Ferida Papracanin

Groupe 5 : Martin Amez-Droz, Maxime Cuche, Marco Locatelli

Groupe 6 : Nathan Gretillat, Lionel Sandoz, Maxime Gutknecht

Groupe 7 : Julie Achard & Neyla Sanjuan

Responsable :

Prof. Daniel Rappo

Enseignants :

Yoann Douillet, assistant académique HEIG-VD

Julien Mercier, doctorant HEIG-VD

Alexandre Pinault, PhD, assistant académique HEIG-VD

+ There are no comments

Add yours