Le photographe Boris Eldagsen a récemment créé la surprise et suscité une vague de débats dans le monde de la photographie en remportant l’un des prix des Sony World Photography Awards avec une image produite par l’IA ou le réseau neuronal génératif DALL-E 2.
Le photographe, qui affirme que son intention n’était pas de tromper, a refusé cette distinction lors de la cérémonie de remise des prix, estimant que les organisateurs ne parlaient pas du fait que l’image était artificielle. Son objectif, dit-il, a toujours été de susciter un débat sur l’impact de ces technologies sur la façon dont nous concevons la photographie. Il a également précisé sa position en affirmant que ces images artificielles ne sont pas des photos et qu’elles ne devraient pas être acceptées dans les concours de photographie. Mais est-ce si simple ?
Dans un entretien accordé à la BBC, Boris Eldagsen a décrit ces images en utilisant le terme « promptographie » et non de photographie, opérant la distinction entre une véritable photo qui résulte de la réaction de la lumière sur une surface sensible et ces images générées en introduisant des données dans un réseau neuronal. Toutefois, cette description masque la réalité plus complexe et plus obscure de la manière dont ces réseaux neuronaux peuvent générer ces images.
Pour produire des photographies aussi impressionnantes et réalistes, ces réseaux neuronaux sont entraînés à traiter d’énormes masses de données de millions de photographies préexistantes, ce qui leur permet de former les connexions « neuronales » nécessaires pour transformer une description textuelle en une image photoréaliste. En ce sens, ces systèmes ne produisent rien de nouveau – ils synthétisent de nouvelles images à partir des points de données de photographies préexistantes.
Ils « apprennent » ainsi comment la lumière et les lentilles interagissent pour créer des images dans un appareil photo classique, mais ils ne le font pas eux-mêmes, de sorte que, d’une certaine manière, leurs résultats sont presque plus proches du collage ou de la modélisation en 3D que de la photographie classique. Mais, ces systèmes ont du mal à générer des images de choses sur lesquelles ils n’ont pas été formés, ce qui constituera toujours une limite majeure à leur créativité.
Comme l’a déclaré Boris Eldagsen dans un entretien, « le langage photographique est devenu une entité flottante séparée de la photographie et a désormais une vie propre ». Dans le même temps, il convient de noter que la photographie computationnelle et générative n’est pas vraiment nouvelle et que nous tolérons un large éventail d’effets de post-traitement appliqués à des images qui n’ont pas de rapport direct avec la lumière, les objectifs et les autres éléments que nous associons à la photographie traditionnelle. Les téléphones portables utilisent de plus en plus des réseaux neuronaux pour améliorer les images de leurs appareils photos, les modifiant parfois de manière spectaculaire et produisant une image qui ne serait pas possible par le seul biais de l’optique. Il existe donc un compromis à mi-chemin entre la photographie traditionnelle et l’imagerie artificielle, celui des photographies « assistées » qui combinent le meilleur des deux mondes.
Toutefois, le problème de ce débat réside peut-être en partie dans le fait que la photographie est utilisée à des fins très diverses. Évoquer tous ces usages, sans distinction, ne permet pas d’avancer dans la réflexion. Il existe des genres pour lesquels nous pourrions convenir que l’utilisation de ces images produites avec l’IA, sans que cela soit mentionné, est problématique, à l’exemple du photojournalisme, où le potentiel d’abus est énorme et pourrait avoir des conséquences réellement dangereuses.
L’imagerie artificielle d’événements d’actualité circule déjà largement sur les réseaux sociaux (comme l’image récente des présidents Vladimir Poutine et Xi Jinping), et nos propres recherches nous ont permis de constater que les rédactions des journaux craignaient énormément les dangers liés à l’utilisation par erreur de l’une de ces images par les organes de presse. Cela importe peut-être beaucoup moins dans le contexte de l’art, où ces réseaux neuronaux génératifs constituent un outil d’expression potentiellement puissant, comme l’affirme Boris Eldagsen lui-même.
Mais une dernière question se pose : le débat ne devrait-il pas moins porter sur la question de savoir si ces images sont considérées comme des photographies que sur celle du caractère moralement acceptable ou condamnable de leur utilisation ? Il est de plus en plus évident que les données servant à bon nombre de ces réseaux neuronaux s’appuient sur des images protégées par le droit d’auteur de photographes existants, et le nombre de procès intentés contre les entreprises à l’origine de ces réseaux neuronaux ne cesse de croître. Au-delà des avantages et des inconvénients des images elles-mêmes, nous devrions nous demander s’il est n’est pas problématique que les photographes se retrouvent financièrement impactés face à des systèmes qui ne sont rendus possibles, dans un premier temps, que grâce à leurs photographies.
Lewis Bush est un photographe basé à Londres. Il est actuellement doctorant à la London School of Economics, dans le département Media and Communications, et était auparavant responsable du cours du MA Photojournalism and Documentary Photography au London College of Communication, University of the Arts London.