bar de l'économie

2 systèmes génèrent des images à partir d’une phrase

14/01/2021. OpenAI, l’organisation à but non lucratif dédiée à la recherche en intelligence artificielle, a levé le voile sur Dall-E, et sur CLIP, deux systèmes qui génèrent des images à partir d’une phrase en combinant vision par ordinateur et traitement du langage naturel.
Dall-E est aussi capable de créer des choses qui n’existent pas, il peut copier, et changer les attributs (couleur, texture), et la quantité d’un objet.

CLIP est capable d’apprendre à reconnaître des catégories d’objets rapidement à partir d’indications en langage naturel. Il s’appuie notamment sur la reconnaissance optique de caractères (la géolocalisation ou encore la « reconnaissance d’actions » pour être en mesure d’identifier de nouvelles catégories d’images par lui-même.
D’après OpenAI, CLIP a pour objectif d’étudier les défis posés par la vision par ordinateur et de donner un aperçu de ses biais et impacts. La reconnaissance faciale est particulièrement mis en cause pour les biais discriminatoires qu’elles peut provoquer.