21 novembre 2023

StableRep : L'imagerie synthétique établit une nouvelle norme en matière d'efficacité d'entraînement pour l'IA.

ia image
Accueil » Future Tech » StableRep : L'imagerie synthétique établit une nouvelle norme en matière d'efficacité d'entraînement pour l'IA.

StableRep, l'utilisation d'images synthétiques redéfinit les critères d'efficacité dans l'apprentissage de l'intelligence artificielle.

Utiliser des images synthétiques

Les données représentent un nouveau terrain fertile, et dans cet environnement propice, les chercheurs du MIT ne se contentent pas de semer des pixels. En utilisant des images synthétiques pour former des modèles d'apprentissage automatique, une équipe de scientifiques a récemment dépassé les résultats obtenus par les méthodes traditionnelles d'entraînement avec des "images réelles".

Cela peut vous intéresser : Amazon développe un modèle linguistique de grande envergure pour rivaliser avec OpenAI et Google.

Au cœur de cette approche se trouve un système appelé StableRep, qui ne se contente pas d'utiliser des images synthétiques ordinaires ; il les génère à travers des modèles texte-vers-image très prisés, tels que Stable Diffusion. C'est un peu comme façonner des mondes avec des mots.

Quel est le secret de la méthode StableRep ?

StableRepUne stratégie baptisée "apprentissage contrastif multi-positif".

A lire aussi : Semaine de travail de 3 jours ? Bientôt d'après Bill Gates

"Nous apprenons au modèle à comprendre davantage les concepts de haut niveau à travers le contexte et la variance, plutôt que de lui fournir simplement des données", explique Lijie Fan, doctorante en génie électrique au MIT, affiliée au laboratoire d'informatique et d'intelligence artificielle du MIT (CSAIL) et chercheuse principale de cette étude. "Lorsque plusieurs images, toutes générées à partir du même texte, sont traitées comme des représentations de la même entité sous-jacente, le modèle plonge plus profondément dans les concepts derrière les images, tels que l'objet, et non simplement leurs pixels."

Cette méthode considère plusieurs images générées à partir de textes identiques comme des paires positives, apportant des informations supplémentaires pendant l'entraînement. Elle va au-delà de la simple diversité en spécifiant au système visuel quelles images se ressemblent et lesquelles diffèrent. De manière impressionnante, StableRep a surpassé les performances de modèles de premier plan entraînés sur des images réelles, tels que SimCLR et CLIP, sur des ensembles de données étendus.

"Alors que StableRep contribue à résoudre les défis liés à l'acquisition de données en apprentissage automatique, il marque également une avancée vers une nouvelle ère de techniques d'entraînement en intelligence artificielle. La capacité à générer, à la demande, des images synthétiques diverses et de haute qualité pourrait contribuer à réduire les coûts et les ressources nécessaires"

Le processus de collecte de données n'a jamais été simple.

Dans les années 1990, les chercheurs devaient capturer manuellement des photographies pour constituer des ensembles de données d'objets et de visages. Les années 2000 ont vu des individus fouiller Internet à la recherche de données. Cependant, ces données brutes et non filtrées présentaient souvent des incohérences par rapport aux scénarios réels et reflétaient des biais sociaux, offrant ainsi une vision déformée de la réalité. Nettoyer les ensembles de données par intervention humaine est non seulement coûteux, mais aussi extrêmement difficile. Cependant, imaginez si cette tâche fastidieuse de collecte de données pouvait être simplifiée à quelque chose d'aussi simple que de donner une commande en langage naturel.

StableRep et StableRep+

StableRep a réussi grâce à un réglage minutieux de l'échelle de guidage dans le modèle génératif, équilibrant avec finesse la diversité et la fidélité des images synthétiques. Cette méthode, surpassant parfois les images réelles, a été améliorée avec une supervision linguistique, donnant naissance à StableRep+. Ce dernier, entraîné avec 20 millions d'images synthétiques, a démontré une précision supérieure et une efficacité remarquable par rapport aux modèles CLIP utilisant 50 millions d'images réelles.

Cependant, des défis subsistent, notamment la lenteur actuelle de la génération d'images, les incohérences sémantiques, le risque d'amplification de biais, et les complexités liées à l'attribution des images. Bien que StableRep réduise la dépendance aux vastes collections d'images réelles, des préoccupations subsistent quant aux biais dans les données non triées utilisées pour les modèles texte-vers-image. Malgré ces enjeux, StableRep offre une alternative prometteuse en matière d'entraînement.

Les chercheurs soulignent que bien que l'entraînement initial nécessite des données réelles, une fois qu'un bon modèle génératif est établi, il peut être réutilisé pour diverses tâches. L'étude sera présentée à la Conférence sur les systèmes d'information neuronaux (NeurIPS) de 2023.

Source : MIT

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

🤖 Aiflare.fr : Explorer l'IA, Innover le Futur 🚀

Bien plus qu'un blog, Aiflare.fr est votre portail vers l'univers dynamique de l'intelligence artificielle. Plongez dans les dernières tendances, découvrez des analyses approfondies, et participez à la conversation qui façonne le futur de la technologie.

Suivez-nous pour rester à la pointe de l'innovation et explorez avec nous les possibilités infinies de l'intelligence artificielle. Ensemble, construisons un avenir où la technologie inspire la créativité et transforme le monde.
📧 Contactez-nous
🔗 Politique de confidentialité
Made with ❤ and ☕ © 2023

Source image : Pixabay.com
logo-1