La conférence AWS re:Invent d’Amazon de cette année restera gravée dans les annales de l’entreprise. En l’espace de quelques jours, Amazon a dévoilé une série de nouveautés, dont de nouveaux processeurs conçus pour les calculs d’intelligence artificielle, un chatbot de type ChatGPT destiné aux clients de ses solutions AWS, et enfin, le Titan Image Generator, une IA de génération d’images de type DALL-E (OpenAI) et Midjourney.
Amazon promet que son IA « peut produire des images réalistes de qualité studio » tout en assurant que des mesures de protection ont été mises en place pour éviter les résultats indésirables. En d’autres termes, il ne sera pas possible de générer des images inappropriées. Contrairement à Midjourney et à la plupart des autres IA génératives d’images, le Titan Image Generator a été spécifiquement conçu pour une utilisation en entreprise. Il offre aux développeurs un outil puissant pour créer leurs propres générateurs d’images, bien que cela nécessite un accès à Amazon Bedrock.
Lors de la conférence, Swami Sivasubramanian, le vice-président d’AWS, a présenté les capacités impressionnantes de Titan. Cette IA peut non seulement générer des images à partir d’instructions en langage naturel, mais elle est également capable de modifier dynamiquement l’arrière-plan d’une image sans affecter les autres éléments graphiques.
Cependant, l’atout majeur de Titan, qui peut être considéré comme « caché », réside dans son intégration de filigranes totalement invisibles. Ce filigrane ne se limite pas aux métadonnées habituelles et n’est détectable que via une API spécialement créée par Amazon. Cette approche met en évidence le fait que Titan est véritablement un modèle d’IA, plutôt qu’un produit final. Il offre aux développeurs la possibilité de personnaliser au maximum ce qu’ils souhaitent proposer à leurs utilisateurs finaux.
En plus du Titan Image Generator, Amazon a également annoncé la disponibilité d’autres modèles Titan, tels que Titan Text Lite, destiné à la génération de texte « léger », et Text Express, conçu pour des applications plus volumineuses comme les systèmes de chat conversationnel.