گوگل از سیستم هوش مصنوعی جدیدی پرده برداشته که میتواند با دریافت متن تصویر خلق کند. این سیستم در واقع به کاربر اجازه میدهد تا با نوشتن یک متن توصیفی از طریق هوش مصنوعی معادل تصویری آن را ببیند. این شرکت مدعی است که مدل Imagen دارای سطح بیبدیلی از واقعگرایی و درک عمیقی از زبانهاست.
مدل هوش مصنوعی گوگل به راحتی توسط همه کاربران قابل استفاده است. برای مثال اگر بنویسید «تصویر یک گربه پرشین که کلاه گاوچرانی به سر گذاشته، پیراهن قرمز پوشیده و در ساحل گیتار میزند» تصویر زیر به دست میآید. گوگل میگوید در مقایسهای که بین مدل خود و سایر مدلهای مشابه داشته، فهمیده که کاربران دقت و صحت تصاویر را در این مدل بیشتر میپسندند.
اهالی ماونتین ویو شماری از خروجیهای مدل Imagen را در وبسایت این پروژه منتشر کردهاند. با این حال، این نمونهها دستچین شدهاند و ممکن است از بین هزاران خروجی دیگر انتخاب شده باشند که به این خوبی نیستند. مدل Imagen بهصورت عمومی در دسترس نیست، چون گوگل معتقد است که این مدل هنوز به دلایل مختلف برای استفاده عمومی آماده نیست.