گوگل نسخه جدیدی از مدل هوش مصنوعی تولید تصویر خود به نام Imagen 4 را معرفی کرده است و میگوید که این مدل از «کیفیت خیرهکننده» و «تایپوگرافی برتر» برخوردار است.
الی کالینز، معاون محصولات در Google DeepMind، در یک پست وبلاگی میگوید: «جدیدترین مدل Imagen ما سرعت را با دقت ترکیب میکند تا تصاویر خیرهکنندهای ایجاد کند.» وی ادامه میدهد:
Imagen 4 وضوح چشمگیری در جزئیات ظریف مانند پارچههای پیچیده، قطرات آب و خز حیوانات دارد و در هر دو سبک فوتورئالیستی و انتزاعی عملکرد برجستهای ارائه میدهد.
تصاویر نمونه ارائهشده توسط گوگل برخی جزئیات واقعگرایانهی چشمگیری را نشان میدهند، مانند تصویری که یک نهنگ را در حال پریدن از آب نمایش میدهد و دیگری که یک آفتابپرست را به تصویر کشیده است.
مدل هوش مصنوعی همچنین «بهطور قابل توجهی در املا و تایپوگرافی بهتر شده است»، که کالینز میگوید این امر ایجاد کارتهای تبریک، پوسترها و کمیکها را آسانتر میکند. (هنگامی که OpenAI اخیراً قابلیت تولید تصویر را به ChatGPT اضافه کرد، این شرکت نیز بهبودهای خود در نمایش متن را مطرح کرد، اما همچنان مستعد اشتباهات تایپی است.)
در برخی تصاویر ارائهشده توسط گوگل، متن بهخوبی نمایش داده میشود. برای مثال، در یک کمیک کوتاه، متن کاملاً خوانا است و حتی یک فونت کوچک در یک تمبر پستی شبیهسازی شده نیز قابل خواندن است. اما باید ببینیم که قابلیتهای نمایش متن این مدل در دست کاربران عادی چگونه عمل خواهد کرد.
مدل هوش مصنوعی تولید تصویر Imagen 4 از تاریخ 31 اردیبهشت در اپلیکیشن جمینای، برنامه Whisk، و Vertex AI در دسترس خواهد بود. همچنین در گوگل اسلایدز، Vids، داکس، و سایر ابزارهای Workspace ارائه خواهد شد.
علاوه بر این، گوگل قصد دارد نسخهی سریعتر Imagen 4 را نیز بهزودی عرضه کند، که گفته میشود تا 10 برابر سریعتر از مدل هوش مصنوعی تولید تصویر Imagen 3 خواهد بود.
گوگل در کنفرانس I/O سهشنبه شب، از امکانات جدید مبتنی بر هوش مصنوعی خود نیز رونمایی کرد. از جمله امکان ترجمه گفتار در گوگل میت و نیز بهبود پاسخهای هوشمند جیمیل که حالا با استخراج اطلاعات مرتبط به شما در ایجاد پاسخهای مرتبط و مطمئنتر کمک میکند.
source
کلاس یوس