گوگل نسخه جدیدی از مدل هوش مصنوعی تولید تصویر خود به نام Imagen 4 را معرفی کرده است و  می‌گوید که این مدل از «کیفیت خیره‌کننده» و «تایپوگرافی برتر» برخوردار است.

الی کالینز، معاون محصولات در Google DeepMind، در یک پست وبلاگی می‌گوید: «جدیدترین مدل Imagen ما سرعت را با دقت ترکیب می‌کند تا تصاویر خیره‌کننده‌ای ایجاد کند.» وی ادامه می‌دهد:

Imagen 4 وضوح چشمگیری در جزئیات ظریف مانند پارچه‌های پیچیده، قطرات آب و خز حیوانات دارد و در هر دو سبک فوتورئالیستی و انتزاعی عملکرد برجسته‌ای ارائه می‌دهد.

تصاویر نمونه ارائه‌شده توسط گوگل برخی جزئیات واقع‌گرایانه‌ی چشمگیری را نشان می‌دهند، مانند تصویری که یک نهنگ را در حال پریدن از آب نمایش می‌دهد و دیگری که یک آفتاب‌پرست را به تصویر کشیده است.

مدل هوش مصنوعی همچنین «به‌طور قابل توجهی در املا و تایپوگرافی بهتر شده است»، که کالینز می‌گوید این امر ایجاد کارت‌های تبریک، پوسترها و کمیک‌ها را آسان‌تر می‌کند. (هنگامی که OpenAI اخیراً قابلیت تولید تصویر را به ChatGPT اضافه کرد، این شرکت نیز بهبودهای خود در نمایش متن را مطرح کرد، اما همچنان مستعد اشتباهات تایپی است.)

در برخی تصاویر ارائه‌شده توسط گوگل، متن به‌خوبی نمایش داده می‌شود. برای مثال، در یک کمیک کوتاه، متن کاملاً خوانا است و حتی یک فونت کوچک در یک تمبر پستی شبیه‌سازی شده نیز قابل خواندن است. اما باید ببینیم که قابلیت‌های نمایش متن این مدل در دست کاربران عادی چگونه عمل خواهد کرد.

مدل هوش مصنوعی تولید تصویر Imagen 4 از تاریخ 31 اردیبهشت در اپلیکیشن جمینای، برنامه Whisk، و Vertex AI در دسترس خواهد بود. همچنین در گوگل اسلایدز، Vids، داکس، و سایر ابزارهای Workspace ارائه خواهد شد.

علاوه بر این، گوگل قصد دارد نسخه‌ی سریع‌تر Imagen 4 را نیز به‌زودی عرضه کند، که گفته می‌شود تا 10 برابر سریع‌تر از مدل هوش مصنوعی تولید تصویر Imagen 3 خواهد بود.

گوگل در کنفرانس I/O سه‌شنبه شب، از امکانات جدید مبتنی بر هوش مصنوعی خود نیز رونمایی کرد. از جمله امکان ترجمه گفتار در گوگل میت و نیز بهبود پاسخ‌های هوشمند جیمیل که حالا با استخراج اطلاعات مرتبط به شما در ایجاد پاسخ‌های مرتبط و مطمئن‌تر کمک می‌کند.

source
کلاس یوس

توسط petese.ir