
دیپمایند گوگل نسخه جدیدی از مدل هوش مصنوعی خود موسوم به Genie 3 را عرضه کرده که توانایی ساخت محیطهای سهبعدی قابل تعامل در لحظه برای کاربران و عوامل هوش مصنوعی را دارد. این شرکت همچنین گفته که مدت زمان تعامل با این دنیاهای مجازی نسبت به گذشته بهطرز چشمگیری افزایش یافته و این مدل قادر خواهد بود مکان اشیاء را حتی پس از آنکه نگاه کاربر از آنها برداشته شد، به خاطر بسپارد.
نگاهی به مدل هوش مصنوعی Genie 3 گوگل
مدلهای هوش مصنوعی جدید امکان شبیهسازی فضاهایی مجازی را برای اهدافی نظیر آموزش، سرگرمی یا تربیت رباتها و عوامل هوش مصنوعی فراهم میکنند. با استفاده از چنین مدلهایی، میتوان صرفاً با ارائه یک دستور متنی، فضایی خلق کرد که قابلیت جابجایی در آن مشابه یک بازی ویدئویی وجود دارد؛ با این تفاوت که در اینجا محیط بهصورت دستی طراحی نشده و تمام عناصر آن با بهرهگیری از هوش مصنوعی تولید میشوند. گوگل سرمایهگذاری جدی در این حوزه انجام داده و در آذرماه گذشته از Genie 2 رونمایی کرد؛ مدلی که میتوانست بر اساس یک تصویر، دنیایی تعاملی ایجاد کند. این تیم مدلسازی گوگل تحت رهبری یکی از همکاران سابق ابزار Sora شرکت OpenAI شکل گرفته است.
با اینحال، این مدلها همچنان با محدودیتهای قابل توجهی روبرو هستند. برای نمونه، دنیاهای ایجادشده توسط Genie 2 تنها تا حدود یک دقیقه قابل تجربه بودند. اخیراً تجربهای از یک ویدیوی تعاملی متعلق به شرکتی با پشتیبانی یکی از بنیانگذاران پیکسار آزمایش شده که مشابه عبور از نسخهای تار و متغیر از Google Street View بود؛ محیطی که در آن اجزاء به طرز غیرمنتظرهای تغییر شکل میدادند.
با توجه به اطلاعات منتشرشده در یک پست وبلاگی، به نظر میرسد Genie 3 گام مهمی رو به جلو برداشته است. در این نسخه، کاربران قادر خواهند بود با وارد کردن یک دستور متنی، دنیایی ایجاد کنند که چند دقیقه تعامل مستمر را پشتیبانی میکند؛ این در حالیست که Genie 2 تنها امکان تعامل 10 تا 20 ثانیهای را فراهم میکرد. گوگل اعلام کرده که Genie 3 توانایی حفظ عناصر بصری در حافظهای کوتاهمدت تا حدود یک دقیقه را دارد؛ بهعبارت دیگر، اگر در یک محیط چهرهای را برگردانید و سپس دوباره به همان نقطه نگاه کنید، اجسامی مانند نوشتهای روی تخته سیاه یا رنگ دیوار همچنان در جای قبلی خود باقی خواهند ماند. دنیای مجازی تولیدشده در این مدل با وضوح 720p و نرخ فریم 24fps ارائه میشود.
دیپمایند همچنین قابلیتی تحت عنوان «رویدادهای جهانی قابل برنامهریزی با دستور» را به Genie 3 افزوده که از طریق وارد کردن یک فرمان، میتوان تغییراتی از قبیل وضعیت آبوهوا یا افزودن شخصیتهای جدید به محیط اعمال کرد. با این حال، احتمالاً این مدل در دسترس عموم قرار نخواهد گرفت. بر اساس اعلام گوگل، عرضه این مدل در قالب «پیشنمایش تحقیقاتی محدود» انجام خواهد شد که تنها برای گروه کوچکی از پژوهشگران و خالقان محتوا قابل استفاده است تا توسعهدهندگان بتوانند ارزیابی دقیقتری از خطرات احتمالی داشته و راهکارهای مناسبتری برای کاهش آنها بیابند.
این مدل همچنین با محدودیتهای زیادی همراه است؛ از جمله شیوههای محدود تعامل کاربران با دنیاهای تولیدی و اینکه متن خوانا تنها زمانی بهدرستی تولید میشود که در توصیف ورودی محیط به آن اشاره شده باشد. گوگل گفته در حال بررسی چگونگی ارائه Genie 3 به جمعی گستردهتر از آزمایشکنندگان در آینده است.
source
کلاس یوس