دیپ‌مایند گوگل نسخه جدیدی از مدل هوش مصنوعی خود موسوم به Genie 3 را عرضه کرده که توانایی ساخت محیط‌های سه‌بعدی قابل تعامل در لحظه برای کاربران و عوامل هوش مصنوعی را دارد. این شرکت همچنین گفته که مدت زمان تعامل با این دنیاهای مجازی نسبت به گذشته به‌طرز چشمگیری افزایش یافته و این مدل قادر خواهد بود مکان اشیاء را حتی پس از آنکه نگاه کاربر از آن‌ها برداشته شد، به خاطر بسپارد.

نگاهی به مدل هوش مصنوعی Genie 3 گوگل

مدل‌های هوش مصنوعی جدید امکان شبیه‌سازی فضاهایی مجازی را برای اهدافی نظیر آموزش، سرگرمی یا تربیت ربات‌ها و عوامل هوش مصنوعی فراهم می‌کنند. با استفاده از چنین مدل‌هایی، می‌توان صرفاً با ارائه یک دستور متنی، فضایی خلق کرد که قابلیت جابجایی در آن مشابه یک بازی ویدئویی وجود دارد؛ با این تفاوت که در اینجا محیط به‌صورت دستی طراحی نشده و تمام عناصر آن با بهره‌گیری از هوش مصنوعی تولید می‌شوند. گوگل سرمایه‌گذاری جدی در این حوزه انجام داده و در آذرماه گذشته از Genie 2 رونمایی کرد؛ مدلی که می‌توانست بر اساس یک تصویر، دنیایی تعاملی ایجاد کند. این تیم مدل‌سازی گوگل تحت رهبری یکی از همکاران سابق ابزار Sora شرکت OpenAI شکل گرفته است.

با این‌حال، این مدل‌ها همچنان با محدودیت‌های قابل توجهی روبرو هستند. برای نمونه، دنیاهای ایجادشده توسط Genie 2 تنها تا حدود یک دقیقه قابل تجربه بودند. اخیراً تجربه‌ای از یک ویدیوی تعاملی متعلق به شرکتی با پشتیبانی یکی از بنیان‌گذاران پیکسار آزمایش شده که مشابه عبور از نسخه‌ای تار و متغیر از Google Street View بود؛ محیطی که در آن اجزاء به طرز غیرمنتظره‌ای تغییر شکل می‌دادند.

با توجه به اطلاعات منتشرشده در یک پست وبلاگی، به نظر می‌رسد Genie 3 گام مهمی رو به جلو برداشته است. در این نسخه، کاربران قادر خواهند بود با وارد کردن یک دستور متنی، دنیایی ایجاد کنند که چند دقیقه تعامل مستمر را پشتیبانی می‌کند؛ این در حالی‌ست که Genie 2 تنها امکان تعامل 10 تا 20 ثانیه‌ای را فراهم می‌کرد. گوگل اعلام کرده که Genie 3 توانایی حفظ عناصر بصری در حافظه‌ای کوتاه‌مدت تا حدود یک دقیقه را دارد؛ به‌عبارت دیگر، اگر در یک محیط چهره‌ای را برگردانید و سپس دوباره به همان نقطه نگاه کنید، اجسامی مانند نوشته‌ای روی تخته سیاه یا رنگ دیوار همچنان در جای قبلی خود باقی خواهند ماند. دنیای مجازی تولیدشده در این مدل با وضوح 720p و نرخ فریم 24fps ارائه می‌شود.

دیپ‌مایند همچنین قابلیتی تحت عنوان «رویدادهای جهانی قابل برنامه‌ریزی با دستور» را به Genie 3 افزوده که از طریق وارد کردن یک فرمان، می‌توان تغییراتی از قبیل وضعیت آب‌وهوا یا افزودن شخصیت‌های جدید به محیط اعمال کرد. با این حال، احتمالاً این مدل در دسترس عموم قرار نخواهد گرفت. بر اساس اعلام گوگل، عرضه این مدل در قالب «پیش‌نمایش تحقیقاتی محدود» انجام خواهد شد که تنها برای گروه کوچکی از پژوهشگران و خالقان محتوا قابل استفاده است تا توسعه‌دهندگان بتوانند ارزیابی دقیق‌تری از خطرات احتمالی داشته و راهکارهای مناسب‌تری برای کاهش آن‌ها بیابند.

این مدل همچنین با محدودیت‌های زیادی همراه است؛ از جمله شیوه‌های محدود تعامل کاربران با دنیاهای تولیدی و اینکه متن خوانا تنها زمانی به‌درستی تولید می‌شود که در توصیف ورودی محیط به آن اشاره شده باشد. گوگل گفته در حال بررسی چگونگی ارائه Genie 3 به جمعی گسترده‌تر از آزمایش‌کنندگان در آینده است.




source
کلاس یوس

توسط petese.ir