گوگل شب گذشته جدیدترین مدلهای هوش مصنوعی خود را تحت سری جمینای 2.5 (Gemini 2.5) معرفی کرده است که اولین عضو این خانواده مدل هوش مصنوعی استدلالی جمینای 2.5 پرو است.
به گفته این شرکت، این سری جدید با هدف ارتقای تواناییهای استدلالی در هوش مصنوعی طراحی شده و قرار است استانداردهای تازهای در این حوزه تعریف کند.
معرفی جمینای 2.5 پرو: هوشمندترین مدل گوگل تاکنون
گوگل در گام نخست، مدل جمینای 2.5 پرو اکسپریمنتال را بهعنوان اولین عضو این خانواده معرفی کرده است. این مدل چندوجهی که توانایی استدلال پیشرفتهای دارد، از روز سهشنبه در پلتفرم توسعهدهندگان گوگل یعنی Google AI Studio و همچنین در اپلیکیشن جمینای برای کاربران اشتراکی طرح Gemini Advanced (با هزینه 20 دلار در ماه) در دسترس قرار گرفته است.
گوگل مدعی است که جمینای 2.5 پرو هوشمندترین مدل این شرکت تا به امروز محسوب میشود و از این پس، تمام مدلهای جدید هوش مصنوعی این شرکت به قابلیتهای استدلالی مجهز خواهند بود.
گوگل همچنین ماهیت چندوجهی جمینای را به عنوان یک مزیت تبلیغ میکند، چراکه این مدل قادر است نه تنها متن، بلکه صدا، تصاویر، ویدئو و کد را نیز تفسیر کند.
رقابت داغ در دنیای هوش مصنوعی استدلالی
از زمان عرضه اولین مدل استدلالی توسط OpenAI با نامo1 در شهریور ماه سال گذشته، شرکتهای فناوری در رقابتی تنگاتنگ برای پیشی گرفتن از یکدیگر در این حوزه قرار گرفتهاند.
اکنون شرکتهایی مانند Anthropic، DeepSeek، گوگل و xAI مدلهای استدلالی خود را توسعه دادهاند. این مدلها با استفاده از قدرت محاسباتی بیشتر و صرف زمان اضافی برای بررسی و استدلال مسائل، پاسخهایی دقیقتر و قابلاعتمادتر ارائه میدهند.
تکنیکهای استدلالی به این مدلها کمک کرده تا در زمینههایی مثل ریاضیات و کدنویسی به سطح جدیدی از عملکرد دست یابند. بسیاری از کارشناسان معتقدند که این مدلها، ستون اصلی هوش مصنوعی عامل (AI Agents) خواهند بود؛ سیستمهای خودکاری که میتوانند وظایف را بدون نیاز به دخالت گسترده انسان انجام دهند. البته این پیشرفتها هزینههای بالاتری نیز به همراه دارند.
به گفته گوگل، این رویکرد منجر به پاسخها و واکنشهای بهتری در برابر دستورات پیچیده میشود. در پست وبلاگی جدید گوگل آمده است: «ما این قابلیتهای تفکر را به طور مستقیم در همه مدلهای خود تعبیه میکنیم، تا بتوانند مسائل پیچیدهتر را مدیریت کرده و از عوامل توانمندتر و آگاه به متن پشتیبانی کنند.»
در یک ویدئوی نمایشی، مدل جمینای 2.5 پرو توانایی خود را در استفاده از این قابلیتهای استدلالی برای برنامهنویسی یک بازی ویدئویی تنها با یک دستور واحد به نمایش میگذارد.
هوش مصنوعی Gemini 2.5 Pro در برابر رقبا
گوگل پیشتر در آذر ماه سال گذشته، نسخهای “متفکر” از جمینای را آزمایش کرده بود، اما جمینای 2.5 پرو جدیترین تلاش این شرکت برای رقابت با سری مدلهای “o” شرکت OpenAI به شمار میرود.
گوگل اعلام کرده که جمینای 2.5 پرو در چندین معیار سنجش از مدلهای پیشین خود و برخی از رقبای برجسته پیشی گرفته است. بهطور خاص، این مدل برای توسعه برنامههای وب جذاب و کاربردهای کدنویسی مبتنی بر هوش مصنوعی طراحی شده است.
در آزمون Aider Polyglot که توانایی ویرایش کد را میسنجد، جمینای 2.5 پرو با امتیاز 68.6 درصد از برترین مدلهای OpenAI، Anthropic و هوش مصنوعی چینی DeepSeek عملکرد بهتری داشته است.
اما در آزمون دیگری به نام SWE-bench Verified که مهارتهای توسعه نرمافزار را ارزیابی میکند، این مدل با امتیاز 63.8 درصد از o3-mini OpenAI و R1 DeepSeek بهتر عمل کرده، ولی در مقایسه با Claude 3.7 Sonnet از Anthropic (با امتیاز 70.3 درصد) کمی ضعیفتر ظاهر شده است.
همچنین در آزمون چندوجهی Humanity’s Last Exam که شامل هزاران سؤال جمعسپاریشده در زمینه ریاضیات، علوم انسانی و علوم طبیعی است، جمینای 2.5 پرو با امتیاز 18.8 درصد از اکثر مدلهای پرچمدار رقبا پیشی گرفته است.
ظرفیت بینظیر Gemini 2.5 Pro
گوگل اعلام کرده که جمینای 2.5 پرو در ابتدا با پنجره زمینه (Context Window) یک میلیون توکن عرضه میشود؛ این یعنی توانایی پردازش حدود 750 هزار کلمه در یک زمان.
این حجم از ورودی، از کل مجموعه کتابهای «ارباب حلقهها» هم بیشتر است! بهزودی این ظرفیت به 2 میلیون توکن افزایش خواهد یافت که قدرت پردازش اطلاعات عظیمی را به این مدل میبخشد.
گوگل هنوز قیمتگذاری API برای جمینای 2.5 پرو را اعلام نکرده، اما وعده داده که جزئیات بیشتری طی هفتههای آینده منتشر خواهد شد.
گفتنی است همزمان با مدلهای جدید هوش مصنوعی استدلالی جمینای 2.5 گوگل، مایکروسافت نیز از دو عامل (ایجنت) جدید استدلال عمیق برای هوش مصنوعی کوپایلت رونمایی کرد و شرکت OpenAI نیز از اضافه شدن قابلیت تولید تصویر با استفاده از GPT-4o به ChatGPT خبر داده است.
source
کلاس یوس