گوگل شب گذشته جدیدترین مدل‌های هوش مصنوعی خود را تحت سری جمینای 2.5 (Gemini 2.5) معرفی کرده است که اولین عضو این خانواده مدل هوش مصنوعی استدلالی جمینای 2.5 پرو است.

به گفته این شرکت، این سری جدید با هدف ارتقای توانایی‌های استدلالی در هوش مصنوعی طراحی شده و قرار است استانداردهای تازه‌ای در این حوزه تعریف کند.

معرفی جمینای 2.5 پرو: هوشمندترین مدل گوگل تاکنون

گوگل در گام نخست، مدل جمینای 2.5 پرو اکسپریمنتال را به‌عنوان اولین عضو این خانواده معرفی کرده است. این مدل چندوجهی که توانایی استدلال پیشرفته‌ای دارد، از روز سه‌شنبه در پلتفرم توسعه‌دهندگان گوگل یعنی Google AI Studio و همچنین در اپلیکیشن جمینای برای کاربران اشتراکی طرح Gemini Advanced (با هزینه 20 دلار در ماه) در دسترس قرار گرفته است.

جمینای 2.5 پرو گوگل

گوگل مدعی است که جمینای 2.5 پرو هوشمندترین مدل این شرکت تا به امروز محسوب می‌شود و از این پس، تمام مدل‌های جدید هوش مصنوعی این شرکت به قابلیت‌های استدلالی مجهز خواهند بود.

گوگل همچنین ماهیت چندوجهی جمینای را به عنوان یک مزیت تبلیغ می‌کند، چراکه این مدل قادر است نه تنها متن، بلکه صدا، تصاویر، ویدئو و کد را نیز تفسیر کند.

رقابت داغ در دنیای هوش مصنوعی استدلالی

از زمان عرضه اولین مدل استدلالی توسط OpenAI با نامo1  در شهریور ماه سال گذشته، شرکت‌های فناوری در رقابتی تنگاتنگ برای پیشی گرفتن از یکدیگر در این حوزه قرار گرفته‌اند.

اکنون شرکت‌هایی مانند Anthropic، DeepSeek، گوگل و xAI مدل‌های استدلالی خود را توسعه داده‌اند. این مدل‌ها با استفاده از قدرت محاسباتی بیشتر و صرف زمان اضافی برای بررسی و استدلال مسائل، پاسخ‌هایی دقیق‌تر و قابل‌اعتمادتر ارائه می‌دهند.

تکنیک‌های استدلالی به این مدل‌ها کمک کرده تا در زمینه‌هایی مثل ریاضیات و کدنویسی به سطح جدیدی از عملکرد دست یابند. بسیاری از کارشناسان معتقدند که این مدل‌ها، ستون اصلی هوش مصنوعی عامل (AI Agents) خواهند بود؛ سیستم‌های خودکاری که می‌توانند وظایف را بدون نیاز به دخالت گسترده انسان انجام دهند. البته این پیشرفت‌ها هزینه‌های بالاتری نیز به همراه دارند.

به گفته گوگل، این رویکرد منجر به پاسخ‌ها و واکنش‌های بهتری در برابر دستورات پیچیده می‌شود. در پست وبلاگی جدید گوگل آمده است: «ما این قابلیت‌های تفکر را به طور مستقیم در همه مدل‌های خود تعبیه می‌کنیم، تا بتوانند مسائل پیچیده‌تر را مدیریت کرده و از عوامل توانمندتر و آگاه به متن پشتیبانی کنند.»

در یک ویدئوی نمایشی، مدل جمینای 2.5 پرو توانایی خود را در استفاده از این قابلیت‌های استدلالی برای برنامه‌نویسی یک بازی ویدئویی تنها با یک دستور واحد به نمایش می‌گذارد.

هوش مصنوعی Gemini 2.5 Pro

هوش مصنوعی Gemini 2.5 Pro در برابر رقبا

گوگل پیش‌تر در آذر ماه سال گذشته، نسخه‌ای “متفکر” از جمینای را آزمایش کرده بود، اما جمینای 2.5 پرو جدی‌ترین تلاش این شرکت برای رقابت با سری مدل‌های “o” شرکت OpenAI به شمار می‌رود.

گوگل اعلام کرده که جمینای 2.5 پرو در چندین معیار سنجش از مدل‌های پیشین خود و برخی از رقبای برجسته پیشی گرفته است. به‌طور خاص، این مدل برای توسعه برنامه‌های وب جذاب و کاربردهای کدنویسی مبتنی بر هوش مصنوعی طراحی شده است.

در آزمون Aider Polyglot که توانایی ویرایش کد را می‌سنجد، جمینای 2.5 پرو با امتیاز 68.6 درصد از برترین مدل‌های OpenAI، Anthropic و هوش مصنوعی چینی DeepSeek عملکرد بهتری داشته است.

اما در آزمون دیگری به نام SWE-bench Verified که مهارت‌های توسعه نرم‌افزار را ارزیابی می‌کند، این مدل با امتیاز 63.8 درصد از o3-mini OpenAI و R1 DeepSeek بهتر عمل کرده، ولی در مقایسه با Claude 3.7 Sonnet از Anthropic (با امتیاز 70.3 درصد) کمی ضعیف‌تر ظاهر شده است.

همچنین در آزمون چندوجهی Humanity’s Last Exam که شامل هزاران سؤال جمع‌سپاری‌شده در زمینه ریاضیات، علوم انسانی و علوم طبیعی است، جمینای 2.5 پرو با امتیاز 18.8 درصد از اکثر مدل‌های پرچم‌دار رقبا پیشی گرفته است.

ظرفیت بی‌نظیر Gemini 2.5 Pro

گوگل اعلام کرده که جمینای 2.5 پرو در ابتدا با پنجره زمینه (Context Window) یک میلیون توکن عرضه می‌شود؛ این یعنی توانایی پردازش حدود 750 هزار کلمه در یک زمان.

این حجم از ورودی، از کل مجموعه کتاب‌های «ارباب حلقه‌ها» هم بیشتر است! به‌زودی این ظرفیت به 2 میلیون توکن افزایش خواهد یافت که قدرت پردازش اطلاعات عظیمی را به این مدل می‌بخشد.

گوگل هنوز قیمت‌گذاری API برای جمینای 2.5 پرو را اعلام نکرده، اما وعده داده که جزئیات بیشتری طی هفته‌های آینده منتشر خواهد شد.

گفتنی است همزمان با مدل‌های جدید هوش مصنوعی استدلالی جمینای 2.5 گوگل، مایکروسافت نیز از دو عامل (ایجنت) جدید استدلال عمیق برای هوش مصنوعی کوپایلت رونمایی کرد و شرکت OpenAI نیز از اضافه شدن قابلیت تولید تصویر با استفاده از GPT-4o به ChatGPT خبر داده است.

source
کلاس یوس

توسط petese.ir