شرکت OpenAI مدل هوش مصنوعی پیشرفته GPT-4.1 را معرفی کرد. این مدل جدید، نسخه بهبود یافته‌ای از مدل چندمنظوره GPT-4.0 است که سال گذشته توسط این شرکت معرفی شده بود.

شرکتOpenAI اعلام کرده که GPT-4.1 دارای پنجره‌ متنی بزرگتری است و در بیشتر جنبه‌ها از GPT-4.0 برتری دارد، به ویژه در بهبودهایی که در زمینه کدنویسی و پیروی از دستورات ایجاد شده است.

ویژگی‌های مدل هوش مصنوعی GPT-4.1

مدل GPT-4.1 هم‌اکنون در دسترس توسعه‌دهندگان قرار دارد و همراه با دو نسخه کوچک‌تر دیگر به نام‌های GPT-4.1 Mini و GPT-4.1 Nano عرضه می‌شود که به گفته OpenAI در زمینه کدنویسی و دنبال کردن دستورالعمل‌ها به‌طور ویژه‌ای عملکرد خوبی دارند.

هوش مصنوعی GPT-4.1 Mini مانند نسخه پیشین خود، به‌منظور استفاده ارزان‌تر برای توسعه‌دهندگان طراحی شده است. از سوی دیگر GPT-4.1 Nano مدل سبک‌تر و سریع‌تری است که OpenAI آن را “کوچک‌ترین، سریع‌ترین و ارزان‌ترین مدل” خود می‌داند.

مدل‌های هوش مصنوعی GPT-4.1 از طریق API OpenAI قابل دسترسی هستند و از طریق چت بات ChatGPT در دسترس قرار ندارند.

این مدل‌های چندمنظوره دارای پنجره متنی با ظرفیت یک میلیون توکن هستند که به آن‌ها اجازه می‌دهد تقریباً ۷۵۰ هزار کلمه را در یک بار پردازش کنند (که طولانی‌تر از کتاب “جنگ و صلح” است).

مدل GPT-4.1 در زمانی منتشر می‌شود که رقبا همچون گوگل و شرکت Anthropic تلاش‌های خود را برای ساخت مدل‌های پیچیده‌تر برنامه‌نویسی افزایش داده‌اند. به‌عنوان مثال، مدل جدید گوگل با نام Gemini 2.5 Pro که دارای پنجره متنی یک میلیون توکن است، در بنچ‌مارک‌های کدنویسی محبوب امتیاز بالایی کسب کرده است.

همچنین مدل‌های Claude 3.7 Sonnet از Anthropic و مدل V3 شرکت DeepSeek از چین نیز در این رقابت حضور دارند.

هدف بسیاری از غول‌های فناوری، از جمله OpenAI، تربیت مدل‌های هوش مصنوعی توانمند برای انجام وظایف پیچیده مهندسی نرم‌افزار است.

در این راستا OpenAI با هدف ایجاد یک “مهندس نرم‌افزار خودکار” پیش می‌رود، این شرکت بر این باور است که مدل‌های آینده‌اش قادر به برنامه‌نویسی کامل اپلیکیشن‌ها به‌صورت end-to-end خواهند بود، به‌گونه‌ای که وظایفی چون تضمین کیفیت، تست باگ‌ها و نوشتن مستندات را نیز انجام دهند.

مدل هوش مصنوعی GPT-4.1؛ گام جدید در این مسیر

شرکت OpenAI در مورد مدل GPT-4.1 گفته است که این مدل برای استفاده واقعی بهینه‌سازی شده است، به‌طور خاص بر اساس بازخورد مستقیم از توسعه‌دهندگان در جهت بهبود مواردی که برای آن‌ها اهمیت زیادی دارد، از جمله کدنویسی فرانت‌اند، ایجاد تغییرات کم‌تر اضافی، پیروی از قالب‌ها و ساختار پاسخ‌ها، استفاده منظم از ابزارها و موارد مشابه.

بنچمارک هوش مصنوعی GPT-4.1

این بهبودها به توسعه‌دهندگان این امکان را می‌دهند که مدل‌هایی بسازند که در انجام وظایف مهندسی نرم‌افزار دنیای واقعی عملکرد بهتری دارند.

به گفته OpenAI، مدل کامل GPT-4.1 از مدل‌های قبلی خود مانند GPT-4o و GPT-4o mini در بنچ‌مارک‌های کدنویسی، از جمله SWE-bench، عملکرد بهتری دارد.

همچنین مدل‌های GPT-4.1 mini و nano به دلیل سرعت بالاتر و کارایی بهتر، هرچند ممکن است دقت کمتری داشته باشند، برای استفاده در کاربردهایی که به سرعت نیاز دارند، مناسب‌ترند. نسخه GPT-4.1 nano به‌عنوان سریع‌ترین و ارزان‌ترین مدل این مجموعه شناخته می‌شود.

هزینه‌ها و مدل‌های مختلف GPT-4.1

مدل GPT-4.1 برای هر میلیون توکن ورودی ۲ دلار و برای هر میلیون توکن خروجی ۸ دلار هزینه دارد. مدل GPT-4.1 mini به قیمت ۰.۴۰ دلار برای یک میلیون توکن ورودی و ۱.۶۰ دلار برای یک میلیون توکن خروجی ارائه می‌شود. همچنین مدل GPT-4.1 nano با قیمت ۰.۱۰ دلار برای یک میلیون توکن ورودی و ۰.۴۰ دلار برای یک میلیون توکن خروجی در دسترس است.

بر اساس آزمایش‌های داخلی OpenAI، مدل GPT-4.1 که قادر است توکن‌های بیشتری را نسبت به GPT-4o پردازش کند (۳۲,۷۶۸ توکن در مقابل ۱۶,۳۸۴ توکن)، در بنچ‌مارک SWE-bench Verified امتیاز بین ۵۲ درصد تا ۵۴.۶ درصد کسب کرده است.

این مدل در ارزیابی‌های مختلف کمی پایین‌تر از مدل‌های گوگل و Anthropic قرار گرفته است (برای مثال ۶۳.۸ درصد برای مدل Gemini 2.5 Pro از گوگل و ۶۲.۳ درصد برای مدل Claude 3.7 Sonnet از Anthropic).

دقت و چالش‌ها

اگرچه GPT-4.1 در بنچ‌مارک‌ها عملکرد نسبتاً خوبی دارد و “برش دانش” جدیدتری دارد که آن را قادر می‌سازد رویدادهای جاری را بهتر درک کند (تا ژوئن ۲۰۲۴)، همچنان باید توجه داشت که حتی بهترین مدل‌ها نیز در انجام برخی از وظایف پیچیده مشکل دارند. به‌ویژه در کدنویسی، مدل‌های هوش مصنوعی به‌طور مکرر قادر به اصلاح یا شناسایی آسیب‌پذیری‌های امنیتی و اشکالات نیستند.

OpenAI همچنین اذعان دارد که دقت مدل GPT-4.1 با افزایش تعداد توکن‌های ورودی کاهش می‌یابد. به‌طور خاص، در آزمایش‌های خود، دقت مدل از حدود ۸۴درصد با ۸ هزار توکن به ۵۰ درصد با ۱ میلیون توکن کاهش یافته است. همچنین این مدل بیشتر از GPT-4o به‌طور “واژگانی” عمل می‌کند و گاهی نیاز به دستورات دقیق‌تر و صریح‌تر دارد.

مدل‌های جدید GPT-4.1 از OpenAI قدمی بزرگ در راستای پیشرفت‌های بیشتر در هوش مصنوعی و کدنویسی هستند. با وجود مزایای عملکرد بالا، نیاز به دقت بیشتر در نحوه استفاده از این مدل‌ها وجود دارد، چرا که همچنان چالش‌هایی در زمینه‌های خاص وجود دارد که برای متخصصان مشکلاتی به‌وجود می‌آورد. به‌نظر می‌رسد آینده این مدل‌ها می‌تواند به‌طور قابل توجهی تحول‌آفرین باشد.

source
کلاس یوس

توسط petese.ir