شرکت OpenAI مدل هوش مصنوعی پیشرفته GPT-4.1 را معرفی کرد. این مدل جدید، نسخه بهبود یافتهای از مدل چندمنظوره GPT-4.0 است که سال گذشته توسط این شرکت معرفی شده بود.
شرکتOpenAI اعلام کرده که GPT-4.1 دارای پنجره متنی بزرگتری است و در بیشتر جنبهها از GPT-4.0 برتری دارد، به ویژه در بهبودهایی که در زمینه کدنویسی و پیروی از دستورات ایجاد شده است.
ویژگیهای مدل هوش مصنوعی GPT-4.1
مدل GPT-4.1 هماکنون در دسترس توسعهدهندگان قرار دارد و همراه با دو نسخه کوچکتر دیگر به نامهای GPT-4.1 Mini و GPT-4.1 Nano عرضه میشود که به گفته OpenAI در زمینه کدنویسی و دنبال کردن دستورالعملها بهطور ویژهای عملکرد خوبی دارند.
هوش مصنوعی GPT-4.1 Mini مانند نسخه پیشین خود، بهمنظور استفاده ارزانتر برای توسعهدهندگان طراحی شده است. از سوی دیگر GPT-4.1 Nano مدل سبکتر و سریعتری است که OpenAI آن را “کوچکترین، سریعترین و ارزانترین مدل” خود میداند.
مدلهای هوش مصنوعی GPT-4.1 از طریق API OpenAI قابل دسترسی هستند و از طریق چت بات ChatGPT در دسترس قرار ندارند.
این مدلهای چندمنظوره دارای پنجره متنی با ظرفیت یک میلیون توکن هستند که به آنها اجازه میدهد تقریباً ۷۵۰ هزار کلمه را در یک بار پردازش کنند (که طولانیتر از کتاب “جنگ و صلح” است).
مدل GPT-4.1 در زمانی منتشر میشود که رقبا همچون گوگل و شرکت Anthropic تلاشهای خود را برای ساخت مدلهای پیچیدهتر برنامهنویسی افزایش دادهاند. بهعنوان مثال، مدل جدید گوگل با نام Gemini 2.5 Pro که دارای پنجره متنی یک میلیون توکن است، در بنچمارکهای کدنویسی محبوب امتیاز بالایی کسب کرده است.
همچنین مدلهای Claude 3.7 Sonnet از Anthropic و مدل V3 شرکت DeepSeek از چین نیز در این رقابت حضور دارند.
هدف بسیاری از غولهای فناوری، از جمله OpenAI، تربیت مدلهای هوش مصنوعی توانمند برای انجام وظایف پیچیده مهندسی نرمافزار است.
در این راستا OpenAI با هدف ایجاد یک “مهندس نرمافزار خودکار” پیش میرود، این شرکت بر این باور است که مدلهای آیندهاش قادر به برنامهنویسی کامل اپلیکیشنها بهصورت end-to-end خواهند بود، بهگونهای که وظایفی چون تضمین کیفیت، تست باگها و نوشتن مستندات را نیز انجام دهند.
مدل هوش مصنوعی GPT-4.1؛ گام جدید در این مسیر
شرکت OpenAI در مورد مدل GPT-4.1 گفته است که این مدل برای استفاده واقعی بهینهسازی شده است، بهطور خاص بر اساس بازخورد مستقیم از توسعهدهندگان در جهت بهبود مواردی که برای آنها اهمیت زیادی دارد، از جمله کدنویسی فرانتاند، ایجاد تغییرات کمتر اضافی، پیروی از قالبها و ساختار پاسخها، استفاده منظم از ابزارها و موارد مشابه.
این بهبودها به توسعهدهندگان این امکان را میدهند که مدلهایی بسازند که در انجام وظایف مهندسی نرمافزار دنیای واقعی عملکرد بهتری دارند.
به گفته OpenAI، مدل کامل GPT-4.1 از مدلهای قبلی خود مانند GPT-4o و GPT-4o mini در بنچمارکهای کدنویسی، از جمله SWE-bench، عملکرد بهتری دارد.
همچنین مدلهای GPT-4.1 mini و nano به دلیل سرعت بالاتر و کارایی بهتر، هرچند ممکن است دقت کمتری داشته باشند، برای استفاده در کاربردهایی که به سرعت نیاز دارند، مناسبترند. نسخه GPT-4.1 nano بهعنوان سریعترین و ارزانترین مدل این مجموعه شناخته میشود.
هزینهها و مدلهای مختلف GPT-4.1
مدل GPT-4.1 برای هر میلیون توکن ورودی ۲ دلار و برای هر میلیون توکن خروجی ۸ دلار هزینه دارد. مدل GPT-4.1 mini به قیمت ۰.۴۰ دلار برای یک میلیون توکن ورودی و ۱.۶۰ دلار برای یک میلیون توکن خروجی ارائه میشود. همچنین مدل GPT-4.1 nano با قیمت ۰.۱۰ دلار برای یک میلیون توکن ورودی و ۰.۴۰ دلار برای یک میلیون توکن خروجی در دسترس است.
بر اساس آزمایشهای داخلی OpenAI، مدل GPT-4.1 که قادر است توکنهای بیشتری را نسبت به GPT-4o پردازش کند (۳۲,۷۶۸ توکن در مقابل ۱۶,۳۸۴ توکن)، در بنچمارک SWE-bench Verified امتیاز بین ۵۲ درصد تا ۵۴.۶ درصد کسب کرده است.
این مدل در ارزیابیهای مختلف کمی پایینتر از مدلهای گوگل و Anthropic قرار گرفته است (برای مثال ۶۳.۸ درصد برای مدل Gemini 2.5 Pro از گوگل و ۶۲.۳ درصد برای مدل Claude 3.7 Sonnet از Anthropic).
دقت و چالشها
اگرچه GPT-4.1 در بنچمارکها عملکرد نسبتاً خوبی دارد و “برش دانش” جدیدتری دارد که آن را قادر میسازد رویدادهای جاری را بهتر درک کند (تا ژوئن ۲۰۲۴)، همچنان باید توجه داشت که حتی بهترین مدلها نیز در انجام برخی از وظایف پیچیده مشکل دارند. بهویژه در کدنویسی، مدلهای هوش مصنوعی بهطور مکرر قادر به اصلاح یا شناسایی آسیبپذیریهای امنیتی و اشکالات نیستند.
OpenAI همچنین اذعان دارد که دقت مدل GPT-4.1 با افزایش تعداد توکنهای ورودی کاهش مییابد. بهطور خاص، در آزمایشهای خود، دقت مدل از حدود ۸۴درصد با ۸ هزار توکن به ۵۰ درصد با ۱ میلیون توکن کاهش یافته است. همچنین این مدل بیشتر از GPT-4o بهطور “واژگانی” عمل میکند و گاهی نیاز به دستورات دقیقتر و صریحتر دارد.
مدلهای جدید GPT-4.1 از OpenAI قدمی بزرگ در راستای پیشرفتهای بیشتر در هوش مصنوعی و کدنویسی هستند. با وجود مزایای عملکرد بالا، نیاز به دقت بیشتر در نحوه استفاده از این مدلها وجود دارد، چرا که همچنان چالشهایی در زمینههای خاص وجود دارد که برای متخصصان مشکلاتی بهوجود میآورد. بهنظر میرسد آینده این مدلها میتواند بهطور قابل توجهی تحولآفرین باشد.
source
کلاس یوس