نسخه بهبودیافته مدل هوش مصنوعی DeepSeek منتشر شد. سه ماه پس از معرفی اولیه مدل دیپ سیک V3 در دسامبر 2024، نسخه جدیدی با نام DeepSeek-V3-0324 توسط توسعه‌دهندگان آن منتشر شد. این مدل ارتقا یافته، با بهبودهای چشمگیری در عملکرد و توانایی‌ها، قادر به خلق صفحات وب جذاب و نگارش گزارش‌های روان به زبان چینی است.

شرکت هوش مصنوعی چینی دیپ‌سیک نسخه به‌روزرسانی شده مدل زبانی بزرگ هوش مصنوعی V3 خود را با نام DeepSeek-V3-0324 معرفی کرده است. مدل V3 که ابتدا در دسامبر 2024 معرفی شده بود، به دلیل نیاز به سخت‌افزار آموزشی بسیار کمتر، زمان آموزش کوتاه‌تر و هزینه‌های API پایین‌تر، در مقایسه با رقبای خود مانند مدل‌های GPT شرکت OpenAI، توانست توجهات زیادی را به خود جلب کند و به نوعی شگفتی‌آفرین شد.

در آزمون‌های ارزیابی هوش مصنوعی، مدل DeepSeek-V3-0324 توانست عملکردی بین 5.3% تا 19.8% بهتر از نسخه اصلی V3 از خود نشان دهد. عملکرد این مدل، با سایر سیستم‌های هوش مصنوعی پیشرفته مانند GPT-4.5 و Claude Sonnet 3.7 قابل مقایسه است.

نسخه جدید مدل V3 بر پایه استدلال بنا نشده است. این بدان معناست که هدف اصلی آن پاسخگویی سریع به پرسش‌ها است و بر خلاف مدل R1، برای بررسی عمیق و تفکر در مورد مسائل پیچیده، زمان بیشتری را صرف نمی‌کند. این مدل با داشتن 685 میلیارد پارامتر، در زمره بزرگ‌ترین مدل‌های زبانی موجود در دسترس عموم قرار می‌گیرد. آخرین نسخه این مدل تحت مجوز MIT، برای استفاده عموم ارائه شده است.

در آزمون‌های ارزیابی هوش مصنوعی، مدل DeepSeek-V3-0324 توانست عملکردی بین 5.3% تا 19.8% بهتر از نسخه اصلی V3 از خود نشان دهد. عملکرد این مدل، با سایر سیستم‌های هوش مصنوعی پیشرفته مانند GPT-4.5 و Claude Sonnet 3.7 قابل مقایسه است.

نسخه به‌روز شده این مدل، قابلیت‌های پیشرفته‌تری را نیز به همراه دارد. یکی از مهم‌ترین پیشرفت‌ها، توانایی بهبودیافته آن در طراحی صفحات وب جذاب و رابط‌های کاربری کاربرپسند برای بازی‌های آنلاین است. این مدل همچنین در زمینه‌های جستجو، نگارش و ترجمه به زبان چینی نیز عملکرد بهتری از خود نشان می‌دهد.

افرادی که قصد دارند مدل DeepSeek-V3-0324 را با 685 میلیارد پارامتر آزمایش کنند، باید حداقل 700 گیگابایت فضای ذخیره‌سازی در دسترس داشته باشند و از چند پردازنده گرافیکی Nvidia A100 یا H100 استفاده کنند.




source
کلاس یوس

توسط petese.ir