
نسخه بهبودیافته مدل هوش مصنوعی DeepSeek منتشر شد. سه ماه پس از معرفی اولیه مدل دیپ سیک V3 در دسامبر 2024، نسخه جدیدی با نام DeepSeek-V3-0324 توسط توسعهدهندگان آن منتشر شد. این مدل ارتقا یافته، با بهبودهای چشمگیری در عملکرد و تواناییها، قادر به خلق صفحات وب جذاب و نگارش گزارشهای روان به زبان چینی است.
شرکت هوش مصنوعی چینی دیپسیک نسخه بهروزرسانی شده مدل زبانی بزرگ هوش مصنوعی V3 خود را با نام DeepSeek-V3-0324 معرفی کرده است. مدل V3 که ابتدا در دسامبر 2024 معرفی شده بود، به دلیل نیاز به سختافزار آموزشی بسیار کمتر، زمان آموزش کوتاهتر و هزینههای API پایینتر، در مقایسه با رقبای خود مانند مدلهای GPT شرکت OpenAI، توانست توجهات زیادی را به خود جلب کند و به نوعی شگفتیآفرین شد.
نسخه جدید مدل V3 بر پایه استدلال بنا نشده است. این بدان معناست که هدف اصلی آن پاسخگویی سریع به پرسشها است و بر خلاف مدل R1، برای بررسی عمیق و تفکر در مورد مسائل پیچیده، زمان بیشتری را صرف نمیکند. این مدل با داشتن 685 میلیارد پارامتر، در زمره بزرگترین مدلهای زبانی موجود در دسترس عموم قرار میگیرد. آخرین نسخه این مدل تحت مجوز MIT، برای استفاده عموم ارائه شده است.
در آزمونهای ارزیابی هوش مصنوعی، مدل DeepSeek-V3-0324 توانست عملکردی بین 5.3% تا 19.8% بهتر از نسخه اصلی V3 از خود نشان دهد. عملکرد این مدل، با سایر سیستمهای هوش مصنوعی پیشرفته مانند GPT-4.5 و Claude Sonnet 3.7 قابل مقایسه است.
نسخه بهروز شده این مدل، قابلیتهای پیشرفتهتری را نیز به همراه دارد. یکی از مهمترین پیشرفتها، توانایی بهبودیافته آن در طراحی صفحات وب جذاب و رابطهای کاربری کاربرپسند برای بازیهای آنلاین است. این مدل همچنین در زمینههای جستجو، نگارش و ترجمه به زبان چینی نیز عملکرد بهتری از خود نشان میدهد.
افرادی که قصد دارند مدل DeepSeek-V3-0324 را با 685 میلیارد پارامتر آزمایش کنند، باید حداقل 700 گیگابایت فضای ذخیرهسازی در دسترس داشته باشند و از چند پردازنده گرافیکی Nvidia A100 یا H100 استفاده کنند.
source
کلاس یوس