هر آنچه که باید درباره DeepSeek بدانید
چند روز پیش، آزمایشگاه هوش مصنوعی چینی DeepSeek به طور چشمگیری در کانون توجهات قرار گرفت، زیرا اپلیکیشن چتبات آن به صدر جدول اپل اپ استور رسید. مدلهای هوش مصنوعی DeepSeek که با استفاده از تکنیکهای بهینهسازی محاسباتی آموزش دیدهاند، باعث شده که تحلیلگران وال استریت و متخصصان فناوری به این فکر کنند که آیا آمریکا قادر به حفظ برتری خود در رقابت هوش مصنوعی خواهد بود و آیا تقاضا برای تراشههای هوش مصنوعی ادامه خواهد یافت یا خیر. دیپسیک از کجا آمده و چگونه به سرعت به شهرت جهانی دست یافت؟
ریشه های معامله گر DeepSeek
DeepSeek تحت حمایت High-Flyer Capital Management قرار دارد، که یک صندوق پوشش ریسک کمی در چین است و از هوش مصنوعی برای اتخاذ تصمیمات تجاری خود استفاده میکند. لیانگ ونفنگ، علاقهمند به هوش مصنوعی، این صندوق را در سال 2015 تأسیس کرد و در سال 2019 به عنوان یک صندوق پوشش ریسک با تمرکز بر توسعه و پیادهسازی الگوریتمهای هوش مصنوعی فعالیت خود را آغاز کرد.
در سال 2023، های-فلایر DeepSeek را به عنوان یک آزمایشگاه برای تحقیق در زمینه ابزارهای هوش مصنوعی راهاندازی کرد و این آزمایشگاه به یک شرکت مستقل با نام DeepSeek تبدیل شد. از ابتدای کار، DeepSeek به ساخت کلاسترهای دیتاسنتر خود برای آموزش مدلها پرداخت. اما مانند دیگر شرکتهای هوش مصنوعی در چین، DeepSeek تحت تأثیر ممنوعیتهای صادراتی آمریکا بر روی سختافزار قرار گرفت.
برای آموزش یکی از مدلهای جدید خود، این شرکت مجبور شد از تراشههای Nvidia H800 استفاده کند که نسخهای ضعیفتر از تراشه H100 است که به شرکتهای آمریکایی عرضه میشود. این چالشها نشاندهنده دشواریهایی است که شرکتهای هوش مصنوعی چینی با آن مواجه هستند و اهمیت رقابت در این حوزه را دوچندان میکند.
تیم فنی شرکت DeepSeek به طور عمده جوان است و این شرکت به طور فعال به جذب پژوهشگران دکتری در زمینه هوش مصنوعی از دانشگاههای معتبر چین میپردازد. همچنین، DeepSeek افرادی را که پیشینهای در علوم کامپیوتر ندارند، استخدام میکند تا فناوریاش بتواند درک بهتری از موضوعات مختلف داشته باشد.
مدل های قوی DeepSeek
این شرکت در نوامبر 2023 نخستین مجموعه مدلهای خود را با نامهای DeepSeek Coder، DeepSeek LLM و DeepSeek Chat معرفی کرد. اما توجه صنعت هوش مصنوعی به این استارتاپ، پس از انتشار نسل جدید مدلهای DeepSeek-V2 در بهار سال گذشته جلب شد. DeepSeek-V2، که سیستمی عمومی برای تحلیل متن و تصویر است، در آزمونهای مختلف هوش مصنوعی عملکرد خوبی از خود نشان داد و هزینههای عملیاتی آن به مراتب کمتر از مدلهای مشابه بود.
این موفقیت باعث شد تا رقبا داخلی DeepSeek از جمله ByteDance و Alibaba قیمتهای استفاده از برخی مدلهای خود را کاهش دهند و حتی برخی دیگر را کاملاً رایگان ارائه کنند. مدل DeepSeek-V3 که در دسامبر 2024 عرضه شد، بر شهرت این شرکت افزوده است. بر اساس آزمایشهای داخلی DeepSeek، مدل V3 از نظر عملکردی از مدلهای قابل دانلود و عمومی مانند Llama متا و همچنین مدلهای “بسته” که تنها از طریق API قابل دسترسی هستند، مانند GPT-4o شرکت OpenAI، پیشی گرفته است.
این موفقیتها نشاندهنده توانمندیهای بالای DeepSeek در زمینه ارائه راهکارهای هوش مصنوعی است که میتواند بر رقابتهای موجود در این حوزه تأثیر بسزایی بگذارد. مدل “استدلال” R1 شرکت DeepSeek که در ماه ژانویه معرفی شد، به طرز قابل توجهی عملکردی مشابه با مدل o1 OpenAI در معیارهای کلیدی دارد. این مدل به دلیل قابلیت استدلالی خود، میتواند به طور مؤثری صحت اطلاعات را بررسی کند و از برخی مشکلاتی که معمولاً مدلها با آن مواجه میشوند، جلوگیری نماید.
مدلهای استدلالی معمولاً برای رسیدن به نتایج نیاز به زمان بیشتری دارند، که این زمان میتواند از چند ثانیه تا چند دقیقه متغیر باشد. با وجود این، دقت آنها در زمینههایی مانند فیزیک، علوم و ریاضیات بیشتر است. با این حال، مدل R1 و دیگر مدلهای DeepSeek، با یک چالش نیز روبرو هستند. به عنوان یک هوش مصنوعی که در چین توسعه یافته، تحت نظارت نهادهای اینترنتی این کشور قرار دارند تا اطمینان حاصل شود که پاسخهای آنها با “ارزشهای اصلی سوسیالیستی” همخوانی دارد.
به عنوان مثال، در اپلیکیشن چتبات DeepSeek، مدل R1 قادر به پاسخگویی به سؤالاتی درباره میدان تیانآنمن یا خودمختاری تایوان نیست. این محدودیتها میتواند بر روی قابلیتهای این مدل و انتخابهای اطلاعاتی آن تأثیرگذار باشد و در نتیجه، کاربران باید با آگاهی از این شرایط به استفاده از این فناوری بپردازند.
رویکردی نوآورانه و تحولآفرین
مدل کسبوکار شرکت DeepSeek به روشنی مشخص نیست. این شرکت محصولات و خدمات خود را با قیمتهایی پایینتر از بازار ارائه میدهد و برخی از آنها را بهصورت رایگان در اختیار کاربران قرار میدهد. به گفته DeepSeek، پیشرفتهای قابل توجه در کارایی به آنها این امکان را داده تا به رقابت قیمتی بسیار بالایی دست یابند. با این حال، برخی کارشناسان به ارقامی که این شرکت ارائه داده، شک و تردید دارند.
در هر صورت، توسعهدهندگان به مدلهای DeepSeek توجه ویژهای نشان دادهاند. این مدلها بهطور کامل متنباز نیستند، اما تحت مجوزهای اجازهدهندهای قرار دارند که استفاده تجاری از آنها را مجاز میسازد. به گفته کلم دلانگ، مدیرعامل Hugging Face، یکی از پلتفرمهای میزبانی مدلهای DeepSeek، توسعهدهندگان در Hugging Face بیش از 500 مدل “مشتق” از مدل R1 را ایجاد کردهاند که مجموعاً 2.5 میلیون بار دانلود شدهاند.
موفقیت DeepSeek در برابر رقبای بزرگ و تثبیتشده بهعنوان عاملی برای “تغییر در زمینه هوش مصنوعی” توصیف شده و بهنظر میرسد که به آغاز “عصر جدیدی از رقابت در هوش مصنوعی” منجر شده است. این موفقیت همچنین باعث کاهش 18 درصدی قیمت سهام انویدیا شد و واکنش عمومی سام آلتمن، مدیرعامل OpenAI را به دنبال داشت