هوش مصنوعی

هر آنچه که باید درباره DeepSeek بدانید

چند روز پیش، آزمایشگاه هوش مصنوعی چینی DeepSeek به طور چشمگیری در کانون توجهات قرار گرفت، زیرا اپلیکیشن چت‌بات آن به صدر جدول اپل اپ استور رسید. مدل‌های هوش مصنوعی DeepSeek که با استفاده از تکنیک‌های بهینه‌سازی محاسباتی آموزش دیده‌اند، باعث شده که تحلیلگران وال استریت و متخصصان فناوری به این فکر کنند که آیا آمریکا قادر به حفظ برتری خود در رقابت هوش مصنوعی خواهد بود و آیا تقاضا برای تراشه‌های هوش مصنوعی ادامه خواهد یافت یا خیر. دیپ‌سیک از کجا آمده و چگونه به سرعت به شهرت جهانی دست یافت؟

ریشه های معامله گر DeepSeek

DeepSeek تحت حمایت High-Flyer Capital Management قرار دارد، که یک صندوق پوشش ریسک کمی در چین است و از هوش مصنوعی برای اتخاذ تصمیمات تجاری خود استفاده می‌کند. لیانگ ون‌فنگ، علاقه‌مند به هوش مصنوعی، این صندوق را در سال 2015 تأسیس کرد و در سال 2019 به عنوان یک صندوق پوشش ریسک با تمرکز بر توسعه و پیاده‌سازی الگوریتم‌های هوش مصنوعی فعالیت خود را آغاز کرد.

در سال 2023، های-فلایر DeepSeek را به عنوان یک آزمایشگاه برای تحقیق در زمینه ابزارهای هوش مصنوعی راه‌اندازی کرد و این آزمایشگاه به یک شرکت مستقل با نام DeepSeek تبدیل شد. از ابتدای کار، DeepSeek به ساخت کلاسترهای دیتاسنتر خود برای آموزش مدل‌ها پرداخت. اما مانند دیگر شرکت‌های هوش مصنوعی در چین، DeepSeek تحت تأثیر ممنوعیت‌های صادراتی آمریکا بر روی سخت‌افزار قرار گرفت.

برای آموزش یکی از مدل‌های جدید خود، این شرکت مجبور شد از تراشه‌های Nvidia H800 استفاده کند که نسخه‌ای ضعیف‌تر از تراشه H100 است که به شرکت‌های آمریکایی عرضه می‌شود. این چالش‌ها نشان‌دهنده دشواری‌هایی است که شرکت‌های هوش مصنوعی چینی با آن مواجه هستند و اهمیت رقابت در این حوزه را دوچندان می‌کند.

تیم فنی شرکت DeepSeek به طور عمده جوان است و این شرکت به طور فعال به جذب پژوهشگران دکتری در زمینه هوش مصنوعی از دانشگاه‌های معتبر چین می‌پردازد. همچنین، DeepSeek افرادی را که پیشینه‌ای در علوم کامپیوتر ندارند، استخدام می‌کند تا فناوری‌اش بتواند درک بهتری از موضوعات مختلف داشته باشد.

مدل های قوی DeepSeek

این شرکت در نوامبر 2023 نخستین مجموعه مدل‌های خود را با نام‌های DeepSeek Coder، DeepSeek LLM و DeepSeek Chat معرفی کرد. اما توجه صنعت هوش مصنوعی به این استارتاپ، پس از انتشار نسل جدید مدل‌های DeepSeek-V2 در بهار سال گذشته جلب شد. DeepSeek-V2، که سیستمی عمومی برای تحلیل متن و تصویر است، در آزمون‌های مختلف هوش مصنوعی عملکرد خوبی از خود نشان داد و هزینه‌های عملیاتی آن به مراتب کمتر از مدل‌های مشابه بود.

این موفقیت باعث شد تا رقبا داخلی DeepSeek از جمله ByteDance و Alibaba قیمت‌های استفاده از برخی مدل‌های خود را کاهش دهند و حتی برخی دیگر را کاملاً رایگان ارائه کنند. مدل DeepSeek-V3 که در دسامبر 2024 عرضه شد، بر شهرت این شرکت افزوده است. بر اساس آزمایش‌های داخلی DeepSeek، مدل V3 از نظر عملکردی از مدل‌های قابل دانلود و عمومی مانند Llama متا و همچنین مدل‌های “بسته” که تنها از طریق API قابل دسترسی هستند، مانند GPT-4o شرکت OpenAI، پیشی گرفته است.

این موفقیت‌ها نشان‌دهنده توانمندی‌های بالای DeepSeek در زمینه ارائه راهکارهای هوش مصنوعی است که می‌تواند بر رقابت‌های موجود در این حوزه تأثیر بسزایی بگذارد. مدل “استدلال” R1 شرکت DeepSeek که در ماه ژانویه معرفی شد، به طرز قابل توجهی عملکردی مشابه با مدل o1 OpenAI در معیارهای کلیدی دارد. این مدل به دلیل قابلیت استدلالی خود، می‌تواند به طور مؤثری صحت اطلاعات را بررسی کند و از برخی مشکلاتی که معمولاً مدل‌ها با آن مواجه می‌شوند، جلوگیری نماید.

مدل‌های استدلالی معمولاً برای رسیدن به نتایج نیاز به زمان بیشتری دارند، که این زمان می‌تواند از چند ثانیه تا چند دقیقه متغیر باشد. با وجود این، دقت آن‌ها در زمینه‌هایی مانند فیزیک، علوم و ریاضیات بیشتر است. با این حال، مدل R1 و دیگر مدل‌های DeepSeek، با یک چالش نیز روبرو هستند. به عنوان یک هوش مصنوعی که در چین توسعه یافته، تحت نظارت نهادهای اینترنتی این کشور قرار دارند تا اطمینان حاصل شود که پاسخ‌های آن‌ها با “ارزش‌های اصلی سوسیالیستی” همخوانی دارد.

به عنوان مثال، در اپلیکیشن چت‌بات DeepSeek، مدل R1 قادر به پاسخگویی به سؤالاتی درباره میدان تیان‌آن‌من یا خودمختاری تایوان نیست. این محدودیت‌ها می‌تواند بر روی قابلیت‌های این مدل و انتخاب‌های اطلاعاتی آن تأثیرگذار باشد و در نتیجه، کاربران باید با آگاهی از این شرایط به استفاده از این فناوری بپردازند.

رویکردی نوآورانه و تحول‌آفرین

مدل کسب‌وکار شرکت DeepSeek به روشنی مشخص نیست. این شرکت محصولات و خدمات خود را با قیمت‌هایی پایین‌تر از بازار ارائه می‌دهد و برخی از آنها را به‌صورت رایگان در اختیار کاربران قرار می‌دهد. به گفته DeepSeek، پیشرفت‌های قابل توجه در کارایی به آن‌ها این امکان را داده تا به رقابت قیمتی بسیار بالایی دست یابند. با این حال، برخی کارشناسان به ارقامی که این شرکت ارائه داده، شک و تردید دارند.

در هر صورت، توسعه‌دهندگان به مدل‌های DeepSeek توجه ویژه‌ای نشان داده‌اند. این مدل‌ها به‌طور کامل متن‌باز نیستند، اما تحت مجوزهای اجازه‌دهنده‌ای قرار دارند که استفاده تجاری از آنها را مجاز می‌سازد. به گفته کلم دلانگ، مدیرعامل Hugging Face، یکی از پلتفرم‌های میزبانی مدل‌های DeepSeek، توسعه‌دهندگان در Hugging Face بیش از 500 مدل “مشتق” از مدل R1 را ایجاد کرده‌اند که مجموعاً 2.5 میلیون بار دانلود شده‌اند.

موفقیت DeepSeek در برابر رقبای بزرگ و تثبیت‌شده به‌عنوان عاملی برای “تغییر در زمینه هوش مصنوعی” توصیف شده و به‌نظر می‌رسد که به آغاز “عصر جدیدی از رقابت در هوش مصنوعی” منجر شده است. این موفقیت همچنین باعث کاهش 18 درصدی قیمت سهام انویدیا شد و واکنش عمومی سام آلتمن، مدیرعامل OpenAI را به دنبال داشت

نمایش بیشتر

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا