به گزارش گروه دانشگاه خبرگزاری دانشجو، DeepSeek، یک استارت آپ چینی هوش مصنوعی که کمی بیش از یک سال از عمرش میگذرد، پس از نشان دادن مدلهای هوش مصنوعی موفقی که عملکردی قابل مقایسه با بهترین چت رباتهای جهان را با هزینهای کمتر ارائه میدهند، در دره سیلیکون حیرت برانگیخته است.
ظهور DeepSeek ممکن است نقطه مقابل این باور عمومی باشد که آینده هوش مصنوعی به مقادیر روزافزونی از قدرت و انرژی برای توسعه نیاز دارد.
سهام فناوری جهانی در اواخر ژانویه سقوط کرد، زیرا تبلیغات در مورد نوآوری DeepSeek به گلوله برفی رسید و سرمایه گذاران شروع به هضم پیامدهای آن برای رقبای مستقر در ایالات متحده و تامین کنندگان سخت افزار آنها کردند.
DeepSeek دقیقا چیست؟
DeepSeek در سال ۲۰۲۳ توسط لیانگ ونفنگ، رئیس صندوق تامینی کوانت مبتنی بر هوش مصنوعی High-Flyer تاسیس شد. این شرکت مدلهای AI را توسعه میدهد که منبع باز هستند، به این معنی که جامعه توسعهدهندگان در کل میتوانند نرمافزار را بررسی و بهبود بخشند. برنامه موبایل آن پس از انتشار در اوایل ژانویه به بالای جدول دانلود آیفون در ایالات متحده صعود کرد.
این برنامه با بیان استدلال خود قبل از ارائه پاسخ به یک درخواست، خود را از سایر رباتهای چت مانند ChatGPT OpenAI متمایز میکند. این شرکت ادعا میکند که نسخه R۱ آن عملکردی برابر با آخرین نسخه OpenAI ارائه میدهد و به افرادی که علاقهمند به توسعه رباتهای چت با استفاده از فناوری برای ساخت آن هستند مجوز اعطا کرده است.
چگونه DeepSeek R۱ با OpenAI یا Meta AI مقایسه میشود؟
اگرچه جزئیات کاملی توسط شرکت ارائه نشده است، اما به نظر میرسد هزینه آموزش و توسعه مدلهای DeepSeek تنها کسری از آنچه برای بهترین محصولات OpenAI یا Meta Platforms Inc. لازم است باشد. کارایی بسیار بهتر این مدل، نیاز به هزینههای هنگفت سرمایه برای به دست آوردن جدیدترین و قدرتمندترین شتاب دهندههای هوش مصنوعی مانند Nvidia Corp را زیر سوال میبرد. این امر همچنین توجه به محدودیتهای صادرات چنین نیمه هادیهای پیشرفتهای را به چین افزایش میدهد. در نظر گرفته شده برای جلوگیری از پیشرفتی از نوعی که به نظر میرسد DeepSeek نشان میدهد.
DeepSeek میگوید R۱ در چندین معیار پیشرو مانند AIME ۲۰۲۴ برای کارهای ریاضی، MMLU برای دانش عمومی و AlpacaEval ۲.۰ برای عملکرد پرسش و پاسخ، نزدیک یا بهتر از مدلهای رقیب است. همچنین در جدول امتیازات وابسته به UC Berkeley به نام Chatbot Arena در بین بهترین عملکردها قرار دارد.
چه چیزی زنگ خطر را در ایالات متحده به صدا درآورده است؟
واشنگتن صادرات فناوریهای پیشرفته مانند نیمههادیهای GPU به چین را ممنوع کرده است تا پیشرفتهای این کشور در زمینه هوش مصنوعی را که مرز کلیدی در رقابت آمریکا و چین برای برتری فناوری است، متوقف کند. اما پیشرفت DeepSeek نشان میدهد که مهندسان چینی هوش مصنوعی راه خود را برای دور زدن محدودیتها و تمرکز بر کارایی بیشتر با منابع محدود کار کردهاند. در حالی که هنوز مشخص نیست DeepSeek به چه مقدار سخت افزار پیشرفته آموزش هوش مصنوعی دسترسی داشته است، این شرکت به اندازه کافی نشان داده است که محدودیتهای تجاری کاملاً در جلوگیری از پیشرفت چین مؤثر نبوده است.
چه زمانی DeepSeek باعث جلب توجه جهانی شد؟
توسعهدهنده هوش مصنوعی از زمان عرضه اولین مدل خود در سال ۲۰۲۳ به دقت تحت نظر بوده است. سپس در نوامبر، مدل استدلالی DeepSeek R۱ خود را که برای تقلید از تفکر انسان طراحی شده بود، به دنیا نشان داد. این مدل زیربنای برنامه چت ربات تلفن همراه آن است که همراه با رابط وب در ماه ژانویه به عنوان یک جایگزین بسیار ارزانتر OpenAI شهرت جهانی پیدا کرد و مارک آندرسن سرمایهگذار آن را «لحظه اسپوتنیک هوش مصنوعی» نامید.
برنامه موبایل DeepSeek تا ۲۵ ژانویه ۱.۶ میلیون بار دانلود شد و بر اساس دادههای App Figures ردیاب بازار، رتبه اول را در فروشگاههای برنامه آیفون در استرالیا، کانادا، چین، سنگاپور، ایالات متحده و بریتانیا کسب کرد.
موسس DeepSeek کیست؟
لیانگ در سال ۱۹۸۵ در گوانگدونگ متولد شد و مدرک لیسانس و فوق لیسانس خود را در رشته مهندسی الکترونیک و اطلاعات از دانشگاه ژجیانگ دریافت کرد. بر اساس پایگاه داده شرکت Tianyancha، او DeepSeek را با ۱۰ میلیون یوان (۱.۴ میلیون دلار) سرمایه ثبت کرد.
لیانگ در مصاحبهای با outlet چینی ۳۶kr گفت که گلوگاه پیشرفتهای بیشتر نه بیشتر جذب سرمایه، بلکه محدودیتهای ایالات متحده برای دسترسی به بهترین تراشهها است. او گفت که اکثر محققان برتر او فارغ التحصیلان تازه وارد از دانشگاههای برتر چین بودند و بر نیاز چین به توسعه اکوسیستم داخلی خود شبیه به اکوسیستم ساخته شده پیرامون Nvidia و تراشههای هوش مصنوعی آن تاکید کرد.
سرمایه گذاری بیشتر لزوماً منجر به نوآوری بیشتر نمیشود. در غیر این صورت، شرکتهای بزرگ تمام نوآوریها را در اختیار خواهند گرفت.
جایگاه DeepSeek در چشم انداز هوش مصنوعی چین کجاست؟
رهبران فناوری چین، از Alibaba Group Holding Ltd؛ و Baidu Inc گرفته تا Tencent Holdings Ltd پول و منابع قابل توجهی را در رقابت برای به دست آوردن سخت افزار و مشتریان برای سرمایه گذاریهای هوش مصنوعی خود ریختهاند. در کنار استارتآپ ۰۱.AI Kai-Fu Lee، DeepSeek با رویکرد منبع باز خود طراحی شده برای جذب سریع بیشترین تعداد کاربر قبل از توسعه استراتژیهای کسب درآمد در بالای آن مخاطبان بزرگ متمایز است.
از آنجایی که مدلهای DeepSeek مقرون به صرفهتر هستند، در حال حاضر نقشی در کاهش هزینهها برای توسعهدهندگان هوش مصنوعی در چین داشته است، جایی که بازیگران بزرگتر درگیر جنگ قیمتی بودهاند که شاهد موجهای متوالی کاهش قیمت در یک سال و نیم گذشته بودهاند.
پیامدهای آن برای بازار جهانی هوش مصنوعی چیست؟
موفقیت DeepSeek ممکن است OpenAI و سایر ارائه دهندگان ایالات متحده را وادار کند تا قیمت خود را کاهش دهند تا برتری ثابت خود را حفظ کنند. همچنین هزینههای هنگفت شرکتهایی مانند متا و مایکروسافت را زیر سوال میبرد – که هرکدام از آنها در سال جاری ۶۵ میلیارد دلار یا بیشتر، عمدتاً در زیرساختهای هوش مصنوعی متعهد شدهاند – اگر مدلهای کارآمدتر بتوانند با هزینههای بسیار کمتری رقابت کنند.
این امر بازارهای سهام جهانی را متلاطم کرد، زیرا سرمایه گذاران شرکتهایی مانند Nvidia Corp؛ و ASML Holding NV را که از تقاضای رو به رشد برای خدمات هوش مصنوعی سود بردهاند، فروختند. سهام نامهای چینی مرتبط با DeepSeek، مانند شرکت Iflytek، افزایش یافت.
در حال حاضر، توسعه دهندگان در سراسر جهان در حال آزمایش نرم افزار DeepSeek هستند و به دنبال ساخت ابزار با آن هستند. این میتواند پذیرش مدلهای استدلالی پیشرفته هوش مصنوعی را تسریع کند - در حالی که به طور بالقوه نگرانیهای بیشتری را در مورد نیاز به نردههای محافظ در اطراف استفاده از آنها برطرف میکند. پیشرفتهای DeepSeek ممکن است مقررات را برای کنترل چگونگی توسعه هوش مصنوعی تسریع بخشد.
کاستیهای DeepSeek چیست؟
مانند سایر مدلهای هوش مصنوعی چینی، DeepSeek در مورد موضوعاتی که در چین حساس تلقی میشوند، خودسانسوری میکند. این پرسشها در مورد اعتراضات میدان تیانآنمن در سال ۱۹۸۹ یا پرسشهای پرتنش ژئوپلیتیکی مانند احتمال حمله چین به تایوان را منحرف میکند. در آزمایشها، ربات DeepSeek قادر به ارائه پاسخهای دقیق در مورد شخصیتهای سیاسی مانند نارندرا مودی، نخستوزیر هند است، اما در مورد شی جینپینگ، رئیسجمهور چین از انجام این کار خودداری میکند.
احتمالاً زیرساخت ابری DeepSeek با محبوبیت ناگهانی آن مورد آزمایش قرار میگیرد. این شرکت برای مدت کوتاهی در ۲۷ ژانویه یک قطعی بزرگ را تجربه کرد و باید ترافیک بیشتری را مدیریت کند، زیرا کاربران جدید و بازگشته سوالات بیشتری را در ربات چت خود ارسال میکنند.