یک استارتاپ گمنام چینی بهتازگی صحنه هوش مصنوعی را تکان داده است، غولهای سیلیکونولی را نگران کرده، بازارهای جهانی سهام را به لرزه انداخته و فرضیات قبلی درباره دستاوردهای هوش مصنوعی را به چالش کشیده است. DeepSeek ترکیبی از تامین مالی در سطح صندوقهای پوشش ریسک، بلندپروازی منبعباز و ماموریتی عمیق برای فراتر رفتن از هوش انسانی را در خود جای داده است، همه اینها در حالی است که توانسته از نامهای شناختهشدهای مانند OpenAI پیشی بگیرد. با این حال، با چنین رشد سریعی، سوالات زیادی مطرح میشود.
آیا ما شاهد یک انقلاب واقعی در هوش مصنوعی هستیم یا هیاهو بیش از حد است؟ در این مطلب، پرده از بنیانگذاری و فلسفه DeepSeek برمیداریم، مدلهای آن را با ستارگان هوش مصنوعی مانند ChatGPT مقایسه، تحولات بازار خیرهکنندهای را که ایجاد کرده است بررسی و نگرانیهای مربوط به آن را بررسی میکنیم. با اِروتِک همراه باشید.
DeepSeek چیست و چه کسی آن را اداره می کند؟
DeepSeek در ژوئیه 2023 توسط لیانگ ونفنگ، فارغالتحصیل برجسته دانشگاه ژجیانگ تاسیس شد. این شرکت مستقر در هانگژو با حمایت مالی قابلتوجه و ورودی استراتژیک از High-Flyer، یک صندوق پوشش ریسک که توسط لیانگ نیز تاسیس شده است، پشتیبانی میشود.
DeepSeek با استفاده از قدرت مالی High-Flyer که دارای داراییهایی حدود 8 میلیارد دلار است، با خرید تعداد زیادی از تراشههای Nvidia A100 علیرغم ممنوعیت صادرات آنها به چین، ورود جسورانهای به بخش هوش مصنوعی داشته است. این تراشهها برای پایه فناوری و ظرفیت نوآوری شرکت حیاتی هستند.
شهرت DeepSeek به دلیل توسعه مدل DeepSeek-V3 است که به منابع محاسباتی شگفتانگیز 6 میلیون دلاری نیاز داشت، کسری از آنچه معمولاً توسط غولهای فناوری ایالاتمتحده سرمایهگذاری می شود. این عملکرد، دستیار هوش مصنوعی DeepSeek یا (DeepSeek AI Assistant) را به صدر جدول برنامههای رایگان در اپ استور ایالاتمتحده رسانده و حتی از ChatGPT نیز پیشی گرفته است. این دستاورد پتانسیل DeepSeek را برای ارائه عملکرد بالا با هزینه کمتر نشان میدهد، هنجارهای فعلی را به چالش میکشد و ارزیابی مجدد را در صنعت هوش مصنوعی جهانی آغاز میکند.
نوآوریهای فناوری در DeepSeek توسط یک گروه تحقیقاتی اختصاصی در High-Flyer هدایت میشود که در اوایل سال 2023 قصد خود را برای تمرکز بر هوش مصنوعی عمومی (AGI) اعلام کرد. این گروه که کنترل عملیاتی بر خوشهای از 10000 تراشه A100 را در اختیار دارد، قصد دارد هوش مصنوعی را فراتر از کاربردهای سنتی پیشرفت دهد تا به قابلیت هایی دست یابد که عملکرد انسان را در وظایف با ارزش اقتصادی فراتر رود.
این ادغام عمیق منابع، تعهد جدی DeepSeek را برای رهبری در حوزه هوش مصنوعی برجسته میکند و نشاندهنده یک همسوئی استراتژیک است که میتواند بهطور قابلتوجهی بر تحولات آینده در هوش مصنوعی تأثیر بگذارد.
DeepSeek چگونه به وجود آمد؟
سرچشمه DeepSeek به بلندپروازی گستردهای برمیگردد که با انتشار ChatGPT OpenAI در اواخر سال 2022 شعلهور شد که یک رقابت تسلیحاتی فناوری را در میان شرکتهای فناوری چینی برای توسعه چتباتهای هوش مصنوعی رقابتی برانگیخت. علیرغم تلاشهای اولیه غولهایی مانند Baidu، شکاف قابل تشخیصی در قابلیتهای هوش مصنوعی بین ایالات متحده و فناوریهای چینی مشهود بود که منجر به ناامیدی گسترده در جامعه فناوری چین شد.
این سناریو، ظهور DeepSeek را در سال 2023 با ماموریتی جسورانه برای پر کردن این شکاف و برتری در هوش مصنوعی عمومی (AGI) برای توسعه هوش مصنوعی که بتواند از هوش انسانی فراتر رود، برانگیخت.
اصول بنیادین DeepSeek ریشه در آرمانگرایی غیر تجاری دارد؛ مشابه روزهای اولیه OpenAI! آنها خود را به عنوان گروهی از آرمانگرایان معرفی کردند که نه توسط سود، بلکه توسط جستجوی دستیابی به پیشرفتهای پیشگامانه در AGI هدایت میشوند.
این چشم انداز آرمان گرایانه با سرمایهگذاریهای فناوری قابلتوجه، به ویژه در توسعه مدلهای DeepSeek-V3 و DeepSeek-R1 خود، حفظ میشود. این مدلها به سرعت به دلیل عملکرد خود که با مدلهای پیشرو از OpenAI و Meta رقابت میکند و در برخی جنبهها از آنها پیشی میگیرد، علیرغم دسترسی محدود شرکت به آخرین تراشههای Nvidia، مورد تحسین قرار گرفتهاند.
DeepSeek-V3 به ویژه به دلیل سرعت استنتاج و کارایی هزینه برتر خود شناخته شده است و گام های قابلتوجهی در زمینههایی که نیاز به توانایی های محاسباتی فشرده مانند کدنویسی و حل مسئله ریاضی دارند، برداشته است.
قدرت این مدل در مقاله تحقیقاتی منتشر شده در Arxiv برجسته شد، جاییکه به دلیل عملکرد بهتر از سایر مدلهای منبع باز و مطابقت با قابلیتهای مدلهای منبع بسته برتر مانند GPT-4 و Claude-3-Sonnet، مورد توجه قرار گرفت.
DeepSeek چگونه با چتباتهای هوش مصنوعی مانند ChatGPT مقایسه میشود؟
DeepSeek خود را از سایر برنامههای کاربردی هوش مصنوعی مانند ChatGPT با رویکردهای معماری و عملیاتی منحصربهفرد خود که برای افزایش کارایی و کاهش هزینههای عملیاتی در نظر گرفته شدهاند متمایز میکند.
DeepSeek با استفاده از معماری “ترکیب کارشناسان” (MoE)، فقط قسمتهای مرتبط شبکه خود را برای هر پرسوجوی خاص فعال کرده و بهطور قابلتوجهی در مصرف انرژی و هزینه صرفهجویی میکند. این در تضاد شدید با معماری مبتنی بر ترانسفورماتور ChatGPT است که وظایف را از طریق کل شبکه خود پردازش میکند و منجر به مصرف منابع بیشتر میشود.
بهبود عملکرد و فناوری
طراحی MoE DeepSeek امکان پردازش خاص هر وظیفه را فراهم کرده که عملکرد آن را در زمینههای تخصصی مانند کدنویسی و حل مسائل فنی افزایش میدهد و زمان پاسخ را تسریع میکند.
در مقابل، ChatGPT عملکرد ثابتتری را در طیف گستردهای از وظایف ارائه میدهد اما ممکن است به دلیل روش پردازش جامع خود در سرعت عقب باشد. با وجود این، ChatGPT اغلب پاسخهای ظریفتر و غنی از زمینه را ارائه میدهد و عمقی را ارائه میدهد که DeepSeek ممکن است در زمینههای گسترده تر از آن برخوردار نباشد.
سفارشیسازی و موارد استفاده
چارچوب DeepSeek ذاتاً قابل تنظیم بیشتری است و برای پاسخگویی به نیازهای خاص کاربران با دانش فنی برای دستکاری قابلیتهای آن طراحی شده است. این امر آن را برای وظایف تخصصی که نیاز به کمک فنی دقیق دارند بسیار مناسب میکند.
از سوی دیگر، گزینههای سفارشیسازی آسانتر ChatGPT برای مخاطبان گستردهتری جذاب است و آن را برای نوشتن خلاقانه، طوفان فکری و بازیابی اطلاعات عمومی ایدهآل میکند.
هزینه و دسترسی
از نظر دسترسی، ماهیت منبع باز DeepSeek آن را کاملاً رایگان و به راحتی برای اصلاح و استفاده در دسترس قرار میدهد که میتواند برای جامعه توسعهدهندگان بسیار جذاب باشد. ChatGPT در حالیکه نسخه رایگان ارائه میدهد، شامل سطوح پرداخت شده است و دسترسی به ویژگیهای پیشرفتهتر و قابلیتهای API بیشتر را فراهم میکند.
تجربه کاربری و ملاحظات اخلاقی
DeepSeek در حالیکه قدرتمند است، نیاز به سطح بالاتری از مهارت فنی از سوی کاربران دارد که میتواند پذیرش آن را در بین کسانی که فاقد پیشینه فنی هستند، پیچیده کند. رابط کاربری بصری ChatGPT و مدل تعامل کاربر سادهتر، منحنی یادگیری آسانتری را فراهم میکند.
از نظر اخلاقی، DeepSeek به دلیل شیوههای جمعآوری دادههای خود، از جمله ذخیره آدرسهای IP و اطلاعات دستگاه، ورودیهای متن و صوتی، فایلهای آپلودشده و سابقه چت که در سرورهای چین ذخیره میشوند، نگرانیهایی را ایجاد میکند که ممکن است با استانداردهای GDPR مغایرت داشته باشد. OpenAI در مقابل، بر ناشناسسازی و رمزگذاری دادهها برای همسو شدن بیشتر با مقررات حریم خصوصی تاکید میکند.
موفقیت DeepSeek چه معنایی برای بازارهای جهانی دارد؟
راهاندازی مدل R1 DeepSeek شوک قابلتوجهی را در بازارهای جهانی سهام، به ویژه در بخش فناوری ایجاد کرده است. در یک روز معاملاتی قابل توجه، شاخص کامپوزیت Nasdaq با کاهش شدید 3.1 درصد مواجه شد و بیش از 1 تریلیون دلار از ارزش بازار را از بین برد!
طبق گزارش CNBC، این کاهش شدید تحت تأثیر شدید ضررهای شرکت های بزرگ فناوری بود، زیرا Nvidia با سقوط تاریخی مواجه شد و بیش از 700 میلیارد دلار از ارزش بازار خود را از دست داد و بزرگترین ضرر یک روزه تاریخ را برای یک شرکت تجربه کرد. این تغییر باعث شد اپل از Nvidia به عنوان ارزشمندترین شرکت در ایالاتمتحده پیشی بگیرد، در حالیکه غول های فناوری دیگری مانند گوگل و مایکروسافت نیز با ضررهای قابلتوجهی مواجه شدند.
تاثیر پیشرفتهای DeepSeek فراتر از ارزیابی سهام است. بخش انرژی با کاهش قابلتوجهی مواجه شد که ناشی از نگرانی سرمایهگذاران بود که فناوری کارآمدتر انرژی DeepSeek میتواند تقاضای کلی انرژی از صنعت فناوری را کاهش دهد. شرکتهایی مانند GE Vernova و Vistra که به تولید توربینهای بادی و گازی خود شناخته شدهاند، شاهد سقوط 21% و 28% سهام خود بودند.
تحلیلگران وال استریت پیامدهای بلندمدت ظهور DeepSeek به عنوان یک رقیب قدرتمند در فضای هوش مصنوعی را با دقت بررسی میکنند. هزینههای کمتر و کاهش نیازهای انرژی مدلهای DeepSeek سوالاتی را در مورد پایداری نرخهای سرمایهگذاری بالا در فناوری هوش مصنوعی توسط شرکتهای آمریکایی ایجاد میکند و به برجسته شدن احتمال هزینه بیش از حد در این بخش میپردازد.
این وضعیت منجر به واکنشهای متفاوتی شده است، برخی از تحلیلگران معتقدند که واکنش بازار ممکن است بیش از حد باشد، با توجه به تقاضای بالای مداوم برای فناوری هوش مصنوعی که همچنان به زیرساختهای قابلتوجهی نیاز خواهد داشت.
علاوه بر این، ملاحظات ژئوپلیتیک نیز در حال بازی است، زیرا عدم قطعیت در مورد پاسخهای دولت ایالات متحده، به ویژه در مورد تعرفههای واردات چین و اقدامات نظارتی که میتواند بر پذیرش و ادغام فناوریهایی مانند DeepSeek در بازارهای ایالات متحده تأثیر بگذارد، همچنان ادامه دارد.
برخی از واکنش های برجسته به DeepSeek چیست؟
Nvidia سهم DeepSeek را به عنوان پیشرفت قابلتوجهی در هوش مصنوعی، به ویژه با برجسته کردن کاربرد آن در مقیاسبندی زمان آزمایش که امکان ایجاد مدلهای جدیدی را که کاملاً مطابق با کنترلهای صادرات هستند، شناخته است. Nvidia ضمن ستایش DeepSeek، خاطرنشان کرد که استنتاج هوش مصنوعی به شدت به پردازندههای گرافیکی NVIDIA و شبکههای پیشرفته متکی است و بر نیاز مداوم به سختافزار قابلتوجه برای پشتیبانی از عملکردهای هوش مصنوعی تاکید کرد.
سم آلتمن از OpenAI در مورد اثربخشی مدل R1 DeepSeek اظهار نظر کرد و عملکرد چشمگیر آن را نسبت به هزینه آن ذکر کرد. آلتمن بر تعهد OpenAI به پیشبرد تحقیقات خود و افزایش ظرفیت محاسباتی برای دستیابی به اهداف خود تاکید و نشان داد که اگرچه DeepSeek یک پیشرفت قابلتوجه است، اما OpenAI همچنان بر اهداف استراتژیک خود متمرکز است.
آراوند سرینیواس، مدیرعامل Perplexity، از موفقیت DeepSeek، به ویژه پیشی گرفتن آن از سایر مدل ها مانند ChatGPT در برخی معیارها، ابراز خوشحالی کرد. حمایت سرینیواس نشان دهنده علاقه گستردهتر به ادغام نوآوریهای DeepSeek در پلتفرمها و خدمات موجود است.
پت گلسینگر، مدیرعامل اخراج شده Intel، هوش مصنوعی DeepSeek را به دلیل یادآوری درسهای ضروری به جامعه فناوری، مانند اینکه هزینههای پایینتر باعث پذیرش گستردهتر میشود، محدودیت@ها میتوانند خلاقیت را تقویت کنند و رویکردهای منبع باز اغلب غالب هستند، ستایش کرد. نظرات گلسینگر بر پیامدهای گستردهتر استراتژیهای DeepSeek و پتانسیل آنها برای تغییر شکل شیوههای صنعت تاکید میکند.
رسانه های دولتی چین و محافل سیاسی علاقه قابلتوجهی به تأثیر DeepSeek نشان دادهاند و موفقیت آن را به عنوان مقابله با تسلط ایالات متحده در فناوری و گامی در جهت خودکفایی استراتژیک چین در هوش مصنوعی میدانند. همانطور که رویترز گزارش داد، بنیانگذار DeepSeek در یک سمپوزیوم سطح بالا با نخستوزیر لی کیانگ شرکت کرد که نشاندهنده اهمیت DeepSeek برای اهداف استراتژیک ملی است.
ترامپ نیز ظهور DeepSeek را هم به عنوان یک چالش و هم یک فرصت برای صنعت فناوری ایالات متحده توصیف کرده است. او این را به عنوان یک زنگ خطر برای شرکتهای آمریکایی برای نوآوری و رقابت موثرتر در فناوری جهانی میداند و ابعاد ژئوپلیتیک و اقتصادی ظهور DeepSeek را برجسته میکند.
DeepSeek که تنها یک سال از تاسیس آن میگذرد، از نظر محبوبیت از ChatGPT پیشی گرفته و ثابت کرده است که هوش مصنوعی پیشرفته نیازی به برچسب قیمت یک میلیارد دلاری ندارد! با این حال، صعود شهابسنگ آن میتواند موج دیگری از روند باشد. مطمئناً، DeepSeek در حال حاضر پویایی بازار را تغییر داده و بحثهای اخلاقی را ایجاد کرده است، اما برخی سوالات بزرگ باقی می ماند.
آیا DeepSeek کتاب بازی هوش مصنوعی را به روشهایی که تعداد کمی انتظار داشتند بازنویسی خواهد کرد؟ چه موانع غیرمنتظرهای میتواند توسعه و محبوبیت آن را کّند کند؟ یا شاید حتی منجر به سقوط آن شود؟ مسیر پیش رو برای این استارتاپ جاهطلبانه هوش مصنوعی مملو از احتمالات و مخاطرات است. زمان نشان خواهد داد که این سرمایه گذاری جسورانه چگونه پیش خواهد رفت.
منبع: Interestingengineering