هوش منصوعی DeepSeek از کجا آمد و چگونه تمام بازارهای مالی آمریکا را به هم ریخت؟

هوش مصنوعی DeepSeek از کجا آمد و چگونه تمام بازارهای مالی آمریکا را به هم ریخت؟

اشتراک‌گذاری:

یک استارتاپ گمنام چینی به‌تازگی صحنه هوش مصنوعی را تکان داده است، غول‌های سیلیکون‌ولی را نگران کرده، بازارهای جهانی سهام را به لرزه انداخته و فرضیات قبلی درباره دستاوردهای هوش مصنوعی را به چالش کشیده است. DeepSeek ترکیبی از تامین مالی در سطح صندوق‌های پوشش ریسک، بلندپروازی منبع‌باز و ماموریتی عمیق برای فراتر رفتن از هوش انسانی را در خود جای داده است، همه اینها در حالی است که توانسته از نام‌های شناخته‌شده‌ای مانند OpenAI پیشی بگیرد. با این حال، با چنین رشد سریعی، سوالات زیادی مطرح می‌شود.

آیا ما شاهد یک انقلاب واقعی در هوش مصنوعی هستیم یا هیاهو بیش از حد است؟ در این مطلب، پرده از بنیانگذاری و فلسفه DeepSeek برمی‌داریم، مدل‌های آن را با ستارگان هوش مصنوعی مانند ChatGPT مقایسه، تحولات بازار خیره‌کننده‌ای را که ایجاد کرده است بررسی و نگرانی‌های مربوط به آن را بررسی می‌کنیم. با اِروتِک همراه باشید.

DeepSeek چیست و چه کسی آن را اداره می کند؟

DeepSeek در ژوئیه 2023 توسط لیانگ ونفنگ، فارغ‌التحصیل برجسته دانشگاه ژجیانگ تاسیس شد. این شرکت مستقر در هانگژو با حمایت مالی قابل‌توجه و ورودی استراتژیک از High-Flyer، یک صندوق پوشش ریسک که توسط لیانگ نیز تاسیس شده است، پشتیبانی می‌شود.

DeepSeek با استفاده از قدرت مالی High-Flyer که دارای دارایی‌هایی حدود 8 میلیارد دلار است، با خرید تعداد زیادی از تراشه‌های Nvidia A100 علی‌رغم ممنوعیت صادرات آنها به چین، ورود جسورانه‌ای به بخش هوش مصنوعی داشته است. این تراشه‌ها برای پایه فناوری و ظرفیت نوآوری شرکت حیاتی هستند.

شهرت DeepSeek به دلیل توسعه مدل DeepSeek-V3 است که به منابع محاسباتی شگفت‌انگیز 6 میلیون دلاری نیاز داشت، کسری از آنچه معمولاً توسط غول‌های فناوری ایالات‌متحده سرمایه‌گذاری می شود. این عملکرد، دستیار هوش مصنوعی DeepSeek یا (DeepSeek AI Assistant) را به صدر جدول برنامه‌های رایگان در اپ استور ایالات‌متحده رسانده و حتی از ChatGPT نیز پیشی گرفته است. این دستاورد پتانسیل DeepSeek را برای ارائه عملکرد بالا با هزینه کمتر نشان می‌دهد، هنجارهای فعلی را به چالش می‌کشد و ارزیابی مجدد را در صنعت هوش مصنوعی جهانی آغاز می‌کند.

نوآوری‌های فناوری در DeepSeek توسط یک گروه تحقیقاتی اختصاصی در High-Flyer هدایت می‌شود که در اوایل سال 2023 قصد خود را برای تمرکز بر هوش مصنوعی عمومی (AGI) اعلام کرد. این گروه که کنترل عملیاتی بر خوشه‌ای از 10000 تراشه A100 را در اختیار دارد، قصد دارد هوش مصنوعی را فراتر از کاربردهای سنتی پیشرفت دهد تا به قابلیت هایی دست یابد که عملکرد انسان را در وظایف با ارزش اقتصادی فراتر رود.

این ادغام عمیق منابع، تعهد جدی DeepSeek را برای رهبری در حوزه هوش مصنوعی برجسته می‌کند و نشان‌دهنده یک همسوئی استراتژیک است که می‌تواند به‌طور قابل‌توجهی بر تحولات آینده در هوش مصنوعی تأثیر بگذارد.

DeepSeek چگونه به وجود آمد؟

سرچشمه DeepSeek به بلندپروازی گسترده‌ای برمی‌گردد که با انتشار ChatGPT OpenAI در اواخر سال 2022 شعله‌ور شد که یک رقابت تسلیحاتی فناوری را در میان شرکت‌های فناوری چینی برای توسعه چت‌بات‌های هوش مصنوعی رقابتی برانگیخت. علی‌رغم تلاش‌های اولیه غول‌هایی مانند Baidu، شکاف قابل تشخیصی در قابلیت‌های هوش مصنوعی بین ایالات متحده و فناوری‌های چینی مشهود بود که منجر به ناامیدی گسترده در جامعه فناوری چین شد.

این سناریو، ظهور DeepSeek را در سال 2023 با ماموریتی جسورانه برای پر کردن این شکاف و برتری در هوش مصنوعی عمومی (AGI) برای توسعه هوش مصنوعی که بتواند از هوش انسانی فراتر رود، برانگیخت.

اصول بنیادین DeepSeek ریشه در آرمان‌گرایی غیر تجاری دارد؛ مشابه روزهای اولیه OpenAI! آنها خود را به عنوان گروهی از آرمان‌گرایان معرفی کردند که نه توسط سود، بلکه توسط جستجوی دستیابی به پیشرفت‌های پیشگامانه در AGI هدایت می‌شوند.

این چشم انداز آرمان گرایانه با سرمایه‌گذاری‌های فناوری قابل‌توجه، به ویژه در توسعه مدل‌های DeepSeek-V3 و DeepSeek-R1 خود، حفظ می‌شود. این مدل‌ها به سرعت به دلیل عملکرد خود که با مدل‌های پیشرو از OpenAI و Meta رقابت می‌کند و در برخی جنبه‌ها از آنها پیشی می‌گیرد، علی‌رغم دسترسی محدود شرکت به آخرین تراشه‌های Nvidia، مورد تحسین قرار گرفته‌اند.

DeepSeek-V3 به ویژه به دلیل سرعت استنتاج و کارایی هزینه برتر خود شناخته شده است و گام های قابل‌توجهی در زمینه‌هایی که نیاز به توانایی های محاسباتی فشرده مانند کدنویسی و حل مسئله ریاضی دارند، برداشته است.

قدرت این مدل در مقاله تحقیقاتی منتشر شده در Arxiv برجسته شد، جایی‌که به دلیل عملکرد بهتر از سایر مدل‌های منبع باز و مطابقت با قابلیت‌های مدل‌های منبع بسته برتر مانند GPT-4 و Claude-3-Sonnet، مورد توجه قرار گرفت.

DeepSeek چگونه با چت‌بات‌های هوش مصنوعی مانند ChatGPT مقایسه می‌شود؟

DeepSeek خود را از سایر برنامه‌های کاربردی هوش مصنوعی مانند ChatGPT با رویکردهای معماری و عملیاتی منحصر‌به‌فرد خود که برای افزایش کارایی و کاهش هزینه‌های عملیاتی در نظر گرفته شده‌اند متمایز می‌کند.

DeepSeek با استفاده از معماری “ترکیب کارشناسان” (MoE)، فقط قسمت‌های مرتبط شبکه خود را برای هر پرس‌و‌جوی خاص فعال کرده و به‌طور قابل‌توجهی در مصرف انرژی و هزینه صرفه‌جویی می‌کند. این در تضاد شدید با معماری مبتنی بر ترانسفورماتور ChatGPT است که وظایف را از طریق کل شبکه خود پردازش می‌کند و منجر به مصرف منابع بیشتر می‌شود.

بهبود عملکرد و فناوری

طراحی MoE DeepSeek امکان پردازش خاص هر وظیفه را فراهم کرده که عملکرد آن را در زمینه‌های تخصصی مانند کدنویسی و حل مسائل فنی افزایش می‌دهد و زمان پاسخ را تسریع می‌کند.

در مقابل، ChatGPT عملکرد ثابت‌تری را در طیف گسترده‌ای از وظایف ارائه می‌دهد اما ممکن است به دلیل روش پردازش جامع خود در سرعت عقب باشد. با وجود این، ChatGPT اغلب پاسخ‌های ظریف‌تر و غنی از زمینه را ارائه می‌دهد و عمقی را ارائه می‌دهد که DeepSeek ممکن است در زمینه‌های گسترده تر از آن برخوردار نباشد.

سفارشی‌سازی و موارد استفاده

چارچوب DeepSeek ذاتاً قابل تنظیم بیشتری است و برای پاسخگویی به نیازهای خاص کاربران با دانش فنی برای دستکاری قابلیت‌های آن طراحی شده است. این امر آن را برای وظایف تخصصی که نیاز به کمک فنی دقیق دارند بسیار مناسب می‌کند.

از سوی دیگر، گزینه‌های سفارشی‌سازی آسان‌تر ChatGPT برای مخاطبان گسترده‌تری جذاب است و آن را برای نوشتن خلاقانه، طوفان فکری و بازیابی اطلاعات عمومی ایده‌آل می‌کند.

هزینه و دسترسی

از نظر دسترسی، ماهیت منبع باز DeepSeek آن را کاملاً رایگان و به راحتی برای اصلاح و استفاده در دسترس قرار می‌دهد که می‌تواند برای جامعه توسعه‌دهندگان بسیار جذاب باشد. ChatGPT در حالی‌که نسخه رایگان ارائه می‌دهد، شامل سطوح پرداخت شده است و دسترسی به ویژگی‌های پیشرفته‌تر و قابلیت‌های API بیشتر را فراهم می‌کند.

تجربه کاربری و ملاحظات اخلاقی

DeepSeek در حالی‌که قدرتمند است، نیاز به سطح بالاتری از مهارت فنی از سوی کاربران دارد که می‌تواند پذیرش آن را در بین کسانی که فاقد پیشینه فنی هستند، پیچیده کند. رابط کاربری بصری ChatGPT و مدل تعامل کاربر ساده‌تر، منحنی یادگیری آسان‌تری را فراهم می‌کند.

از نظر اخلاقی، DeepSeek به دلیل شیوه‌های جمع‌آوری داده‌های خود، از جمله ذخیره آدرس‌های IP و اطلاعات دستگاه، ورودی‌های متن و صوتی، فایل‌های آپلودشده و سابقه چت که در سرورهای چین ذخیره می‌شوند، نگرانی‌هایی را ایجاد می‌کند که ممکن است با استانداردهای GDPR مغایرت داشته باشد. OpenAI در مقابل، بر ناشناس‌سازی و رمزگذاری داده‌ها برای همسو شدن بیشتر با مقررات حریم خصوصی تاکید می‌کند.

موفقیت DeepSeek چه معنایی برای بازارهای جهانی دارد؟

راه‌اندازی مدل R1 DeepSeek شوک قابل‌توجهی را در بازارهای جهانی سهام، به ویژه در بخش فناوری ایجاد کرده است. در یک روز معاملاتی قابل توجه، شاخص کامپوزیت Nasdaq با کاهش شدید 3.1 درصد مواجه شد و بیش از 1 تریلیون دلار از ارزش بازار را از بین برد!

طبق گزارش CNBC، این کاهش شدید تحت تأثیر شدید ضررهای شرکت های بزرگ فناوری بود، زیرا Nvidia با سقوط تاریخی مواجه شد و بیش از 700 میلیارد دلار از ارزش بازار خود را از دست داد و بزرگترین ضرر یک روزه تاریخ را برای یک شرکت تجربه کرد. این تغییر باعث شد اپل از Nvidia به عنوان ارزشمندترین شرکت در ایالات‌متحده پیشی بگیرد، در حالی‌که غول های فناوری دیگری مانند گوگل و مایکروسافت نیز با ضررهای قابل‌توجهی مواجه شدند.

تاثیر پیشرفت‌های DeepSeek فراتر از ارزیابی سهام است. بخش انرژی با کاهش قابل‌توجهی مواجه شد که ناشی از نگرانی سرمایه‌گذاران بود که فناوری کارآمدتر انرژی DeepSeek می‌تواند تقاضای کلی انرژی از صنعت فناوری را کاهش دهد. شرکت‌هایی مانند GE Vernova و Vistra که به تولید توربین‌های بادی و گازی خود شناخته شده‌اند، شاهد سقوط 21% و 28% سهام خود بودند.

تحلیلگران وال استریت پیامدهای بلندمدت ظهور DeepSeek به عنوان یک رقیب قدرتمند در فضای هوش مصنوعی را با دقت بررسی می‌کنند. هزینه‌های کمتر و کاهش نیازهای انرژی مدل‌های DeepSeek سوالاتی را در مورد پایداری نرخ‌های سرمایه‌گذاری بالا در فناوری هوش مصنوعی توسط شرکت‌های آمریکایی ایجاد می‌کند و به برجسته شدن احتمال هزینه بیش از حد در این بخش می‌پردازد.

این وضعیت منجر به واکنش‌های متفاوتی شده است، برخی از تحلیلگران معتقدند که واکنش بازار ممکن است بیش از حد باشد، با توجه به تقاضای بالای مداوم برای فناوری هوش مصنوعی که همچنان به زیرساخت‌های قابل‌توجهی نیاز خواهد داشت.

علاوه بر این، ملاحظات ژئوپلیتیک نیز در حال بازی است، زیرا عدم قطعیت در مورد پاسخ‌های دولت ایالات متحده، به ویژه در مورد تعرفه‌های واردات چین و اقدامات نظارتی که می‌تواند بر پذیرش و ادغام فناوری‌هایی مانند DeepSeek در بازارهای ایالات متحده تأثیر بگذارد، همچنان ادامه دارد.

برخی از واکنش های برجسته به DeepSeek چیست؟

Nvidia سهم DeepSeek را به عنوان پیشرفت قابل‌توجهی در هوش مصنوعی، به ویژه با برجسته کردن کاربرد آن در مقیاس‌بندی زمان آزمایش که امکان ایجاد مدل‌های جدیدی را که کاملاً مطابق با کنترل‌های صادرات هستند، شناخته است. Nvidia ضمن ستایش DeepSeek، خاطرنشان کرد که استنتاج هوش مصنوعی به شدت به پردازنده‌های گرافیکی NVIDIA و شبکه‌های پیشرفته متکی است و بر نیاز مداوم به سخت‌افزار قابل‌توجه برای پشتیبانی از عملکردهای هوش مصنوعی تاکید کرد.

سم آلتمن از OpenAI در مورد اثربخشی مدل R1 DeepSeek اظهار نظر کرد و عملکرد چشمگیر آن را نسبت به هزینه آن ذکر کرد. آلتمن بر تعهد OpenAI به پیشبرد تحقیقات خود و افزایش ظرفیت محاسباتی برای دستیابی به اهداف خود تاکید و نشان داد که اگرچه DeepSeek یک پیشرفت قابل‌توجه است، اما OpenAI همچنان بر اهداف استراتژیک خود متمرکز است.

آراوند سرینیواس، مدیرعامل Perplexity، از موفقیت DeepSeek، به ویژه پیشی گرفتن آن از سایر مدل ها مانند ChatGPT در برخی معیارها، ابراز خوشحالی کرد. حمایت سرینیواس نشان دهنده علاقه گسترده‌تر به ادغام نوآوری‌های DeepSeek در پلتفرم‌ها و خدمات موجود است.

پت گلسینگر، مدیرعامل اخراج شده Intel، هوش مصنوعی DeepSeek را به دلیل یادآوری درس‌های ضروری به جامعه فناوری، مانند اینکه هزینه‌های پایین‌تر باعث پذیرش گسترده‌تر می‌شود، محدودیت@ها می‌توانند خلاقیت را تقویت کنند و رویکردهای منبع باز اغلب غالب هستند، ستایش کرد. نظرات گلسینگر بر پیامدهای گسترده‌تر استراتژی‌های DeepSeek و پتانسیل آنها برای تغییر شکل شیوه‌های صنعت تاکید می‌کند.

رسانه های دولتی چین و محافل سیاسی علاقه قابل‌توجهی به تأثیر DeepSeek نشان داده‌اند و موفقیت آن را به عنوان مقابله با تسلط ایالات متحده در فناوری و گامی در جهت خودکفایی استراتژیک چین در هوش مصنوعی می‌دانند. همانطور که رویترز گزارش داد، بنیانگذار DeepSeek در یک سمپوزیوم سطح بالا با نخست‌وزیر لی کیانگ شرکت کرد که نشان‌دهنده اهمیت DeepSeek برای اهداف استراتژیک ملی است.

ترامپ نیز ظهور DeepSeek را هم به عنوان یک چالش و هم یک فرصت برای صنعت فناوری ایالات متحده توصیف کرده است. او این را به عنوان یک زنگ خطر برای شرکت‌های آمریکایی برای نوآوری و رقابت موثرتر در فناوری جهانی می‌داند و ابعاد ژئوپلیتیک و اقتصادی ظهور DeepSeek را برجسته می‌کند.

DeepSeek که تنها یک سال از تاسیس آن می‌گذرد، از نظر محبوبیت از ChatGPT پیشی گرفته و ثابت کرده است که هوش مصنوعی پیشرفته نیازی به برچسب قیمت یک میلیارد دلاری ندارد! با این حال، صعود شهاب‌سنگ آن می‌تواند موج دیگری از روند باشد. مطمئناً، DeepSeek در حال حاضر پویایی بازار را تغییر داده و بحث‌های اخلاقی را ایجاد کرده است، اما برخی سوالات بزرگ باقی می ماند.

آیا DeepSeek کتاب بازی هوش مصنوعی را به روش‌هایی که تعداد کمی انتظار داشتند بازنویسی خواهد کرد؟ چه موانع غیرمنتظره‌ای می‌تواند توسعه و محبوبیت آن را کّند کند؟ یا شاید حتی منجر به سقوط آن شود؟ مسیر پیش رو برای این استارتاپ جاه‌طلبانه هوش مصنوعی مملو از احتمالات و مخاطرات است. زمان نشان خواهد داد که این سرمایه گذاری جسورانه چگونه پیش خواهد رفت.

منبع: Interestingengineering

مقالات مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *