پنج شنبه 11 بهمن 1403
Thursday, 30 January 2025

هوش مصنوعی چینی کاخ سفید را ترساند؛ افت سهام انویدیا و مرزارزها

خبرگزاری مهر چهارشنبه 10 بهمن 1403 - 10:25
کاخ سفید تصمیم دارد درباره هوش مصنوعی چینی دیپ سیک تحقیق کند اما شواهد حاکی از آن است که این فناوری بسیار ساده تر و کم هزینه تر از مدل های آمریکایی است.

به گزارش خبرنگار مهر، به گفته کارولین لیویت، سخنگوی کاخ سفید، مقامات آمریکایی مشغول بررسی پیامدهای امنیت ملی هوش مصنوعی چینی «دیپ سیک» هستند. این درحالی است که تزار رمزارز دونالد ترامپ اعلام کرد در این زمینه احتمالا سرقت مالکیت معنوی رخ داده است!

لیویت در این باره افزود: این یک زنگ هوشیار برای صنعت هوش مصنوعی آمریکا است. سخنان او انعکاسی از اظهارات ترامپ است. وی همچنین اظهار کرد کاخ سفید تلاش می کند تا تسلط هوش مصنوعی آمریکا بر بازار را تضمین کند.

رویترز با انتشار این مطلب آورده است: سرمایه گذاران بازار سهام در سراسر جهان روز دوشنبه سهام شرکت های فناوری را به دلیل نگرانی ها درباره ظهور یک مدل هوش مصنوعی چین ارزان که تهدیدی برای سلطه رهبران آمریکایی بازار هوش مصنوعی (مانند اوپن ای آی و گوگل) به شمار می روند، فروختند.

«دیوید ساکس» تزار هوش مصنوعی و رمزارز کاخ سفید در پاسخ به سوال شبکه خبری فاکس نیوز درباره آنکه سرقت مالکیت معنوی در اوج گیری دیپ سیک نقشی داشته یا خیر، گفت: خب این امر ممکن است. در هوش مصنوعی تکنیکی به نام عصاره گیری وجود دارد که درباره آن مطالب زیادی خواهید شنید و این زمانی اتفاق می افتد که یک مدل از مدل دیگر می آموزد.

وی در ادامه افزود: تصور می کنم یکی از مواردی که در چند ماه آینده مشاهده می کنید آن است که شرکت های برتر هوش مصنوعی ما با اتخاذ گام هایی سعی در جلوگیری از فرایند عصاره گیری می کنند. این امر به طور حتم برخی از مدل های کپی شده را کندتر می کند.

اما در این میان نمی توان صحبت های تزار هوش مصنوعی کاخ سفید را کاملا صحیح دانست. بی‌شک، رونمایی از مدل DeepSeek R۱ داغ‌ترین اتفاق چند روز گذشته هوش مصنوعی بود. زلزله‌ای که لرزه‌هایش به هوش مصنوعی محدود نماند و پس‌لرزه‌هایش باعث ریزش ۲۰ درصدی قیمت سهام انویدیا در ۵ روز گذشته شده و این افت قیمت سهام هم مثل دومینو باعث ریزش قیمت بیت کوین و سایر رمزارزها شد اما اهمیت DeepSeek R۱ چیست.

نخست آنکه این اولین جهش DeepSeek نیست. حدود ۲۰ روز پیش این شرکت چینی، مدل DeepSeek V۳ خود را را به صورت منبع باز منتشر کرد. مدلی که در عملکرد بالاتر از Llama و در رقابت نزدیک با GPT-۴o قرار می‌گیرد و البته طبق ادعاهایش تنها با ۵.۵ میلیون دلار آموزش دیده است. اهمیت DeepSeek V۳ در این بود که آموزش مدل در چنین ابعادی، مخصوصا با در نظر گرفتن تحریم GPU‌های H۱۰۰ که آمریکا بر چین تحمیل کرده، کار راحتی نیست. در واقع برای آموزش LLM‌هایی در این ابعاد باید تعداد بسیار زیادی H۱۰۰ به هم متصل شوند و با هم آموزش ببینند. حال آنکه آمریکا هم فروش H۱۰۰ به چین را ممنوع کرده است. در همین راستا انویدیا یک نسخه دستکاری‌شده از H۱۰۰ به نام H۸۰۰ را که نرخ انتقال داده کمتری دارد برای شرکت های چینی می سازد و به آنها می فروشد. به همین دلیل حدس زده شد که چینی‌ها GPU‌های H۸۰۰ را به هم متصل کردند و سپس در سطحی پایین‌تر از Cuda آنها را برنامه ریزی کردند تا بتوانند به چنین عملکردی دست یابند.

اما این روند به DeepSeek V۳ ختم نشد و چین پس از پنجه در پنجه انداختن با GPT-۴o این بار سراغ زورآزمایی با GPT-o۱ رفت و از مدل DeepSeek R۱ رونمایی کرد. نکته این مدل آن است که قدرت استدلال در سطح o۱ دارد، با صرفا ۶ میلیون دلار هزینه درست شده است. همچنین قیمت اینفرنس آن هم نسبت به o۱ پایین تر است.

در درجه سوم نکته‌ فنی که نمی توان از آن عبور کرد، نوآوری R۱ در نحوه آموزش هست. مغز نوآوری که چینی‌ها برای این مدل به خرج دادند آن است که به جای استفاده از SFT مستقیما از RL استفاده کردند. یعنی مدل را صرفا در یک ستینگ RL آن هم با دو ریوارد مدل ساده‌ای که یکی از آنها قرار است جواب نهایی را چک می کند و دیگری مدل را ملزم به خروجی داده در یک فرمت خاص کند، آموزش دادند. نکته جالب اینه که این ریوارد مدل‌ها بسیار ساده هستند و صرفا می توان آنها را Rule-Based دید.

براساس گزارش روزنامه شریف، در درجه چهارم، چرا سیلیکون ولی و انویدیا دچار شوک شدند؟ حرف‌ و حدیث در این زمینه زیاد است. بعضی‌ها تحلیل کرده اند که شاید این که روش R۱ توانسته بدون تکیه بر تکنیک‌های Inference Time Compute که مستلزم استفاده بیشتر از قدرت محاسباتی هستند، به AGI نزدیک شود از اهمیت GPU‌ها کاسته است.

آنچه قابل توجه است این است که این یک شوک موقتی است و از ۳ امر ناشی می شود. نخست آنکه بالاخره چینی‌ها توانستند در زمینه مدل‌های زبانی به رقابت نزدیک به آمریکا برسند و در حالی که همیشه آزمایشگاه‌های هوش مصنوعی چینی عقب‌تر از آمریکایی‌ها بودند، R۳ را می توان به مثابه یک شوک و نقطه عطف برای مونوپلی آمریکا در هوش مصنوعی به حساب آورد. دوما این که قیمت پایین‌ آموزش و اینفرنس R۱ ممکن است باعث یک تکانه به وابستگی به nvidia باشد که البته صرفا در حد یک شوک موقت خواهد بود. در درجه سوم از این زاویه می توان این موضوع را نگاه کرد که DeepSeek توانسته تحریم‌های آمریکا در زمینه GPU را کم‌اثرتر کند و شاید این روند در آینده ادامه دار باشد.

پنجم، آیا DeepSeek برنده شده است؟ هنوز نه. چرا که o۳ هنوز عملکرد بسیار بهتری نسبت به R۱ دارد، با این وجود R۱ کاراتر است و می تواند روی دیوایس‌ها اجرا شود و هم هزینه اینفرنس پایین‌تری دارد. از سوی دیگر با منبع باز کردن آن فشار برای کاهش قیمت به مدل‌هایی مثل o۱ و o۱-mini وارد می‌کند. باید دید رقابت بین آمریکایی‌ها و چینی‌ها در ادامه چه خواهد شد.

منبع خبر "خبرگزاری مهر" است و موتور جستجوگر خبر تیترآنلاین در قبال محتوای آن هیچ مسئولیتی ندارد. (ادامه)
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت تیترآنلاین مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویری است، مسئولیت نقض حقوق تصریح شده مولفان از قبیل تکثیر، اجرا و توزیع و یا هرگونه محتوای خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.