گوگل طی سالهای اخیر در میان کمپانیهایی قرار گرفته که هوش مصنوعی را در اولویتهای اصلی خود قرار داده است. با این حال، اولین اقدامات این کمپانی در دنیای هوش مصنوعی با ابزار تعاملی بارد (Bard) نتوانست آنقدرها موفق ظاهر شود. موضوعی که به نظر گوگل قصد دارد با هوش مصنوعی جمینای (Gemini) از تکرار آن جلوگیری کرده و گام بزرگی در این حوزه بردارد. در همین راستا، ساندار پیچای در مقام مدیرعامل کمپانی گوگل، هوش مصنوعی Gemini را به عنوان «آغاز عصر جدید هوش مصنوعی» توصیف کرده است.
اولینبار پیچای در جریان کنفرانس سالانهی توسعهدهندگان گوگل (I/O 2023) که در اردیبهشتماه امسال برگزار شد، به این هوش مصنوعی اشاره کرده بود. اکنون با انتشار رسمی این AI جدید، هوش مصنوعی نقش پررنگتری در تقریباً تمامی محصولات گوگل بهدست خواهد آورد و تأثیر بیشتری بر روی آنها خواهد گذاشت. اما این هوش مصنوعی دقیقاً چیست؟ نسخههای متفاوت آن چه تفاوتی با یکدیگر دارند؟ برای دریافت پاسخ این سوالات و آشنایی بیشتر با هوش مصنوعی Gemini با اِروتِک در ادامه همراه باشید.
هوش مصنوعی Gemini چیست؟
هوش مصنوعی Gemini در اصل یک مدل هوش مصنوعی کاملاً جدید از کمپانی گوگل است که نهتنها میتواند متون را درک کند، که توانایی درک و تعامل با ویدیوها، صداها و تصاویر را نیز دارد. گوگل این مدل چندوجهی را به عنوان یک هوش مصنوعی که قادر به کامل کردن وظایف و کارهای پیچیدهای است، توصیف میکند.
این مسئله شامل درک و تولید کدهای باکیفیت هم میشود و نقطهی قوت اصلی هوش مصنوعی جدید گوگل این است که میتواند چنین کاری را به زبانهای مختلف برنامهنویسی انجام دهد. هوش مصنوعی Gemini همچنین میتواند وظایف و کارهای پیچیدهی مرتبط با فیزیک، ریاضی و سایر زمینهها را کامل کند.
گوگل اذعان داشته که هوش مصنوعی جدید خود را «از ابتدا برای چندوجهی بودن» ساخته است. این بدان معناست که Gemini قادر به تعمیمدهی و درک یکپارچهی اطلاعات میباشد و میتواند انواع مختلف اطلاعات را با یکدیگر ترکیب کند.
چه کسی پشت این هوش مصنوعی چندوجهی است؟
دمیس هاسابیس، مدیرعامل و یکی از بنیانگذاران گوگل دیپمایند (Google DeepMind)، بیان کرده که «جمینای حاصل تلاشهای مشترکی در مقیاس بزرگ است».
این پروژهی بزرگ با همکاری مشترک تحقیقات گوگل، گوگل دیپمایند و آلفابت میسر شده است.
نسخههای مختلف هوش مصنوعی Gemini گوگل
گوگل گفته که هوش مصنوعی Gemini یک مدل انعطافپذیر است که تقریباً بر روی هر دستگاهی قابل اجرا خواهد بود. دامنهی فعالیتهای هوش مصنوعی جدید گوگل از مراکز دادهی این کمپانی تا تلفنهای همراه را شامل میشود. جهت دسترسی به چنین مقیاس قابل توجهی، گوگل این هوش مصنوعی را در سه اندازهی مختلف به انتشار میرساند. این ۳ مدل Gemini عبارتاند از:
جمینای نانو
همانطور که از نام این مدل پیداست، جمینای نانو (Gemini Nano) کوچکترین شکل هوش مصنوعی جدید گوگل به حساب میآید. گوگل این نسخه را برای گوشیهای هوشمند طراحی کرده تا به برنامههای هوش مصنوعی روی دستگاه (On-Device AI) کمک برساند. به عنوان مدلی که برای انجام وظایف و کارهای روی دستگاه طراحی شده، تمرکز جمینای نانو بر روی کارایی است.
علاوه بر این، جمینای نانو مخصوص برنامههایی است که نیازی به اتصال به سرورهای خارجی ندارند. به طور مثال، این مدل میتواند به کاربران پیشنهادات متنی ارائه دهد یا یک متن را خلاصه کند.
جمینای پرو
مدل جمینای پرو (Gemini Pro) در حال حاضر در مراکز دادهی کمپانی گوگل مورداستفاده قرار میگیرد و به جدیدترین نسخهی چتبات بارد کمک میرساند. جمینای پرو که نسخهی ارتقایافتهی هوش مصنوعی قبلی گوگل محسوب میشود، توانایی ارائهی پاسخهای سریعتری را دارد و میتواند سوالهای پیچیدهتری را درک کند.
جمینای اولترا
اگرچه مدل جمینای اولترا (Gemini Ultra) برای استفادهی گسترده در دسترس عموم قرار نگرفته، کمپانی گوگل این مدل از هوش مصنوعی جمینای را به عنوان توانمندترین نسخه معرفی کرده است. گوگل دربارهی جمینای اولترا گفته که این مدل میتواند عملکرد بهتری نسبت به بسیاری از رقبای خود به نمایش بگذارد و حتی توانسته از ۳۲ بنچمارک مهم و پراستفاده، در ۳۰ مورد بهتر عمل کند. گوگل این مدل از هوش مصنوعی Gemini را برای انجام کارها و وظایف بسیار پیچیده طراحی کرده و این مدل بعد از اتمام مراحل آزمایشی، بهصورت رسمی منتشر خواهد شد.
چگونه میتوان از هوش مصنوعی Gemini گوگل استفاده کرد؟
مدلهای جمینای نانو و پرو هماکنون در محصولات کمپانی گوگل در دسترس قرار گرفته است. کاربران میتوانند در گوشیهای پیکسل ۸ گوگل مدل نانو را پیدا کنند، در حالی که مدل پرو اکنون در گوگل بارد (Google Bard) موجود است. کمپانی گوگل همچنین برنامه دارد تا از این هوش مصنوعی در تبلیغات، مرورگر کروم، جستجو و سایر خدمات این کمپانی بهمرور زمان بهره بگیرد و آن را با سرویسهای مختلف خود ادغام کند.
مشتریان و توسعهدهندگان سازمانی میتوانند از طریق واسط برنامهنویسی کاربردی (API) جمینای به مدل پرو دسترسی پیدا کنند. این مدل در تاریخ ۱۳ دسامبر (۲۲ آذر) در سرویس ابری هوش مصنوعی Vertex و ابزار AI Studio گوگل در دسترس قرار خواهد گرفت. توسعهدهندگان اندروید نیز میتوانند از طریق AICore به مدل نانو دسترسی داشته باشند.
منبع: Gizchina