روز گذشته کمپانی OpenAI از جدیدترین مدل زبان بزرگ (LLM) چندوجهی خود تحت عنوان چتبات هوش مصنوعی GPT-4o (“o” نمادی از کلمه “omni” به معنای همهجانبه) رونمایی کرد. OpenAI در توسعه GPT-4o تلاش کرده است با بهبود قابلیتهای این چتبات در تولید محتوای «متنی، صوتی و تصویری» بستر مناسبی برای شکلگیری تعاملات انسانگونه و طبیعیتری میان کاربران با هوش مصنوعی خود را ایجادکند.
به ادعای OpenAI، مدل جدید هوش مصنوعی این کمپانی قادر است به ورودیهای صوتی (سوالات و دستورات ارائهشده از سمت کاربر که به صورت صوتی ادا میشوند) در کمتر از 232 میلیثانیه پاسخ دهد. همچنین این کمپانی مدعی است چتبات هوش مصنوعی GPT-4o به واسطه پشتیبانی از بیش از 50 زبان زنده، در پاسخدهی به سوالات و دستورات مبتنی بر متن از سمت کاربران غیرانگلیسیزبان نسبت به سایر نسخههای این چتبات بسیار سریعتر عمل میکند. علاوه بر این، در چتبات هوش مصنوعی GPT-4o کاربران قادرند صحبت چتبات را در حین ارائه پاسخ قطع کرده و سوالات جدیدی را از مدل پرسیده یا درخواستهای پیشین خود را شفافسازی کنند.
همچنین، چتبات هوش مصنوعی GPT-4o دارای یک دستیار صوتی توانمندتر با صدایی بسیار نزدیک به صدای انسانهاست. با این حال، امکان تنظیم میزان «احساس» نهفتهشده در صدای چتبات نیز وجود دارد و کاربران میتوانند از چتبات درخواست کنند تا پاسخ سوالات را با لحنی شاد یا حتی رباتیکگونه بیان نماید. علاوه بر این، این دستیار صوتی قادر است در لحظه به سوالات کاربران خود پاسخ دهد و در یک قابلیت بسیار کاربردی با مشاهده محیط اطراف کاربر از طریق دوربین دستگاه و تجزیه و تحلیل اطلاعات، منظره اطراف وی را برای او توصیف کند یا به سوالهای مرتبط کاربر پاسخ دهد. این قابلیت پس از ترکیب با قابلیت ترجمه بلادرنگ 50 زبان توسط این چتبات میتواند به عنوان یک دستیار شخصی بسیار مفید برای افراد «نابینا، کمبینا یا دارای سایر معلولیتهای چشمی» در سراسر جهان نیز عمل کند.
کمپانی OpenAI فهرست بلندبالایی از قابلیتهای GPT-4o را در پخش زنده مراسم رونمایی از این چتبات به نمایش گذاشت. برخی از این قابلیتهای جدید عبارتند از:
- دریافت پاسخهای ارائهشده توسط چتبات یا نتایج جستجو وب در یک پنجره جدید
- امکان تجزیه و تحلیل دادهها و ایجاد نمودار (در یک پنجره جدید)
- دریافت توصیف از عکس ارائهشده به چتبات
- آپلود چندین فایل در راستای دریافت «جمعبندی، تجزیه و تحلیل» یا «الهامگیری از فایلهای ارائهشده برای نوشتن یک متن جدید»
- امکان ذخیرهسازی مکالمات پیشین در حافظه چتبات برای دریافت بهترین تجربه کاربری شخصیسازیشده در مکالمات بعدی
هوش مصنوعی GPT-4o برای کاربرانی که به صورت رایگان از ChatGPT استفاده میکنند، در دسترس خواهد بود. این در حالی است که در این مدل، محدودیت درخواست برای کاربران سطح ChatGPT Plus پنج برابر افزایش یافته است. در حال حاضر قابلیتهای مبتنی بر متن و تصویر در چتبات هوش مصنوعی GPT-4o در اپلیکیشن و نسخه وب ChatGPT موجود است. با این حال، قابلیتهای جدید صوتی در هفتههای آتی به صورت آزمایشی (آلفا) در نسخه ChatGPT Plus در دسترس کاربران قرار خواهند گرفت.
علاوه بر این، روز گذشته کمپانی OpenAI از یک اپلیکیشن دسکتاپ ChatGPT برای سیستمعامل macOS نیز رونمایی کرد. این در حالی است که انتشار نسخه ویندوزی این اپلیکیشن به اواخر سال جاری میلادی موکول شده است. همچنین، OpenAI در این رویداد فروشگاه ChatGPT را نیز معرفی کرد. این فروشگاه مجازی میزبان میلیونها چتبات سفارشیسازیشده است و کاربران میتوانند بسته به نیاز خود به صورت رایگان به تمامی چتباتهای موجود در این فروشگاه دسترسی داشته باشند.
منبع: Gsmarena