گوگل در رویداد Google I/O 2025 از جدیدترین مدل‌های هوش مصنوعی خود رونمایی کرد

گوگل در رویداد Google I/O 2025 از جدیدترین مدل‌های هوش مصنوعی خود رونمایی کرد

اشتراک‌گذاری:

رویداد Google I/O 2025 یک نمایشگاه بزرگ با انبوهی از اعلان‌ها بود که بیشتر بر روی هوش مصنوعی تمرکز داشت. گوگل به‌روزرسانی‌ها و ویژگی‌های جدیدی را برای مدل‌های Gemini 2.5 (Pro و Flash)، در کنار تولیدکننده تصویر قدرتمندتر Imagen 4 و تولیدکننده ویدیوی هوش مصنوعی Veo 3 منتشر کرد. این شرکت همچنین از Flow، یک ابزار اختصاصی فیلم‌سازی هوش مصنوعی که مدل‌های Imagen ،Veo و Gemini را برای ایجاد صحنه‌های سینمایی از پیام‌های متنی ساده ترکیب می‌کند، رونمایی کرد.

Gemini 2.5

Gemini 2.5 پشتیبانی از زبان گسترده را به بیش از 24 زبان با تبدیل متن به گفتار و صداهای رسا ارائه می‌دهد. گوگل ادعا می‌کند که قابلیت‌های استدلال، چندوجهی، کدنویسی و زمینه طولانی برای هر دو مدل Flash و Pro بهبود یافته است.

به‌روزرسانی بزرگ جدید در مدل پرو، حالت استدلال Deep Think اضافه‌شده برای کارهای بسیار پیچیده ریاضی و کدنویسی است. این ویژگی هنوز در مرحله “تجربی” خود است و به‌زودی برای آزمایش کنندگان مورد اعتماد منتشر خواهد شد. گوگل می‌گوید این مدل قبل از پاسخ دادن می‌تواند چندین فرضیه را در نظر بگیرد.

Gemini 2.5 Pro اکنون حالت هوش مصنوعی پیشرو در معیارهای WebDev Arena و LMARena است. این مدل، کدنویسی پیشرفته و ابزارهای ساخت اپلیکیشن وب و یک پنجره توکن تا 1 میلیون را برای درک متن طولانی ارائه می‌دهد. Gemini 2.5 همچنین امنیت را در برابر تزریق سریع غیرمستقیم بهبود می‌بخشد.

گوگل در رویداد Google I/O 2025 از جدیدترین مدل‌های هوش مصنوعی خود رونمایی کرد

Gemini 2.5 Flash به صورت پیش نمایش برای همه کاربران در برنامه Gemini در دسترس است، در حالی‌که انتشار عمومی آن در اواخر ژوئن منتشر می‌شود. نسخه تجاری Gemini 2.5 Pro نیز اندکی پس از آن منتشر خواهد شد.

Imagen 4

Imagen 4 اکنون می‌تواند تصاویر را با وضوح 2K تولید کند. گوگل مدعی است که دقت متن را در کارت‌ها، پوسترها و کمیک‌های تولیدشده بهبود بخشیده است. Imagen 4 از امروز در برنامه‌های Gemini،Google Workspace ،Whisk و Vertex AI در دسترس است.

Veo 3 جدیدترین مدل ویدیویی هوش مصنوعی گوگل است و قابلیت تشخیص سریع متن به ویدیو را بهبود داده است. این مدل می‌تواند ویدئو را با صدا، گفتگوی شخصیت‌ها و نویزهای پس زمینه خروجی دهد. Veo 3 از امروز برای مشترکین Google AI Ultra در ایالات متحده و کاربران شرکت Vertex AI در دسترس است.

Veo 2

Veo 2 دارای قابلیت حرکت دوربین، اضافه کردن و حذف اشیا است. کاربران همچنین می‌توانند تصاویری را برای کنترل سبک و رنگ‌آمیزی اضافه کنند تا فریم‌ها را فراتر از مرزهای اصلی گسترش دهند.

Flow

Flow ابزار جدید فیلم‌سازی هوش مصنوعی گوگل است که قابلیت‌های مدل‌های Veo ،Imagen و Lyria را برای صحنه‌های سینمایی با جزئیات بیشتر ترکیب می‌کند. گوگل ادعا می‌کند که Flow می‌تواند به داستان‌نویسان و نویسندگان کمک کند تا کلیپ‌های سینمایی استثنایی بسازند که در فیزیک و واقع‌گرایی برتری دارند. کاربران همچنین می‌توانند حرکت دوربین، زوایا و پرسپکتیو را کنترل کنند و ویدیوهای تولیدشده قبلی را ویرایش و گسترش دهند. Google Flow اکنون برای مشترکین Google AI Pro و Ultra در ایالات متحده در دسترس است.

منبع: Gsmarena

مقالات مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *