رویداد Google I/O 2025 یک نمایشگاه بزرگ با انبوهی از اعلانها بود که بیشتر بر روی هوش مصنوعی تمرکز داشت. گوگل بهروزرسانیها و ویژگیهای جدیدی را برای مدلهای Gemini 2.5 (Pro و Flash)، در کنار تولیدکننده تصویر قدرتمندتر Imagen 4 و تولیدکننده ویدیوی هوش مصنوعی Veo 3 منتشر کرد. این شرکت همچنین از Flow، یک ابزار اختصاصی فیلمسازی هوش مصنوعی که مدلهای Imagen ،Veo و Gemini را برای ایجاد صحنههای سینمایی از پیامهای متنی ساده ترکیب میکند، رونمایی کرد.
Gemini 2.5
Gemini 2.5 پشتیبانی از زبان گسترده را به بیش از 24 زبان با تبدیل متن به گفتار و صداهای رسا ارائه میدهد. گوگل ادعا میکند که قابلیتهای استدلال، چندوجهی، کدنویسی و زمینه طولانی برای هر دو مدل Flash و Pro بهبود یافته است.
بهروزرسانی بزرگ جدید در مدل پرو، حالت استدلال Deep Think اضافهشده برای کارهای بسیار پیچیده ریاضی و کدنویسی است. این ویژگی هنوز در مرحله “تجربی” خود است و بهزودی برای آزمایش کنندگان مورد اعتماد منتشر خواهد شد. گوگل میگوید این مدل قبل از پاسخ دادن میتواند چندین فرضیه را در نظر بگیرد.
Gemini 2.5 Pro اکنون حالت هوش مصنوعی پیشرو در معیارهای WebDev Arena و LMARena است. این مدل، کدنویسی پیشرفته و ابزارهای ساخت اپلیکیشن وب و یک پنجره توکن تا 1 میلیون را برای درک متن طولانی ارائه میدهد. Gemini 2.5 همچنین امنیت را در برابر تزریق سریع غیرمستقیم بهبود میبخشد.
Gemini 2.5 Flash به صورت پیش نمایش برای همه کاربران در برنامه Gemini در دسترس است، در حالیکه انتشار عمومی آن در اواخر ژوئن منتشر میشود. نسخه تجاری Gemini 2.5 Pro نیز اندکی پس از آن منتشر خواهد شد.
Imagen 4
Imagen 4 اکنون میتواند تصاویر را با وضوح 2K تولید کند. گوگل مدعی است که دقت متن را در کارتها، پوسترها و کمیکهای تولیدشده بهبود بخشیده است. Imagen 4 از امروز در برنامههای Gemini،Google Workspace ،Whisk و Vertex AI در دسترس است.
Veo 3 جدیدترین مدل ویدیویی هوش مصنوعی گوگل است و قابلیت تشخیص سریع متن به ویدیو را بهبود داده است. این مدل میتواند ویدئو را با صدا، گفتگوی شخصیتها و نویزهای پس زمینه خروجی دهد. Veo 3 از امروز برای مشترکین Google AI Ultra در ایالات متحده و کاربران شرکت Vertex AI در دسترس است.
Veo 2
Veo 2 دارای قابلیت حرکت دوربین، اضافه کردن و حذف اشیا است. کاربران همچنین میتوانند تصاویری را برای کنترل سبک و رنگآمیزی اضافه کنند تا فریمها را فراتر از مرزهای اصلی گسترش دهند.
Flow
Flow ابزار جدید فیلمسازی هوش مصنوعی گوگل است که قابلیتهای مدلهای Veo ،Imagen و Lyria را برای صحنههای سینمایی با جزئیات بیشتر ترکیب میکند. گوگل ادعا میکند که Flow میتواند به داستاننویسان و نویسندگان کمک کند تا کلیپهای سینمایی استثنایی بسازند که در فیزیک و واقعگرایی برتری دارند. کاربران همچنین میتوانند حرکت دوربین، زوایا و پرسپکتیو را کنترل کنند و ویدیوهای تولیدشده قبلی را ویرایش و گسترش دهند. Google Flow اکنون برای مشترکین Google AI Pro و Ultra در ایالات متحده در دسترس است.
منبع: Gsmarena