پربازدید ترین‌های هفته

شایعه: احتمال رونمایی از نسخه ریمیک بازی اساسینز کرید: بلک فلگ در ماه آوریل!

هابل لحظه شکافتن «سحابی تخم مرغ» توسط یک ستاره در حال مرگ را ثبت کرد!

مینی پی‌سی Acemagic Retro X5 با طراحی نوستالژیک نینتندو و پردازنده Ryzen AI 9 HX 370 معرفی شد

این پیشرفت کوانتومی، دو واقعیت متضاد را به هم پیوند می‌دهد!

ظهور طراحی تاشوی عریض سامسونگ در نسخه‌های آزمایشی نرم‌افزار داخلی

آموزش

چطور اعلان‌هایی که به اشتباه در اندروید پاک کرده‌ایم را بازیابی کنیم؟

چگونه دسترسی اپلیکیشن‌ها به اطلاعات شخصی‌مان را محدود کنیم؟

این تنظیمات پیش‌فرض ویندوز، سرعت SSD شما را کمتر از حد واقعی نگه می‌دارد!

آیا خاموش کردن وای‌فای و بلوتوث واقعاً در مصرف باتری صرفه‌جویی می‌کند؟!

آیا فعال کردن حالت هواپیما باعث شارژ سریع‌تر گوشی می‌شود؟!

خانه » فناوری » هوش مصنوعی » گوگل در رویداد Google I/O 2025 از جدیدترین مدل‌های هوش مصنوعی خود رونمایی کرد

هوش مصنوعی

گوگل در رویداد Google I/O 2025 از جدیدترین مدل‌های هوش مصنوعی خود رونمایی کرد

تحریریه اروتک

اشتراک‌گذاری:

رویداد Google I/O 2025 یک نمایشگاه بزرگ با انبوهی از اعلان‌ها بود که بیشتر بر روی هوش مصنوعی تمرکز داشت. گوگل به‌روزرسانی‌ها و ویژگی‌های جدیدی را برای مدل‌های Gemini 2.5 (Pro و Flash)، در کنار تولیدکننده تصویر قدرتمندتر Imagen 4 و تولیدکننده ویدیوی هوش مصنوعی Veo 3 منتشر کرد. این شرکت همچنین از Flow، یک ابزار اختصاصی فیلم‌سازی هوش مصنوعی که مدل‌های Imagen ،Veo و Gemini را برای ایجاد صحنه‌های سینمایی از پیام‌های متنی ساده ترکیب می‌کند، رونمایی کرد.

✅ این مطلب جذاب را از دست ندهید؛ فقط عکس نگیرید! آیا فعال کردن حالت هواپیما باعث شارژ سریع‌تر گوشی می‌شود؟! 🚀

Gemini 2.5

Gemini 2.5 پشتیبانی از زبان گسترده را به بیش از 24 زبان با تبدیل متن به گفتار و صداهای رسا ارائه می‌دهد. گوگل ادعا می‌کند که قابلیت‌های استدلال، چندوجهی، کدنویسی و زمینه طولانی برای هر دو مدل Flash و Pro بهبود یافته است.

به‌روزرسانی بزرگ جدید در مدل پرو، حالت استدلال Deep Think اضافه‌شده برای کارهای بسیار پیچیده ریاضی و کدنویسی است. این ویژگی هنوز در مرحله “تجربی” خود است و به‌زودی برای آزمایش کنندگان مورد اعتماد منتشر خواهد شد. گوگل می‌گوید این مدل قبل از پاسخ دادن می‌تواند چندین فرضیه را در نظر بگیرد.

Gemini 2.5 Pro اکنون حالت هوش مصنوعی پیشرو در معیارهای WebDev Arena و LMARena است. این مدل، کدنویسی پیشرفته و ابزارهای ساخت اپلیکیشن وب و یک پنجره توکن تا 1 میلیون را برای درک متن طولانی ارائه می‌دهد. Gemini 2.5 همچنین امنیت را در برابر تزریق سریع غیرمستقیم بهبود می‌بخشد.

Gemini 2.5 Flash به صورت پیش نمایش برای همه کاربران در برنامه Gemini در دسترس است، در حالی‌که انتشار عمومی آن در اواخر ژوئن منتشر می‌شود. نسخه تجاری Gemini 2.5 Pro نیز اندکی پس از آن منتشر خواهد شد.

Imagen 4

Imagen 4 اکنون می‌تواند تصاویر را با وضوح 2K تولید کند. گوگل مدعی است که دقت متن را در کارت‌ها، پوسترها و کمیک‌های تولیدشده بهبود بخشیده است. Imagen 4 از امروز در برنامه‌های Gemini،Google Workspace ،Whisk و Vertex AI در دسترس است.

گوگل در رویداد Google I/O 2025 از جدیدترین مدل‌های هوش مصنوعی خود رونمایی کرد

Veo 3 جدیدترین مدل ویدیویی هوش مصنوعی گوگل است و قابلیت تشخیص سریع متن به ویدیو را بهبود داده است. این مدل می‌تواند ویدئو را با صدا، گفتگوی شخصیت‌ها و نویزهای پس زمینه خروجی دهد. Veo 3 از امروز برای مشترکین Google AI Ultra در ایالات متحده و کاربران شرکت Vertex AI در دسترس است.

Veo 2

Veo 2 دارای قابلیت حرکت دوربین، اضافه کردن و حذف اشیا است. کاربران همچنین می‌توانند تصاویری را برای کنترل سبک و رنگ‌آمیزی اضافه کنند تا فریم‌ها را فراتر از مرزهای اصلی گسترش دهند.

Flow

Flow ابزار جدید فیلم‌سازی هوش مصنوعی گوگل است که قابلیت‌های مدل‌های Veo ،Imagen و Lyria را برای صحنه‌های سینمایی با جزئیات بیشتر ترکیب می‌کند. گوگل ادعا می‌کند که Flow می‌تواند به داستان‌نویسان و نویسندگان کمک کند تا کلیپ‌های سینمایی استثنایی بسازند که در فیزیک و واقع‌گرایی برتری دارند. کاربران همچنین می‌توانند حرکت دوربین، زوایا و پرسپکتیو را کنترل کنند و ویدیوهای تولیدشده قبلی را ویرایش و گسترش دهند. Google Flow اکنون برای مشترکین Google AI Pro و Ultra در ایالات متحده در دسترس است.

منبع: Gsmarena