谷歌推出 Gemini Omni:动嘴即可 AI 修图,全能多模态新突破
时间:2026-05-21 11:10:40
小编:china
阅读:
5 月 20 日消息:在 Google I/O 2026 上,谷歌正式发布 Gemini Omni 模型。该模型支持文本、图像、音频、视频作为输入,实现跨模态生成与编辑。
其中在音频方面,目前该模型初期仅支持语音输入,但Google表示未来将很快扩展更多类型的音频输入能力。
首发产品Gemini Omni Flash已在Gemini应用上线,后续将向企业客户开放API。
该模型核心卖点在于深度视频编辑能力。用户通过自然语言指令即可对生成内容持续迭代,包括添加或删除对象、切换摄像机角度、修改环境与风格。
得益于模型对物理规律的理解以及对历史、科学、文化知识的整合,生成的视频在角色、场景及视觉逻辑上高度连贯,甚至能推测后续情节。用户亦可创建个人数字分身,并将其植入视频中。
谷歌在安全领域同步布局,所有通过Omni生成的视频均会自动嵌入SynthID数字水印,支持通过Google搜索及Chrome验证。
Gemini Omni Flash 现已面向拥有 Google AI Plus/Pro/Ultra 订阅的用户在 Gemini 应用和 Google Flow 中推出。此外,它还免费向希望混剪 YouTube Shorts 的用户以及 YouTube Create 应用用户推出。
Google DeepMind负责人哈萨比斯表示,该模型正推动AI从单纯的任务执行向通用人工智能(AGI)迈进。
- 谷歌推出 Gemini Omni:动嘴即可 AI 修图,全能多模态新突破5 月 20 日消息:在 Google I O 2026 上,谷歌正式发布 Gemini Omni 模型。该模型支持文本、图像、音频、视频作为输入,实现跨模时间:2026-05-21
-
华为 MatePad Edge 迎鸿蒙 6.1 重磅更新:二合一平板更流畅更安全5 月 20 日消息:华为正式宣布,华为 MatePad Edge 鸿蒙二合一平板电脑已开放鸿蒙 6 1 升级。官方介绍,升级鸿蒙6 1之后整机综合性时间:2026-05-21 -
光荣 WIN Turbo 定档 5 月 29 日:全新配置与价格前瞻5 月 20 日消息:荣耀「WIN Turbo」今日正式官宣,将于 5 月 29 日 15:00 正式发布。官方同步公布出了新机外观,继承了系列家族时间:2026-05-21 -
德克萨斯扑克规则详解图:深入理解德克萨斯扑克的魅力与技巧德克萨斯扑克作为一种流行的扑克游戏,以其简单的规则和丰富的策略深受玩家喜爱。无论是在赌场还是家庭聚会上,德克萨斯扑克都能带来无限的时间:2026-05-21 - 广东男子院中惊魂:剧毒银环蛇从天而降,现场画面曝光5 月 20 日消息:据报道,近日广东茂名一男子李先生遭遇惊魂一幕——在自家院子吊椅上休息时,一条剧毒银环蛇突然从头顶藤蔓坠落,直接时间:2026-05-21
热门阅读
-
哥哥抚慰腮腺炎弟弟 得知传染秒变脸
阅读:120
-
华为FreeClip 2推送鸿蒙OS 6晋级,支撑星闪音频 抗搅扰才能提拔
阅读:85
-
95岁广东白叟扮演一字马火了 自己谈长命诀要,1天喝2瓶可乐
阅读:59
-
刘文祥塌房紫薯精改吃大理寺米线 网友,筹办整理升咖
阅读:52
-
这才是东北春季最霸气的开场,百万只大雁春季迁移
阅读:51









