谷歌推出“双子座智能”。将Android发展成为“自主AI平台”

谷歌宣布为 Android 推出一套新的人工智能功能,称为 Gemini Intelligence。这个想法是将生成式人工智能“Gemini”集成到操作系统级别,并将智能手机本身发展成为“代表用户行事的人工智能系统”。目标是最新的 Pixel 和三星 Galaxy 系列,将于 2026 年夏季开始推出。

Gemini Intelligence 是谷歌推进其过去几年一直奉行的“人工智能优先”战略的一部分。在传统智能手机上,用户必须一遍又一遍地在应用程序之间切换、复制信息并输入信息。借助Gemini Intelligence,AI可以理解这一系列过程,并根据屏幕上的信息、图像和声音进行自主处理。

UI(用户界面)使用基于“Material 3 Expressive”的新表达方式。 Gemini的“听”、“思考”、“处理”状态通过不显眼的动画和波形表达来展现,并以不遮挡视线的方式传达AI的运行状态。 Gboard 显示跨越整个键盘的波形动画,作为 Gemini Intelligence 的通用视觉语言。

部分 Galaxy S26 系列和 Pixel 10 系列已经提供了 Gemini 的任务自动化功能,但 Gemini Intelligence 将进一步扩大兼容应用程序的范围。此前,人工智能仅限于网约车、外卖等少数应用,但未来,人工智能将能够在更广泛的应用中进行操作。

例如,如果您在显示用笔记应用程序编写的购物清单时按住电源按钮并指示用户“创建送货车”,Gemini 将读取内容并自动在目标服务上注册商品。

此外,通过拍摄放置在酒店大堂的旅行手册的照片,并告诉用户“在Expedia中搜索内容相似的6人旅游”,人工智能将在操作旅行网站时搜索建议。

Gemini Intelligence不仅支持语音和文本,还支持截图和摄像头图像相结合的多模态操作。由于您可以在了解屏幕上的内容后执行操作,因此无需在应用程序之间来回转录信息。

介绍 Gboard 的新功能“Rambler”和一代 UI

键盘应用程序“Gboard”将引入新的语音输入功能“Rambler”。与传统的语音识别不同,传统的语音识别采用逐字语音识别,它可以理解上下文,包括改述、沉默和“嗯”、“嗯”等填充词,并将其组织成自然句子。

例如,如果您说“苹果、香蕉、橙子...我真的不需要苹果”,则最终列表将在不包含苹果的情况下进行排序。您可以实时编辑和格式化句子,多语言模型允许您在一条消息中在多种语言之间切换。

表单输入功能也将得到增强。在 Android 应用程序和 Chrome 中,Gemini 使用“智能自动填充”帮助您进行输入。它是一个可以参考Google Photos和Gmail等个人数据自动填写表格的系统,其中包含车牌号码和护照信息等信息。使用时需要明确选择加入。

Android 版 Chrome 将具有与桌面版 Chrome 相同的 Gemini 集成。您的浏览器中已添加双子座按钮,允许您在共享正在查看的网页时向 AI 提问。对于Google AI Pro和Ultra套餐的订户,还计划提供“自动浏览”功能,由AI代表用户进行预订操作,并将从6月下旬开始逐步推出。

对于主屏幕,将引入“创建我的小部件”作为生成 UI 的第一步。 Gemini 通过简单地用自然语言传达您的愿望来自动生成专用小部件的功能。

您可以通过输入“每周建议三种高蛋白预制食谱”来创建食谱仪表板,或者通过询问“仅显示风速和降雨量”来为骑自行车的人创建天气小部件。生成的小部件也可以在主屏幕上调整大小。

支持的类别包括总结多种信息的“组合”、处理紫外线指数和潮汐水平的“天气警报”、管理时区的“我的世界时钟”、显示算命和食谱的“每日简报”、倒计时生日和周年纪念日的“重要日期”以及处理股票价格、加密资产和外汇的“市场”。

这一代小部件功能还将与 Wear OS Tiles 兼容,并且也将在智能手表上提供。谷歌宣布计划在今年年底前将 Gemini Intelligence 扩展到汽车、智能眼镜和笔记本电脑。

在安全方面,我们有三个原则:“明确的用户控制”、“全面的数据保护”和“操作透明”。当AI在后台操作应用程序时,屏幕顶部的通知芯片会不断显示操作状态,以便用户了解进度。此外,Rambler 的音频处理不存储录制数据,仅进行实时处理。

信息来源

(图片来源:谷歌)