Google 推出最强大的人工智能模型:Gemini

周三, Google 开始了一个新的 多模态通用人工智能 (人工智能)模型, 双胞胎与 OpenAI、微软和 Meta 的产品竞争。

Google 推出最强大的人工智能模型:Gemini

据搜索巨头称,双子座是 “最大、最强大”的大语言模型(LLM) 该公司一直以来都在许多领先的基准测试中具有领先的性能。

开发者 Google 借助张量处理单元 (TPU),谷歌在 DeepMind AI 单元上训练了这种灵活的 AI 模型,它的运行速度明显快于以前的、较小且功能较弱的模型。 它可以概括并 无缝理解、处理和组合不同类型的信息,包括文本、代码、音频、图像和视频

Google 推出第一个版本 Gemini 1.0 三种不同尺寸双子座超适用于高度复杂任务的最大、最强大的模型; 双子座专业版,可扩展到广泛任务的最佳模型; 和 双子座纳米设备上最有效的任务模型。

“这些是 Gemini 时代的第一款车型,也是我们成立时愿景的首次实现 Google DeepMind 今年早些时候。 “这个模型的新时代代表了我们作为一家公司所做出的最伟大的科学和工程努力之一,”首席执行官 Sundar Pichai 说道。 Google Alphabet 在博客文章的注释中谈到了这一消息。

因此 Google 深心, Gemini Ultra 表现出色 GPT-4 在 32 项广泛使用的学术基准测试中,有 30 项测试衡量视觉理解或数学推理等技能。

尤其, Google 根据 Gemini Ultra 的数据,MMLU(大规模多任务语言理解)得分为 90%。 它结合了数学、物理、历史、法学、医学和伦理学等 57 个学科,既测试世界知识又测试解决问题的能力,是第一个在这种规模上超越人类专家的人工智能模型。

超越, Google Gemini Ultra 在新的 MMMU 基准测试中得分为 59.4%,该基准测试由跨越不同领域并需要有意识思考的多模式任务组成。 在没有光学字符识别(OCR)系统支持的情况下,它甚至在图像基准测试中超越了以前的模型,光学字符识别(OCR)系统从图像中提取文本以进行进一步处理。

Gemini AI 的可用性

Google 说 Bard 聊天机器人现已推出专业版 并将在 170 多个国家和地区提供英文版本。 它计划很快扩展到不同的模式并支持新的语言和地点。 从 12 月 13 日开始,开发者和企业客户将能够通过 Gemini API 访问 Gemini Pro Google 人工智能工作室或 Google Cloud 顶点人工智能。

更远, Google 还推出Gemini Nano Pixel 8 Pro 智能手机,并计划将 Gemini 扩展到搜索、广告和 Chrome以及未来几个月的其他服务。 此外, Android 开发人员可以使用 AICore 中提供的一项新系统功能 Gemini Nano Android 14、开始于 Pixel 8 个 Pro 设备可在一台设备上使用 早期预览基地

最后的, Google 计划从 2024 年初开始通过 Bard Advanced 发布其最先进的 AI 模型 Gemini Ultra 版本。 它将供选定的客户、开发人员、合作伙伴以及安全和责任专家“进行早期实验和反馈”,然后在明年初向开发人员和企业客户推出。