快速链接

中心论点

  • 谷歌的 Gemini AI 模型有三种变体:Ultra、Pro 和 Nano,分别专注于不同的任务和复杂程度。
  • Gemini Ultra 在关键 AI 基准测试中显示出令人鼓舞的结果,但自 2023 年 12 月起不再可供公众使用。 Google 表示应该会在 2024 年 1 月上市。
  • Gemini Pro已经上市,虽然性能不错,但目前还无法取代它 GPT-4。

Google 一直承诺其Gemini AI模型会比 OpenAI’S GPT-4、驱动的型号 ChatGPT 加。 现在这个 Google Gemini 已上市,我们终于可以对其进行测试,看看 Gemini 的比较如何 GPT-4。

什么时候 Google 当巴德于 2023 年 3 月推出时,有很多值得兴奋的事情。 最后, OpenAI’S ChatGPT 垄断将会被打破,我们将会有有价值的竞争。

但巴德从来都不是人们所期待的AI巨头,而且 GPT-4 仍然是占主导地位的生成式人工智能聊天机器人平台。 现在, GoogleGemini 来了——但期待已久的 AI 模型比这更好吗? ChatGPT?

什么是 GoogleGemini 人工智能模型?

Gemini 是来自微软的谷歌最强大的生成式人工智能模型,能够理解和处理各种数据格式,包括文本、音频、图像和视频。 谷歌试图创建一个统一的人工智能模型,利用其最强大的人工智能技术提供绘图功能。 Gemini 将提供三种型号:

  1. 双子座超: 适用于高度复杂任务的最大、最强大的变体。
  2. 双子座专业版: 用于扩展和为各种任务提供高性能的最佳模型,但不如 Ultra 强大。
  3. 双子座纳米: 设备上任务交付的最有效模型。 例如,开发人员可以使用 Gemini Nano 创建移动应用程序或集成系统,为移动领域带来强大的人工智能。

在他的官方博客上 关键词, Google 表示 Gemini Ultra 在多项基准测试中均优于最先进的技术。 Google 声称 Gemini Ultra 的表现优于行业领先者 GPT在几个关键基准测试中为-4。

在严格的 MMLU 基准测试中获得了前所未有的 90.0% 分数, Google 根据声明,Gemini Ultra 是第一个在这项有 57 名测试对象的复杂测试中超越人类的模型。

Google

Gemini Ultra 还可以理解、解释和生成一些世界上最流行的编程语言的高质量代码,包括 Go、JavaScript、Python、Java 和 C++。 从纸面上看,这些都是很好的结果。 但这些都是基准,基准并不总是能说明全部情况。 那么双胞胎在现实世界的任务中表现如何呢?

如何使用 Google 双子座人工智能

在 Gemini AI 模型的三个变体中,您现在可以使用 Gemini Pro。 Gemini Pro 目前可在 Google的 Bard 聊天机器人。 要将 Gemini Pro 与 Bard 一起使用,请访问 bard.google.com 并使用您的登录 Google 帐户。

Google 表示 Gemini Ultra 将于 2024 年 1 月推出,因此我们不得不满足于对其进行测试 Gemini Pro ChatGPT 现在。

双胞胎如何比较 GPT-3.5 和 GPT-4

当新的人工智能模型上市时,它会受到测试 OpenAI’S GPT 通常被认为是最先进的人工智能模型应该与其他模型进行比较。 因此,我们通过 Bard 和 ChatGPT 测试了 Gemini 在数学、创意写作、代码生成和图像输入精确处理方面的能力。

我们从我们能想到的最简单的数学问题开始,要求两个聊天机器人解决以下问题: -1×-1×-1

巴德先行。 我们重复了这个问题两次,但都得到了错误的答案。 我们在第三次尝试时得到了答案,但这不算数。

我们尝试过 ChatGPT 继续运行 GPT-3.5。 第一次尝试就成功了。

为了测试双子座的图像解释能力,我们要求他解释一些流行的模因。 它拒绝了,称它无法解释描绘人物的图像。 ChatGPT 正在运行 GPT-4V,愿意并且能够完美地做到这一点。

我们再次尝试让他解释图像,同时测试他解决问题和编码的能力。 我们给了 Bard 运行 Gemini Pro 的屏幕截图,并要求他解释并编写 HTML 和 CSS 代码来重现该屏幕截图。

这是源屏幕截图。

下面是 Gemini Pro 尝试使用 HTML 和 CSS 解释和重现屏幕截图。

这是 GPT-4s 尝试重现屏幕截图。 鉴于此,结果并不令人意外 GPT-4 历来擅长编码。 我们已经演示了它的用途 GPT-4 从头开始​​创建一个网络应用程序。

我们请 Gemini Pro 写一首关于特斯拉(电动汽车品牌)的诗。 与我们过去进行的测试相比,它显示出微小的改进。 结果如下:

此时我们考虑比较结果 GPT-3.5代替压缩机 GPT-4会更合适。 所以我们问 ChatGPT 跑步 GPT-3.5 创作一首类似的诗。

可能是个人选择,但Gemini Pro的意见似乎更好。 但我们会让你来做法官。

双子座比双子座好吗 ChatGPT?

前 Google 巴德推出了,我们以为就是这样 ChatGPT 我们一直在等待的竞争 – 但事实并非如此。 现在Gemini来了,到目前为止Gemini Pro似乎不是合适的型号 ChatGPT 致命一击。

Google 说Gemini Ultra会好很多。 我们真诚地希望情况确实如此,并且它达到或超过 Gemini Ultra 公告中的要求。 但在我们看到并测试谷歌生成式人工智能工具的最佳版本之前,我们不知道它是否可以取代其他人工智能模型竞争对手。 就目前情况而言, GPT-4 仍然是无可争议的 AI 模型冠军。