登陆注册
13544

性能超GPT-4!谷歌放出最强悍大模型Gemini,与Open AI正式较量

套路网2023-12-08 10:23:550

今日凌晨,谷歌 CEO 桑达尔・皮查伊官宣 Gemini 1.0 版正式上线。

这次发布的 Gemini 大模型是原生多模态大模型,是谷歌大模型新时代的第一步,它包括三种量级:能力最强的 Gemini Ultra,适用于多任务的 Gemini Pro 以及适用于特定任务和端侧的 Gemini Nano。

一个视频速看谷歌大杀器

这是 Bard 问世以来最大的更新。

据说 Gemini 有万亿参数,训练动用的算力是 GPT-4 的五倍。

在发布会上,面对记者有关「Gemini 相比以前的大模型有哪些新能力」的提问,DeepMind 产品副总裁 Eli Collins 回答说:「我怀疑有」,表示谷歌仍然在努力了解 Gemini Ultra 的全部能力。

Pixel 8 Pro将是第一款运行Gemini Nano的智能手机。

谷歌计划在接下来几个月中,将Gemini全面推向搜索、广告、Chrome和Duet AI等产品线。

谷歌 DeepMind CEO 和联合创始人 Demis Hassabis 代表 Gemini 团队正式推出了大模型 Gemini。

Hassabis 表示长久以来,谷歌一直想要建立新一代的 AI 大模型。在他看来,AI 带给人们的不再只是智能软件,而是更有用、更直观的专家助手或助理。Gemini 是一个多模态大模型,意味着它可以泛化并无缝地理解、操作和组合不同类型的信息,包括文本、代码、音频、图像和视频。

经过严格测试和评估,Gemini Ultra在32个学术基准测试集中,有30个测试集的表现超过了现有的最佳成果。在许多基准测试中,Gemini的性能甚至超越了GPT-4。在图像基准测试中,Gemini Ultra无需提取图像文本即可进行OCR处理,展示了其强大的多模态能力。

在大多数基准测试中,Gemini 的性能都超越了 GPT-4。

此外,Gemini还具有复杂的推理能力,例如通过分析潦草的笔记来解决物理问题。

图中一位老师画了一个滑雪者从斜坡上下来的物理问题,Gemini直接用数学公式,准确算出滑雪者在斜坡底部的速度。这,还是潦草笔记,它不仅能正确理解问题的表述,还指出了提问者的出错步骤,能力超强!

同时,Gemini具备高级编码能力,已在多个编码基准测试中展现出优异表现。

为了支持Gemini的发展,谷歌还发布了迄今最强大、高效且可扩展的TPU系统——Cloud TPU v5p,专为训练尖端人工智能模型而设计。新一代TPU将加速Gemini的研发进程,助力开发人员与企业客户更快地训练大规模生成式AI模型,让客户更早地体验到新产品与新功能。

值得一提的是,谷歌CEO桑达尔·皮查伊此前还说过,在某些方面,中国将走在AI领域的最前沿。目前,AIGC领域已涌现出众多行业化、场景化的应用,AI带来内容创作能力泛化与创作能力结构的改变,将会涌现一批擅长AIGC的玩家。

Gemini模型作为谷歌在AI领域的重磅发布,同样可以为数字人应用带来更好的用户体验和更高的性能。

更强大的自然语言处理能力,Gemini模型可以更好地理解和生成自然语言,使得数字人能够更准确地理解和回应用户的问题和指令;更强大的逻辑推理,Gemini模型可以帮助数字人进行更复杂的逻辑推理,使其能够处理更复杂的任务和问题;更好的理解和生成文本,Gemini模型可以帮助数字人更好地理解和生成文本,使其能够提供更准确、更相关的信息和建议;更强的多模态学习能力和个性化服务,学习和处理多种类型的数据,如文本、图像、音频等,使数字人能够提供更丰富、更全面的服务,最终在更多场景中发挥作用。

新畅元科技作为AIGC 数字人领域的先行者,我们将持续紧跟潮流科技,为数字人赋能企业服务提供更多可能性与适配性。

在Bard体验强大的Gemini

https://bard.google.com/chat

0000
评论列表
共(0)条
热点
关注
推荐