谷歌DeepMind发布了备受期待的人工智能聊天机器人Gemini系列,该系列将与OpenAI的GPT系列展开竞争。
据谷歌称,其最大、功能最强的新模型Gemini Ultra在许多基于文本、基于图像、编码和推理的任务上都优于OpenAI最强大的模型GPT-4。该公司表示,从明年年初开始,Gemini Ultra将通过名为Bard Advanced的新人工智能聊天功能提供。据公告称,该平台目前正在进行完善,并正在接受“信任和安全检查,包括由可信赖的外部机构进行红队检查”。
谷歌深度思维还宣布推出Gemini Pro,现在可以通过谷歌的Bard聊天界面向公众开放,以及较小的Gemini Nano,它将在谷歌的Pixel 8 Pro智能手机上运行。这三种模型都可以处理文本、图像、音频和视频,并产生文本和图像输出。
谷歌将开始将Gemini模式整合到其他产品和服务中,比如互联网搜索和广告。从12月13日起,开发者将能够通过API访问Gemini Pro,而Android开发者将能够使用Gemini Nano进行构建。
此次推出将使Gemini套件与OpenAI、Anthropic、Inflection、meta和埃隆·马斯克(Elon Musk)的xAI等竞争对手展开竞争。
DeepMind由Demis Hassabis、Shane Legg和Mustafa Suleyman于2010年创立。2014年,谷歌斥资4亿美元收购了这家人工智能实验室,2023年4月,DeepMind与谷歌的精英人工智能研究团队谷歌大脑(Google Brain)合并,成立了由哈萨比斯领导的谷歌深度思维(Google DeepMind)。
阅读更多:《时代》周刊2023年最具影响力公司100强:谷歌DeepMind
收购一年后,DeepMind的创始人开始谈判,试图从新的母公司获得更大的独立性。据报道,2017年,DeepMind的创始人曾试图脱离谷歌,但以失败告终。据报道,在2020年,创始人推动了一种新的法律结构,以确保强大的人工智能不受单一公司实体的控制,甚至聘请了一名外部律师来帮助起草该结构,但据《华尔街日报》报道,拟议的结构对Alphabet来说没有经济意义。
谷歌和谷歌DeepMind在过去十年中取得了许多最重要的人工智能突破,包括AlphaGo,它掌握了复杂的围棋游戏,发明了为当今聊天机器人提供动力的变压器架构,以及用AlphaFold解决了蛋白质折叠问题。
但在人工智能聊天机器人时代,这家科技巨头落后于OpenAI和Anthropic等竞争对手。2021年的一篇论文表明,DeepMind早在2020年12月就开发了一个聊天机器人Gopher。谷歌DeepMind首席运营官莱拉·易卜拉欣告诉《时代》杂志,DeepMind决定不发布Gopher是因为它经常给出事实上不准确的回答——这种倾向在业内被称为“幻觉”。在DeepMind和谷歌大脑合并之前,DeepMind的一个代号为Goodall的项目正在努力打造一个ChatGPT的竞争对手,尽管为了专注于Gemini,这个项目被放弃了。
2023年最佳CEO:山姆·奥特曼
谷歌在2023年2月宣布推出自己的聊天机器人巴德,但在分析师认为Alphabet不如竞争对手后,母公司Alphabet的股价下跌。5月,它发布了PaLM 2,这是对Bard的改进,但评论家认为它不如GPT-4。
虽然谷歌推出消费类人工智能产品的速度较慢,但它最大的竞争对手一直在考虑这个问题。微软与OpenAI的合作关系使其有权使用OpenAI的人工智能模型。在这家软件巨头宣布将OpenAI的模型整合到必应搜索引擎后,首席执行官萨蒂亚·纳德拉在接受the Verge采访时表示,他认为人工智能可以帮助他的公司挑战谷歌在互联网搜索领域的主导地位,他预计谷歌会对此做出反应。“我想让人们知道,是我们让他们跳舞的,”他说。(分析公司StatCounter的数据显示,谷歌在搜索领域仍保持着霸主地位,不过微软一位高管在今年8月接受《华尔街日报》采访时对此提出了质疑。)
谷歌DeepMind在声明中表示,它已经将Gemini Ultra与一系列竞争对手的模型——openai的GPT-4、Anthropic的Claude 2、Inflection的Inflection-2、meta的Llama 2和xAI的Grok 1——进行了比较,发现大型语言模型在包括专业和学术多项选择题以及Python编码在内的测试中表现优于这些竞争对手。
有话要说...