谷歌展示Gemini的聪明才智 将于12月6日先向开发者提供

来源:网界网 | 2023-12-06 23:35:41

  在先前有消息指称谷歌可能延后揭晓其大型自然语言模型Gemini之后,显然为了澄清市场传闻,同时基于与竞争对手抗衡,谷歌宣布将从12月6日开始向Android平台开发者提供名为Gemini Nano、可在手机上运行的小型模型,预计在12月13日通过谷歌 Cloud的Vertex AI、AI Studio,向开发者及企业提供名为Gemini Pro、规模更大的模型,而规模最大的Gemini Ultra则针对早期注册开发者、企业提供,目标在2024年初向大众开放使用。

  而针对未来Gemini技术应用是否会比照OpenAI提供类似收录各类GPT服务的软件市集服务,Bard与谷歌 Assistant产品负责人萧茜透露或许会是未来规划方向,但目前并未有能透露细节。

  谷歌强调,Gemini能以更精准的语意理解与视觉判断能力,加上原生支持多模运作,以及可衔接开发者、企业导入资料集,能以更高准确度、更快反应速度给予解答,或是进行更深层互动。

  此次除了公布Gemini即将推出消息,谷歌也确定Gemini将会以Gemini Pro形式整合至人工智慧服务「Bard」等谷歌产品,但初期仅对应英语互动,未来也会陆续支持更多语种,后续则将进一步推出整合Gemini Ultra、更进阶的Bard Advanced,但是否会另外以计费形式提供使用,目前还无法确定。

  针对谷歌 Tensor处理器优化的Gemini Nano,将会率先用于Pixel 8 Pro,之后也会陆续对应更多Android手机。

  不过,谷歌在此次说明并未透露Gemini具体对应参数规模,同时也未说明是否针对不同处理器、操作系统平台(例如使用Qualcomm、联发科处理器,或是iPhone机种)调整Gemini运作模式。

  谷歌说明,Gemini 有更高运算精准度,以及内容描述能力,在效能表现相当优异表现,并且通过前期进行广域范围测试,同时也强调以负责任态度打造此模型。 而谷歌更说明,Gemini 更成为MMLU (大型多任务自然语言理解)测试基准中,第一个达90%以上的大型自然语言模型,强调其对于语意理解准确性。

  此外,「Gemini」也能依照不同布署需求,区分可用于手机装置、支持离线运作,更标榜针对谷歌 Tensor处理器最佳化的Gemini Nano,另外也包含在执行准确、运作速率之间取得平衡的Gemini Pro,以及具备完整功能、执行效能的Gemini Ultra。

  可在不同语种维持一致执行效能、原生支持多模运作

  在进一步说明中,谷歌表示Gemini不仅对应英语使用,同时也能支持多个语种,甚至在不同语种执行时的效能也能维持一致。 至于Gemini的训练,则是通过谷歌于2022年推出的TPU 4,以及在2023年推出的TPU v5e加速完成,甚至谷歌更同步揭晓算力更高的全新TPU v5p,强调无须仰赖NVIDIA、AMD的GPU产品也能加快推动人工智能技术发展。

  而从整体架构来看,开发者、企业能在最上层采用自有人工智能软件框架、数据集,底下则可依序使用Vertex AI、AI Studio工具资源,以及开发相关API内容,底层则可选用Gemini Nano、Gemini Pro或Gemini Ultra,最底层则是人工智能优化基础架构。

  至于在谷歌实际展示中,Gemini能以几乎实时形式描述使用者绘制线条、形成图像,并且能依照不同颜色、物品改变其判断描述内容,并且做出相关回应,甚至以不同语言形容。

  另外,Gemini也具备丰富的计算机视觉分析能力,例如能与使用者游玩景点特色猜国家位置的游戏,或是猜硬币戏法,另外也能判断饼干与橘子的差异,以及针对不同毛线建议编织不同玩偶等。 其他部分,则包含可由AlphaCode 2解译、编写更正确的程序编码,或是串接更多技术、资料内容对应各类运算需求。

相关阅读

每日精选