企业用Gemini Pro模型API上架,Google更要打造从端到云全套GAI工具链
· 2023-12-22

公有云巨头纷纷瞄准企业生成式AI开发需求,推出了各自的GAI技术架构和开发组件。


公有云巨头纷纷瞄准企业生成式AI开发需求,推出了各自的GAI技术架构和开发组件。紧接在11月底AWS披露GAI产品战略之后,Google也在12月初,发布了最新也是他们最强的LLM模型Gemini,隔周更在GCP的AI开发组件Vertex AI上发布了企业用的Gemini Pro版模型预览版,开放企业免费试用。Google同步推出Web版AI Studio开发工具,也将自家MLOps开发平台Vertex AI转为聚焦企业GAI开发的LLMLOps平台,要涵盖开发、部署到运维更多模型生命周期阶段的需求。


Google在12月初正式发布了Gemini,包括高端Ultra版,中端Pro和低端Nano版模型。Gemini Ultra将可以同时分辨和理解文本、图片和声音,也可以用来分辨和解释几种热门开发语言,包括Python、Java、C++。Google推出Gemini模型时就强调,与其他知名大型语言模型如GPT、LLama最大差异是将提供一个移动设备的小参数模型Nano版Gemini。


Google先在Vertex AI平台上架了Gemini Pro模型API预览版,这是Gemini三款模型中的中端款。又细分为两款API,目前只支持文本输入和文本生成的Gemini Pro,最大可以输入32K个Token,支持38种语言。另外,也提供了Gemini Pro Vision端点,可接受文本和图片输入,但只能输发文本,Google在记者会上实测展示时,则可以直接输入一段视频,让模型来判读视频中的元素。Google用“模型端点”而非另一款模型来形容第二款API,意味着,这是同一个Gemini Pro模型,只是多发布图片功能API来区隔版本。



Vertex AI上已经可以选择Google新版LLM模型Gemini Pro版本,也可使用Gemini Pro Vision版本,可直接上传一段视频,让模型来分析视频中的元素。


Gemini Pro从现在开始提供企业和开发者免费测试,2024年才开始正式收费,输入和输出都要计价,将按输入文本每千字0.00025美元或每张图0.0025美元,而输出则是每千字0.005美元


而Gemini Pro的SDK目前支持了数据科学主流语言Python、两大移动平台Android的Kotlin和iOS应用的Swift,另外还包括了Web前后端开发主流JavaScript和Node.js语言。从Pro版SDK所支持开发语言种类更可以反映出,Gemini Pro格外注重未来的移动AI应用开发需求。


除了自家新模型之外,Vertex AI的模型花园中,也一并增加了文本生成图片的Imagen 2模型,可以生成更拟真的图片。另外也将在数周后发布了一个以Med-PaLM 2模型为主打造的医疗GAI模型产品集称为MedLM,中国医药大学附设医院将是亚洲第一家采用这款医疗GAI模型的医学中心。用医疗数据微调过的Med-PaLM 2以85分高分通过了美国医生执照考试,可以达到医疗专科医生的回答水准。


除了新模型上架化,Google也正式推出了免费的Web版GAI开发工具AI Studio,(前身是MakerSuite),默认就是使用Gemini Pro或Gemini Pro Vision来开发AI应用,每分钟可以免费使用60次模型请求。实测AI Studio,目前已经可以输入中文,也能产生繁体中文的内容,不过,AI Studio上的Gemini Pro模型目前只支持到2023年8月的数据。


Google在今年5月开始大幅升级机器学习开发平台Vertex AI,更聚焦提供各种生成式AI的开发工具。在这个平台的模型花园清单上,提供了超过130种通过Google企业级安全品质审查的ML模型,包括了开源和第三方提供的商用模型。在模型定制化上,这个平台提供了多项微调方法,例如提示设计、LoRA微调、人类反馈增强学习RLHF等。


随着这次新模型发布同时,Google也宣布了多项Vertex AI更多新功能,从模型增强,与外部数据或API的互动,多模型的协作框架,自动化模型评比,更多GAI控制机制等,逐渐从模型开发,延伸到了模型部署,运维管理等LLM模型的MLOps流程。


Vertex AI增强工具主要提供三大功能,包括强化搜索常用的嵌入检索机制,设置配置就能快速构建的RAG(检索增强生成)工具,也可以串联外部的矢量数据库,图片或影音转换成矢量后可以存储到矢量数据库,通过Vertex AI使用Gemini来实现多模态的嵌入检索,可使用GCP托管或第三方的矢量数据库。Vertex AI将提供到18种不同的GAI控制或负责任管控机制,例如可以自动引用连接检查,企业基础正确性比较,或像是不宜用语和不雅图片过滤等。


此外,Google也将陆续提供3项模型与外部环境互动的能力,8月先宣布了预览版插件机制(Extension),可以连接到外部数据源或是外部应用,让生成式AI模型可以取得即时的外部资讯,甚至可以代表模型操作者的身份,在授权后取得个性化的AP数据。后续,Google将添加“函数调用”(Function Calling)能力,可以将Gemini生成的结果自动导出成一只API或一只函数程序。企业可以在这只功能性API中再次优化模型输出的结果。


另外一项将添加的功能是调度(Orchestration)多模型协同运行的能力,Vertex将可以用来调度多个模型互相运行。例如在手机上用Nano版模型接收用户口语的问题,先将问题声音转成文本后,再抛转到云计算的Pro版模型来生成回答,然后再抛转给用户。Google将提供一套调度框架,可以用来串联和连接不同模型共同产生更好的回应内容。不过,Google还没披露这套调度框架的发布进程。


在这次新版Gemini预览版发布同时,Google也披露了Vertex AI平台多项模型评估和部署新功能,模型自动评估矩阵从单一模型评估,添加加了多模型评比功能Auto SxS,可以一对一自动比较两个模型对指定任务的执行结果,例如进行不同模型的A/B测试之用,或是比较微调前后,或相同模型但不同参数大小的效果。当模型部署上线后,可以关注每一次回应从输入到输出的速度来了解模型性能。


Google新推出的AI Studio与Vertex AI采用了相同的数据安全和隐私管控机制,都可以支持顾客自带密钥、VPC控制、访问透明度记录和IAM权限管控。Google Cloud首席执行官Thomas Kurian在发布记者会上强调,企业数据只有企业自己可以访问,其他任何人,就连Google都无法看到模型输入、输出或每一项人类反馈到企业模型的数据。


今年3月,Google发布了NoCode的AI工具Vertex AI Studio,主要提供两种常见企业AI应用的快速开发,包括了“搜索”和“对话”应用,这两项应用将会在2024年初开始支持Gemini模型。目前搜索功能只能针对单一数据源查询,2024年时将添加一项“混合搜索”(Blended Search)应用,只需要输入一个搜索指令,就能用Gemini来搜索不同数据源上的多模态数据,包括企业内部私有的结构化数据与非结构化数据,还有外部的公开数据。


Google预计在2024年初正式推出Gemini模型后,会集成到更多服务中,包括了Google企业级高端搜索服务将开始支持多模态嵌入矢量搜索。而Duet AI for Workspace明年初也会引进Gemini模型,可以对分析内容提供多模态的高端理解能力。


Popular articles
Are you ready to maximize your earnings? Try ProPush.me Constructor!
Marketing
SBC Summit Canada to Make Player Safety a Key Pillar of 2026 Agenda
Marketing
HUIDU Invites You to Booth T70 at iGB L!VE 2026 — Let’s Ignite London This July!
HUIDU Focus
Gaming & Technology Expo Makes a Powerful Entrance in CDMX
Marketing
Online gambling, crypto pose ongoing money laundering risks in Philippines, analyst says
Southeast Asia
JILI Partners with Cricket Legend AB de Villiers (ABD) to Launch Exclusive Branded Game Series 100% 11
Sports Game
Kazakhstan plans to penalise online casino promotions
Regulation
Full House at GAT Expo Cartagena 2026 Academic Agenda
Online Game
British gambling levy rates confirmed for each vertical
Regulation
GGC Awards 2026 Shines in Colombo: Honoring Leaders and Innovators in the iGaming Industry
HUIDU Focus
B2B Tech Infrastructure Gains Momentum in Philippine Gaming Sector
Southeast Asia
Indiana online casino bill stalls in House committee
Regulation
1spin4win grows its Latin American presence by partnering with Fortuna Juegos
Online Game
Vietnam's tightening online gaming policy creates new market opportunities
Southeast Asia
New Jersey July Gambling Revenue Hits $606M, Sweeps Casinos Banned
Regulation
Home
Game
Cooperation
Find
My