Hugging Face推出依用量计价的Nvidia NIM推论即服务
支付動態 · 2024-07-30

Hugging Face企业平台推出云端推论即服务(inference-as-a-service),以Nvidia DGX Cloud以及容器化推论微服务NIM为技术内核

Hugging Face

AI开发资源平台Hugging Face昨(29)日宣布使用Nvidia NIM技术的云端推论即服务(inference-as-a-service)上线,支持企业生成式AI应用。

这项名为Hugging Face Inference-as-a-Service powered by NVIDIA NIM的服务,是以Nvidia NIM为底层内核,现在已加入Hugging Face Enterprise Hub服务。这新服务让企业用户可以无服务器方式,在Hugging Face Hub中,通过API和写几行代码使用最新Meta Llama和Mistral模型运行推论。Inference-as-service也可搭配Hugging Face的AI训练服务Train on DGX Cloud使用。

NIM是Nvidia于今年3月公布的容器化推论微服务,它内含预建的容器、预训练的AI模型、标准API、Nvidia的软件与推论引擎等,目的是让企业在容器中运行模型推论,且可将其部署到想要的环境,包括云端、数据中心或工作站上。NIM的设计是结合Nvidia GPU加速的基础架构,来加快模型部署和推论,支持企业开发的助理服务(copilot)、聊天机器人等生成式AI应用程序。今年6月Nvidia提供40多个NIM微服务,供企业试用包括Meta Llama 3、Microsoft Phi-3、Mistral Large、Google Gemma等开源模型,而在Hugging Face上,也已可试用支持Meta Llama 3的NIM服务。

Hugging Face Inference-as-a-Service则是双方合作的最新结果,为运行在DGX Cloud的NIM服务,全部使用Nvidia H100 Tensor Core GPU。这服务采用依使用量计价(pay-as-you-go),提供API供企业用户使用生成式AI模型进行推论,Hugging Face强调灵活计价模型使其适合各种规模的企业。模型方面则支持Llama及Mistral AI主要模型,包括Llama 3、3.1版8B、70B,以及Mistral 7B和Mixtral-8x22B模型。

Hugging Face Inference-as-a-Service已成为Hugging Face企业平台Enterprise Hub的最新服务。费用依企业使用的模型而定。例如使用Llama-3-8B-Instruct时,一般回应时间(输入500 token、输出100 token)下费用为1秒0.0023美元。若使用Meta-Llama-3-70B-Instruct,费用为2秒0.0184美元

热门文章
巴西颁布新法赋权央行封锁非法博彩账户及 Pix 交易
支付动态
巴西拟将博彩税率提高至24% 税收将用于社保和医疗领域
游戏风向
哈萨克斯坦计划对在线赌场促销活动进行处罚
游戏风向
准备好了将你的收益最大化吗?尝试ProPush.me Constructor!
广告营销
灰度在iGB L!VE 2026展位T70和你相约7月,一起点燃伦敦的热情!
灰度头条
越南博彩管控逐步放宽,惟本土需求仍显乏力
东南亚资讯
PropellerAds 分享了新的 iGaming 案例研究:在 3 个月实现 97,674 次安装和 12,701 笔存款
广告营销
横跨全球6个城市,灰度8场派对邀你共看世界杯,重塑高质量社交新场景
灰度头条
超级PAC筹资4800万美元:体育博彩势力加码
游戏风向
菲律宾博彩技术赛道迎来新变局,B2B 供应模式加速渗透
东南亚资讯
新泽西州7月博彩收入创6.06亿美元新高,颁布禁令
游戏风向
斯里兰卡博弈产业大转型,官方:剑指南亚拉斯维加斯
游戏风向
JILI 宣布与全球板球传奇 AB de Villiers(ABD)达成重磅战略合作
体育游戏
英国确认各垂直行业的赌博税税率
游戏风向
越南在线博彩业政策收紧 催生市场新机遇
东南亚资讯
首页
游戏
合作
发现
我的