

Google DeepMind用Python-JAX打造托卡马克核融合设备模拟器并开源;Meta AI证实Transformer能处理单一像素而非16x16的区块,效果还更好;健保署联手Google要打造糖尿病风险预测AI;Nvidia开源HelpSteer2数据集,可低成本确保LLM与人类偏好一致;苹果新推Apple Intelligence智能功能
糖尿病 Google Cloud 健保署
健保署联手Google要打造糖尿病风险预测AI
健保署日前宣布联手Google,展开为期5年的合作,要使用Google云端算力资源、MedLM基础模型、Vertex AI平台和数据处理工具等,来与国卫院共同打造专属台湾的疾病风险预测模型,第一波瞄准糖尿病风险预测模型。这是因为,在台湾每10人就有1人罹患糖尿病,且其并发症严重,如心血管疾病、肾病、视网膜及神经病变等,需及早介入预防与治疗。
在模型训练数据部分,健保署会采用去识别化的性别、年龄、家族病史、风险信息、国际疾病分类代码ICD-10和检验检查等数据,同时通过国卫院专业知识找出更多参数,来训练糖尿病风险预测模型。完成后,模型会通过健保署健保云运行,医疗院所医师上传数据到健保云,模型运算后会发送结果给医师和民众。这个风险预测分2种,一是针对未患糖尿病的民众,模型会提供10年内、5年内和1至3年内的罹病风险,另一是患糖尿病民众,模型会提供数种风险预测,如总住院率、特定原因住院率、死亡率、慢性病罹患率等。
其中,风险高低会以灯号表示,作为分级医疗参考,比如绿色为低风险、黄绿色为有风险、黄色是中风险、黄橙色中高风险、红橙色高风险,红色则是严重风险。风险较低的民众可建议至卫生所、门诊就医,黄色灯号则可转介至地区医院、黄橙色至区域医院,高风险和严重风险则至医学中心,以此达到分级医疗目标。石崇良表示,健保署与Google联手打造的糖尿病风险预测AI是第一波应用,借此抛砖引玉,来推动、扩大到更多慢性病和三高疾病风险管理。(详全文)

Nvidia HelpSteer2 LLM
Nvidia开源HelpSteer2数据集,可低成本确保LLM与人类偏好一致
最近,Nvidia开源一款数据集HelpSteer2,可用来训练先进的奖励模型,来引导大型语言模型(LLM)产出与人类偏好一致的回答。这个数据集共有10,681组提示和回答,并由1,000多名美国注释者按Likert量表,对5种属性标注。
此团队表示,他们用HelpSteer2数据集来训练自家3,400亿参数的Nemotron-4基本模型后,在RewardBench主要数据集测试,达到了最先进的92.0%准确率,优于任何现有的开放和专有模型。而且,这个数据集才1万多个提示-回答组,比起现有的偏好数据集(如HH-RLHF)动辄数百万组,大幅降低了运算成本。 团队表示,这个数据集可用来对齐Llamna-3-70B等这类LLM,来提高与人类偏好的一致性。(详全文)
苹果 ChatGPT Apple Intelligence
集成ChatGPT!苹果新推Apple Intelligence智能功能
苹果在日前举行的WWDC开发者大会上发表AI服务Apple Intelligence,将进驻macOS Sequoia、iOS 18与iPadOS 18等苹果操作系统。同时,苹果也宣布与OpenAI合作,将在Siri、Writing Tools中集成GPT-4o驱动的ChatGPT。
进一步来说,这款Apple Intelligence提供多项AI功能,包括写作工具Writing Tools、图像创作工具Image Playground、可客制化表情符号的Genmoji,以及强化的Siri。其中,Writing Tools可让用户在邮件、备忘录、Pages或第三方的程序中,改写、校对或摘要文本,还能通过Compose功能来存取ChatGPT的图像工具,可在文本中嵌入图像。
再来,Image Playground将内置于消息、Keynote、Pages等苹果原生应用程序中,并支持采用Image Playground API的第三方程序,用户可在几秒内以文本描述、所挑选的主题、服装、配件、地点或个人来创作图像,还能以动画、插图或素描的方式呈现。Genmoji则允许用户以文本描述来客制化表情符号。Apple Intelligence也改善了照片/视频搜索功能,能以自然语言搜索特定照片,例如「脸上贴着贴纸的Katie」,或找到视频中的特定段落。(详全文)

PyTorch 漏洞 Huntr
开源机器学习框架PyTorch存在重大漏洞
今年4月,有研究者向漏洞悬赏平台Huntr通报开源机器学习框架PyTorch存在重大层级漏洞CVE-2024-5480,CVSS风险评分达到10分,影响2.2.2版以前的PyTorch。对此,Huntr向通报者提供1,500美元奖励,并在日前公布细节。
这漏洞位于torch.distributed.rpc框架,开发者使用该框架运行RPC调用时,该框架未验证相关功能是否如开发者预期运行,因此攻击者能借机通过网络使用RPC调用Python功能,进而加载Python程序库并运行任意命令。这个框架通常用于分布式训练,如增强式学习、模型平行化等,因此影响范围相当广泛。研究人员也提供概念性验证(PoC)代码,并指出该漏洞可能带来的影响:由于攻击者可将其用来远程攻击分布式训练的master节点,一旦这些节点遭到入侵,对方就有机会窃取与AI有关的敏感数据。(详全文)
ChromeOS Android AI
要加速AI创新应用,ChromeOS将重整Android技术架构
Google日前宣布,ChromeOS很快就会重整Android技术架构,包括把Android Linux内核和Android框架当作ChromeOS基础,来加速ChromeOS运行AI创新应用或其他新功能的速度。
其实ChromeOS一直在向Android靠拢,Google自2016年就让ChromeOS用户运行Android程序,隔年更宣布采用ChromeOS的所有Chromebook笔电都将支持Google Play和Android程序。此外,自今年3月发表的ChromeOS 122起,ChromeOS也开始改用Android的蓝牙架构Fluoride。Google解释,把Android技术架构导入ChromeOS,可加速ChromeOS内核的AI创新脚步,简化工程任务,有助于手机等各种设备与Chromebook更兼容。(详全文)
OpenAI 甲骨文 微软
OpenAI采用甲骨文云端为基础架构
甲骨文和OpenAI宣布合作,OpenAI将采用甲骨文云端基础架构(OCI),来扩展微软Azure AI的基础架构,加速运行模型推论等任务。这项合作涉及OpenAI、微软Azure和甲骨文等3家业者,目的是要OCI作为类似备援方案,可从微软Azure AI扩展到甲骨文云端,来提供负载更高的处理能力。
其中,光是OpenAI的ChatGPT AI服务,每月用户数就超过1亿,是最吃运算资源的任务。这项合作是让OpenAI使用「OCI基础架构上的Azure AI平台」,来运行推论和其他作业,OpenAI最尖端的模型仍运行在与微软合作的超级电脑上。(详全文)
/Meta AI、Apple
摄影/王若朴
AI近期新闻
1. 微软将默认关闭Copilot+ PC中的Recall功能,以平息隐私疑虑
2. Databricks联手Shutterstock推出企业级文生图AI服务ImageAI
3. 杜拜发起100万提示者计划(One Million Prompters),要在3年内培训100万名懂提示工程的AI人才
:iThome整理,2024年6月