登录

谷歌发布医疗AI模型MedGemma 1.5 4 B:可本地部署,CT、MRI都能处理


速读:谷歌发布医疗AI模型MedGemma1.54B:可本地部署,CT、MRI都能处理2026年01月14日15:14IT之家IT之家1月14日消息,谷歌今日发布了专为医疗场景设计的AI模型“MedGemma1.54B”及语音识别模型“MedASR”。
2026年01月14日 15:14

IT之家 1 月 14 日消息,谷歌今日发布了专为医疗场景设计的 AI 模型“MedGemma 1.5 4B”及语音识别模型“MedASR”。MedGemma 1.5 4B 是一款可本地运行的轻量化模型,相比前代产品,其准确率得到了提升。

据IT之家了解,谷歌已免费开放 MedGemma 系列开源医疗模型。MedGemma 1.5 4B 为可本地部署的轻量化模型,能够读取并分析文本及图像格式的医疗记录并进行推理。MedASR 是一款专注于医疗术语的语音识别模型,可与 MedGemma 系列模型集成,且相比现有模型具备更高的转录准确率。

谷歌提供的数据显示,与前代模型 MedGemma 1 4B(浅蓝色)相比,MedGemma 1.5 4B(蓝色)的文本处理准确率有所提升。

以下表格展示了 MedGemma 1.5 4B 与各类模型的基准测试得分。该模型的得分高于通用模型 Gemma 3 4B 及前代医疗模型 MedGemma 1 4B,部分测试中甚至优于参数规模更大的 MedGemma 1 27B。

MedGemma 系列前代产品已支持处理文本及胸部 X 光片、病理组织图像等影像数据,而 MedGemma 1.5 4B 进一步升级,可兼容计算机断层扫描(CT)、磁共振成像(MRI)等三维数据。

在影像处理准确率基准测试中,MedGemma 1.5 4B(蓝色)的得分同样高于 MedGemma 1 4B(浅蓝色)。

MedGemma 系列的另一大特点是便于开发者进行微调优化,目前已衍生出超过 500 款衍生模型。随着未来开发者社区的持续贡献,预计将推出针对各类细分任务优化的模型版本,MedGemma 1.5 4B 的相关迭代也在其中。

同日发布的 MedASR 是一款专为医疗场景打造的语音识别模型。该模型对“胸部 X 光片相关对话”的转录错误率仅为 5.2%。谷歌强调,这一表现显著优于 OpenAI 的 Whisper large-v3(同类场景错误率 12.5%)。此外,MedASR 的转录结果还可直接作为 MedGemma 系列模型的输入提示词(prompt)。

关键词 :

谷歌 AI 语音识别

新浪众测

新浪众测

新浪科技公众号

新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

MiniMax 上市,“多巴胺”能否供养“AGI 野心”?

不做汽车公司,做科技公司,特斯拉核心市场不断失守

美国政府批准向中国出口英伟达H200芯片

“死了么”App能活多久,不重要

充电时车辆突然损坏 车主:4S店称充电桩电流过大 把车充坏了

马斯克定了160亿公里无人车门槛线

一半老年人用3000元以上手机 华为、苹果占比近7成

死了么APP官宣改名!正式启用全球化品牌名Demumu

小米高管谈企业喷同行模仿 因羡慕嫉妒恨:苹果谷歌也大量买和抄

马斯克3小时高能量访谈:全是暴论 不看后悔!

钱大妈赴港IPO 近3000家门店年营收逾百亿元

苹果谷歌AI联姻 分析师:有两大原因迫使苹果这么做

陈志被捕后,太子集团旗下大型房地产项目被禁止销售:付全款购房者可申请产权转移

王自如回应曾称看董明珠很幸福:到今天都坚定这个观点

廉价版特斯拉Model Y现身国内官网!

挪用公款借贷给他人,至案发超7亿元未归还,郑建华一审被判死缓

消息称拼多多内测“百亿超市”业务,同款商品比其他平台低10%-30%

“刨猪宴”爆火,合川文旅:杀了5头猪,超五千名游客来吃流水席

被黑怕了!谁咒骂小米车主所有霉运转到他身上的帖子火了:雷军转发后已删除

不只 Magic8 Pro Air,1 月 19 日还有荣耀“联名设计系列新品”发布会

湖南体育生卖饺子冲上市,4266家店年收入超25亿元,还拉来东方甄选高管坐镇

暴涨近10倍 西红柿价格为何走高:专家释疑 预计3月下旬价格回落

主题:MedGemma1.54B|谷歌|MedGemma系列|语音识别模型