谷歌发布医疗AI模型MedGemma 1.5 4 B:可本地部署,CT、MRI都能处理
IT之家 1 月 14 日消息,谷歌今日发布了专为医疗场景设计的 AI 模型“MedGemma 1.5 4B”及语音识别模型“MedASR”。MedGemma 1.5 4B 是一款可本地运行的轻量化模型,相比前代产品,其准确率得到了提升。
据IT之家了解,谷歌已免费开放 MedGemma 系列开源医疗模型。MedGemma 1.5 4B 为可本地部署的轻量化模型,能够读取并分析文本及图像格式的医疗记录并进行推理。MedASR 是一款专注于医疗术语的语音识别模型,可与 MedGemma 系列模型集成,且相比现有模型具备更高的转录准确率。
谷歌提供的数据显示,与前代模型 MedGemma 1 4B(浅蓝色)相比,MedGemma 1.5 4B(蓝色)的文本处理准确率有所提升。
以下表格展示了 MedGemma 1.5 4B 与各类模型的基准测试得分。该模型的得分高于通用模型 Gemma 3 4B 及前代医疗模型 MedGemma 1 4B,部分测试中甚至优于参数规模更大的 MedGemma 1 27B。
MedGemma 系列前代产品已支持处理文本及胸部 X 光片、病理组织图像等影像数据,而 MedGemma 1.5 4B 进一步升级,可兼容计算机断层扫描(CT)、磁共振成像(MRI)等三维数据。
在影像处理准确率基准测试中,MedGemma 1.5 4B(蓝色)的得分同样高于 MedGemma 1 4B(浅蓝色)。
MedGemma 系列的另一大特点是便于开发者进行微调优化,目前已衍生出超过 500 款衍生模型。随着未来开发者社区的持续贡献,预计将推出针对各类细分任务优化的模型版本,MedGemma 1.5 4B 的相关迭代也在其中。
同日发布的 MedASR 是一款专为医疗场景打造的语音识别模型。该模型对“胸部 X 光片相关对话”的转录错误率仅为 5.2%。谷歌强调,这一表现显著优于 OpenAI 的 Whisper large-v3(同类场景错误率 12.5%)。此外,MedASR 的转录结果还可直接作为 MedGemma 系列模型的输入提示词(prompt)。

关键词 :
谷歌 AI 语音识别



新浪科技公众号
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

MiniMax 上市,“多巴胺”能否供养“AGI 野心”?
不做汽车公司,做科技公司,特斯拉核心市场不断失守
美国政府批准向中国出口英伟达H200芯片
“死了么”App能活多久,不重要
充电时车辆突然损坏 车主:4S店称充电桩电流过大 把车充坏了
马斯克定了160亿公里无人车门槛线
一半老年人用3000元以上手机 华为、苹果占比近7成
死了么APP官宣改名!正式启用全球化品牌名Demumu
小米高管谈企业喷同行模仿 因羡慕嫉妒恨:苹果谷歌也大量买和抄
马斯克3小时高能量访谈:全是暴论 不看后悔!
钱大妈赴港IPO 近3000家门店年营收逾百亿元
苹果谷歌AI联姻 分析师:有两大原因迫使苹果这么做
陈志被捕后,太子集团旗下大型房地产项目被禁止销售:付全款购房者可申请产权转移
王自如回应曾称看董明珠很幸福:到今天都坚定这个观点
廉价版特斯拉Model Y现身国内官网!
挪用公款借贷给他人,至案发超7亿元未归还,郑建华一审被判死缓
消息称拼多多内测“百亿超市”业务,同款商品比其他平台低10%-30%
“刨猪宴”爆火,合川文旅:杀了5头猪,超五千名游客来吃流水席
被黑怕了!谁咒骂小米车主所有霉运转到他身上的帖子火了:雷军转发后已删除
不只 Magic8 Pro Air,1 月 19 日还有荣耀“联名设计系列新品”发布会
湖南体育生卖饺子冲上市,4266家店年收入超25亿元,还拉来东方甄选高管坐镇
暴涨近10倍 西红柿价格为何走高:专家释疑 预计3月下旬价格回落