颜宁:揭开“生命暗物质”的神秘面纱
俗称“碳水化合物”的糖质,是与核酸(DNA、RNA)、蛋白质、脂质一起构成生命的四大基本生物大分子,也是地球上已知生物量最高的生物大分子,其重要性不言而喻。然而,由于其太过复杂、缺乏有效的研究手段,一直以来科学界连它们有哪些、长啥样都不知道,导致糖质研究困难重重、严重滞后于蛋白质。
如今,深圳医学科学院/深圳湾实验室/清华大学颜宁团队与合作者另辟蹊径、利用“酷寻”策略,终于逐步揭开了这一“生命暗物质”的神秘面纱。
特别是,在《科学》杂志发表的最新成果中,颜宁团队获得了最高分辨率达到0.18纳米的天然糖质复合物超高分辨率三维结构,实现了在原子分辨率的“可视化”研究,打开了糖质生物学研究的“天眼”。
冷冻电镜分析揭示金藻管状微绒毛表面存在的大量复杂糖质及其近原子分辨率三维结构。A.金藻表面的管状微绒毛。上图:金藻卡通示意图,以及其长鞭毛(橙色粗线)表面覆盖的微绒毛(浅绿色细线)。中图:冷冻电镜拍摄到的管状微绒毛的原始照片。下图:图像初步处理过的二维分类。B.管状微绒毛的冷冻电镜三维重构图。C.根据冷冻电镜密度图搭建的微绒毛结构模型。D.微绒毛表面覆盖大量复杂糖质(以红白球示意)。深圳医学科学院供图
糖质:熟悉而又陌生的“生命暗物质”
“你可能经常听见身边的朋友说‘碳水使我快乐’或者‘少吃碳水’,这都说明糖质与我们的生活息息相关。”颜宁在接受记者采访时说,“糖质不仅给我们提供能量,还在细胞识别、信号转导、免疫调控和结构支撑等多种生理过程中发挥着关键作用。”
“糖质的分子结构复杂,种类繁多。”颜宁说,它既包括单糖(葡萄糖、果糖、半乳糖等)、双糖(蔗糖、乳糖、麦芽糖等)、多糖(淀粉、糖原等)、纤维素等膳食纤维,还包括糖肽分子等与多糖耦合的各种生物大分子。“我们的研究表明,在自然界中还有许多未被人类发现甚至想象过的糖质,其功能和作用更有许多未解之谜。”
与蛋白质、核酸一样,对糖质的研究可追溯至19世纪。但是,迄今为止,人类对于糖质的了解远不如核酸和蛋白质,称其为“生命暗物质”并不为过。
“研究滞后的根本原因之一是糖质研究中存在一个巨大的瓶颈——科学家看不清它的内部结构。”颜宁解释说,“在生命科学领域,结构决定功能。这里的‘结构’,既包括长宽高外形这些几何形式,也包括所用的材料等物理化学性质。就像家里面,不同的结构、材料决定了这个地方是厨房、那个地方是卫生间一样,生物大分子的结构不同,所具有的功能和作用也各不相同。”
为什么糖质的结构难以解析?
“一是因为糖质太过复杂。它们一般都由多种多样数量不明的单糖通过复杂的糖苷键化学连接,具有高度柔软灵活的‘身段’,因为一直缺乏好的研究系统,所以过去即便用最强大的冷冻电子显微镜也很难‘看清’复杂糖质的内部构造。”颜宁告诉记者,另一个重要原因,DNA、RNA、蛋白质可以依赖模板生成,从基因组序列就可以直接推测出它们的组成,但细胞合成糖质没有模板,导致科学家很难搞清楚糖质的成分。
她进一步解释:通过人类基因组计划,人们发明了高通量测序技术,可以很容易获得某个研究对象的DNA、RNA序列,而DNA、RNA的序列又与蛋白质序列存在确定的对应关系;另一方面,几十年的研究也基本确立了蛋白质序列与其三维结构的相对准确的对应关系,这就是AlphaFold可以预测蛋白结构的基础。你给人工智能工具AlphaFold一串氨基酸序列,它就可以预测出其中大部分相对准确的结构,当然也有很多预测不准确的情况。“但我们研究的糖质许多是压根都不知道其存在与否的复杂生物大分子,像AlphaFold这种人工智能工具连研究对象都没有,所以压根无能为力。”
颜宁指出,高分辨率结构信息的长期缺失,在很大程度上阻碍了人类对糖质在多种生理和病理过程中作用机制的深入理解,导致糖质生物学的发展远远滞后于核酸和蛋白质。
采用酷寻策略,探索(创建)结构生物学研究新范式
自2022年回国后,此前在蛋白质结构研究领域成绩斐然的颜宁,开始转向自己的第二战场——糖质生物学。
然而,面对既不知道其内部“长什么样”、更不知有多少未知“新物种”的“生命暗物质”,如何才能找到突破的入口?
颜宁团队另辟蹊径,创造性地提出酷寻(CryoSeek)研究策略——“结构先行”的生物发现新范式。
颜宁介绍说,传统结构生物学长期遵循“从分子到结构”的经典研究范式:先确定某个已知其功能的目标分子,然后解析它的结构,进而深入研究它如何发挥功能。“我们提出的CryoSeek研究策略的核心,是把冷冻电镜这一传统的结构解析工具变为发现未知生物大分子的‘放大镜’:不依赖作为先验知识的序列或功能信息,直接从自然水体、环境样品特别是临床样本和动物组织中提取研究对象,通过解析高分辨率结构来发现此前未知的生物大分子,再据此深入研究它们的生理功能和作用机制。”
为此,颜宁团队与深圳医学科学院的胡名旭团队合作开发了高通量的电镜图像处理算法,大幅提升了结构解析效率。然而,随着CryoSeek策略在多种环境样本中的广泛使用,所解析结构的数量与复杂度迅速增加,传统的数据管理与分析方法已难以适应高通量发现的需求。
为推动数据共享与科研协作,并使CryoSeek策略真正成为服务全球生命科学研究的公共工具,他们又依托深圳医学科学院运行的深圳国家基因库建立了CryoSeek数据库(cryoseek.org.cn)。