登录

被忽视的神秘“暗蛋白质组”有新名字了


速读:但近日《自然》发表的一项研究为人类基因组编码的数千种此类分子赋予了一个正式名称——peptideins(肽),并将其纳入生命科学界广泛使用的基因和蛋白质数据库。 不过,科学家发现,还存在数千种“暗蛋白质组”,它们在细胞中的作用未知但可能很重要,因为它们可能为癌症及其他疾病的治疗提供线索。 研究人员表示,此次重新命名将为弄清不同肽在细胞中的作用带来助益。 Mudge参与了GENCODE蛋白质编码基因数据库的工作。
作者:许悦 来源:中国科学报 发布时间:2026/5/7 16:26:4

被忽视的神秘“暗蛋白质组”有新名字了

人类基因组包含约两万个基因,它们携带指导蛋白质合成的指令。不过,科学家发现,还存在数千种“暗蛋白质组”,它们在细胞中的作用未知但可能很重要,因为它们可能为癌症及其他疾病的治疗提供线索。

这些蛋白质来自基因组中被认为不会产生蛋白质的部分,因此未被纳入官方基因组和蛋白质的统计中。但近日《自然》发表的一项研究为人类基因组编码的数千种此类分子赋予了一个正式名称——peptideins(肽),并将其纳入生命科学界广泛使用的基因和蛋白质数据库。研究人员表示,此次重新命名将为弄清不同肽在细胞中的作用带来助益。一些肽与包括儿童癌症在内的多种疾病有关,也参与了基本的细胞功能。

“这是一个重大突破。”德国海德堡大学的生物信息学家Christoph Dietrich说,“这些微蛋白有可能真正开启一波新的研究浪潮。”

“暗蛋白质组”所含的氨基酸较少,因此长度极短,并且在其他物种中缺乏进化上的近亲。这是它们被排除在数据库外的部分原因。不过,在大多数情况下,它们是由与已知蛋白质编码基因非常接近,甚至在某些情况下重叠的基因所编码的。

致力于加速生物医学研究和创新的“TransCODE联盟”研究团队对数千种潜在“暗蛋白质组”实验数据进行了分析。他们从一份包含7264个疑似编码“暗蛋白质组”的DNA序列清单入手,发现仅有15个序列有足够的实验依据支持其纳入蛋白质编码基因的官方目录。

在细胞中还能检测到数千种蛋白质的片段,实验依据没那么充分、功能几乎未知。“目前我们还不确定它们是否发挥作用,但它确实存在。”欧洲生物信息研究所的生物信息学家Jonathan Mudge说。

Mudge参与了GENCODE 蛋白质编码基因数据库的工作。GENCODE 及其他数据库正在为肽创造一个新目录。Mudge表示,这有助于吸引其他科学家关注它们,从而弄清其作用。

Mudge说,此前被认为编码“暗蛋白质组”的约10个序列已被移入由GENCODE维护的官方蛋白质编码基因数据库。随着证据不断积累,预计会有更多的肽被添加其中。此外,一些典型的蛋白质可能被重新归类为肽。“这与发现数千颗围绕太阳运行的矮行星,迫使天文学家重新定义行星这一概念如出一辙。”Mudge说。

在最新发表的论文中,研究人员发现有迹象表明,超过50种肽对细胞来说在某种程度上是必不可少的。此前的研究表明,如今被称为肽的这些分子可能是某些癌症(如一种影响儿童的侵袭性脑癌)的重要驱动因素,而且对心脏功能也至关重要。

TransCODE联盟的联合负责人、荷兰公主玛克西玛儿科肿瘤中心的系统生物学家Sebastiaan van Heesch预计,会有更多此类见解涌现,“人们再也不能对它们视而不见了”。

相关论文信息:https://doi.org/10.1038/s41586-026-10459-x

主题:蛋白质|基因|在细胞中