23岁女生大胆“跨界”,“手搓”出自己的基因检测报告
23岁女生大胆“跨界”,“手搓”出自己的基因检测报告
文|《中国科学报》记者 孙滔
3月4日中午,冯睿洋收到家人发来的一条信息。一个同样20多岁的亲戚患了癌症,“春节前做的手术,现在在化疗”。
亲戚跟自己年纪相若,冯睿洋不由得神经绷紧。她告诉家人,自己担心与遗传因素有关,考虑去做一次全基因组测序。
二代测序是国内当下的主流商业测序技术,但冯睿洋调研之后,决定做更前沿的三代测序。后者目前主要用于实验室研究,仅针对特定疾病诊疗、生育筛查、遗传基因检测等场景。
初步预期费用是3万到5万元。得到家人支持后,冯睿洋立刻开始行动。从得知亲戚患癌、查信息到决定做三代测序,她只用了24个小时;再到计划好完整流程,总共用时48个小时。
其间,她还在社交媒体上向几位名校生物系的博士生请教。其中一位并不建议她这么做,因为费用高且处理难度大,很容易花了大价钱却得不到有用的信息。
市面上的检测只会给出简单的结果报告,但冯睿洋希望得到三代测序的全部原始数据。这个23岁女生有足够强的探索欲望——她要研究自己的基因组,亲自“手搓”出一份分析报告。

冯睿洋
行动派
冯睿洋是北京市一所普通高校的信息管理专业大四学生,刚刚完成毕业论文答辩。她的研究课题是AI隐私保护问题。不过她决定延毕一年,这样可以保留应届生身份,给自己更多的时间来做下一步的选择。
从2025年8月起,她就在香港科技大学(广州)深度交叉智能实验室岳玉涛课题组担任科研助理,硬性任务并不多。她在接触AI前沿知识的同时,定期分享自己的研究。
冯睿洋了解到,天津有一家机构可以提供个人的三代测序,但递送样品是个麻烦。因为血液样本在高于4℃的环境下,DNA就会快速降解。
她采用了最直接的方法——“肉身递送”样品。
3月21日,她回到北京,和朋友郭昂扬直接开车到了天津那家机构楼下的停车场。在车上完成采血后,她拎着冰块冷藏的新鲜样本便去提交了。工作人员后来告诉冯睿洋,样本没有污染,质量非常好,她的样本有不少长度超过3万个碱基的片段。
4月7日,测序结果出来了。131G的DNA碱基序列数据,加上DNA甲基化(其异常与癌症、衰老和多种疾病有关)等相关数据,一共有600多G。
接下来才是重头戏,冯睿洋要自己分析这些数据。
之所以要“手搓”分析报告,一方面是因为商业机构的数据分析比较贵,仅仅完成主流的七八项特定分析就需要两三万元。更重要的是,这七八项分析根本达不到冯睿洋的预期——她要得到尽可能多的分析结果。
作为一个没有经过系统生物信息学训练的本科生,她拉来了最强大的外援——AI。
通过与AI多轮深度的探讨,她确定了极其极客的技术方案:先把数据传到阿里云OSS存储,再租服务器从内网拉取数据,以便降低服务器租用成本。她找到了常用的生物信息分析工具,选择了最适配的几种。她提前准备好粘合代码,这样就可以把十几种开源工具连接在一起,按顺序自动化运行。为了避免在高配服务器上装软件浪费昂贵的按量计费时间,她还提前在低配服务器上制作好了镜像环境。
最后,只租用高配服务器十几个小时,算上存储费用,她总共只花费500元左右就完成了商业收费超过2万元的数据分析。加上测序本身,她的所有实际支出被压缩到一万多元。

冯睿洋的云计算体验
“手搓”报告
个人基因组测序分析,就是把个人DNA序列和人类通用参考基因组比对,找出基因差异,再结合数据解读这些差异,用来评估疾病风险、了解祖源与体质特征。
冯睿洋得到了不少结果。
4月20日,冯睿洋发现自己携带红绿色盲的隐性基因。她忍不住感叹:“我要是男性就是色盲了。”她想起高中自学《陈阅增普通生物学》时,还在关于红绿色盲隐性遗传的章节做了批注,如今想来“感觉很奇妙”。
在药物代谢学报告中,她看到自己对于不同药物的耐受与禁忌。基因分析结果也解释了她生活中的一些问题,比如皮肤容易泛红,跷二郎腿后被压到的腿部会红一片。
她还发现,某个分析结果和自己3年前在天坛医院做的简单基因点位测序结果一致,这印证了自己“手搓”处理数据的可靠性。
更关键的是,她找到了与亲戚所患癌症有关的嫌疑突变。不过,虽然发现了基因异常,但现有研究无法直接判定她的患病风险,毕竟人类对这个癌症的基因研究还不够透彻。
冯睿洋发现,对于这些突变,有的尚未收录到数据库,于是她联系了国内外几个课题组。
4月27日,浙江大学一位研究员给她回信:这个基因突变,在人类身上没有报道过,但在小鼠中的突变会导致健康问题,“不过你不要太过担心,有的时候人类跟模式动物小鼠相差还是很大的”。
过了两天,日本宫崎大学医学院一位教授回信称,冯睿洋提及的另外一种基因突变,在小鼠中是健康的。
那位浙江大学研究员告诉冯睿洋,“我们非常希望得到您的这份罕见样本信息,进一步扩展我们相关领域的研究,希望可以有更多的发现以及探索潜在治疗方向”。
直到这一刻,冯睿洋才真切地意识到,原来自己的工作确实对生命科学研究有价值。
“我敢直接开干,是因为测序结果的解读是一个相对固定的步骤,相关方法和工具都已经公开,自己可以通过与AI合作和相关学习,完成这些操作。”冯睿洋说。

冯睿洋和AI的合作过程
这是科研操作的平民化,一些本来森严的壁垒在松动。
更让人意外的是,在冯睿洋就读的大学,甚至都没有生物学专业,那些有关基因检测的知识都是她自学而来。她并不精通每一个生物学细节,但能借助AI跨越专业门槛。
非常规成长
对于冯睿洋身边的熟人而言,这番“逆天操作”并不出人意料。她一直是个不走寻常路的人。
早在2018年,刚步入高中的她,在读了《奇点临近》《未来简史》这类描述未来的著作后,突然觉醒了一种宏大的视角:自己的人生宛如在玩《地球 Online》这款“游戏”。
她开始专门收集自己的个人数据,包括海量的录音、大量照片与截图、无纸化笔记、社交软件中的聊天记录等。最初她想做一份自己的“外部记忆”,在他人看来,这正是数字永生的一种实践。
冯睿洋积累了数万个文件,近10TB内容,然后通过音频转文字等技术,并利用本地大模型进行了简单的数据处理,实现了初步意义上的“数字生命”。2024年,她在广州召开的机器人人文学术研讨会上分享了她的这部分工作。

冯睿洋2024年参加在广州召开的机器人人文学术研讨会
用今天的流行词讲,她可以顺势“蒸馏”自己,做出自己的“蒸馏Skill”。不过她很快发现,这项工作涉及太多的隐私安全、数据归属、伦理等多方面问题,就没有再继续下去。
冯睿洋这样的非常之举远不止一两次。
高一,她组织过中学生哲学大会,后来该活动成为全国性的中学生哲学活动;大学期间,她在科学社区集智俱乐部主持关于AGI(通用人工智能)主题的读书会。这个读书会定期邀请教授或业界大佬分享,参与者主要是研究生,冯睿洋是策划人和主持人。她读了很多大模型相关文献,讨论“什么是智能”,掌握了AI前沿知识。正是在这个读书会上,她认识了岳玉涛。
这些都不是学校生活能给到的,而是她走出课堂后自由探索而来的。
那时候,她背不下去英语单词。她的英语老师发现,这个孩子很有个性,不喜欢的事情是不会去做的,“即使你跟她说这个东西对高考很重要,她也不会去做”。
冯睿洋决定脱离学校课堂,她从高二开始就很少到学校上课了。在那所海淀区的高中,“尊重个性”是其办学的核心理念之一,校长给了她足够的自由。她买了各学科的大学教材,同时“肆无忌惮”地参与各种感兴趣的活动。
她的自学也有了正反馈。2019年11月,在众多本科生参赛的北京师范大学(BNU)实验科学锦标赛中,高中生冯睿洋获得二等奖。这让她觉得,“985大学”学生的水平也不是很难达到。
之所以决定自学,还有一个原因是,她在高一就奔赴美国波士顿,在一家华人科学家创办的脑机接口公司BrainCo(强脑科技)待了两个月。在这家孵化于哈佛大学创新实验室的公司,她被前沿科技的发展速度所震惊,意识到未来30年所需的知识和技能与现在完全不同,如果按部就班地读书,不知道能不能适应未来社会。
远离课堂也造就了她的另一个结果:考试成绩逐渐下滑。她在复读一年后,最终的高考分数在北京只够报考一所“双非”大学。在羡慕其他同学名校光环的同时,她又觉得自己现在的发展“刚刚好”。
冯睿洋说,她从高中就开始参加集智俱乐部的各类活动。某种意义上,她的部分知识和研究方法都是在这里跟随北京师范大学的教师学习到的。到了大学,她更是放飞自我,从大二开始就很少上课了。AI成了她的重要学习帮手,ChatGPT正是在她19岁那年问世的。
冯睿洋的朋友郭昂扬,现在是首都医科大学大四学生。他认为,“疫情期间,应试教育与唯成绩论的体系有所松动,给了我们突破传统学习的机会。而AI适合知识面广但不精通细枝末节的人完成跨领域工作,正好契合我们这些人的情况。”
不受束缚
冯睿洋还是一个电竞爱好者。早在高中的时候,冯睿洋就去电竞俱乐部当领队,还在《电子竞技》杂志做过实习生。她目前正在落地的一个项目,就是给电竞选手做营养补剂。
她要根据选手的体重、代谢、心率、呼吸等数据,利用AI推荐补剂的剂量、服用时间和组合方案,并进行实时监测与调整。这属于生命科学与信息科学的交叉领域,其核心不是销售补剂,而是提供精准方案。
她考虑接下来去读研究生,这样就能平衡个人的追求和家庭、社会的期待,有一个得体的社会身份和更多的自由时间。