肿瘤细胞的驱动突变,麻省理工科学家发明癌症驱动的突变挖掘算法

发布时间: 2022-08-06 13:17

用手机扫描二维码 在手机上继续观看

手机查看

肿瘤细胞正是得益于一些具有“正向选择“功能的驱动突变,这种基因突变往往能起到促进细胞生长、入侵、抵抗死亡等作用。从而赋予肿瘤细胞增殖优势。识别这些突变的驱动基因一直是了解肿瘤发病机制和寻找相应治疗策略的重要组成部分。

肿瘤细胞的驱动突变,麻省理工科学家发明癌症驱动的突变挖掘算法

但肿瘤基因组中存在许多中性突变(对肿瘤的发生发展并不关键),且来自不同组织的肿瘤的突变具有一定的特异性,如何判断一个突变是驱动突变还是中性突变一直以来都是肿瘤领域研究的热点与难点.

最近,一个来自麻省理工学院BonnieBerger教授团队和哈佛医学院Po-RuLoh教授的团队在通过深度学习的方法绘制了千碱基级分辨率的癌症特异性体细胞突变率图谱,并在此基础上开发了可快速、精准识别肿瘤基因组中任意位置驱动突变的方法(Dig算法)。

研究人员利用这种算法探索了肿瘤非编码区发现了内含子中隐蔽剪接单核苷酸变异,及5’非翻译区突变在部分驱动基因(如TP53)中起到关键作用,的驱动突变,相关研究发表在期刊《自然生物技术》。

通常,识别驱动突变的方法主要有两种,一种是基于癌症驱动突变比中性突变频率更高的频率算法,另一种是基于突变基因编码的蛋白质的危害性评估的基因功能算法。对于第一种算法,识别过度突变的关键在于准确的体细胞中性突变率模型。

为了构建特定类型肿瘤的全基因组体细胞突变率模型,研究人员使用概率深度学习模型,通过识别以下两个特征进行计算:由表观遗传学特征如染色质可及性等导致的千碱基级变异,以及由DNA序列改变如紫外线暴露等导致的碱基对级变异。

肿瘤细胞的驱动突变,麻省理工科学家发明癌症驱动的突变挖掘算法

通过PCAWG(泛癌数据库)、Roadmap表观基因组学(表观遗传学数据库)、ENCODE(转录调控数据库)和参考基因组的数据,应用Dig算法构建了37种癌症类型的突变率图谱和推断的核苷酸突变偏向性。

研究员构建特定类型肿瘤的全基因组体细胞突变率模型

通过比对Dig预测的突变率及实际的突变率,Dig成功预测10-kb区域内单核苷酸变异(SNV)的中位数为77.3%,在1-Mb区域内的中位数为94.6%。由于Dig具有识别局部表观遗传结构的能力(如活跃的转录起始点),并将这些结构与突变率联系起来,其识别突变的效率及准确性优于同类的其他模型。

在构建的体细胞突变率模型具有优异准确性的基础上,Dig识别肿瘤驱动基因的效率自然也不遑多让。相比于其他用于识别驱动突变的算法,Dig在全基因组或全外显子测区的样本中显示出相同或更好的效率。

值得一提的是,使用Dig识别潜在的驱动基因比现有方法快1-5个数量级,Dig只需要不超过90秒,就可抵得上现有方法10分钟到超过2天的计算。

相比于同类型算法,Dig在预测体细胞突变路及识别肿瘤驱动基因的效率更好

对于编码区的驱动突变,已有很多算法进行研究,因此,研究人员着重利用Dig对非编码区的驱动突变进行研究,这也是Dig算法的一大优势,先前的许多算法都仅适用于寻找编码区的驱动突变。

首先,研究人员利用Dig算法来量化肿瘤中可能存在于基因外显子和内含子中的隐蔽剪接SNV(经典剪切位点外的体细胞突变并可致可变剪切)的程度。

肿瘤细胞的驱动突变,麻省理工科学家发明癌症驱动的突变挖掘算法

通过计算发现,在所选择研究的肿瘤抑制基因集中,隐蔽剪接SNV的发生频率要高于预期(P&0.001),且主要集中在内含子中。在肿瘤抑制基因集中,隐蔽剪接SNV约占到所有潜在驱动SNV的4.5%,略低于经典剪切SNV的频率(7.4%)。在12种肿瘤中,有7个肿瘤抑制基因具有显著的内含子隐蔽剪接SNV负担,如TP53和SMAD4。

抑癌基因中潜在驱动SNV各类型占比及7个具有显著的内含子隐蔽剪接SNV负担的抑癌基因

有趣的是,对于原癌基因,隐蔽剪接SNV发生的频率并不高,这提示隐蔽剪接SNV应该是导致功能丧失,而不是功能激活。

此外,研究人员还使用Dig算法研究了基因启动子中插入缺失标记(indels)的负荷。结果显示,TP53启动子是唯一具有全基因组显著indels负担的元件,且全为缺失突变(大部分缺失超过4个碱基)。这些突变集中在5’非翻译区,影响转录因子结合,抑制TP53的转录,从而驱动肿瘤发生。

TP53的5’非翻译区发生indels导致肿瘤发生

对106个肿瘤抑制基因和95个具有多外显子5’非翻译区的癌基因的5’非翻译区进行计算发现,ELF3的5’非翻译区同样有显著的SNV负担。然而,因为相应转录数据获取受限,研究人员无法对这些5’非翻译区突变的功能进行进一步分析。

肿瘤细胞的驱动突变,麻省理工科学家发明癌症驱动的突变挖掘算法

总的来说,研究人员基于概率深度学习方法开发的Dig算法可快速、准确地在测试基因组中寻找潜在的突变基因,其在构建中性突变率模型和识别候选驱动基因方面的强大性能,突出了深度学习在该类研究中的广阔前景。

Dig算法概览

由于Dig算法可快速评估分布在大范围基因组上的突变,因此其特别适用于识别弱或中等具有正向选择作用的驱动基因。

然而,该研究也有一定的缺陷,该研究仅靠计算预测,并不足以确定某一突变在肿瘤发生及发展中的因果作用,过量的突变率并不意味着其一定具有正向选择作用。因此,为了确定突变与肿瘤驱动因素的因果作用尚需实验验证。

更多健康资讯请点击医药头条,为您带来更多精彩内容!

该文章内容仅代表作者观点,不代表澳大利亚vs丹麦水位分析 观点,如涉及版权问题,请及时联系我们予以删除!
看病要趁早,不等待 不排队,全国知名专家 在线挂号
扫描左侧二维码,关注微信号:澳大利亚vs丹麦水位分析 ,求医更省时更省心

推荐阅读

告别失眠,享受深度睡眠:HUJ禾优健草本奇妙的睡眠魔力
告别失眠,享受深度睡眠:HUJ禾优健草本奇妙的睡眠魔力
在信息爆炸的时代,用户的时间成为了各类媒体抢夺的主要目标,社交媒体为了用户留存而花样层出不穷。这样一来,手机成瘾而导致的熬夜现象日益严重。玩手机不仅影响了我们的睡眠时间,也影响了我们的睡眠质量。即使放下手机,大脑也迟迟无法平静下来,脑海中不...[详细]
2024-07-19 17:12
HUJ禾优健THYROID NODULE SUPPORT,让甲状腺健康触手可及
HUJ禾优健THYROID NODULE SUPPORT,让甲状腺健康触手可及
在当今这个快节奏、高压力的时代背景下,环境污染与生活方式的变化让甲状腺健康成为不容忽视的话题。甲状腺功能减退症(甲减)、甲状腺结节、甲状腺肿等各种疾病层出不穷。为了精准狙击这一健康挑战,禾优健(HUJ)傲然推出——甲状腺健康守护神:THYR...[详细]
2024-07-19 15:30
烦恼“秃”然到来,达霏欣拯救脱发没商量
烦恼“秃”然到来,达霏欣拯救脱发没商量
脱发这个看似不起眼的问题,实际上却给无数人的日常生活带来了巨大的困扰。它不仅影响了个人的外观形象,更在无形中侵蚀着自信心。无论是正值壮年的男性,还是优雅美丽的女性,都渴望找到一种能够有效解决脱发问题的方法。当达霏欣应运而生,就迅速成为了市场...[详细]
2024-07-18 15:44
香港中华医学会:首个成人及青少年疫苗建议摘要发布
香港中华医学会:首个成人及青少年疫苗建议摘要发布
疫苗接种在构建群体免疫、预防疾病反弹方面具有举足轻重的作用。香港中华医学会致力参与社区疫苗的教育推广,在新冠疫情期间深入民居,为长者作医疗评估以及疫苗接种服务。为增进本地医护人员对疫苗接种指引,香港中华医学会早前成立疫苗接种咨询委员会,发出...[详细]
2024-07-18 09:21
通用技术环球医疗汇聚业内权威专家举办儿童肿瘤多学科诊疗研讨会
通用技术环球医疗汇聚业内权威专家举办儿童肿瘤多学科诊疗研讨会
7月6日,中国生物医学工程学会精确放疗技术分会儿童肿瘤放疗专委会成立大会暨儿童肿瘤多学科诊疗研讨会在江苏省南京市成功召开。此次大会由中国生物医学工程学会精确放疗技术分会主办,通用环球迈胜医疗科技(天津)有限公司(以下简称“环球迈胜”)承办。...[详细]
2024-07-17 16:36
按下“共建共享”快捷键,驶入高质量发展的“快车道”!
按下“共建共享”快捷键,驶入高质量发展的“快车道”!
诸药所生,皆有境界;性从地变,质与物迁。在纵横万里的华夏大地上,每一味中药都有其生长的最佳境遇,中药谓之“道地”。在野生道地药材资源有限的情况下,人工栽培、种植药材的步伐不断加快,逐渐形成了四大怀药、浙八味、晋十味、川药、关药、秦药等一批产...[详细]
2024-07-16 10:29
“聆听天地 陇宁传递”——西部公益行温暖启程,共筑听障人士希望之路
“聆听天地 陇宁传递”——西部公益行温暖启程,共筑听障人士希望之路
在金色的七月,阳光洒满大地,一份来自远方的温暖正悄然汇聚于陇宁这片古老的土地。2024年7月8日,由中国战略性新兴产业联盟和中国民族卫生协会主办,北京融和医学发展基金会、北京杏林春雨公益基金会等机构鼎力支持,世界杯202212强赛程表 科学院(北京)健康科技有限公...[详细]
2024-07-15 09:48

精彩必读

夏季多发皮肤病该注意什么?夏季皮肤病用药小常识介绍
热门推荐 点击排行