随着生物领域研究日渐深入,新加坡国立大学癌症科学研究所 (CSI Singapore) 的一组研究人员开发了一种新型软件,可以帮助揭示 RNA 序列变化与癌症等疾病发展之间的关系。

CSI研究组编织出的RNA序列变化,来源:NUS Web
在新加坡国立大学Daniel Tenen教授和Henry Yang 博士的带领下,科学家们设计了名为ModTect的新式计算软件,可以使用来自临床队列研究中的测序数据,从而来识别 RNA 序列的变化。借助ModTect,该团队开展了新型泛癌研究,研究涵盖了33种不同的癌症类型。研究中,科学家们发现这些 RNA 序列变化与癌症患者不同的生存率之间存在一定关联。
概述
CSI新加坡研究副教授Henry Yang博士接受采访时表示 “这项工作是为数不多的证明 mRNA 变化序列与癌症发展相关的研究之一。我们研究表明,显性转录组在多种癌症类型的患者中出现了失调的现象,并且还与癌症进展和疾病生存率相关”。
同时,CSI 新加坡高级首席研究员 Tenen 教授表示 “在过去的十年中,人类基因组测序的能力已经改变了对正常过程和疾病(如癌症)的研究。我们预计,像这样的研究,最终会导致完整的RNA序列变化,并直接影响检测到的 RNA序列”。
该团队的突破于 2021年8月4日发表在著名的科学期刊《科学进展》上。

CSI研究组官网,来源:CSI Singapore Web
RNA序列变化是什么?
尽管大多数人都熟悉DNA,但RNA 在人体的细胞功能中扮同样演着重要的角色。与大多数人熟悉的具有双螺旋结构的DNA 不同,RNA 是一个单链分子家族,具有各种重要的生物学功能。
例如,有着信息传递功能的RNA (mRNA)可以传递不同蛋白质生产的遗传信息。如果把DNA想像成一个里面装满了关于如何制造不同蛋白质的说明的书籍庞大的图书馆。那么,构成书籍内容的单词序列中的每个字母就被称为核苷酸,它们是用于存储遗传信息的小分子。为了确保遵循这些指令,mRNA会复制这些书籍,并将它们从存储DNA的细胞核运送到核糖体。这些核糖体是合成蛋白质的“工厂”。如果没有 RNA,那么存储在我们细胞中的宝贵遗传指令将永远不会被使用。

Dr. Henry Yang,来源:NUS CSI Web
而其他类型的RNA也同样在执行其他重要功能。一些会帮助催化生化反应,就像酶一样;而另一些则有着调节基因表现的功能。同时RNA有时会进行小的化学序列变化,并改变分子的功能和稳定性。对这些研究RNA序列变化及其影响的研究,业内统称为“表观转录组学”。过去的研究表明,阿尔茨海默病和癌症等疾病的发展与某些 RNA 变化序列之间存在联系。然而,尽管多次尝试更深入地研究这些关联,但在 CSI 新加坡的科学家取得这一突破之前,表观转录组的研究已被证明是困难的。
从大样本的患者序列中收集和处理患者样本,是具有挑战性的工作。检测RNA序列变化通常涉及技术上复杂的过程,例如用难以获得的化学品处理样品。这些技术通常还需要使用在稀有条件下进行,并且难以获得的大量样品。因此,科学家们在建立特定RNA 序列变化与各种人类疾病之间关系的能力方面受到多重限制。

CSI研究组科研人员,来源:CSI Singapore Web
软件使表观转录组学研究更容易
CSI新加坡团队创建的软件,使用了其他大型临床队列研究中可用的RNA序列。为了检测这些 RNA 序列中的变化,ModTect会适宜得寻找错配信号和缺失信号。当科学家用来将RNA转回DNA的实验酶在测序过程中掺入随机核苷酸时,错配信号就会出现。而另一方面,酶在跳过序列的一部分时,有时会删除信号。这些信号被统称为“错误掺入信号”。与其他模型不同,ModTect不需要通过与不同类型的RNA序列变化,从而找寻相对应的错误掺入信号谱数据库来识别或分类它们。ModTect甚至可以有能力识别与以前记录的完全不同的新信号配置文件。

Prof. Daniel G. Tenen,来源:NUS CSI Web
通过将该软件应用于大约11,000名癌症患者RNA序列测序数据集,CSI新加坡团队借此便能够开展一项新研究。调查 RNA 序列变化与患者临床结果之间的关联。ModTect能够利用这些大型数据集并通过强大的统计过滤处理它们。统计的结果揭示了某些类型的表观转录组与患者的癌症进展和生存结果之间的联系。这一发现揭露出了RNA序列变化作为生物标志物的潜在用途——可用于检测疾病的分子。
揭开序列差异可逃脱检测之谜
如前所述,将遗传信息从细胞核中的DNA,传递到细胞核糖体的RNA分子,是一个关键过程。然而,这种传输过程并不完美,会导致RNA-DNA序列的差异。这些不匹配的位点已被广泛记录在先前的研究中。然而,尚不清楚这些观察结果是否由mRNA的序列变化引起,以及为什么这些位点无法通过Sanger 测序(最流行的 DNA 测序方法之一)检测到。
CSI 新加坡的小组在研究中,发现了一个潜在的解释,解释了为什么这些RNA修饰信号多年来一直无法检测到。CSI小组解释了一些表观转录组如何阻碍标准逆转录酶 (RT) 的使用,该酶用于将RNA转化为 DNA。同时,这种酶被科学家用于基因组测序,它的使用是实验成功的最关键步骤之一。因此,具有这些阻碍修饰的RNA会在Sanger测序技术中的代表性不足,从而逃避检测。
为了解决这个问题,CSI团队使用了新开发的RT 酶,这些酶以其绕过这些序列变化位点影响的能力而闻名。这使他们能够观察到最初用Sanger测序无法检测到的表观转录组。表观转录组学仍然是一个新兴且快速发展的领域,迄今为止已检测到大约 170 种RNA序列变化。通过利用ModTect,Tenen教授和他的团队能够为人类疾病(如癌症)与此类 RNA 序列变化之间的关系提供新的见解。该软件将在 Github 上公开供其他科学家使用。该团队希望他们的贡献将有助于进一步研究,确定RNA序列变化与肿瘤形成之间的任何潜在因果关系或机制。
