跳到主要内容

验证了ob欧宝娱乐平台网站

人工智能和多组学识别癌症生物标志物和药物靶点

人工智能算法使用组学来发现癌症生物标志物,用于个性化医疗。

要点

  • 研究人员使用支持人工智能的多组学平台,从基因表达特征中识别新的治疗靶点的新型生物标志物。
  • AI算法通过分析数据和相关基因,确定疾病的治疗靶点,从而实现药物开发。
  • 新型分子生物标记物的鉴定将具有不同生存结果的癌症患者分层,以提供量身定制的治疗。
MasterTux / Pixabay
来源:MasterTux / Pixabay

人工智能(人工智能)机器学习不仅有可能彻底改变疾病的检测方式,而且有可能根据患者的基因组学确定个性化治疗方案。一项新的研究发表在细胞死亡与疾病,同行评议自然杂志,展示了一个支持人工智能的多组学平台如何从癌症相关疾病的基因表达特征中识别新的治疗靶点的新型生物标志物。

来自Insilico Medicine、哥本哈根大学和芝加哥大学的研究人员写道:“对具有不同生存结果的癌症患者进行分层的新型分子生物标志物的鉴定,可能为靶点发现和后续定制疗法的开发提供新的机会。”

为了找到这些生物标志物,研究人员使用Insilico Medicine的名为PandaOmics的基于人工智能的平台来寻找新的癌症靶点,并分析罕见的DNA修复缺陷疾病中的基因表达突变。熊猫组学是一种人工智能深度学习算法,它可以阅读科学论文,以产生内容的图形表示。它还可以进行跨数据集比较、数据协调和激活或抑制的途径分析。

AI算法通过分析数据和相关数据,确定疾病的治疗靶点,从而实现药物发现基因.它利用了500万组学数据样本(转录组学、基因组学、表观基因组学、蛋白质组学、单细胞数据),此外还有来自380多万项专利的相关数据,3000万项已发表的生物医学研究,从临床试验一期到启动阶段的130万种药物,342万项临床试验,以及300万项生命科学研究资助。

在科学上,组学是指以“组学”结尾的研究领域,如基因组学(对生物体基因组的研究)、神经基因组学(研究遗传对人体的影响)神经系统)、心理基因组学(应用基因组学和蛋白质组学,以了解对正常和患病大脑和行为的影响)、微生物组学(研究微生物的基因组)和连接组学(研究大脑的神经连接-连接组)。

组学的其他例子包括泛基因组学(研究一个物种的所有基因)、脂质组学(研究脂质通路和网络)、免疫蛋白质组学(研究蛋白质和免疫反应)、糖组学(研究糖和碳水化合物)、药物基因组学(研究基因组和药物反应)、毒性基因组学(研究细胞或组织在接触毒素时的基因和蛋白质活性)、代谢组学(研究代谢物的化学过程)、转录组学(研究生物体的RNA转录-转录组),蛋白质组学(研究蛋白质),表观基因组学(研究一整套表观遗传细胞表观基因组遗传物质的修饰),等等。

多组学是将多种组学整合到单一分析中。人工集成情报使用多组学数据分析的机器学习使科学家能够快速发现新的生物标志物。

研究人员写道:“为了选择疾病进行后续的基因表达分析和新型癌症生物标志物的鉴定,我们在分析多种DNA修复疾病中常见的临床表型的基础上进行了分层聚类。”“值得注意的是,我们发现了三个主要的疾病集群,涵盖了不同的表型。”

科学家们确定了三种主要的疾病群,并选择了这些罕见的遗传性疾病进行进一步分析:Louis-Bar综合征(失联-血管扩张症)、奈梅亨断裂综合征和Werner综合征。根据美国国立卫生研究院(NIH)的说法,这三种疾病都是常染色体隐性遗传疾病,这意味着必须有两个异常基因的副本才能出现特征或综合症。

路易斯-巴综合征是一种罕见的遗传性神经退行性疾病,可导致严重残疾,影响神经系统和免疫系统等身体系统。圣裘德儿童研究医院称,患有路易斯-巴氏综合征的人患免疫系统癌症和某些类型的血癌的风险较高。

奈梅亨断裂综合征是一种罕见的遗传性疾病,出生时表现为异常小的头部尺寸(小头畸形),畸形的面部特征和矮小的身材。这个名字来源于这种疾病患者身上发现的大量DNA断裂。根据美国国家卫生研究院的说法,奈梅亨断裂综合征患者患癌症的风险增加,特别是罹患非霍奇金淋巴瘤(一种免疫系统细胞的癌症),以及与该综合征相关的其他癌症,包括脑癌,如胶质瘤和成神经管细胞瘤,以及横纹肌肉瘤(肌肉组织的癌症)。

沃纳综合征是一种罕见的疾病,其特征是过早衰老和增加皮肤癌和甲状腺癌等癌症的风险。根据美国国立卫生研究院的数据,维尔纳综合征患者最常见的死亡原因是癌症和心脏病发作。

研究人员使用了来自癌症风险升高的DNA修复缺陷疾病的基因表达数据集,以确定可能与癌症进展相关的频繁失调基因的生物标志物。为了发现这些疾病中与癌症相关的途径,研究小组分析了基因表达谱的变化,特别是那些显示出失调基因的变化。

“值得注意的是,CEP135是三种DNA修复疾病中表达模式相似的下调基因,这表明它可能与共享的癌症表型有关,”科学家们报告说。

科学家们假设,CEP135基因可能作为一种预测性生物标志物,可以将患者分为不同生存结果的亚组。为了验证这一点,研究小组对来自癌症基因组图谱(TCGA)数据集的33种癌症类型进行了生存分析,根据美国国家癌症研究所的数据,TCGA数据集是最大、最全面的基因组数据集之一,包含来自11,000多名患者的癌症样本,横跨12年。

这导致了CEP135基因可以作为肉瘤(一种在结缔组织中发展的罕见类型的癌变肿瘤)患者的预测生物标志物的发现。通过对CEP135基因高表达和生存结果低的肉瘤患者的分析,科学家们在人工智能算法的帮助下,发现了20个最有希望的靶向基因列表。经过实验验证,候选基因的列表进一步缩小到五个基因。在剩下的5个基因中,polo样激酶1 (PLK1)基因是唯一一个显示出细胞生长显著下降的基因,使其成为未来癌症治疗的潜在靶点。

科学家们总结道:“虽然还需要进一步的靶标验证,但这项研究证明了硅基研究在快速发现生物标志物和靶标表征方面的潜力。”

版权所有©2022 Cami Rosso

广告