陕西省技术转移中心

科技成果

阅读数： 2228

成果名称: 基于生物大数据的癌症分子标记物识别方法

成果登记号: 9612022J0212

第一完成单位: 西安电子科技大学

联系人: 杨鸣

成果类型: 基础理论

成果体现形式 : 其他

应用行业: 信息传输、软件和信息技术服务业

学科分类: 计算机科学技术(520)

完成人: 覃桂敏

成果简介:

项目的主要目标是提供有效的组学数据整合方法，整合不同水平和层次的数据，建立复杂网络模型；提

出新的复杂网络聚类和模式挖掘算法，识别有效的癌症分子标记物。在项目期间，主要培养了四个硕士研究生

，并发表了三篇论文。具体完成工作如下：

（1）提出一种新的计算模型PhosD进行磷酸化关系预测。提出一个生物假设：激酶是通过识别底物蛋白上的特

异结构域单元来完成和底物蛋白的磷酸化反应，然后提出一个概率模型来衡量候选底物蛋白被该激酶磷酸化的

可能性。

（2）提出一种基于分子交互数据和基因数据给通路打分的方法来识别癌症中失调的通路，分析和比较乳腺癌，

卵巢癌和子宫癌是三种最常见的妇科肿瘤，并进一步预测疾病基因。

（3）多网络中条件特异的模块识别可以揭示疾病的分子机制。发展了一个有效的启发式算法SMMN，通过考虑多

网络识别条件特异的模块。在人工网络的结果表明SMMN比现有的经典方法性能更优。在乳腺癌网络中，SMMN识

别的阶段特异模块比其它方法可以更好地区分癌症的不同阶段。在泛癌网络中，癌症特异模块与病人的生存期

更相关，因此可以有效地帮助癌症诊断和治疗。

（4）基于转录因子和miRNA调控网络预测与癌症相关的基因。提出核心节点识别算法，并从生物通路、功能和

疾病等方面分析进行分析。最后，改进KNN算法，预测肺癌的疾病候选分子。

（5）基于药物表型、治疗学、化学结构和基因组学等属性构建DDI预测模型DAPM。在该模型中，运用Logistic

回归、决策树、朴素贝叶斯、支持向量机、kNN、随机森林六种算法进行对比试验。同时，本文在数据层面和网

络结构层面，提出了两个优化策略，提高了模型的预测准确率。在数据层面，由于现有数据库缺乏正常样本，

使用One-class SVM算法，将模糊分类标签优化为可信任的标准分类数据。在网络结构方面，首次提出构建药物

维度的多层网络，更精确地描述药物相互作用关系。结合Lévy-随机游走算法和重启随机游走算法（RWR），提

出基于多层网络的RWLR随机游走算法来优化网络机构。