基于疾病信息网络的表型相似基因搜索
作者:
作者单位:

作者简介:

侯泳旭(1994-),女,河北石家庄人,硕士生,CCF学生会员,主要研究领域为数据挖掘;卢莉(1972-),女,博士,教授,主要研究领域为数据挖掘,环境医学,GIS;段磊(1981-),男,博士,副教授,主要研究领域为数据挖掘,生物医学信息分析,进化计算;唐常杰(1946-),男,教授,博士生导师,CCF杰出会员,主要研究领域为数据科学;李岭(1969-),男,博士,教授,博士生导师,主要研究领域为医学遗传学,生物信息学.

通讯作者:

段磊,E-mail:leiduan@scu.edu.cn

中图分类号:

TP311

基金项目:

国家自然科学基金(61572332,81473446);中国博士后科学基金(2016T90850);中央高校基本科研业务费(2016SCU 04A22)


Search of Genes with Similar Phenotype Based on Disease Information Network
Author:
Affiliation:

Fund Project:

National Natural Science Foundation of China (61572332, 81473446);China Postdoctoral Science Foundation (2016T90850);Fundamental Research Funds for the Central Universities (2016SCU04A22)

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    人类基因组计划的成果推动了生物信息学研究的发展.基于疾病表型相似性策略寻找功能上存在联系的致病基因,即表型相似基因,具有重要的研究价值和广阔的应用前景,是新兴的研究热点.然而,生物医学领域尚没有利用计算机方法开展基于基因-疾病-表型关系网络的表型相似基因搜索研究.对此,利用疾病公开数据库构建了包含基因、疾病、表型这3类异构类型节点的疾病信息网络,并设计了基于疾病信息网络的相似基因搜索算法gSim-Miner.针对疾病表型数据的特点,设计了剪枝策略提高算法效率.通过在真实数据上的实验,验证了疾病信息网络对搜索表型相似基因的适用性以及gSim-Miner算法的有效性、执行效率和可扩展性.

    Abstract:

    The results of Human Genome Project promote the development of bioinformatics. Searching disease genes that have function correlations, also called similar phenotype genes, based on the strategy of disease phenome similarity becomes an emerging research topic due to its important research value and wide range of applications. However, in biomedical field, there is no previous work that applies computer methods to search similar phenotype genes via a network consists of "gene-disease-phenotype" relations. To fill the gap, in this study, a disease information network containing three heterogeneous nodes (i.e., gene, disease, and phenotype) is built by making use of a disease open database. In addition, an algorithm, called gSim-Miner, is designed for the search of similar phenotype genes via the disease information network. Pruning strategies based on the characteristics of disease phenotype data are proposed to improve the efficiency of gSim-Miner. Experiments on real-world data sets demonstrate that the disease information network is feasible, and gSim-Miner is effective, efficient and extensible.

    参考文献
    相似文献
    引证文献
引用本文

侯泳旭,段磊,李岭,卢莉,唐常杰.基于疾病信息网络的表型相似基因搜索.软件学报,2018,29(3):721-733

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2017-07-31
  • 最后修改日期:2017-09-05
  • 录用日期:
  • 在线发布日期: 2017-12-05
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号