主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2019年第4期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
滕莉,付旭平,李宏宇,李瑶,陈文斌,李荣宇,沈一帆.一种基于主集分割的基因芯片聚类算法.软件学报,2005,16(9):1591-1598
一种基于主集分割的基因芯片聚类算法
A Microarray Cluster Algorithm Based on Dominant Set Segmentation
投稿时间:2004-05-31  修订日期:2005-02-04
DOI:
中文关键词:  基因芯片  主集  聚类  相关表达  排序
英文关键词:microarray  dominant set  clustering  coexpressed  sorting
基金项目:Supported by the Nationl Natural Science Foundation of China undder Grant No.60473104(国家自然科学基金)
作者单位
滕莉 复旦大学,计算机科学与工程系,上海,200433 
付旭平 复旦大学,生命科学学院,遗传研究所,上海,200433 
李宏宇 复旦大学,计算机科学与工程系,上海,200433 
李瑶 复旦大学,生命科学学院,遗传研究所,上海,200433 
陈文斌 复旦大学,数学系,上海,200433 
李荣宇 上海博星基因芯片有限责任公司,上海,200092 
沈一帆 复旦大学,计算机科学与工程系,上海,200433 
摘要点击次数: 3241
全文下载次数: 5454
中文摘要:
      聚类算法广泛应用于生物芯片数据分析中,用于寻找表达相似的基因或样本.大多数已有算法都需要人为地给出一些参数,然而在没有先验知识的情况下,人为地确定这些参数是十分困难的.为了解决这一难题,提出了一种迭代的聚类算法,首先用主集方法对原有基因进行重新排序,使高度相似的基因排列在特定区域.类的分割界线通常难于确定.提出一种标准,根据类内元素间的距离远小于类外元素间的距离的性质,从排序后的数据集中划分出一个类.将找到的类从当前数据集中排除以后,对剩下的数据重复以上处理,直到满足所提出的徨停止条件为止.从多方面分析了
英文摘要:
      Clustering algorithms are wildly used in the research of microarray data to extract groups of genes or samples that are tightly coexpressed. In most of them, some parameters should be predefined artificially, however, it is very difficult to determine them manually without prior domain knowledge. To handle this problem, an iterative clustering algorithm is proposed. Firstly, by sorting the original data by dominant set, similar genes would be aligned together. It’s hard to specify the cluster boundary. A criterion is presented to partition a cluster from the sorted data according to the property that the distances between the inside elements are smaller than that of outside elements. The idea is to remove the cluster form the current data set, repeat the process, and stop the algorithm when the stop criterions are satisfied. The new clustering algorithm is analyzed on several aspects and tested on the published yeast cell-cycle microarray data. The results of the application confirm that the method is very applicable, efficient and has good ability to resist noise.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利