主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2019年第6期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
宋国杰,唐世渭,杨冬青,王腾蛟.基于最大熵原理的空间特征选择方法.软件学报,2003,14(9):1544-1550
基于最大熵原理的空间特征选择方法
A Spatial Feature Selection Method Based on Maximum Entropy Theory
投稿时间:2002-08-09  修订日期:2002-12-23
DOI:
中文关键词:  空间数据挖掘  空间特征选择  最大熵理论  互信息  决策树
英文关键词:spatial data mining  spatial feature selection  maximum entropy theory  mutual information  decision tree
基金项目:Supported by the Foundation of the Innovation Research Institute of PKU-IBM (北京大学-IBM中国研究中心联合实验室资助项目); the National Grand Fundamental Research 973 Program of China under Grant No.G1999032705 (国家重点基础研究发展规划(973)
作者单位
宋国杰 北京大学,计算机科学技术系,北京,100871 
唐世渭 北京大学,计算机科学技术系,北京,100871
北京大学,视觉与听觉信息处理国家重点实验室,北京,100871 
杨冬青 北京大学,计算机科学技术系,北京,100871 
王腾蛟 北京大学,计算机科学技术系,北京,100871
北京大学,视觉与听觉信息处理国家重点实验室,北京,100871 
摘要点击次数: 3344
全文下载次数: 7692
中文摘要:
      特征选择在模式识别和数据挖掘等领域都有十分广泛的应用.然而,当涉及空间数据时,由于传统特征选择方法没有很好地考虑数据的空间特性,所以会导致特征选择结果性能下降.从空间数据本身的特性出发,提出一种特征选择方法MEFS(maximum entropy feature selection).MEFS在基于最大熵原理的基础上,运用互信息和Z-测试技术,采用两步方法进行空间特征选择.第1步,空间谓词选择;第2步,选择与每个空间谓词对应的相关属性集.最后,分别对MEFS方法和RELIEF方法以及基于MEFS的分类方法与决策树算法ID3分别进行了实验比较.实验结果表明,MEFS方法不仅可以节约特征提取和分类时间,而且也极大地提高了分类质量.
英文摘要:
      Feature selection has an important application in the field of pattern recognition and data mining etc. However, in real world domains, if there are spatial data operated in the application, the performance of feature selection will be decreased because of without considering the characteristic of spatial data. In this paper, a feature selection method from the point of the characteristic of spatial data, named MEFS (maximum entropy feature selection), is proposed. Based on the theory of maximum entropy, MEFS uses mutual information and Z-test technologies, and takes two-step method to execute feature selection. The first step is predicate selection, and the second step is to choose relevant dataset corresponding to each predicate. At last, the experiments between feature selection algorithms MEFS and RELIEF, and between ID3 classification algorithm and classification algorithm based on MEFS are carried out. The experimental results show that the MEFS algorithm not only saves feature selection and classification time, but also improves the quality of classification.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利