基于次范畴化的汉语多义动词模糊聚类
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

Supported by the National Natural Science Foundation of China under Grant No.60373101 (国家自然科学基金)


Inducing Fuzzy Classes for Chinese Polysemic Verbs via Subcategorization Information
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    描述了应用模糊k均值方法聚类汉语多义动词的实验,共涉及到60个汉语动词,40个多义词,20个单义词.首先,自动获取每个动词的次范畴化框架的概率分布,然后,导出这些动词的模糊聚类.结果表明,纯洁度和对精确度的综合量度较好地反映了聚类性能,尽管动词的句法行为在一定程度上体现了深层语义,但汉语动词的句法行为不易从单一的语义层预测出来.

    Abstract:

    This paper describes the application of Fuzzy k-Means, a derivant of k-Means that may assign an item to more than one cluster, in the task of inducing fuzzy classes for Chinese polysemic verbs. The probability distributions over subcategorization frames of 60 Chinese verbs, among which there are 40 polysemic ones and 20 monosemic ones are first acquired, and then these verbs are clustered into fuzzy classes. Evaluation and post-hoc analysis show that a combined measure of purity and pairwise precision can better estimate the clustering performance, and although to a certain extent syntactic behaviors of verbs have their counterparts of meaning components underlying, syntactic behaviors of verbs cannot be easily predicted from a single semantic level, at least for Chinese polysemic verbs.

    参考文献
    相似文献
    引证文献
引用本文

韩习武,赵铁军.基于次范畴化的汉语多义动词模糊聚类.软件学报,2006,17(2):259-266

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2004-05-01
  • 最后修改日期:2005-07-28
  • 录用日期:
  • 在线发布日期:
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号