摘要:随着Web 服务技术的不断成熟和发展,互联网上出现了大量的公共Web 服务.在使用Web 服务开发软件系统的过程中,其文本描述信息(例如简介和使用说明等)可以帮助服务消费者直观有效地识别和理解Web 服务并加以利用.已有的研究工作大多关注于从Web 服务的WSDL 文件中获取此类信息进行Web 服务的发现或检索,调研发现,互联网上大部分Web 服务的WSDL 文件中普遍缺少甚至没有此类信息.为此,提出一种基于网络信息搜索的从WSDL 文件之外的信息源为Web 服务扩充文本描述信息的方法.从互联网上收集包含目标Web 服务特征标识的相关网页,基于从网页中抽取出的信息片段,利用信息检索技术计算信息片段与目标Web 服务的相关度,并选取相关度较高的文本片段为Web 服务扩充文本描述信息.基于互联网上的真实数据进行的实验,其结果表明,可为约51%的互联网上的Web 服务获取到相关网页,并为这些Web 服务中约88%扩充文本描述信息.收集到的Web 服务及其文本描述信息数据均已公开发布.