张伟哲,张宏莉,许笑,何慧.分布式搜索引擎系统效能建模与评价.软件学报,2012,23(2):253-265 |
分布式搜索引擎系统效能建模与评价 |
Distributed Search Engine System Productivity Modeling and Evaluation |
投稿时间:2011-07-08 修订日期:2011-09-06 |
DOI:10.3724/SP.J.1001.2012.04140 |
中文关键词: 分布式搜索引擎 效能建模 分布式采集 分布式索引 半广域网搜索引擎 |
英文关键词:distributed search engine productivity modeling distributed crawling distributed indexing half-WAN-based search engine |
基金项目:国家自然科学基金(61173145); 国家重点基础研究发展计划(973)(G2011CB302605); 国家高技术研究发展计划(863)(2010AA012504, 2011AA010705) |
|
摘要点击次数: 6529 |
全文下载次数: 5313 |
中文摘要: |
针对分布式搜索引擎系统效能建模与评估问题,通过对当前分布式搜索引擎系统的建模与分类,扩展了能耗与网络开销的成本模型;对5种构建搜索引擎系统的设计方案,从系统成本、系统规模和查询响应时间等角度进行了详尽的理论分析与评价.由此发现,由广域网分布式采集系统和多机群索引系统组成的半广域网搜索引擎系统相对于其他系统具有相对较高的效能,同时能够较好地兼顾用户的服务质量. |
英文摘要: |
This study extends the current productivity models for a typical Web search engine system, which consists of a Web crawling system and an indexing system. Five different design schemata are characterized according to this model and are compared through power consumption, networking cost, system scale, and query efficiency. The half-WAN scheme, which consists of a WAN-based crawling system and a multi-cluster indexing system, is proved to be the best choice for a large-scale highly-efficient Web search engine. |
HTML 下载PDF全文 查看/发表评论 下载PDF阅读器 |