面向IPv6网络的大规模分布式搜索引擎
2009.1-2010.12,闫宏飞负责
- 建设目标:从搜索引擎体系结构面临的可扩展性问题出发,结合IPv6网络信息分布的构造特点和潜在的发展趋势,掌握具有自主知识产权的分布式搜索引擎体系结构及其关键技术,形成支持大规模、个性化、主题化、多媒体、多终端、易管理和标识网页安全的IPv6分布式搜索引擎技术体系。构建至少三个核心校园节点的分布式搜索引擎系统,支持对国内外IPv6网络信息的多领域信息检索和联合检索服务。
- 主要建设内容包括:针对IPv6网络环境下资源分布的特点,研究新一代的可扩展的分布式搜索引擎体系结构;研发IPv6搜索引擎单元系统,实现多领域信息检索服务及单元系统间数据共享;研发网页恶意代码检测技术和平台,保障用户访问安全的网页内容;研发新一代的面向IPv6网络的分布式搜索引擎系统,支持大规模信息检索服务,网络上规模部署和提供服务。
System
TREC Evaluation
Papers
-
Xin Zhao, Jing Jiang, Jianshu Weng, Jing He, Ee-Peng Lim, Hongfei Yan and Xiaoming Li.
Comparing Twitter and traditional media using topic models.
In Proceedings of the 33rd European Conference on Information Retrieval (ECIR'11) (full paper), pages 338-349, 2011. (20% acceptance)
- Jing He, Baihan Shu, Xiaoming Li, and Hongfei Yan,
Effective Time Ratio: A Measure for Web Search Engines with Document Snippets
AIRS 2010, 2010.
- Geng Li,Bo Peng,
Improving Range Query Performance on Historic Web Page Data.
Chinagrid2010. Guangzhou, China, July 16-18, 2010
- Chong CHEN, Jing HE, Dongdong SHAN, Hongfei YAN, Optimize Document Identifier Assignment for Inverted Index Compression,
in proceeding of the 2010 International Conference on Web Information Systems and Mining (WISM'10), Sanya, China. Also published in Journal of Computational Information Systems
- Xin Zhao, Jing Jiang, Jing He, Dongdong Shan, Hongfei Yan,Xiaoming Li, "Context Modeling for Ranking and Tagging Bursty Features in Text Streams", CIKM2010 (poster)
- Xin Zhao, Jing Jiang, Hongfei Yan,Xiaoming Li, "Jointly Modeling Aspects and Opinions with a MaxEnt-LDA Hybrid",in the Proceedings of the 2010 Conference on Empirical Methods in Natural Language Processing (EMNLP'10), pages 56–65, MIT, Massachusetts, USA, 9-11 October 2010.
- 何靖,陈翀,闫宏飞,开放域问答系统研究综述, 第六届全国信息检索学术会议(CCIR2010), 2010年8月12-15日,黑龙江镜泊湖.
- 赵东生,单栋栋,闫宏飞, "基于查询词出现的相关度改进",情报学报 (to appear)
- 毛先领,何靖,闫宏飞,“网页去噪:研究综述”,计算机研究与发展 , 2010, (12).