3月2日,李晓明教授在“首都科学讲堂”进行了题为“获取互联网信息:除了搜索引擎还能有什么 ”的主题报告。
人类有史以来的书籍数据总量大约40TB,而2006年全世界网网页的数据到达120TB。人们对网络信息的日益依赖说明,网络信息的质量也在不断加大,人们越来越有信心在网上找到自己想要的任何信息。目前人类从网络获取信息的手段主要有三种,根据已知的网址、通过门户网站,以及通过搜索引擎。但从原理上讲,搜索引擎具有的一个较大局限性在于,一方面它抓取的不是真正最新的网页,另一方面,它又无法保存“过去的”信息。因此,我们既需要建立互联网信息档案馆,将网页在消失之前搜集保存起来,又需要探索新的信息获取模式,以便更好地利用互联网所提供的内容为社会科学研究和人们的生活提供帮助。
主讲人介绍:李晓明,北京大学教授、博士生导师,网络与分布式系统实验室主任。
报告内容下载
2008-03-04