| |
|
“燕穹”的诞生 |
“燕穹”孕育于积累,启发于观察,立足于信念,升华于畅想。
- 我们有丰厚的技术和数据积累
- 我们有独立的搜索引擎技术、网页动态存储技术和web挖掘技术。
- 我们已经维护有一亿七千万中文网页,并以平均每月一千万网页的速度扩大规模。
- 我们敏锐的观察到:
- 中国网上已经有超过6000万活跃网页,且大约每年翻一番。这些网页自发地通过“超链”相互紧密地联系起来。
- 这些网页分布在大约10万个网站中,这些网站大多是个人(或者是自发)维护的。
- 网站数和网页数都在快速增加,大约每年翻番。
- 天网每天得到几十万人的访问。
- 我们坚信:
- 以网页为代表的网上信息(以及对这些信息关心的信息)除教育和娱乐外,在相当程度上是社会状态和变化的一种反映。
- 这类信息产生的“自发性”和存在的“流逝性”使其成为了一种珍贵的社会历史资源。
- 我们有美好的畅想:
- 如果能将网上出现(“流过”)的信息都收集起来,长期保存起来,…???
- 如果让这些保存的信息还能够方便地“回放”,…???
- 如果我们能在这些保存的信息上,从空间和时间两个角度做信息挖掘和分析研究, … ???
|
|
| “燕穹”的目标 |
- 承当起中国网络信息搜集、整理、归档的历史责任
---若干年后,要能够回答“2001年中国网上有些什么东西”?
- 开展基于海量网络信息“仓储”的各种科学研究
---完成上述任务本身所需的研究
---脱离内容,将Web看作是一个复杂抽象系统的研究
---跨学科研究:新的社会现象?新的传媒效果?新的经济模型?
|
|
| “燕穹”的阶段性成果 |
|
|
| 缤纷、开放、共享 |
- 燕穹是缤纷的,它的研究涉及到网络社会的方方面面,同时它也是跨学科研究的产物。(图)
- 燕穹是开放的,燕穹的所有成果都将在网上公开
---“源于社会”,“服务于社会”
- 燕穹是共享的,燕穹会定期发布报告,像人们展示最新的研究成果。(图)
|
| |