中文维基百科演化趋势与政策环境结构研究...

7
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net 基金项目 : 国家自然科学基金项目“基于 Web2 . 0 的信息自组织和有序化研究” ( 编号 :70773086) 的研究成果之一 。 作者简介 : 李小宇 ,,1984 年生 ,硕士研究生 ,研究方向为信息自组织理论、信息政策 ;罗志成 ,,1984 年生 , 硕士研究生 , 研究方向为信息检 索、 Web2 . 0 网络环境 。 中文维基百科演化趋势与政策环境结构研究 3 Study on Evolving Tendency and Policy Environment of Chinese Language Wikipedia 李小宇  罗志成 ( 武汉大学信息管理学院  武汉   430072) 摘 要  以中文维基百科为研究对象 ,分析了其页面更新和用户行为的演化过程 ,得出用户与词条编辑增长的四个 趋势。通过页面链接分析 ,揭示了中文维基百科政策环境的三层结构。结合对政策制定、施行和维护过程的定性分 ,基于社会科学理论探讨了中文维基百科政策环境制定与运行原则 。 关键词   中文维基百科  演化  政策环境  链接分析 中图分类号  G350 维基百科(www. wikipedia.org) 作为 Web2 . 0 环境 下的开放编辑的网络百科全书和基于在线合作的用户 社区已经越发成为互联网研究的热点。以维基百科为 实例的研究集中于对其知识共享机制 , 知识内容的生 长与维护 ,用户合作激励机制的解释等。实际上 ,此类 研究均试图揭示在用户广泛参与的网络环境下 , 如何 通过构建理想的机制 , 使参与者统一目标、达成共识、 公平协作 ,实现高效。在维基百科的结构性合作过程 ,方针( Policy) 与指引 ( Guideline) 所构成的政策环境 扮演了重要角色 。 中文维基百科 (zh. wikipedia. org) 创建于 2002 10 24 ,截止到 2008 9 6 , 共有 203 507 条目。中文维基百科的政策环境覆盖了文章引用 , 点中立 ,保证共识 , 维基文化 , 格式规范 , 内容控制 , 为规范等几乎所有的维基百科活动 , 是维基百科正常 发展和维系的基石之一。方针与指引的制定并不是来 自于维基的“高级领导” ,相反 ,是通过严格的机制产生 于最多数用户的共识 ( Consensus) 。为了保证这一点 , 政策环境具有如下特征 : 首先 ,维基百科政策开放给所有用户。和其他条 目一样 ,方针与指引本质上也是进行开放编辑的特殊 条目。其创建和维护 , 都是由普通用户通过达成共识 来完成。特别是对于方针和指引的不断维护 , 是随着 维基百科的日益成长而进行的 , 使维基百科政策环境 可以适应新的要求 。 其次 ,维基百科政策可以被方便地引用。在编辑 条目时 ,只要任何政策被作为关键词链接处理 ,就可以 方便地链接到政策页面。这使得维基百科政策可以随 时随地发挥作用 ,扩大了其对用户的影响力 。 再次 ,维基百科政策彼此间具有相互作用。在政 策页面之间存在着引用链接 , 有些处于核心地位的政 策在影响着其他政策的制定和维护 。 本文学习吸收了以往类似研究的特点 , 从纵向的 时间沿革与横向的政策关系两个角度 , 对中文维基百 科的演化过程和政策环境做了深入分析研究 , 试图揭 示开放网络环境用户合作的组织原则和管理经验 。 1 相关研究 回顾以往文献 ,我们发现集中于英文维基百科的 此类研究 ,大致从定性、技术、定量三种分析角度来解 释维基百科的政策环境和协作机制 。 首先 , 从定性分析的角度出发 , Bryant et al (2005) [1] 通过用户采访调查 , 描述性的研究了英文维 基百科用户在合作目的、工具使用和对社区的参与三 个方面与传统网络用户的区别 , 给出了网络开放合作 系统研究的新范式。Forte Bruckman(2007) [2] 在长 期跟踪观察英文维基百科社区的基础上 , 结合社会行 为学理论 ,通过电话采访关键核心用户 ,发现维基百科 的日常管理日益中心化 (Decentralization) 的趋势 , 并对 政策环境的产生和加强做了结构上的分析。Stvilia et al(2007) [3] 通过对用户讨论页面内容的深入分析 , 究了开放的网络知识共享系统如何保证信息质量。 0 6 1 情报杂志 2009 年第 2 期                     J ournal of Intelligence No.2,2009

Upload: nguyenkien

Post on 26-Feb-2019

253 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 中文维基百科演化趋势与政策环境结构研究 3or.nsfc.gov.cn/bitstream/00001903-5/105167/1/1000001609402.pdf析,基于社会科学理论探讨了中文维基百科政策环境制定与

© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net

基金项目 :国家自然科学基金项目“基于 Web2. 0 的信息自组织和有序化研究”(编号 :70773086)的研究成果之一。

作者简介 :李小宇 ,男 ,1984 年生 ,硕士研究生 ,研究方向为信息自组织理论、信息政策 ;罗志成 ,男 ,1984 年生 ,硕士研究生 ,研究方向为信息检

索、Web2. 0 网络环境。

中文维基百科演化趋势与政策环境结构研究 3

Study on Evolving Tendency and Policy Environment of Chinese Language Wikipedia

李小宇 罗志成

(武汉大学信息管理学院  武汉  430072)

摘  要  以中文维基百科为研究对象 ,分析了其页面更新和用户行为的演化过程 ,得出用户与词条编辑增长的四个

趋势。通过页面链接分析 ,揭示了中文维基百科政策环境的三层结构。结合对政策制定、施行和维护过程的定性分

析 ,基于社会科学理论探讨了中文维基百科政策环境制定与运行原则。

关键词  中文维基百科  演化  政策环境  链接分析

中图分类号  G350

  维基百科 (www. wikipedia. org) 作为 Web2. 0 环境

下的开放编辑的网络百科全书和基于在线合作的用户

社区已经越发成为互联网研究的热点。以维基百科为

实例的研究集中于对其知识共享机制 ,知识内容的生

长与维护 ,用户合作激励机制的解释等。实际上 ,此类

研究均试图揭示在用户广泛参与的网络环境下 ,如何

通过构建理想的机制 ,使参与者统一目标、达成共识、

公平协作 ,实现高效。在维基百科的结构性合作过程

中 ,方针 ( Policy) 与指引 ( Guideline) 所构成的政策环境

扮演了重要角色。

中文维基百科 (zh. wikipedia. org) 创建于 2002 年

10 月 24 日 ,截止到 2008 年 9 月 6 日 ,共有 203 507 条

条目。中文维基百科的政策环境覆盖了文章引用 ,观

点中立 ,保证共识 ,维基文化 ,格式规范 ,内容控制 ,行

为规范等几乎所有的维基百科活动 ,是维基百科正常

发展和维系的基石之一。方针与指引的制定并不是来

自于维基的“高级领导”,相反 ,是通过严格的机制产生

于最多数用户的共识 ( Consensus) 。为了保证这一点 ,

政策环境具有如下特征 :

首先 ,维基百科政策开放给所有用户。和其他条

目一样 ,方针与指引本质上也是进行开放编辑的特殊

条目。其创建和维护 ,都是由普通用户通过达成共识

来完成。特别是对于方针和指引的不断维护 ,是随着

维基百科的日益成长而进行的 ,使维基百科政策环境

可以适应新的要求。

其次 ,维基百科政策可以被方便地引用。在编辑

条目时 ,只要任何政策被作为关键词链接处理 ,就可以

方便地链接到政策页面。这使得维基百科政策可以随

时随地发挥作用 ,扩大了其对用户的影响力。

再次 ,维基百科政策彼此间具有相互作用。在政

策页面之间存在着引用链接 ,有些处于核心地位的政

策在影响着其他政策的制定和维护。

本文学习吸收了以往类似研究的特点 ,从纵向的

时间沿革与横向的政策关系两个角度 ,对中文维基百

科的演化过程和政策环境做了深入分析研究 ,试图揭

示开放网络环境用户合作的组织原则和管理经验。

1  相关研究

回顾以往文献 ,我们发现集中于英文维基百科的

此类研究 ,大致从定性、技术、定量三种分析角度来解

释维基百科的政策环境和协作机制。

首先 , 从定性分析的角度出发 , Bryant et al

(2005) [1 ]通过用户采访调查 ,描述性的研究了英文维

基百科用户在合作目的、工具使用和对社区的参与三

个方面与传统网络用户的区别 ,给出了网络开放合作

系统研究的新范式。Forte 和 Bruckman (2007) [2 ]在长

期跟踪观察英文维基百科社区的基础上 ,结合社会行

为学理论 ,通过电话采访关键核心用户 ,发现维基百科

的日常管理日益中心化 (Decentralization) 的趋势 ,并对

政策环境的产生和加强做了结构上的分析。Stvilia et

al (2007) [3 ]通过对用户讨论页面内容的深入分析 ,研

究了开放的网络知识共享系统如何保证信息质量。

061

情报杂志 2009 年第 2 期                    J o ur nal of Int elli ge nc e No . 2 ,2009

Page 2: 中文维基百科演化趋势与政策环境结构研究 3or.nsfc.gov.cn/bitstream/00001903-5/105167/1/1000001609402.pdf析,基于社会科学理论探讨了中文维基百科政策环境制定与

© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net

Viégas et al (2007) [4 ]结合社会科学的研究框架 ,分析

了“特色条目”( Featured Article) 的产生过程 ,与政策

方针的关联以及在特色条目产生过程的背后有怎样的

形式化的机制。

其次 ,从技术的角度出发 ,以往的研究手段是用开

发可视化的工具来挖掘和分析维基百科数据。Viégas

et al (2004) [5~6 ]开发了一种数据挖掘和分析的可视化

工具———History Flow ,通过对不同年份词条的历史编

辑数据的比较 ,作者揭示了讨论页面作为最基本的用

户协作机制的演化过程。Kittur et al (2007) [7~8 ]开发

了工具 Revert Graph Visualization ,该工具从英文维基

百科的讨论页面 ( Talk pages) 中识别、区分了一种特殊

编辑———回退 ( Revert ) ,并藉此对用户的群聚实现可

视化分析。Suh et al (2008) [9 ]介绍了一种社会性动态

分析工具———WikiDashboard ,用来提高维基百科条目

的透明度和说明性 ,以此促进用户交互协作的效率。

再次 ,一些有意义的研究通过对维基百科数据的

定量分析 ,揭示了维基百科演化过程中的规律。Buriol

et al (2006) [10 ]分析了英文维基百科的条目数、用户数 ,

编辑数以及条目间的连接数随时间的演化过程。

Almeida et al (2007) [11 ]通过详实的数据分析 ,得出在维

基演化的过程中 ,条目的维护与条目的创建之间存在

自相似现象 ,用户基数的增加带来了维基百科自身的

指数性生长的结论。Kittur et al (2007) [12 ]通过对用户

编辑次数的统计分析 ,比较了不同编辑数量水平的用

户对维基百科的贡献 ,提出大量普通用户的参与保证

了维基百科的强健生长 ,同样的结论也适用于网络标

签集 del. icio . us 网站。Beschastnikh et al (2008) [13 ] 定

量地分析了英文维基百科中讨论页面中政策的引用随

时间变化的演进趋势 ,指出普通用户对政策的引用日

益与管理员同样熟识。

2  研究方法

本文采用定量分析与定性分析相结合的方法 ,从

中文维基百科的历史演化过程和现实层次结构 ,揭示

了政策环境的演化与作用规则。我们从维基媒体基金

会 ( Wikimedia Foundation) 公布的维基百科统计 ( stats.

wikimedia. org) 获取了中文维基百科的生长数据。此

外 ,维基媒体基金会定期提供维基百科全部内容的数

据集 ,包括几乎所有命名空间 ( Namespace) 的版本历史

数据。我们下载了 2008 年 3 月 11 日中文维基百科的

数据集 ( download. wikipedia. org) ,藉此对各个不同命

名空间的用户编辑次数的历史变化进行了统计。同

时 ,抽取政策页面之间的链接 ,通过社会网络的分析方

法和 UCINET 工具 ,对政策页面的引用关系进行分

析 ,并对被引用次数排序。然后我们阅读分析了中文

维基百科全部方针指引页面 ,对其进行基于目的的分

类 ,结合定量分析的排序结果 ,指出不同类型的政策页

面的被引用程度。

3  中文维基百科的演化趋势分析

中文维基百科自创建之日起就保持了强健的增

长 ,我们从维基媒体基金会公布的数据中 ,分析得出中

文维基百科自身生长演化的四种趋势。

第一 ,中文维基百科经历了指数型增长过程。我

们分析了中文维基百科的条目数量、用户数量和编辑

量的历史数据 ,其中条目数量统计的是至少含有一个

内部链接的文章条目数量 ,而不包括诸如方针指引和

用户讨论页面等的功能性页面。用户数量 ,以注册后

至少编辑过 10 次的用户数量为代表 ,虽然没有进行过

编辑的注册用户数量可能更多 ,但正是这些实际参与

编辑的用户才构成了维基百科成长的推动力。从图 1

中我们可以看到 ,用户数量与文章条目数量经历了几

乎同步的指数增长。其中 ,红色方形折点线表示用户

数量累计变化 ;蓝色三角形折点线表示文章条目数变

化趋势。

图 1  用户数量与文章条目数量增长态势

第二 ,维基百科文章条目的信息质量在稳步提升。

尽管维基百科在某种意义上处于无政府状态 ( Anar2chy) ,但事实表明中文维基百科用户社群十分重视维

基的信息质量[3 ] 。来自于用户的不断编辑使得维基百

科条目的数量与质量都在提高。图 2 表示平均每个条

目的编辑次数和长度都在线性增长 ,其中蓝色三角形

折点线表示每个词条平均字节长度的变化 ,红色方块

折点线表示编辑次数变化。图 3 显示了用户平均每个

月的编辑次数也在波动式的上升。这些变化表明随着

中文维基百科的发展 ,不仅仅条目的数量在指数增长 ,

条目本身的质量也在得到加强。除了用户的直接编

辑 ,维基百科的政策环境很大程度上为保证信息质量

设置了详细的标准规范 ,比如完善的特色条目审议流

程等。同时用户在条目讨论页或用户页面的讨论页中

商议辩论、交互协作 ,不仅及时发现信息错误 ,而且及

161

J o ur nal of Int elli ge nc e No . 2 ,2009                情报杂志 2009 年第 2 期

Page 3: 中文维基百科演化趋势与政策环境结构研究 3or.nsfc.gov.cn/bitstream/00001903-5/105167/1/1000001609402.pdf析,基于社会科学理论探讨了中文维基百科政策环境制定与

© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net

时地改正信息错误。这样的开放编辑 ,使得维基百科

对于破坏性编辑保持强健的恢复力[5 ] ,保证了作为网

络百科全书的知识质量。

第三 ,中文维基百科的增长速率在趋缓。分析用

户和条目每月的增加数量 ,可以得出无论是用户还是

条目的增长速率在一定程度上呈下降趋势。图 4 中红

色方形折点线表示用户数量每月新增量 ,蓝色三角折

点线表示平均每月每天条目数量新增量。我们看到 ,

平均每月每天新增条目数量在 2006 年 7 月达到峰值 ,

此前 ,条目平均每月每天的增量不断增大 ,而后进入回

落阶段。而用户每月的新增人数在 2007 年 10 月达到

峰值 ,而后急剧回落至 2006 年三月的水平。

另外 ,我们通过同时间划度的用户数量与条目数

量 ,计算了平均每个用户编辑的条目数量 ,如图 5 所

示。可见 ,大约在 2004 年 3 月后 ,平均每个用户所编

辑的条目数量处于指数下滑的趋势。这表明在一定程

度上 ,用户对维基百科的编辑效率在下降。虽然这对

用户与条目总数的增长态势不构成太大的影响 ,却与

图 4 所示的用户与条目增长速率的下降有关。结合以

上分析 ,不难看出 ,用户对条目的编辑次数在上升 ,但

是新条目的增长速度却在变缓 ,一方面是因为条目基

数在不断加大 ,另一方面也可以推论出 ,随着维基百科

的发展用户编辑的重点逐渐由新条目的创建转移到既

有条目的维护上 ,这也印证了维基百科条目质量在增

加的趋势。

第四 ,中文维基百科的参与用户与编辑对象正在

经历中心化的趋势。我们根据每月编辑次数区分了不

同编辑层次的用户群随时间的数量变化 ,如图 6 所示。

图中分析了三种编辑层次的用户数量 ,从中我们可以

看到 ,每月编辑次数少于 5 次的用户群 (蓝色部分) 的

比例不断上升 ,每月编辑数量在 5~100 次之间 (红色

部分) 和高于 100 次的用户数量 (黄色部分) 比例则处

于下降态势。在经历了最初的数量波动后 ,大约在

2004 年 7 月后 ,三个用户群的人数比例相对收敛。图

7 表示了不同长度的词条数目随时间的变化比例图。

同样在 2004 年 7 月后 ,长度分别为小于 0. 5kb(蓝色部

分) ,0 . 5~2kb 之间 (红色部分) 和大于 2kb(黄色部分)

的词条类型呈现了收敛的态势。值得注意的是 ,图 6

中的每月编辑数量在 5~100 次之间的用户比例大致

维持在 20 %左右。这种现象的原因可能是由于用户

的编辑日益集中于修订业已存在的词条 ,而非创建新

的条目 ,使得黄色部分长词条比例的增加与蓝色部分

短词条比例的衰减同步 ,这印证了我们在第三点趋势

中做得推论。比较不同编辑层次的用户和不同长度类

型的词条数目变化趋势 ,可以看出中文维基百科中大

261

情报杂志 2009 年第 2 期                    J o ur nal of Int elli ge nc e No . 2 ,2009

Page 4: 中文维基百科演化趋势与政策环境结构研究 3or.nsfc.gov.cn/bitstream/00001903-5/105167/1/1000001609402.pdf析,基于社会科学理论探讨了中文维基百科政策环境制定与

© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net

量编辑次数较少的用户的增值 ,日益成为维基百科的

主要编撰人群 ,他们的作用正在赶上编辑次数较多、十

分活跃的“核心”用户群。

图 7  不同长度词条类型的数量比例

此外 ,我们从下载的中文维基百科数据集中 ,抽取

了不同命名空间的页面编辑数目的比例。我们特别观

察了以 main 开头的命名空间 ,这些词条就是维基百科

的文章词条 ,从中发现针对词条页面的编辑在全部编

辑数目中的比例有下降趋势、这意味着 ,虽然用户和用

户编辑的绝对数量在指数上升 ,但用户编辑的主要对

象正在从文章词条页面转移到其他页面中 ,比如讨论

页面、政策环境页面、用户页面等。图 8 中蓝色三角形

折点线表示全部编辑数量 ,红色方块折点线表示针对

文章词条页面的编辑数量 ,可以看到二者的绝对差值

在加大。

图 8  文章词条编辑数量与全部词条编辑数量比较

4  政策环境的结构分析

在方针指引页面中存在着彼此的引用链接 ,即在

某方针或指引的文本内容中可能存在一个指向另一个

方针或指引的内部链接 ,用以引用或佐证。我们从下

载的数据集中 ,抽取了政策页面的链接关系 ,首先通过

关系矩阵和 UCINET 工具构建政策页面间的关系图 ,

然后对页面做了链入度排序和分类分析。

 4. 1  政策页面间关系的精炼  我们从方针列表和

指引列表中阅读收集了它的 156 个方针指引页面 (注 :

在中文维基百科中 ,同一面有繁简版本地区分 ,繁简页

面之间由重定向 ( redirection) 连接 ,二者分别占用一个

命名空间 ,但彼此之间内容完全一致 ,由算法进行繁简

互换。所谓子页面是特别针对同一方针指引的子方针

而言 ,他们都是关于一类问题的政策 ,只是阐述的具体

方面不同 ,一个方针往往带有数个子方针) 。这是一个

粗糙的数据集 ,其中包括了中文维基百科的正式方针、

指引 ,也包括了尚未在中文维基中达成用户共识的译

自英文维基百科的方针指引参考 ,以及上述页面的一

系列子页面和繁简区别页面 (在中文维基百科中 ,同一

页面有繁简版本的区分 ,繁简页面之间由重定向 ( redi2rection) 连接 ,二者分别占用一个命名空间 ,但彼此之

间内容完全一致 ,由算法进行繁简互换。所谓子页面

是特别针对同一方针指引的子方针而言的 ,他们都是

关于一类问题的政策 ,只是阐述的具体方面不同 ,一个

方针往往带有数个子方针) 。分析这个粗糙数据集的

链接关系 ,如图 9 所示 ,图中结点的数字名称是中文维

基百科数据集中政策页面对应的唯一 ID 标识。黑色

结点是没有内部链接的孤立点 ,很有可能这六个页面

已经被删除了但仍留有 ID 标识在数据库中。图右下

角由 4 个结点组成了一个孤立点群。

图 9  粗糙数据集的链接关系有向图

为了进一步获得政策环境的清晰结构 ,我们对粗

糙数据集进行了第一次精炼 ,将主页面与子页面、繁简

版本页面进行合并 ,子页面和繁简版本的入链和出链

保留并加和到该类政策的主页面上 ,这样我们就获得

了一个只含有各类别政策之间链接关系的第一次精炼

网络结构 ,如图 10 所示。

图 10  第一次精炼结果链接关系有向图

361

J o ur nal of Int elli ge nc e No . 2 ,2009                情报杂志 2009 年第 2 期

Page 5: 中文维基百科演化趋势与政策环境结构研究 3or.nsfc.gov.cn/bitstream/00001903-5/105167/1/1000001609402.pdf析,基于社会科学理论探讨了中文维基百科政策环境制定与

© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net

实际上 ,第一次精炼结果仍不能称之为严格的中

文维基百科政策环境 ,这是因为来自于英文维基百科

的参考性质的政策 ,在中文维基百科中尚未达成广泛

共识。即得到大多数用户承认的“官方”政策环境是第

一次精炼结果中一部分结点 ,因此我们在第一次精炼

后的网络中剔除来自英文维基的参考政策 ,仅保留达

成共识的正式方针 ,得到第二次精炼结果 ,如图 11 所

示。

图 11  第二次精炼后正式方针指引页面连接关系

 4. 2  政策页面关系网络的分析  从表 1 的网络分

析指标统计中可以看出 ,在包含了全部方针指引页面

的粗糙集中 ,彼此间链接较紧密 ,但全局中心势并不很

高 ,这说明粗糙集中有些成分的关联很紧密 ,但有些成

分处于边缘态。第一次精炼后的网络比粗糙集各项指

标都增加 ,这是子页面连接关系加和到主页面的结果。

第二次精炼结果与第一次精炼结果比较链入度中心势

和平均距离增加 ,而其他指标回落。三个网络中链入

度中心势均高于链出度中心势 ,说明某些政策页面的

被引用次数要高于其他页面。对第一次和第二次精炼

结果按照链入度排序结果如图 12 和图 13 所示。表 1  网络分析指标

类别 结点数 关系数 密度链出度中心势

链入度中心势

聚集系数

平均距离

粗糙集 156 1574 0. 0617 0. 250 0. 438 0. 410 2. 696

第一次精炼后 67 914 0. 2067 0. 482 0. 744 0. 528 1. 947

第二次精炼后 41 311 0. 1896 0. 446 0. 805 0. 497 2. 014

图 12  第一次精炼结果结点链入度排序

从第一次精炼结果的链入度排序结果可以看到 ,

中文维基百科的政策页面有分层现象 ,按照被引用次

数在 0~10 ,10~30 ,30~60 的区间大致分为三层。其

中被引用次数最多的三个政策页面分别为“方针与指

引 ( ID33 )”、“快 捷 方 式 ( ID79887 )”和 “共 识

( ID142344)”。其中 ,“方针与指引”来自于页面分类 ,

“快捷方式”和“共识”是政策页面模板 ( Template) 自动

生成的链接。

图 13  第二次精炼结果链入度排序

第二次精炼结果的链入度排序与第一次精炼结果

呈现类似的层次结构 ,原因是第二次精炼是人工剔除

了非正式方针指引 ,而非剔除网络中的核心结点。也

就是说用户达成共识的政策环境与包含了全部类目的

政策环境有相似的链接结构。

 4. 3  政策页面的归类分析  为了区分不同层次的

政策类型 ,我们基于政策的目的和使用功能 ,人工对第

二次精炼后的 41 个正式方针指引做了分类 ,分类类型

如表 2 所示。表 2  政策类型表

分类码 分类名称 分类描述 举例

b 版权协议 知识内容的引用和使用涉及的版权问题 GNU 自由文档许可证文本

x 行为规范 对用户惯常行为合理性的要求 不要伤害新手

c 操作指导 对用户操作的规定的标准与规范 编辑守则

s 格式指南 各种页面内容格式规定 格式手册

n 内容包含 文章可以或不可以包括的内容的规定 不适合维基百科的文章

y 一致共识 帮助用户达成共识或避免争议 共识

p 平衡观点 保证观点内容的客观中立 中立的观点

j 基础功能 基本使用公能的指导介绍 方针与指引

g 管理事项 关于管理员自身和其管理行为的规范 管理员

z 自身原则 维基百科对自身的定位和文明 礼仪

  通过 UCINET 工具 ,为结点添加分类属性 ,可以

用不同颜色在链接关系图中标识不同类型的结点 ,得

到图 14。同样颜色标注在柱状图中 ,得到图 15 ,可以

更直观表示在不同层次页面中 ,不同类型的政策如何

分布。图中可见被引用最多的是执行基本指导作用和

一致共识政策页面 ,这一方面是页面自动链接的结果 ,

但也反映了一致共识对于制定政策的重要性。对页面

内容 ,用户行为和基本操作方式的说明性政策处于被

引用次数的第二层次 ,最后由维基媒体基金会主要发

布的对维基百科自身性质定义的政策主要构成了被引

用次数的第三层次。

461

情报杂志 2009 年第 2 期                    J o ur nal of Int elli ge nc e No . 2 ,2009

Page 6: 中文维基百科演化趋势与政策环境结构研究 3or.nsfc.gov.cn/bitstream/00001903-5/105167/1/1000001609402.pdf析,基于社会科学理论探讨了中文维基百科政策环境制定与

© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net

5  讨  论

以上我们从时间演化和结构层次两个方面分析了

中文维基百科发展及政策环境 ,在此基础上我们可以

对维基百科政策环境的制定过程、维护特点和作用原

则进行定性探讨。

 5. 1  政策的制定 在中文维基百科中 ,方针与指引

主要有三个来源。第一 ,由吉米·威尔士或维基媒体理

事会 ( Wikipedia Board) 制定及颁布 ;第二 ,一项政策性

的提案经过讨论取得共识之后被采用为方针或者指

引 ;第三 ,来自逐渐演化出的常规或惯例。准备正式化

的政策观点会在互助客栈、邮件列表以及相关的条目、

讨论页上公布广告 ,持续合理的时间 ,并且在所有反对

意见都已经妥善处理之后 ,才可能成为正式方针指引

的一员。在一般情形下 ,维基百科中的重大决议都要

经历严格的制定过程 :共识—讨论—投票。即如果用

户不能对此达成广泛共识 ,要在得到充分讨论的前提

下 ,最终不得已通过投票决定 ,影响越大的决议 (如管

理员任命、方针的通过) 需要的投票支持比例越高。特

别是对于方针与指引 ,维基百科十分慎重。在有关投

票流程的页面中规定 :如果投票是关于方针 ,宜先在互

助客栈得到足够的讨论 ,然后按照多数人的意见发起

投票。值得注意的是 ,中文维基百科中关于投票能否

代替讨论仍没有达成共识 ,而且针对不同问题的投票 ,

票数比例达到多少才可以通过投票的争论一直没有停

止过。这表明维基百科的政策制定要求其来自最广泛

的用户共识。

 5. 2  政策环境的施行与维护  维基百科的方针指

引主要来自于用户的实际编辑过程 ,又在更多用户的

参与下进行修改和完善。根据公共产品博弈理论 ,内

生规则生成面临两难 :所有人都可以在缔结的约束规

则中获益 ,但同时每个人又都会在只有他人缔结规则

时得到更多利益[14 ] 。面对这种可能 ,维基百科通过一

致共识类政策保证参与用户最大程度对政策的认可。

对于不想参与贡献的注册用户 ,维基百科通过强调共

同目标对之进行激励 ;对于有破坏行为的用户 ,维基百

科的管理员 ( Administrator) 和行政员 (Bureaucrats) 保

留对其封禁的权利。

用户的积极参与也是方针与指引得以贯彻的重要

动力。从图 8 中可以看到用户的编辑对象正在从对条

目转移到其他命名空间的页面 ,以更好的实现协作。

对政策页面的编辑和维护也在这样的趋势中得到加

强。在一项方针或指引得到充分讨论并达成共识后 ,

用户对其仍有讨论与编辑的权利。用户在开放的维基

社区中既是创建者又是参与者 ,自觉创编并维护页面 ,

尤其是大量编辑层次不高的“非核心”用户 ,逐渐形成

维基百科的中坚力量。除了主观意愿外 ,我们参考了

公共产品博弈的“红后机制 ( Red Queen Mechanism)”,

认为日益成熟的用户社区 ,是促使用户更多参与公共

服务的动力。根据“红后机制”,个人为了保证自己在

社群中的利基 (Niche) ,需要与社群他人保持一致的目

的和行为[15 ] 。维基百科很重视用户社群的建设 ,其技

术与文化环境为形成强健的用户关系社群提供了便

利。如在“分类 ( Category)”命名空间中有专门为不同

维基用户社群设定的模板 ,来自不同地区或者保留有

不同兴趣爱好的用户团体可以通过自身标识列表聚集

并拓展社群。这些基于不同组织原因的社群使得维基

百科的用户保持有强大的编辑兴趣。

 5. 3  政策环境的基本原则  中文维基百科有四个

最基本的原则 :“不偏颇的中立观点”、“不侵犯著作

权”、“维基百科是百科全书”和“尊重其他参与者”。与

中文相比 ,英文维基中在此四个原则外还有“维基百科

没有硬性规定 ( Firm rules)”这样一条指引。全部这五

条原则被称为维基百科“五大支柱 ( Five pillars)”。实

际上 ,尽管中文维基百科的用户对于“没有硬性规定”

尚未达成共识 ,在其方针与指引的施行过程中 ,却一直

保持着灵活和开放。如上文提到的投票流程 ,针对每

一个具体问题都讨论了该指引的不同施用程度。我们

参考了社会科学理论 ,认为中文维基百科政策是“软家

长主义”原则的实践者。

561

J o ur nal of Int elli ge nc e No . 2 ,2009                情报杂志 2009 年第 2 期

Page 7: 中文维基百科演化趋势与政策环境结构研究 3or.nsfc.gov.cn/bitstream/00001903-5/105167/1/1000001609402.pdf析,基于社会科学理论探讨了中文维基百科政策环境制定与

© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net

所谓软家长主义就是不对任何真实的决定进行干

预 ,只对削弱的决定 :即“强制 ,虚假信息 ,兴奋或冲动、

被遮蔽的判断 ,推理能力不成熟或欠缺”的结果进行限

制和干预。这个理论的依据是 :人们可能做出的选择

并不能反应他们的愿望和偏好 ,信息的缺乏、不成熟或

不自愿都能阻碍愿望的实现。为了当事人的利益并且

在不违背其实质意愿的前提下 ,机构可以对其行为进

行干预 , 而干预的最佳手段就是促使其实现自治

(Autarchy) [16 ] 。

在维基百科的政策环境中 ,激励合作和操作规则

构成了首要的政策条目。维基百科从不禁止某种言论

的发表 ,但反对不中立的观点、不理性的争论不休。

“回退不过三原则”就是很好的行为控制却不伤害内容

中立的政策例证。该方针 (尚未达成共识) 规范了任何

用户在 24 小时内互相删除内容的回退操作不得超过

三次 ,这种干预并不伤害意见的表达 ,因为不停的回退

历史已经可以表明用户的观点 ,但是通过有时限的编

辑控制可以有效保证维基百科的公平环境。类似的

“软性规则”使维基百科的政策环境表现出严格、公正、

开放、高效的特点。

6  结论与展望

本文发现 ,中文维基百科在经历指数增长的变化

后增长速率趋于缓和 ,维基用户的注意力逐渐从对新

条目的编辑转移到对既有条目的维护和基于功能性页

面的用户协作中。在政策环境内部 ,有些政策对于其

他政策具有规范性作用 ,基础指导类的政策被引用次

数较高 ,内容说明与行为控制的政策也具有较高的被

引用率。这些类型的政策构成了中文维基百科政策环

境的重要部分。日益成熟的用户社群是用户积极参与

行为的重要保证 ,而维基百科的“软性政策”也激励了

用户的知识贡献和交互协作。

本文对中文维基百科政策环境的揭示限于结构描

述 ,尚欠缺对政策环境的深度分析和政策的使用效率

的评价。未来的工作我们试图从两方面着手 :a. 通过

比较中英文维基百科的政策环境 ,发掘中文维基百科

政策环境的特点和演化规律 ; b. 通过揭示政策使用与

用户行为的关系 ,发现新型网络环境下开放的用户社

区的管理理论。参 考 文 献

1  Bryant S , Forte A , Bruckman A. Becoming Wikipedian : Transfor2

mation of Participation in a Collaborative Online Encyclopedia [ A ] .

Proceedings of ACM GROUP : International Conference on Support2

ing Group Work[ C] ,N Y: ACM , 2005 : 1 - 10

2  Forte A , Bruckman A. Scaling Consensus : Increasing Decentraliza2

tion in Wikipedia Governance[ A ] . Proc. of the 41st Hawaii Inter2

national Conference on System Sciences [ C ] . Hawaii , 2008 : 157 -

167

3  Stvilia B , Twidale M ,Smith L ,et al. Information Qualit y Work Or2

ganization in Wikipedia[J ] . JASIST ,2007 ,59 (6)

4  Viégas F , Wattenberg M , Mc Keon M. The Hidden Order of

Wikipedia [ A ] . Lecture Notes in Computer Science [ C ] . Heidel2

berg : Springer Berlin , 2007 :445 - 454

5  Viégas F , Wattenberg M , Dave K. Studying Cooperation and Con2

flict between Authors with History Flow Visualizations[ A ] . Proc.

of the SIGCHI Conference on Human Factors in Computing Systems

[ C] . N Y: ACM , 2004 :575 - 582

6  Viégas F , Wattenberg M , Kriss J ,et al. Talk Before You Type : Co2

ordination in Wikipedia[ A] . Proc. of the 40th Hawaii International

Conference on System Sciences[ C] . Washington : IEEE Computer

Society ,2007 :78 - 87

7  Kittur A , Suh B , Pendleton B ,et al. He Says , She Says : Conflict

and Coordination in Wikipedia[ A] . Proc. of the SIGCHI Conference

on Human Factors in Computing Systems[ C] . N Y:ACM ,2007 :453

- 462

8  Suh B ,Chi E , Pendleton B ,et al. A. Us vs. Them : Understanding

Social Dynamics in Wikipedia with Revert Graph Visualizations[ A] .

IEEE Symposium on Visual Analytics Science and Technology[ C] .

Washington : IEEE Computer Society , 2007 :163 - 170

9  Suh B , Chi E , Kittur A ,et al. Lifting the Veil : Improving Ac2

countability and Social Transparency in Wikipedia with WikiDash2

board[ A] . Proc. of the Twenty - sixth Annual SIGCHI Conference

on Human Factors in Computing Systems[ C] . N Y: ACM , 2008 :

1037 - 1040

10 Buriol L , Castillo C , Donato D , et al. Temporal Analysis of the

Wikigraph[ A] . Proc. of the 2006 IEEE/ WIC/ ACM International

Conference on Web Intelligence [ C] . Washington : IEEE Computer

Society , 2006 :45 - 51

11 Almeida R , Mozafari B , Cho J . On the Evolution of Wikipedia[ A] .

Proc. of ICWSM[ C] ,2007

12 Kittur A , Suh B , Pendleton B ,et al. Power of the Few vs. Wisdom

of the Crowd : Wikipedia and the Rise of the Bourgeoisie[ A] . Proc.

of the 25th Annual ACM Conference on Human Factors in Comput2

ing Systems[ C] ,2007

13 Beschastnikh I , Kriplean T , McDonald D. Wikipedian Self - Gov2

ernance in Action : Motivating the Policy Lens [ A ] . Proc. of

ICWSM[ C] . Association for the Advancement of Artificial Intelli2

gence ,2008

14 Kosfeld M , Okada A , Riedl A. Institution Formation in Public

Goods Games[ EB] . Social Science Research Network Electronic Pa2

per Collection at : http :/ / ssrn. com/ abstract = 930011 , 2006 - 9 -

14/ 2008 - 9 - 5

15 Hauert C , Monte S , Hofbauer J ,et al. Volunteering as Red Queen

Mechanism for Cooperation in Public Goods Games[J ] . SCIENCE ,

2002 ,296 :1129 - 1132

16 Pope T. Counting the Dragon’s Teeth and Claws : the Definition of

Hard Paternalism[J ] . Georgia State University Law Review ,2004 ,

20 :659 - 722 (责编 :刘武英)

661

情报杂志 2009 年第 2 期                    J o ur nal of Int elli ge nc e No . 2 ,2009