电子出版控制的一项工具:DOI系统

DOI系统出现的背景
 由于因持网的广泛普及。许多出版商开始从事网络出版。但是,从版权所有者的角度考虑,电子资料可以或经过授权,或不被授权,就可任意发行给大量的受众。这种盗版的现象在软件和音乐作品中已屡见不鲜,从而使原有的版权所有者蒙受重大经济损失。

  从网络用户的角度来说,因特网的出现既为人们的交流、寻求信息提供了便利,但也为信息的查寻带来了混乱。网上内容不仅难找,或者虽能被找到,但被寻找的对象却不再存在。目前的一些搜索引擎在检索文献时都存在着大量的这类问题。造成这一状况的部分原因是因为因特网的容量庞大。

DOI系统的结构
  由于上述这些原因,美围出版商协会(AAP)于1994年建立了“技术实现委员会”来设计一种既能保护知识产权又能实现版权所有者商业利益的系统。决定第一步先引进一种行业性标准的电子出版内容识别符以支持出版商与用户之间各种系统的相互转换,为版权与使用权之间的协调管理提供基础。该系统以美国全国研究创新联合会(CNRI)研发的“处理系统”作为支撑技术,用来对数字化出版物提供持久和可靠的识别符。这一系统在1997年法兰克福图书博览会首次亮相,1998年的法兰克福图书博览会中继续展示,引起了出版界的重视。

  DOI的全称为Digital Objects Identifer,意为数字化对象识别符,是一组由数字、字母或其他符号组成的字符串。包括前缀和后缀两部分,中间用一道斜线区分。前缀由识别符管理机构指定,后缀由出版机构自行分配。

  前缀又由两部分组成,中间用一个圆点分开。第一部分有两个字符,代表该DOI由哪个名址管理机构分配。目前因为只有一个识别符管理机构,所以总是1、0两个数字。以后可能会有多家管理机构,例如一个国家一个,或一个行业一个(如出版、摄影、音乐、软件等行业)。前缀的第二部分代表被分配使用该DOI前缀的出版执构,或在识别符管理机构进行登记的、任何欲对其数字化对象实现控制的版权所有着。

  后缀由出版商或版权所有者自行给定,是一组唯一的字符,用来代表特定的数字化对象。许多出版商选用已有的识别符号作为后缀,如ISBN、ISSN等。试举二例:
① 10·1000/1
② 10·1016/SO 921877797000232
例①是DOI系统在Web上的主页识别符,前缀是10·1000,后缀是1。
例②是Elsevier科学会一份杂志上一篇文章的识别符。其后缀用的是出版商款目识别符(PⅡ)。

DOI系统的运行原理
  ISBN、ISSN等现有的标识符用于纸介质的出版物中,无法提供电子环境中各种识别与贸易的要求。而DOI系统是专门用于标识数字化资料的。简单来说,其原理是:在一个数字化对象产生时或产生前,对其贴加一个唯一的和持久的标识符,以此对该数字化对象的全部生存期提供一个标签,而与该数字化对象的具体位置无关。

  所谓的数字化对象,是任何在计算机中有地址可寻的、机器可读的文档。包括计算机程度、数字化的全部文档、数字化音频、数字图像或视频、或其他被数字化的资料。

  DOI系统运行的理想境界是:DOI将作为数字化对象被描述数据的一部分,始终与该数字对象并存。一个DOI记录,同该数字化对象的具体位置的信息一起被送往DOI 中心服务器,得到登记、进行存贮。这种被集中存贮起来的数据形成了一个数据分辨库。利用特殊的软件这一数据库可以链接、或分辨某个DOI,使其与同其有关的数字化对象的位置联系起来。当用户寻找一个数字化对象。或有关这一对象的信息,DOI问询就会被传送到DOI服务器,该服务器寻找到DOI的记录及同其有关的对象的地址,将二者链接起来,将其位置(大部分是URL)送回给用户浏览器。然后浏览器自己检索这两个对象或有关该对象的信息,将结果显示给用户。其过程同寻找URL一样快捷,但增加了检索那些频繁变化URL的数字化对象的机会。

DOI系统的管理
  目前DOI系统由非赢利性的国际DOI基金会管理,由一个董事会监管。董事会的成员是一些大出版商的代表,包括微软公司、Elsevier、John Wiley&Son等公司,以及为促进出版商利益而成立的一些协会的代表,如AAP、英国的作者许可与版权协会、图际科学技术与医学出版商协会等。这些机构每年为基金会提供10万至30万美元的会员费。

  出版商在基金会登记DOI前缀时,目前约需1000美元。一个出版商既可登记一个前缀,也可为其不同的子公司注册不同的前缀,数量不限。

  DOI系统建立时,基金会希望通过良好的组织和严格的规则来进行管理和运行。因此在开始的时期只允许一些大的、或者信誉良好的出版机构为对DOI的分配。并且在规则中制定了参与这一系统的各项要求,以保持与专门的URL链接的准确性与有效性。

  当出版商将其产品版权转让或出售时,也即某一数字化对象的位置发生了变化,该出版商应将这一对象改变的信息送到DOI服务器,该服务器将自动更新,中心服务器将会保持数据的完整。

DOI系统的评价
  DOI系统为出版商提供了一个既能用于出版物的内部管理,又能进行数字化商务的工具。它对文件检索、票据交换,、出版许可等电子出版日常的交易程序提供了自动化管理的工作基础。

  在迅速变化的电子出版世界中,由于信息所有者的变化,电子文档的位置变化频繁,需要提供一种技术,以保证虽然被链接的版权所有者的出版时间和地点有了变化,其识别符仍能保持一种持久性。图此,DOI系统提供了一种识别途径,为读者或用户将相关的资料链接在一起。由于DOI对所有形式的知识内容都适用,因此可以对文章、图书、课堂实验、数字化视频、音频数据、电子文档等相关的各种形式都可进行键接、检索。DOI系统这种保持追踪文献当前地址的能力,可以使用户从一个出版商的产品,如书目数据库或文章引文,链接到另一出版商的对这一数字化对象所作的文摘或全文中,尤其在使用那些在服务器之间来回转换的文件、新版的软件、不同文档格式的数字化音乐作品、或经过修改或增加内容的科学文章中特别有用。

  但是,虽然DOI系统具有一些优越性,但从学术界的眼光分析,它还不是一个完美的系统,其存在的主要问题是:

  1.它未能提供一个人人都能使用的、稳定可靠的、用得起的标准的系统。DOI系统对那些大出版商会很有帮助。可以支持他们在网上的商业性交往、保护他们的知识版权。但这些出版商生产的产品只占网上能够获得的所有资料的一部分。此外,在DOI系统引入之前。他们的资料已经比较稳定,得到了较好的控制。

  这就意味着在同上出版的大部分成员没有直接参与DOI系统。既然URL的稳定性和因特网上的出版物缺乏持久性的最大问题来源于其他出版者,这就说明网上出版的混乱局面仍将无法得到有效的控翻。

  2.DOI系统对各种出版商的网络出版对象进行持久性的识别提供了一个可靠的途径,但是如果大多的非正规的出版机构也被允许加入到DOI系统中,系统有可能因为积累大量不存在的对象的识别符而导致崩溃。但从另一方面来说。如果不允许那些非正规出版机构参与到DOI系统中,他们有可能被迫建立一个类似的系统,具有同样的持久性,自己对这些系统进行管理以保证质量。但并不是各种类型的出版商都能花得起时间、金钱来经营像DOI这样一个复杂的、需要不断进行信息更新的系统的。而因特网上的大级分信息却是由这些机构提供的。

  3.DOI为出版商创造了一个系统。既可以保护出版商免遭滥用数字化资料而蒙受严重的经济损失,又可以继续有益于公益性机构的使用。但是DOI 有可能妨碍用户它联机出版物的公开获取,尤其是对商业性出版物。因为读者对DOI的查询,除非获得授权检索,大多数得到的可能只是各种出版物的清单。而非直接被查询的出版物。如果最终用户发现DOI成为获取学术性信息的障碍。他们就有可能倾向于去寻找那些非正式的文献源,如目前出现的越来越多的预印文档。

[时间:2001-01-13  作者:陈燕  来源:中国出版]

黄品青微站