日期:2023-01-12 阅读量:0次 所属栏目:档案管理
1 数字档案馆元数据标准的概念和功能
元数据,即“Metadata”,指“长久的、在领域内或领域间支持文件的形成、注册、分类、利用、长久保存和处置的结构或半结构的信息”。[ ]而元数据标准指“说明元数据元素之间关系的逻辑方案,通常建立元数据的语义(使用和管理规则)、语法和值的完备性等”[ ]。元数据标准核心功能是推动数字档案馆系统间元数据的互操作。元数据互操作指“元数据可以在不同机构和不同类型的信息系统之间顺利地移动和交换”[ ]。在互操作过程中,必须首先明确采用何种方式、语言(例如XML),如何解释元数据等一系列问题,系统之间才能顺利地理解交换的元数据。元数据标准就是对这些问题进行说明和规定的规范性文档,内容包括元数据值的定义方式和语义、值列表、分类词表、控制词汇等,以确保交换元数据的质量和一致性理解。
2 国际数字档案馆元数据标准的主要类型及项目
数字档案馆应用的元数据分为三类,包括:①档案机构移交的电子文件管理元数据;②数字档案馆对接收档案著录形成的著录元数据;③数字档案馆在保管电子档案过程中形成的长久保存元数据。
2.1 文件管理元数据标准及项目。文件管理元数据标准的研究具有代表性的是美国电子文件专家戴维?比尔曼(David Bearman)主持的“电子文件保管证据性功能需求”[ ],该项目目标是明确确保电子文件凭证性所必需的元数据。该项目贡献包括:①提出元数据的权威来源:提出从国家法规标准等文献中总结出电子文件的凭证性需求,继而从具体需求推导出相应元数据的方法[ ];②建立元数据标准模型:提出元数据业务交流模型(Business Acceptable Communications)(以下简称“BAC”),可用于指导元数据标准制定。在澳大利亚,莫纳时大学学者苏?麦克米希(Sue McKemmish)开展了元数据研究和训练项目(Research and Training Project),该项目在文件连续体理论基础上提出“法规三元组”模型,将元数据划分为四大实体:业务、责任者、文件、法规标准,并分别研究了这四大实体应具备的基本元数据元素。这种创新性的元数据模型超越了对文件本身的描述,也描述文件的职责、政策、人员、业务活动等,促使人们对电子文件管理元数据的认识上升到一个新的层次。该模型也被写入国际标准化组织ISO 23081元数据系列标准。
2.2 著录元数据标准及项目。著录形成的条目其实就是元数据,国际著录元数据标准以国际档案理事会(ICA)颁布的标准为代表,主要包括:
(1)国际通用档案著录规则(以下简称“ISAD”(G))。该标准主要用于数字档案馆电子档案元数据著录,包括二十六个元数据元素,七大著录项(标识、背景、内容和结构、利用和使用条件、相关材料、注释和著录控制)。
(2)档案责任者规范记录标准(简称“ISAAR”(CPF))。该标准主要是针对档案相关的责任者背景信息进行著录,包含四大著录项(标识、说明、关系和控制)。该标准不仅提出著录责任者元数据信息在信息交换时,作为检索点上的重要意义,也提出了单独捕获和维护档案背景信息元数据,并且保持和档案自身著录元数据信息链接的重要性。
(3)档案职能著录规则(简称“ISDF”)。该标准主要是对机构业务职能进行著录的元数据标准,该标准对职能的定义是由法律、法规、政策授权的,确保组织机构可靠性的责任、职责或任务[ ]。该标准提供四大著录项,二十三个元数据元素对职能信息进行著录,包括职能类型、名称、分类、职能日期、详细说明、相关职能等,既可以著录机构的高层次社会职责,也能够记录某一次业务活动。
2.3 长久保存元数据标准及项目。长久保存元数据标准最具代表性的是国际联机计算机图书馆中心(OCLC)2003年发起的长久保存元数据实施战略项目,发布了《PREMIS长久保存元数据数据字典》[ ]标准,已成为国际长久保存领域事实上的标准,全世界已经有48家机构正式注册为PREMIS标准的用户[ ],其中包括美国电子文件档案馆、瑞士国家档案馆、苏格兰国家档案馆、新西兰档案馆等多家机构。PREMIS标准将长久保存元数据抽象为五个实体:知识实体(Intellectual),对象(Objects)、权限(Rights)、主体(Agents)和事件(Events),并对后四个实体的元数据进行了详细说明。
3 国际数字档案馆元数据标准的现状分析及未来趋势
3.1 以文件元数据为主体的标准体系初步形成。 从目前国际对这三种元数据标准的研究来看,文件元数据标准是主体,因为文件元数据标准中蕴含着丰富的文件软硬件形成环境、业务职能背景、责任者等信息,因此,立档机构如果遵照科学的文件元数据标准,移交完善的文件元数据,那么,数字档案馆只需在文件元数据基础上,补充部分的后端著录元数据,以及长久保存过程(转化、迁移、利用)中形成的元数据即可。而且从这三类标准来看,标准之间存在元素重叠的现象,因此,元数据完全可以由立档机构一次生成,数字档案馆重复使用。强调文件元数据标准在标准体系中的重要作用在于:①确保电子档案的凭证性,文件的形成环境,即所谓的前端,是确保电子档案凭证性的关键点,文件元数据标准可以控制前端的凭证性;②促使数字档案馆工作重心发生改变:数字档案馆工作重心可以转变为在已经生成的文件元数据基础上,对其进行验证和补充后续元数据,而不必像以前那样从头开始著录,避免浪费人力物力,而可以把精力放在更有价值的工作上。 3.2 元数据标准模型的兼容性不断增强。早期,文件、著录和长久保存元数据标准的研究是并行和相对独立发展的,随着领域之间合作的增强,现代元数据标准越来越有统一的趋势,最明显的特征就是元数据标准模型的设计思想越来越接近。以文件和长久保存元数据标准的模型为例进行比较说明,如表1所示。
如表1所示,文件管理元数据标准模型以ISO 23081标准[9]“法规三元组”模型为代表,长久保存元数据标准模型以PREMIS模型为代表,两者比较发现:两个模型都采用了实体关系法描述元数据,实体即“任何存在的,或过去存在的,或可能存在的具体或抽象的事物,包括这些事物之间的联系”[10],元数据标准采用实体来抽象和提炼元数据描述的对象,例如ISO 23081模型将文件元数据描述对象简单抽象为四个实体,即:文件、主体、业务和法规标准实体,其中每一个实体都应配备相应的元数据,例如文件实体应配备文件题名、形成时间、主题等元数据。同样,PREMIS模型也对长久保存元数据描述对象抽象为知识、对象等五个实体。从这两个模型的实体分类来看,存在一定的对应关系,例如两个模型都提出应具备主体(Agents)、业务(Business)两个实体,虽然实体的语义略有区别,但是其基本思想是一致的,都强调主体(人员或系统)、业务事件元数据在文件管理和长久保存活动中的必要性。而其他实体,例如文件、法规标准、权限实体等也都可以找到类似的对应实体。
这种模型实体之间的对应关系,体现了元数据标准之间对于元数据分类、功能的一致理解,这也促使标准的兼容性增强,元数据元素映射、交换等一系列工作简化。并且从目前文件管理元数据和著录元数据标准的模型关系来看,两者之间的发展更是紧密,早期文件元数据标准BAC模型和著录元数据标准ISAD(G)的多级著录模型相差较远,但当ISO 23081模型出现后,现在两种标准采用的模型基本一致,这种一致性会减少多样化,简化数字档案馆标准应用和管理,正如著名学者Cunningham指出的,“我们需要的是一套互相关联的文件管理和档案著录元数据标准”[11]。
3.3 元数据标准的未来走向和研究趋势。数字档案馆元数据标准未来主要有两个热点方向,包括:
(1)专业化元数据标准研究。目前元数据标准多应用于政府机构文书类型的电子档案,应当研究和评估这些研究成果是否能够适用于那些非文书类型的电子档案,例如图像档案、电子邮件等,虽然国际电子文件真实性项目InterPARES2[12]曾经研究过艺术领域电子档案的长久保存元数据问题,但未取得一定的标准化成果,该领域仍需要更多挖掘。
(2)面向用户利用的元数据标准。数字档案馆元数据标准中一个重要的研究领域就是制定能够反映用户利用需求的利用元数据标准。目前,在数字档案馆的所有元数据标准研究中,唯独缺少利用元数据标准。利用元数据就是指能够反映不同领域用户的利用需求,用于检索和查询档案的元数据。数字档案馆保管档案会被不同领域用户所利用,不同领域的用户可能需要各种不同的元数据信息来理解和利用档案材料。开放档案信息系统模型项目(OAIS)曾提出定义元数据来理解和利用档案,但是需要哪些元数据,并未明晰。国际多伦多大学、密西根大学合作研究项目AX-SNet(Archival Excellence in Information Seeking Studies Network)[13]致力于明确档案用户利用需求,但未出现有影响力的成果。利用元数据标准开发的难点在于对数字档案馆不同用户群利用方式的理解,包括档案的目标利用者是谁、其利用档案的偏好、需要哪些类型的信息来正确、深入地理解电子档案等。但是基本可以明确的是,利用元数据将基于文件和著录元数据基础之上构建。
本文链接:http://www.qk112.com/lwfw/guanlilunwen/danganguanli/146011.html上一篇:档案学期刊知识交流效率评析