日期:2023-01-24 阅读量:0次 所属栏目:信息管理
【内容提要】数字档案馆是数字信息时代档案传递和利用的新途径。数字档案馆与传统档案馆相比有着极大的优越性,然而它也存在着不少缺陷。在数字档案馆的建设中面临着诸多不容乐观难以解决的问题,对此我们要有清醒的认识。本文提出了数字档案馆建设所面临的10个方面的问题。
【关 键 词】数字档案馆/问题
【 正 文】
随着现代信息技术的迅速发展和大量电子文件的产生,数字档案馆的研究和建设成为我国档案界关注的热点。数字档案馆与传统档案馆相比,有着丰富的数字化资源、海量的存储、便捷的检索、快速的传输、高度的开放、信息的共享等优点,使传统的档案馆望尘莫及。然而,它也不可避免地存在一些缺陷和不足,有的甚至可能是致命的缺陷。因此,我们应该清醒地认识到数字档案馆存在的缺陷,数字档案馆的建设还存在着诸多的难点和问题亟待深入研究解决。如果对存在的问题视而不见,或掉以轻心,必将给未来的档案事业留下巨大而无法弥补的遗憾。
1 数字档案的凭证价值问题
档案的基本价值有两方面,凭证价值和参考价值,而尤以凭证价值最为重要,虽然,“目前人们对数字化档案具有参考价值这一点已无疑义,然而,由于一系列技术和立法问题还未解决,数字化档案目前还不具备法律凭证效力”[1]这无疑使数字档案的作用大打折扣。因此,确认数字档案的凭证价值就成为数字档案馆建设中无法回避的难题。目前,主要存在以下几方面的问题:
1.1 认识上的问题。数字档案不具备“白纸黑字”的直观性,必须依赖特定的计算机设备加以解读。数字档案完全脱离了以往人人对档案“原件”的认识,从而引起人们对其原始性、可靠性的怀疑。而且,有些数字档案即使载体保存完好,内容亦可能在无形中丢失,它不像纸质档案那样载体与内容“一损俱损,一荣俱荣”。数字档案与以往其他载体的档案都不一样,从甲骨档案到简牍档案再到纸质档案,只是载体的耐久性有差别,并没有改变其直观性,而数字档案的非人工识读性与其他载体的档案有着质的区别。要确认数字档案的凭证价值,恐怕不仅仅是改变观念的问题,要真正认识数字档案,确认其凭证价值,可能还需要走很长的路。
1.2 技术上的问题。数字档案是高新技术的产物,它给人们带来极大便利的同时,也给人们留下了困惑与难题。其一,数字档案具有易复制、修改、删除的特点,使得档案“原件”的概念变得难以确认。其二,计算机硬、软件技术不断更新换代,迫使数字档案必须不断适应新的“生存环境”,不断地变换载体、格式,因而无法通过载体、格式的鉴定来判定其原始性。其三,数字档案不再具有特定的字迹,人们可以根据需要以不同的字体、字号将其输出,传统的字迹鉴定技术无法分辨数字档案的原始性。其四,数字档案对背景信息和元数据具有很强的依赖性。“电子文件的背景信息常常与文件内容信息相分离保存,一旦失去背景信息,文件的内容即便仍有意义,但也不再具有凭证价值。元数据是电子文件、电子档案所特有的,“元数据由于其隐含性而易被忽视,而元数据一旦丢失或破坏,电子文件的原始性就会改变。”[2]
1.3 管理制度上的问题。“传统档案之所以具有凭证价值,在一定程度上取决于严格的管理制度”,而目前“从电子文件的生成到归档都缺乏十分规范的程序化管理,缺乏严格而科学的标准体系和业务管理制度,一些标准、制度虽已制定,但全面推行尚需时日”[3]而且也有一定的难度。
2 数字档案信息的长期存取问题
数字档案信息的长期存取问题是数字档案馆建设的一个具体而又棘手的难题。“据报道,美国航空航天局在20年前发射的‘海盗’号火星探测器上的计算机中,已经有20%的数据完全丢失,还有大约4000卷的统计数据因存储的格式模糊无法读出,程序员也无法保证将其恢复”。[4]数字档案信息长期存取所面临的主要问题有:
2.1 存储的介质材料。“现代介质的存储设备还不可能解决计算机数据存储问题”。[5]一般说来,磁盘的寿命是3~5年,光盘也不过30年左右,与能保存千年以上的纸质载体相比,其寿命相差甚远,而且它还要受到温度、磁场、记录存储格式、硬件配置等多方面的影响,10年前还经常使用的5.25英寸的软盘,现在已经没有一台普通电脑可以读出来。
2.2 机读语言格式。“计算机语言平均每三个月就会问世一种,而语言之间的互换大部分存在问题。很难想象,若干年以后,我们用现行的机器语言描述的数据,还能百分之百的还原”。[6]
2.3 对设备的依赖。数字档案必须依赖于计算机设备才能读出,这个特征对其长期存取带来很多问题:“如设备发生故障、系统瘫痪,电子文件就读不出来;电子文件对其它设备环境的不兼容性,使其只能在某种设备上处理,而不能在其它设备上处理;不同软件环境形成的电子文件存贮在载体上,有时难以互换;电子文件加密后,不解密就无法识别;技术设备更新时,不及时解决格式转换问题,也无法读取等等”。[7]
3 数字档案的失真问题
“档案数字化工作的生命线在于其能够保持档案原貌”。[8]然而,“就目前的研究水平而言,还难以保质保量地完成馆藏档案数字化的任务。如已研制出的ocr扫描输入技术,其平均识别率是95%。这对于追求最大程度真实性的档案来说无疑是致命弱点”。[9]数字化的主要方式是扫描加工,在这一过程中造成数字档案失真的原因还有以下几个方面:其一,技术参数选择不当。针对不同色调、纸质和字迹,有时需调整不同的技术参数,如分辨率、明暗度、对比度等,选择不当会直接影响扫描的质量,造成信息丢失、图像模糊或产生额外信息,客观上造成档案原貌的改变。其二,工作失误。档案扫描是大量的重复劳动,难免有时失误。如扫错档案或打错顺序,或存错,或在建索引时链接错误等,如不及时发现,将直接导致数字化档案失真。其三,转换过程中的失真。在进行数字档案的迁移或在提供利用时,往往需要将扫描后形成的图像文件转换成另一种格式的文件,如果格式选择不当,同样会导致数据发生变化。
4 数字档案信息的安全问题
安全问题是计算机网络世界最为头痛的难题,也是数字档案馆中的重大难题之一。数字档案馆虽然被称之为“馆”,但它的存在更仿佛是一个巨大的没有警察的自由市场,给不法分子带来可乘之机,主要表现为:其一,计算机病毒。网络信息安全的最主要的敌人就是计算机病毒。“国外有人估计,现在计算机病毒的传染每两个月增加1倍。网络病毒的泛滥已对计算机网络系统构成严重的威胁”。[10]其二,计算机黑客。由于网络的加密性和匿名性,使入侵者难以被发现。黑客对信息资源的攻击,不仅仅是好奇和自我挑战,程序设计高手可以篡改系统控制参数。其三,有窃取行为的间谍活动,窥视其机密信息进行复制或扩散。其四,有意破坏,摧毁系统的信息处理功能或破坏电子通讯装置。其五,人为或偶然事故造成的威胁。如工作人员操作失误而产生的不可预知的事件、网络系统软件硬件的故障、电子系统故障引发的系统问题等,所有这些,都使数字档案信息的安全变得十分“脆弱”。
5 数字档案馆建设的诸多技术问题
数字档案馆完全是高新技术、电子设备和计算机网络技术支撑起来的产物,离开了高新技术的支撑,就没有了数字档案馆。但是高新技术也给数字档案馆带来了致命的弱点,真是“成也萧何,败也萧何”。诸多的技术问题成为制约数字档案馆建设的难点。
5.1 数字化设备技术条件。网络系统中的硬件技术之一是必须有足够的带宽,以保证快捷地传输文本、语音、图像、影像档案,以便实现多网互连、高速互访,实现跨平台、跨系统、跨语种的互相转换和链接。毫无疑问,足够的带宽条件和用户对网络信息传输的需求将一直是一对矛盾体。
5.2 技术难题。数字档案馆是以信息源、网络、数据库为基础的,其相关技术是较复杂较先进并且不断发展的,它几乎囊括了计算机网络技术所需要解决的所有问题,技术密集。如数字化图像的存储与压缩、数据组织技术、信息检索技术、多语言平台互换互访技术、海量信息存储与调配技术等,既是计算机网络技术的难关,也是制约数字档案馆建设发展的难题。此外,“数字档案馆的建设和运行需要解决一些特殊问题,为此必须开发应用一系列新技术,如:身份认定、智能检索、信息隐蔽、数字水印、电子签章、操作跟踪、信息加密等,其中有很多技术有创新性”。[11]这些技术也都是不容易解决的问题。
5.3 技术过时问题。在飞速发展的it业中,电脑硬件、操作系统、应用软件及存储载体等不断地被新产品所替代,it产品是真正的“短命鬼”。虽然绝大多数新产品承诺向下兼容,但其兼容的“代”数在跨越若干年后,旧的数字信息就很难被新的硬件设备和软件系统读出。“技术过时”的阴影一直会笼罩着数字信息。专家们提出的解决方案是数据迁移,但迁移却存在着一个致命弱点,就是每次迁移总会丢失一定的相关信息,这些丢失的信息积累起来会造成数字档案信息无法准确恢复原貌。
6 数字档案馆建设的标准化问题
数字档案馆建设的目的是要使地区档案馆、全国档案馆乃至全世界的档案馆连成一个整体,以实现档案信息资源共享。这个整体性的数字档案馆事实上是一种基于网络环境下的数字化档案信息资源共享的社会档案馆系统,是一个面向对象的分布式的网状结构模式,是由一个个相对独立的数字档案馆实体组成的。要对这分散在各地的数字档案信息资源进行组织控制,就必须要有彼此兼容的硬件环境,要有一致的文件格式、统一的著录标引标准、数据描述标准、元数据标准、全文数据库标准等等,这些标准也仅仅是几个主要的标准。“而实际上,在数字档案馆建设中,标准化是一个体系,是一个系统,因此对于我们来说,如何结合我国实际,迅速建立起一个适合我国数字档案馆建设的标准化体系是摆在我们面前的一个迫切需要解决的新问题”。[12]然而,要解决这个问题并不容易,我们面临着很多问题:其一,一个严峻的事实是我国档案信息系统没有相应的具体标准可遵循;其二,有些标准规范要超出档案工作的范围,如综合数据处理格式就需满足跨行业、跨部门的要求。如何统一是一个很麻烦的问题;其三,与整个档案工作的标准相衔接的问题;其四,与国际通用标准的接轨问题;其五,由于计算机技术更新速度非常快,每次技术设备的更新,都会对原标准产生相应的影响,因而必须不断适时修订标准。
7 数字档案馆建设的投入与产出问题
数字档案馆建设存在着投入与产出不协调的问题。如果我们把数字档案馆与数字图书馆作比较,会对这个问题看得更清楚。数字档案馆建设投入的费用是巨大的,而且它的建设费用要远远高于数字图书馆的建设费用。由于图书有复本,许多图书馆保存的图书都一样。因而国家图书馆和省市图书馆的部分图书数字化后,其他图书馆特别是中小型图书馆完全可以坐享其成,不必再花费资金重复建设。而档案馆则不行,全国各个档案馆保存的档案几乎都是孤本,因而档案馆在用于档案数字化的费用上要比图书馆多,如,仅档案馆进行数字化档案目录的“工作量约是图书馆的35倍”。[13]但是档案馆的利用人次与图书馆读者的人数相比却少得多,“以北京市档案馆和国家
图书馆(原北京图书馆)为例,前者年利用人次约四五千人,后者一年的读者数不少于二百万人”。[14]两者相差400倍。“即使一、二史馆和中央档案馆三个国家档案馆的年平均利用人次也不过5960人次”,[15]三个馆加起来与国家图书馆相比仍相差100多倍。档案馆的利用长期处于低谷已是不争的事实,就是建成数字档案馆后,这种情况也不会改变多少,因为档案信息有保密和时效的限制,有利用者的限制,并不会增加太多的利用者,更不可能赶上数字图书馆的读者人数。事实上,传统档案馆本来就存在着投入与产出不协调的问题,只不过未引起人们的关注,但是,数字档案馆的建设却拉大了这种不协调的距离,使这个问题凸现出来。它也成为摆在数字档案馆建设面前很难解决的问题。
上一篇:对典型分布式计算技术的分析和比较
下一篇:基于改进遗传算法的自动组卷研究