近年来,随着现代化采油技术和油田建设数字化的发展,我国油田企业信息化整体建设突飞猛进,不断取得新的成果。在信息化过程中,石油开采企业全面提高了其钻井、采油等流程的作业效率。目前,油田信息化已被认为是增强石油开采企业核心竞争力的有效途径,其中数字油田功不可没,已成为提高企业竞争力的重要手段。下面是小编整理的《石油文化数据库与数据管理论文(精选3篇)》,欢迎阅读,希望大家能够喜欢。
石油文化数据库与数据管理论文 篇1:
浅论油田企业节能管理实践
摘要:随着科学技术的不断发展,计算机技术在油气企业中的应用越来越普遍。计算机技术在油田企业中的应用,不仅可以提高油田企业的生产效率,降低油田企业对资源的浪费,同时还可以提高企业的经济效益,節省大量的人力资源。但是计算机数据管理与维护的过程中存在有一定的问题,不利于企业的安全发展,本文针对如何提高油田企业的计算机数据管理与维护水平提出几点有效措施,希望通过本文的分析,能够促进企业健康稳定发展。
关键词:油田企业;节能管理实践;油田计算机数据
油田企业发展过程中,节能管理工作是十分重要的,计算机技术在油田企业数据管理与维护中的应用可以有效提高企业的资源利用效率,减少人力、物力等资源的浪费,从而达到企业节能管理的目标。本文首先针对计算机技术在油田技能管理运用中存在的问题进行分析,然后针对问题提出几点有效建议。
一、计算机技术在油田企业节能管理中存在的问题
随着社会经济的不断发展,石油企业也在不断发展之中,为了提高企业的经济效益,企业会加大对资金、财力、物力、人力等方面的投入,同时也造成了大量资源的浪费。因此企业需要加大对新兴科技的利用,引进各种先进技术。计算机技术就是在此背景下被引入石油企业中的,计算机技术在石油企业数据管理中的应用,不仅提高了数据管理效率,减少了对人力资源的浪费,同时也为企业数据的安全性提供了保障。但是计算机技术在应用的过程中却存在一定的问题。由于计算机技术自身的缺陷以及使用者的疏忽,导致计算机在使用的过程中经常会出现黑客侵入、病毒感染、数据丢失和损毁、员工误删等现象,不利于企业数据管理工作的顺利开展,同时也会为企业造成严重的经济损失。
计算机使用过程中之所以会出现这些不安全问题,主要原因有以下几点,首先是计算机操作人员的问题,油田企业的很多数据管理人员都不具备专业的计算机操作技能,其安全意识不高,因此在操作计算机时会存在操作不灵活,操作错误,导致数据误删、记录混乱的问题。而且在使用计算机的过程中,由于对计算机专业知识的不了解,导致安装很多来路不明的软件,从而为计算机系统带来安全隐患。其次计算机使用过程中为了防止黑客、病毒等软件的侵入,会使用杀毒软件,由于杀毒软件不正规,最后导致计算机无法正常使用。最后石油企业应用计算机来进行数据管理工作时,为了维护企业数据的安全性,会对计算机中储存的数据进行备份,但是现在很多的数据管理人员在使用计算机时会对数据进行备份,一旦计算机系统出现问题,就会造成数据的丢失与损坏。
二、油田企业节能管理实践中如何进行计算机数据的管理与维护
(一)加大对计算机操作人员的培训力度
油田企业计算机数据管理工作中对工作人员的综合能力要求比较高,不仅要求工作人员具备专业的操作技能,同时还需要工作人员具备较高的安全意识,因此企业需要加大对工作人员的培训力度。一方面加强对工作人员的技能培训,使每个工作人员都能够严格按照正确的操作方法来灵活操作计算机,保证计算机数据管理工作的顺利开展。另一方面需要加强对工作人员进行安全意识的培训,使工作人员能够充分了解数据管理工作的重要性,在实际工作中不要存在侥幸心理,加强对数据安全工作的重视,如果出现数据误删等失误操作,可以按照相应的操作方法来进行数据恢复,如果数据无法恢复,则应该立即请教专业技术人员进行帮助,及时的对数据进行修复,避免造成更大的损失。
(二)对计算机系统进行正确选择
油田企业应用计算机系统开展数据管理工作时,应该选择正版的计算机系统,因为盗版的计算机系统中可能会携带病毒,对计算机系统造成危害,正版的计算机系统不仅可以保证系统的安全运行,同时还有完善的售后服务,可以对计算机系统定期进行系统升级和不定安装,从而保证计算机系统的安全性和稳定性。工作人员在安装其他软件时需要对软件进行查看,看是否是正版,是否安全,是否存在捆绑软件,当这些不安全因素都排除后再进行安装,从而保证计算机系统的安全性。
(三)做好计算机数据的安全保护措施
为了保证计算机数据管理工作的顺利进行,保证计算机运行的安全性,工作人员可以进行以下几项安全措施。首先需要安装必要的杀毒软件,定期对计算机系统进行杀毒、清理垃圾。例如360杀毒软件、瑞星杀毒软件等,运用这些软件及时对计算机系统进行杀毒,并及时的对杀毒软件进行更新升级,保证其效果。其次需要对计算机系统安装补丁修复系统,对计算机存在的漏洞进行修复。工作人员需要对计算机定期进行电脑体检,卸载不必要的软件,提高其运行效率,从而保证数据库系统的安全性和可靠性。最后为了避免计算机系统出现故障导致数据丢失问题的出现,工作人员可以对数据库中的一些重要信息、客户资料进行备份,或者是将其存储到网盘或者U盘中,以免数据的丢失。
总 结:
综上所述,随着社会经济的不断发展,油田企业也在不断的发展之中,为了提高企业的经济效益,油田企业应该加大对节能工作的重视,减少对企业的资金、物力、人力等资源的投入,降低企业投入成本,促进企业的可持续发展。随着科学技术的不断发展,计算机在各行各业中都得到了广泛的应用,尤其是在企业数据管理工作中发挥着重要的作用,油田企业数据管理工作中引进计算机技术,可以促进企业数据管理信息化的建设,不仅可以提高企业的数据管理效率,同时还可以节省大量的人力、物力资源,减少对资源的浪费。但是计算机数据管理工作中存在很多问题,不利于企业数据安全的保证,因此企业可以通过提高工作人员的安全意识和计算机操作技能,使用正版的计算机系统,下载正版杀毒软件,对数据进行备份等措施来保证油田企业数据管理工作的顺利开展,从而有效保证企业数据的安全,提高数据管理效率,为企业的发展提供安全、可靠的数据依据。
参考文献:
[1]曹洪涛.浅论油田企业节能管理实践——油田计算机数据的管理与维护[J].商业文化,2014(32):82-83.
[2]任重.油田生产节能管理及绩效评价的研究与实现[D].东北石油大学,2014.
作者:陈伟
石油文化数据库与数据管理论文 篇2:
CommVault一体化平台推动吉林油田迈进数字油田新时代
近年来,随着现代化采油技术和油田建设数字化的发展,我国油田企业信息化整体建设突飞猛进,不断取得新的成果。在信息化过程中,石油开采企业全面提高了其钻井、采油等流程的作业效率。目前,油田信息化已被认为是增强石油开采企业核心竞争力的有效途径,其中数字油田功不可没,已成为提高企业竞争力的重要手段。
作为国家大型石油企业的佼佼者,中国石油天然气股份有限公司吉林油田分公司(以下简称吉林油田)始终将信息化建设作为实现数字油田的关键点,紧紧围绕 “规划引领,业务驱动,试点先行,以用促建”的总方针展开工作。在数十年的信息化建设中,吉林油田持续推进了各项业务的管理创新,在信息系统的建设和应用方面创造了巨大价值,不仅提高了企业的工作效率,更大大增加了企业经济效益和社会效益。
客户简介
中国石油天然气股份有限公司吉林油田分公司为中国石油下属的地区公司,总部位于吉林省松原市,勘探开发和生产区域遍布吉林省20多个市、县(区)。建矿50多年以来,吉林油田在油气勘探方面不断取得重大发现,通过勘探思路创新、地质理论创新和工程技术创新,找到了多个亿吨级油田,发现了松辽盆地南部第一个千亿方气田和两个千亿方含气区。油气产量持续稳定增长,2012年达到780万吨。
2012年是吉林油田“十二五”发展规划实施的第二个年头。随着各个子系统纷纷投入运营并不断开发上线,吉林油田IT运维能力面临的挑战在逐步加大。为实现数字油田的阶段性目标,吉林油田力争在2015底建成一个稳定、高效、智能化的IT资源中心,以保障各业务平台的连续有效运行。
客户面临的挑战
随着数字油田建设步伐的不断加快,资源建设与应用平台建设也在不断完善,包括钻井数据应用系统、钻井数据成果系统、项目研究系统、分析化验信息管理系统以及油田网上图文管理系统等。随着各应用系统不断上线、运行与推广,勘探开发主库逐步建成,数字油田目前已由建设期进入到了初步应用期,保证数据安全以及应用系统稳健持续地运转是运维工作的关键。
但是,吉林油田的信息化平台也存在很多对于数字油田建设的不利因素。油田原有的硬件主要是IBM和戴尔的服务器和存储设备,软件包括了Windows,、AIX等操作系统和Oracle、 SQL server等多种数据库。这些来自于不同厂商的设备和系统使吉林油田的运维队伍在数据量迅速增长的现阶段面临很多问题:需要管理的硬件设备不断增多,具有不同的品牌特性,支撑上层应用环境的系统和数据库越来越复杂,由此带来的运维难度和工作量不断加大。更为严峻的考验是,突发事件随时可能发生,并且运维人员不能随系统的增加而增加。概括起来,目前吉林油田在信息化及运维管理方面面临的主要问题有:数据管理设备庞杂多样,带来较大的运维难度和过量的工时;数据管理缺乏科学有效的机制;没有备份报表,无法了解数据保存状况;无统一备份系统,备份分散;数据恢复过程复杂,速度慢;关键应用和数据信息没有进行特殊保护,有丢失风险;存储资源投资越来越大,但依然无法解决数据不断增长带来的管理问题。
随着数字油田项目即将建成,吉林油田需要建立一套完整的数据保护方案,解决目前存在的问题,同时适应将来的数据管理需求(扩容、旧设备使用等),进而保证各生产系统安全、稳健运行,保护数字油田建设成果。同时,该数据保护方案还要辅助管理员完成常规管理工作,减轻管理压力,提高工作效果,并提供应用层、数据层、OS层、DB层全方位保护以及提高存储设备和网络的利用效率,更好地控制存储增长,降低投入,为数字吉林油田的建设和稳定运行保驾护航。
解决方案
经过对信息化平台基础设施和系统运维现状的深入分析,吉林油田希望借助更有效的解决方案助其全面提高数据管理的效率和整体水平,加快向数字化油田目标推进的脚步。在逐一比较了来自众多供应商的可选方案之后,最终,CommVault Simpana一体化数据管理解决方案脱颖而出,凭借一体化平台和现代化数据管理模式赢得了吉林油田技术专家们的青睐。该解决方案不仅能够帮助吉林油田在现有的设备和资源条件下解决数据管理的难题,对于吉林油田未来的数字化建设更具前瞻性投资回报。具体而言,CommVault解决方案的突出特点包括以下几方面。
第一,一体化数据管理模式。由于吉林油田存储设备的分布相对分散和独立,随着数据的不断集中,主存储的使用效率和运维管理的复杂性逐渐凸显,这种状况严重阻碍了数字油田应用的发展。CommVault Simpana9软件能够极大限度利用原有的存储设备,并将其作为一个统一的存储系统来规划,极大限度减少由于存储设备无法升级等原因造成的浪费,并且大大降低了存储管理的复杂程度,通过减少运维人员工作量减少人工成本,降低总体成本。未来,随着业务主机的不断建设,可在设计结构不更改的情况下对数据进行有效的保护。
第二,智能化管理。CommVault Simpana9可以提供全图形化操作界面,替代原来需要通过大量脚本完成的工作,这样不仅简化了数据管理,还提高了数据的可靠性。随着数字油田建设步伐不断加大,应用系统不断上线,需要的各种硬件设备不断增多,技术越来越复杂繁多,这样的智能化管理很大程度上缓解了只依靠人为管理产生的误差率高和技术难度大等问题。
有了智能化的数据管理,Simpana软件的报告管理功能(CommNet)只需要一次定制便可收到来自软件提供的包括预警报告、备份报告、存储资源报告等上百种日常报告,还能够灵活地定义将其发送给不同级别的人员,让他们及时了解备份系统的各种状态。在这种模式下,Simpana软件使吉林油田的管理员可以轻松应对十几套应用系统的管理,并且能够清楚了解到数据的总量和每日变化量等具体内容。
第三,介质管理:由于油田的磁带库自身没有任何监控与管理机制,对磁带库的使用及健康状况无据可查。通过部署Simpana 9,油田可以对存储资源进行有效的监控,包括磁带库驱动器使用状况、磁带使用状况等,实现系统定期体检与丢失数据的恢复,做到对所有存储资产的有据可查,心中有数。
第四,OS级数据保护。CommVault软件能够对操作系统进行备份。如果系统意外宕机或者由于硬件设备故障造成系统崩溃,应用将停止运行,油田原有的配置由于无准确记载会对生产系统造成严重的后果。这种情况下,Simpana 9利用快速系统恢复功能够使应用服务器快速地恢复到系统最后备份时的正常工作状态,从而使系统停止服务的时间大大缩短,有效提升整个业务系统的业务可持续性服务水平。
第五,核心数据库的保护。根据本地化调研成果,吉林油田建立了一批项目库与专业库,存储的数据非常重要,这就需要配备具有对关键应用和数据进行重点保护的工具。为了保证这些数据资产的安全,CommVault采用RMAN(数据库恢复管理器)对其进行备份和恢复,可以提供全图形化“零”脚本的操作方式,以减少对数据库技术以及对数据库管理员(Database Administrator,DBA)的依赖性,使普通管理员能够很容易完成数据库的备份和恢复工作。
实施效果
目前,CommVault一体化数据管理解决方案出色、稳定的表现得到了吉林油田的好评,油田负责信息化建设的主管部门对CommVault技术人员的高超技术水平和他们的周到服务感到非常满意。经过实践检验,CommVault解决方案堪称吉林油田实施信息化系统建设的理想方案。
实施CommVault解决方案之后,吉林油田得到了超出预想的收益。
第一,大幅缩短了数据恢复的时间。无论对文件还是对数据库,CommVault解决方案均采取基于中文化图形界面的恢复手段,无需管理员写任何脚本。用户也由原来多个管理员(5个以上)配合完成的恢复操作,变成仅由1个专员直接处理文件和数据库的恢复工作。此外,采用恢复演练方式进行备份数据的校验,提高了数据的可恢复性,而且,用户可以在夜里将数据自动恢复到验证主机上,次日由业务人员对数据进行验证,总数据量在1.2TB左右。Oracle的表级恢复功能更能大大缩短恢复时间。
第二,提高抗风险能力。CommVault解决方案采用统一的策略备份所有汇交平台中的应用系统,消除不同应用系统数据备份环节的差异性:通过对数据库及文件的断点续传等技术保障(如Oracle数据库备份恢复的断点续传),将数据保护的成功率提升为98%(原数据备份成功率70%左右);备份作业自动失败重启机制增强了系统的抗风险能力。
第三,减少对管理人员的压力并降低成本。全图形化的管理员可以是备份管理员不是DBA,从而减少了DBA的劳动强度。1名备份管理员即可实现应用系统的统一备份管理,在简化操作的同时降低人员成本。自动的恢复演练也让管理人员对数据安全有了更多的理解,操作更流畅。软件的管理端只需要使用PC服务器,无需购买昂贵的硬件。
第四,简化管理,数据处理过程规范,有据可依。吉林油田的系统在用户权限管理、实时监控和报告、定期的管理报告等方面一举跃升到了现代化数据管理的水平,使IT系统负责部门能够随时掌握整个企业数据中心数据保护状况,提高管理和运维能力,提前完成油田信息化的阶段性目标。
第五,实现了数据的方便交换。各应用系统的数据可以简单、快速交替恢复,大大节省了在数据保护方面的成本,这些都受益于可以结合快照、归档等功能实现数据的全方位管理模式;节省硬件方面的投资,比如磁盘空间、磁带设备和磁带介质等;减少管理人员的投入。
客户引言
“在现代化的油田管理中,信息化扮演着重要的角色。吉林油田能够在短期内将原有的数据管理方式转变为高效、系统化的数据管理模式,得益于CommVault公司提供的先进一体化数据管理解决方案。借助这一平台,我们还将不断完成油田数字化的更高目标,为全面助力油田整体发展贡献力量。”
——吉林油田数据中心总工程师 班毓鹏
客户情况一览表
客户企业所属行业: 石油
应用系统: 钻井数据应用系统、钻井数据成果系统、项目研究系统、分析化验信息管理系统、吉林油田网上图文管理系统等
操作系统: Windows,、AIX
数据库应用: Oracle,、SQL Server
硬件环境: IBM,、Dell的服务器和存储设备
石油文化数据库与数据管理论文 篇3:
数据管理大潮下电子文件管理的挑战与对策
摘要:在国家大数据战略的强力推动和信息技术不断普及的背景下,数据大量形成,相关概念日益普及,数据管理领域迅速发展,形成时代潮流。文章首先解读数据管理大潮,其次梳理电子文件管理面临的挑战,最后尝试分析可能的对策。电子文件管理面临受到数据管理相关概念冲击、海量数据难以归档和管理、在数据管理框架中定位单薄、相关主管部门博弈艱难等挑战,需要建立电子文件与数据管理概念关联,坚定推动单轨制电子文件管理,锻造多元数据管理能力,构建协同发展的电子文件数据管理生态环境。
关键词:数据管理 电子文件管理 数据治理 融合发展
21世纪20年代,在大数据技术快速发展和国家大数据战略的强力推动下,数据概念日益普及,走入中央政府的文件里,走入大众媒体的话语体系中,“数据资产”的价值已经获得广泛共识。数据管理相关政策标准先后出台,行业组织和实践活动日益活跃,围绕着数据展开的管理已经形成了非常大的一股潮流,电子文件管理既是这个大潮的一部分,又受到其强烈的影响。本文首先解读数据管理大潮,其次梳理电子文件管理面临的挑战,最后尝试分析可能的对策。
一、数据管理大潮已经来临
(一)数据海量生成
联合国官方网站指出:“世界上的数据量呈指数增长,约90%的数据是过去两年创造的,预计数据量每年将增长40%。”[1]希捷与IDC预计,2025年全球的数据量将是2016年数据量的十倍,达到163ZB。[2]这预示着电子文件的数量正以惊人速度增长。与此同时,越来越多的新增数据是过去没有的新型形式,换言之是档案部门不熟悉的数字对象,如机器自动采集的科学观测数据、关系复杂的社交媒体数据、内容极为丰富的3D数据等。“大”数据时代已经来临。
(二)数据管理大军集结
在手工管理环境下,图书馆,档案部门(档案馆、档案室)以及传统的情报分析机构是集中保管数据的主力军,处于中心位置。随着信息技术的应用,数据管理主体迅速多元化,单位内部的信息技术中心、数据中心,大数据管理机构、电子政务管理部门、第三方信息服务商等不断出现。[3]在工信部《关于工业大数据发展的指导意见》(工信部信发〔2020〕67号)、国资委《关于加快推进国有企业数字化转型工作的通知》[4]等政策推动下,一些企业设置了新型数据管理部门,大力推动数据治理。在此情况之下,业务数据管理格局已经改变,哪怕是历史业务数据管理领域,档案部门也已经不是独行者,核心位置受到了很大的冲击。比如,全国有20家国家级的科学数据中心,管理着国家最为重要的新型科技电子文件、电子档案——科学数据,但显然已经和档案部门甚少交集。[5]
(三)数据管理技术推陈出新
信息技术的发展可谓推陈出新,新技术不断涌现和迭代,比如版本控制、文档协作、图文转录、自动采集等数据生成技术,数据库、数据仓库、数据湖、数据中台等数据集中存储处理技术,数据挖掘、文本分析、知识图谱等数据分析和开发技术,数字签名、数字摘要、时间戳、区块链等数据真实性维护技术等。近年来机器学习技术的突破性发展带动了人工智能应用的热潮,涉及文件档案管控决策、知识服务和数据化处理的方方面面。这些技术相互叠加融合,呈现出一幅非常复杂的图景。为何新出现的数据管理部门都是技术实力雄厚之主体?原因很简单,新型的、海量的数据管理需要使用与数据特性相匹配的新技术,唯有技术掌握者才能掌控资源。
(四)数据管理政策法规汇拢
在国家开启信息化战略之初,信息资源就被作为重要的要素之一。随着信息化推进,尤其是大数据技术的普及,数据的价值认同达到空前的高度,2020年前后,各类相关政策法规以“数据”为主题标识迅速汇拢。2020年4月9日,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》对外公布,数据作为一种新型生产要素写入文件中。2020年7月和10月,《数据安全法》《个人信息保护法》的草案先后公布,2021年4月《数据安全法》《个人信息保护法》二审稿面向社会公众征求意见,[6]这两部法律将为数据生产要素作用的发挥保驾护航。2016—2020年间,国家先后在政务、科技、工业、文化领域出台数据管理相关政策,包括《政务信息资源共享管理暂行办法》(国发〔2016〕51号)、《科学数据管理办法》(国办发〔2018〕17号)、《关于工业大数据发展的指导意见》(工信部信发〔2020〕67号)、《关于做好国家文化大数据体系建设工作的通知》(文改办发〔2020〕3号)等,推动各行各业数据管理的发展。
二、数据管理大潮下电子文件管理面临的挑战
(一)“一统天下”的数据概念
《数据安全法(草案)》第三条指出:“本法所称数据,是指任何以电子或者非电子形式对信息的记录。”这里的数据概念非常之宽,所有信息记录都是数据。长期以来,档案界一直在文件、档案概念之间争吵不休。毫无疑问,文件也好,档案也罢,都是电子或非电子形式的信息记录,都是数据。随着数据概念的流行,一方面,“文件档案究竟是什么样的数据”的问题日益突出,若回答不清楚这个问题,便无法明确档案部门在数据管理大潮中的定位;另一方面,数据管理的相关概念也随之流行,包括数据归档、数据治理等,将对档案界的概念理解造成冲击,比如数据归档多指不活跃数据的冷存储,与文件归档概念存在较大差异。[7]在这些数据概念的冲击下,档案专业概念面临被淡化、被误解的风险,档案工作的社会角色也面临挑战。
(二)海量数据的归档与管理
新增的海量数据会有多大比例归档?如何选择和留存?档案部门的技术支撑如何?这些是摆在我们面前的迫切问题,能否回答好这些问题,关系到档案部门在未来能否胜任留存数字时代留存社会记忆的法定职责。从大的方面来说,电子文件归档工作面临两大挑战。
一是远超既往数量的海量数据,档案专业系统的底层技术能否支撑归档相关应用。在调研过程中,笔者听说过因归档文件数量达到千万级别导致系统崩溃的情况,这涉及系统技术架构和技术能力。业界此前对电子文件归档管理相关系统的讨论多聚焦于功能,而对技术的先进性、可拓展性则较少涉猎。世界上凡是有影响力的数据管理机构无不立足技术高峰。美国国会图书馆2010年获得twitter授权保存所有推文,历时多年仍无成果对外公布,技术掣肘乃重要因素,这值得我们所有传统数据管理部门重视。[8]
二是缺乏传统档案对应物的新类型数据,这些数据很难“原样”归档,应如何决策。以电子发票为例,发票数据产生时为结构化数据,为了符合人们原来使用习惯的凭证,按照固定表单样式生成版式、加盖电子签名输出电子发票文档。事实上结构化数据已经保留了电子发票的所有内容信息,也可以生成数字签名,从功能而非形式来看完全可以履行交易凭证的作用,所以在电子发票技术界存在是否保留版式发票的争论。再如三维模型包含了之前多份二维图纸的信息,具有高度的复杂性和集成性,在归档时候是将其作为一个简单的对象收过来管,还是到模型的内部去做一些选择和加工?这些都是新时代的新问题,需要我们深入电子文件数据内部,认识数据构成,了解相关规则,逐个场景加以钻研判断。
(三)层次单薄的文件管理定位
文件管理在数据管理中定位如何?对这个问题的回答既有档案界的自我认知,也有外部认知。国际数据管理协会(DAMA International)的数据管理职能框架反映了技术主导的数据管理领域的基本认识。在图1中,一个单位内部所有的数据管理职能活动有三个层次,最高层次是监督层,主要包括对整个数据管理开展战略规划、建立原则和策略等内容的数据治理,以及推动适应数据管理的文化变革。中间层次是我们非常熟悉的生命周期管理,包含规划与设计、实现与维护、使用和增强三类活动。最下面的层次是支撑整个数据生命周期管理的基础活动,包括风险管理、元数据管理、数据质量管理等。“文件和内容管理”属于中间层次“生命周期管理”中的最后一个类别“使用和增强”。其中“内容”指非结构化数据,它是一个技术术语,现有文件档案管理系统大多为非结构化数据管理的产品或解决方案。而在档案界的认知中,文件档案管理贯穿数据整个生命周期,覆盖监督、生命周期管理和基础活动所有层次。目前内外认知差别巨大,层次单薄的定位对电子文件管理的深化发展造成巨大挑战。
(四)艰难博弈中的国家数据治理的格局
上文提及国家对数据和数据管理越来越重视,颁布了系列政策法规,全面覆盖政务、科学、工业、文化等多个领域,但是文件档案体现甚少,且缺乏衔接。比如,《促进大数据发展行动纲要》(国发〔2015〕50号)规定“加强数字图书馆、档案馆、博物馆、美术馆和文化館等公益设施建设,构建文化传播大数据综合服务平台”。但是《关于做好国家文化大数据体系建设工作的通知》(文改办发〔2020〕3号)并未涉及档案馆。这样的局面对于文件档案管理纳入数据管理极其不利。一些地方、个别行业开始寻求突破。如浙江、江西、上海等多地的档案部门将档案共享服务嵌入政务服务平台,启动跨部门跨地区的信息资源共享;2020年10月份颁布的《科学技术研究档案管理规定》(国家档案局、科技部第15号令),首次把科学数据纳入科研文件归档范围中。尽管如此,在国家数据治理的整体格局中,文件档案管理远未占据其应用的位置。
三、电子文件管理的可能对策
(一)塑新思维:建立电子文件与数据的概念关联
电子文件是什么样的数据对象?它与其他的数据对象有何区别?我们通常会说电子文件是电子化业务的信息记录,是业务凭证性、记忆性信息,会强调其固化特性,实际操作时会要求“版式文件”格式存档。然而,一方面,因为电子文件与计算机文件之间并不仅仅是一一对应的简单关系,还可能存在一对多、多对一、多对多的复杂关系;[9]另一方面,计算机文件中包含越来越多地依赖软件实现的功能性要素,比如电子签名、数字摘要、超级链接等。[10]因此,单一的版式格式并不能完全承载电子文件信息保存的历史重任,需要我们对电子文件数据对象有更为全面立体的认知。笔者认为电子文件在更多意义上是数据的逻辑组合,它可以被视作一个动态生长的业务数据体。“动态生长”的意义在于:第一,电子文件的构成和呈现方式并非一成不变,而是要随着环境的变化不断变化;第二,上述变化过程不是被动的转变,而是有规划、有设计的求变,从这个意义上来讲,档案部门参与电子文件的动态变化过程,换句话说参与构建了电子档案;第三,电子文件的归档,并不强求所有要素原封不动留存,而是要根据保存条件和相应规则去选择业务的真实数据,在选择的过程中,部分要素是可舍、可换、可变的;第四,需要用持续的元数据来描述和补充维系业务真实记录的价值;第五,电子文件数据体本身可能有相对灵活的组织和展示的方式,但是,不管具体的组织和展现方式如何,有机关联一直会是文件数据的血脉。在数据世界里,我们需要转换思维,重新认识管理对象,从数据流动生长的过程中观察和积累什么是文件档案管理视角,并以新思维来反哺推动电子文件管理方法的革新。
(二)夯实基础:坚定推动电子文件单轨制管理
文件档案管理是非常有特色、有传统、有积累的一个领域。若要在新兴数据管理中占得一席之地,得有自己的看家本事,即独特的数据管理视角、方法和技能。那么文件档案管理进入数据管理的看家本事是什么?笔者以为就是在单轨制进程中积累的电子文件管理知识技能和方法。一方面,档案界从凭证性保护的角度持续探索数据管理路径,没有其他领域像文件档案管理领域如此重视凭证性业务信息的管理和维护,本领域专注文件对象构成、元数据、四性维护、四性检测等问题,在反复应用和研究的过程中已经逐渐形成一套理论和方法体系。另一方面,档案界也在数字世界里传承和探索文件价值鉴定、维护文件关联的方式方法,这对于数据管理是有益的补充。这些独特的贡献将是我们进入数据管理的基础。在笔者和数据管理部门有限的交流中,也了解到在元数据方案、信息组织、数据真实性维护等方面信息技术领域亦在向文件档案领域学习。
因此,应在国家层面坚定地推行单轨制电子文件管理,在此过程中夯实专业根基、积累经验,将我们的专长扩大化,而不是在犹豫观望中降低对电子文件的管理要求,延误专业知识更新和积累的良好时机。2021年开始实施的新《中华人民共和国档案法》,提出了电子档案“来源可靠、程序规范、要素合规”的法定条件,为电子文件单轨运行、单套保存提供了法律保障。根据调研结果,电子公文、电子发票、工程项目电子质检单等类型电子文件单套制归档正在加快试点,有铺开之势。
(三)多元路线:锻造数据管理的能力
电子文件管理需要依靠以系统为中心的综合体系。然而,摆在我们面前的一个事实是:档案部门普遍缺乏技术实力来接收一些特殊类型的数据实体,比如结构化数据、三维数据、社交媒体数据等对于形成软件有严重依赖的文件,这些文件即便脱离原始环境保存下来,看上去也极有可能在一定程度上丢失原件的风貌。在此背景下,我们管理数据的能力要得到进一步的锻造。笔者以为无论是总体技术路线,还是具体技术应用,都需要着力加强。
电子文件归档的总体性技术路线有两个:一是将其物理归档到档案管理系统来加以管理,这种路线延续了传统档案实体管理的做法;二是电子文件实体仍然留在原来系统当中管控,其部分元数据可能同步传送至档案管理系统中,这种逻辑归档模式是新环境下的新路线,对档案部门的管控提出了很高的要求。比如中石油按照系统中所形成的数据类型将87个统建业务系统划分为综合管理型系统、经营管理型系统、生产运行型系统、连续监测型系统等四大类,对每类系统的数据归档范围、归档方式及长久保存模式制定不同方案。其中,综合管理型、经营管理型系统中的数据采用物理归档方式,而生产运行型系统、连续监测型系统中的数据归档后仍在原系统中保管。[11]逻辑归档提出多年,期间也受到质疑和挑战,目前的迫切任务是落地实施。但是,从长远来看,电子文件终将脱离其形成系统而保存。因此,我们一方面要探索逻辑归档方案中档案部门的管控之道,另一方面,面向电子档案长期保存的系统研发和技术选择将是解决问题的根本之道。
随着大数据、人工智能、区块链等新技术的不断出现和持续应用,一个很自然的问题就是档案部门应该采用哪些数据开发和管理的新技术,强化文件档案数据资产的管理能力,活化文档资源开发?新技术在文件档案管理中应用有三个方向,[12]每个方向都有待探路:一为管控,即文件生命周期全过程的规范化管控提供决策支持,如自动分类、自动鉴定等,在文件数量激增且档案专业人员相对匮乏的情况下,管控智能化给出了破解难题的机会;二为利用,即开发档案内容服务利用需求,如智能推荐、关联检索等,现在的用戶逐渐会用一些互联网使用习惯、体验来要求文件档案服务,如在淘宝上购物时,当用户购买了某个产品之后系统会推荐另外类似或相关东西,那么就会对电子文件、电子档案管理系统抱有类似期待,即在用户利用了一份文件之后推荐相关材料;三为数据化,即将面向人工阅读理解的大颗粒文档加工转变为机器可以识读、理解和计算的小颗粒数据,为文档管控决策和内容开发提供数据基础。这是一个容易为人忽略的基础性领域,然而没有文档数据化,就不会有电子文件管控和内容开发利用的智能化。
(四)推动协同:构建良性的电子文件数据管理生态环境
在复杂的数据管理格局下,管理好电子文件,协同是唯一的选择。文件档案管理领域需要和其他的数据管理主体合作,在合作的过程当中一方面形成合力,联合更多力量推动电子文件管理工作,另一方面扩大自己的影响力,巩固专业领域,促进电子文件管理良好生态系统的养成。
学界和业界非常关心档案部门和政府大数据部门之间的关系,认为应对两者职责分工进行合理的划分和协调。笔者调研过的一些地方档案部门对一网通办背景下政府数据能否以及如何归档表现出较大的担忧。浙江、广东等省份通过《浙江省公共数据和电子政务管理办法》《广东省政务数据资源共享管理办法(试行)》等政策文件对职责分工进行了较为明确的规定,夯实档案部门接收数据归档、保存档案数据的职责,[13]为其他地方类似问题提供了参考。根据调研,在科学研究领域,同样存在档案部门与科学数据管理部门之间关系需要理顺的问题,[14]国家档案局经济科技司牵头推动相关课题的研究,中科院档案馆积极探索科研档案和科学数据管理的协同,通过体制机制创新和技术手段的应用,发挥各自的专业特长,形成互补,成为夯实丰富科学数据档案化管理和科研档案数据化服务的关键。
此外,产学研用全链条的深度合作,也将推动整个行业的发展。一方面,文件档案管理的标准化、规范化的管理方法是文件档案管理系统的良性输入,另一方面,良好的技术和工具是提升文件档案管理水平的數字化手段。这个行业中各类成员之间应加强对话和合作,相关服务商在盈利的同时成长,相关的用户单位在合规中发展,相关的科研教学单位在学科建设、人才培养方面拓展,形成相互支持、同向演进的良好局面。中国人民大学电子文件管理研究中心在此方面进行了初步尝试,2020年12月,该中心和上海鸿翼联合发布了《数据管理中的文件档案与内容管理》的白皮书,其目的是提供文件档案管理与非结构化数据管理涉及的基本概念、主要技术、系统实践等通识性知识,以加强文件档案管理领域和技术领域的对话和合作,推动文件档案管理事业与内容管理行业的共同发展。[15]
在《数据管理中的文件档案与内容管理》白皮书中,课题组提出了文件档案管理框架,如图2所示。在这个框架中,文件档案管理的层次和范围都得到应有的扩展,自上而下包括价值实现层、文档治理层、管理活动层和技术实现层,并贯穿文件从生成到处置或保存的整个生命周期。这是档案界对于文件档案管理定位的描绘,图2和图1的差距就是我们需要着力弥补的地方。希望通过各方努力,我们能够在数据管理世界中从图1出发,构建图2,实现电子文件管理与数据管理的深度融合。
注释及参考文献:
[1]联合国.数据创新促进发展[EB/OL].[2021-02-25].https://www.un.org/zh/sections/issues- depth/bigdata-sustainable-development/index.html.
[2]51CTO.2025年全球数据将攀升至163Z[EB/OL].[2021-02-25].https://www.sohu.com/a/140027985_655957.
[3]刘越男.政策背景下政务文件归档面临的挑战[J].档案学研究,2018(2):107-114.
[4]国资委.关于加快推进国有企业数字化转型工作的通知[EB/OL].[2021-02-25].http://www.sasac.gov.cn/ n2588020 /n2588072 /n2591148 /n2591150 /c15517908/ content.html.
[5]科技部财政部关于发布国家科技资源共享服务平台优化调整名单的通知[EB/OL].[2021- 05- 20]. https://www.sohu.com/a/319669645_726570.
[6]网经社.全国人大法工委披露数据安全法个人信息保护法二审稿修改内容[EB/OL].[2021-05-20]. http://www.100ec. cn/detail--6590734.html.
[7]刘越男.数据治理:大数据时代档案管理的新视角和新职能[J].档案学研究,2020(5):50-57.
[8]高晨翔,黄新荣.国外社交媒体文件归档的政策研究[J].图书馆,2017(7):6-11.
[9] DURANTI L.THIBODEAU K.The Concept of Re? cord in Interactive,ExperientialandDynamicEnvironments:the Viewof InterPARES[J].. ArchivalScience,6(1):13-68.
[10]刘越男,杨建梁,张洋洋.单轨制背景下电子签名的归档保存方案研究[J].档案学通讯,2019(3):26-35.
[11]王强,高强.业务系统数据归档研究:以中国石油业务系统数据归档实践为例[J].浙江档案,2019(12):36-39.
[12]刘越男,杨建梁,何思源,等.计算档案学:档案学科的新发展[J/OL].图书情报知识,2021:1-10[2021-05-09].http://kns.cnki.net/kcms/detail/42.1085.2.20210401.1122.002.ht? ml.
[13]徐拥军,张臻,任琼辉.国家大数据战略背景下档案部门与数据管理部门的职能关系[J].图书情报工作, 2019,63(18):5-13.
[14]何思源,刘越男.科学数据和科研档案的管理协同:框架和路径[J].档案学通讯,2021(1):49-57.
[15]中国人民大学电子文件管理研究中心.数据管理中的文件档案与内容管理[EB/OL].[2021-02-25]. http://erm.ruc.edu.cn/filespath/1606635961.pdf.
作者单位:1.中国人民大学信息资源管理学院2.中国人民大学电子文件管理研究中心
作者:刘越男