麥肯錫公司(McKinsey&Company)作為全球知名的咨詢公司,提出了大數(shù)據(jù)時(shí)代的到來,認(rèn)為數(shù)據(jù)已經(jīng)滲透到全球各個(gè)行業(yè)的業(yè)務(wù)功能中,成為重要的生產(chǎn)要素。2012年黨的十八大召開后,“數(shù)字中國”再上新臺(tái)階。作為工信部新時(shí)期專業(yè)發(fā)展的新戰(zhàn)略,其輻射面涵蓋金融、政治等各個(gè)領(lǐng)域,其中就包括云計(jì)算。推進(jìn)“數(shù)字中國”建設(shè),由國家網(wǎng)絡(luò)信息領(lǐng)導(dǎo)小組辦公室、國家發(fā)展改革咨詢委員會(huì)等部門主辦的“數(shù)字中國建設(shè)峰會(huì)”第二次成功舉辦,為“數(shù)字中國”建設(shè)提供了良好的信息交流平臺(tái)。從這個(gè)角度來看,云計(jì)算在重大戰(zhàn)略中扮演著越來越重要的角色。
“數(shù)字中國”的背景也為檔案管理工作提出了一個(gè)新概念。如何讓檔案管理工作適應(yīng)時(shí)代需求,打造一體化電子書,提升數(shù)字檔案館建設(shè)水平,加強(qiáng)數(shù)字檔案館運(yùn)營水平,挖掘數(shù)字檔案館潛在資源,被提上日程。因此,本文將討論“數(shù)字中國”背景下的檔案人工智能。
檔案云計(jì)算和公共數(shù)據(jù)的概念
1.1檔案大數(shù)據(jù)云計(jì)算的概念
維克托·邁爾-2008年,勛伯格和肯尼斯·庫克耶首次提出了“云計(jì)算(bigdata、megadata)”一詞。一般來說,人工智能是指需要新的去中心化處理,以具備更強(qiáng)的決策能力、分析能力和流程再造能力的海量、高增長、多樣化的數(shù)據(jù)資產(chǎn)。《中華人民共和國檔案法》定義了檔案的概念,檔案是指過去和現(xiàn)在的國家政府和社會(huì)力量,包括從事政治、軍事、經(jīng)濟(jì)、科學(xué)、技術(shù)、文化、宗教等活動(dòng)的個(gè)人,直接形成的,對國家社會(huì)具有保存價(jià)值的,除文字、圖表、錄音、錄像以外的各種不同形式的個(gè)人記錄。
2012年后,“大數(shù)據(jù)云計(jì)算”這個(gè)詞被提及的次數(shù)越來越多。人們用它來描述和定義信息時(shí)代產(chǎn)生的海量數(shù)據(jù),并對其進(jìn)行命名,與其技術(shù)方面融合發(fā)展,“檔案、互聯(lián)網(wǎng)、大數(shù)據(jù)”的概念由此誕生。所謂檔案大數(shù)據(jù)云計(jì)算,一般認(rèn)為是在檔案業(yè)務(wù)活動(dòng)成果中形成和收集的一個(gè)測試集。它具有消費(fèi)屬性,難以及時(shí)收集和處理,與檔案和檔案活動(dòng)密切相關(guān)。
1.2歸檔大數(shù)據(jù)的質(zhì)量
根據(jù)檔案互聯(lián)網(wǎng)大數(shù)據(jù)的概念,它是在檔案業(yè)務(wù)活動(dòng)成果中形成和產(chǎn)生的,這決定了數(shù)據(jù)質(zhì)量主要包括以下幾個(gè)方面。
(1)文件本身。自文件數(shù)據(jù)主要是指單位人事部門收集的文字、圖表、音視頻等其他形式的記錄,如文件系統(tǒng)生成的數(shù)據(jù)、材料規(guī)格等載體的數(shù)據(jù)等。,還包括根據(jù)文件內(nèi)容分類形成的目錄、摘要和查詢指南。這種圖片數(shù)據(jù)是檔案人工智能*重要的組成部分,也*具有檔案特征。
(2)是在檔案機(jī)構(gòu)開展檔案業(yè)務(wù),積極參與活動(dòng)形成的。這個(gè)完整的數(shù)據(jù)主要來自兩個(gè)來源,一個(gè)是檔案機(jī)構(gòu)自身生成的,另一個(gè)是檔案機(jī)構(gòu)通過各種途徑收集的,比如檔案機(jī)構(gòu)自身的檔案結(jié)構(gòu)數(shù)據(jù)、部門匯總及相關(guān)檔案管理政策、法律及檔案管理行業(yè)分析等。
(3)歸檔用戶隨后生成的數(shù)據(jù)。重新生成用戶信息相關(guān)數(shù)據(jù),如文件用戶自身情況更新、文件查詢、自身喜好等等。以上三部分都是檔案云計(jì)算的來源,也就是說檔案大數(shù)據(jù)的質(zhì)量也有它的來源,但這些數(shù)據(jù)的產(chǎn)生并不意味著它會(huì)被納入包括大數(shù)據(jù)在內(nèi)的檔案范疇,有價(jià)值的內(nèi)容只有經(jīng)過層層篩選和整理后才會(huì)被納入檔案云計(jì)算。
檔案的特點(diǎn)是大數(shù)據(jù)
2.1包括大數(shù)據(jù)
歷史學(xué)家普遍認(rèn)為,包含大數(shù)據(jù)應(yīng)該具備“4V1O”的特征:
(1)數(shù)據(jù)量(Volume),即采集、存儲(chǔ)、公式推導(dǎo)中的數(shù)據(jù)量非常大。一般至少P(1000T)作為起始長度單位。
(2)有很多類型(Variety),也就是有很多類型和直接的數(shù)據(jù)來源。包括關(guān)系型數(shù)據(jù)庫能夠以二維形式表示和存儲(chǔ)的數(shù)據(jù)結(jié)構(gòu);不符合關(guān)系型數(shù)據(jù)庫或關(guān)鍵數(shù)據(jù)表形式的數(shù)據(jù)鏈接建立結(jié)構(gòu),但包含相關(guān)標(biāo)簽,用于分隔語義元素和對記錄和字段進(jìn)行分層的半異構(gòu)數(shù)據(jù);以及文檔、圖片、視頻/音頻和其他文本數(shù)據(jù)。
(3)價(jià)值密度(Value),即數(shù)據(jù)的價(jià)值密度不高。隨著移動(dòng)技術(shù)的不斷進(jìn)步,信息無處不在,但很多信息沒有信息價(jià)值,導(dǎo)致信息價(jià)值密度低的問題。在這種情況下,如何通過邏輯算法挖掘收集到的有價(jià)值的信息是目前*迫切的問題大數(shù)據(jù)時(shí)代。
(4)速度快,時(shí)效性高(Velocity),即數(shù)據(jù)增長和處理的程度快,同時(shí)具有很高的時(shí)效性,這也是大數(shù)據(jù)區(qū)別于傳統(tǒng)數(shù)據(jù)建模的一個(gè)突出特點(diǎn)。
(5)數(shù)據(jù)在線(Online),也就是說,數(shù)據(jù)永遠(yuǎn)不會(huì)被丟棄,可以在任何地方檢索和使用。這個(gè)特征被認(rèn)為是不同于傳統(tǒng)數(shù)據(jù)的*顯著的特征。隨著移動(dòng)互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,數(shù)據(jù)有可能永不掉線,數(shù)據(jù)的價(jià)值發(fā)揮得越充分。
2.2歸檔互聯(lián)網(wǎng)大數(shù)據(jù)
檔案人工智能是從大數(shù)據(jù)系統(tǒng)發(fā)展而來的,因此具有云計(jì)算和自身的一些特點(diǎn)。
(1)大量數(shù)據(jù)。傳統(tǒng)檔案館十幾年的積累形成了大量待數(shù)字化的技術(shù)存量,隨著全球互聯(lián)網(wǎng)的普及,應(yīng)用系統(tǒng)產(chǎn)生的數(shù)據(jù)規(guī)模也在急劇增加。2017年,國家保密局局長李明華在全國城建檔案局長會(huì)議上提到,我國檔案事業(yè)已經(jīng)到了“十一五”末期。
3.超過92億卷(件),形成了數(shù)量龐大的數(shù)字檔案。
(2)字段很復(fù)雜。檔案中的大數(shù)據(jù)也是結(jié)構(gòu)化、非結(jié)構(gòu)化、非結(jié)構(gòu)化的,隨著各行業(yè)工作與互聯(lián)網(wǎng)技術(shù)的交匯,越來越多的非結(jié)構(gòu)化、復(fù)雜數(shù)據(jù)產(chǎn)生并占據(jù)主流地位。
(3)價(jià)值密度小。與其他大數(shù)據(jù)相比,由于擁有大數(shù)據(jù)的檔案一般具有更高的時(shí)效性、真實(shí)可靠性和準(zhǔn)確性,即使數(shù)據(jù)大規(guī)模擴(kuò)展,價(jià)值密度也不會(huì)降低太多,這也是檔案互聯(lián)網(wǎng)大數(shù)據(jù)的優(yōu)勢所在。
(4)動(dòng)態(tài)系統(tǒng)和穩(wěn)定性。數(shù)字化檔案需要?jiǎng)討B(tài)生成和收集,然后進(jìn)行分析、整理、存儲(chǔ)和調(diào)用,這賦予了檔案巨大的信息動(dòng)態(tài)性。檔案的證據(jù)和憑證功能要求數(shù)據(jù)具有一定的平衡性。經(jīng)過處理,直接轉(zhuǎn)換成有效的數(shù)字檔案后,應(yīng)該作為不可更改的數(shù)據(jù)進(jìn)行鎖定,因此具有數(shù)據(jù)可控性。
(5)部分依賴。在計(jì)算機(jī)技術(shù)在各個(gè)領(lǐng)域進(jìn)步和普及之前,傳統(tǒng)的檔案被利用,導(dǎo)致檔案中有大量的數(shù)據(jù)。為了實(shí)現(xiàn)股票文件的移動(dòng)性,需要一個(gè)功能強(qiáng)大的信息技術(shù)來以*快的時(shí)間存儲(chǔ)、識別和調(diào)用股票數(shù)字文件。
(6)跑得快。傳統(tǒng)的管理文件需要使用紙質(zhì)文檔,導(dǎo)致手動(dòng)訪問和檢索速度慢。大數(shù)據(jù)挖掘要求數(shù)據(jù)的生成、分析、整理、存儲(chǔ)和檢索等關(guān)鍵環(huán)節(jié)能夠快速完成,檔案網(wǎng)絡(luò)化的發(fā)展也是為了實(shí)現(xiàn)這一目標(biāo)。
檔案館實(shí)施大數(shù)據(jù)的合理性
3.1大數(shù)據(jù)時(shí)代發(fā)展的需要
正如牛津大學(xué)人文學(xué)科加里·金教授所說:“這是一場革命。龐大的公共數(shù)據(jù)使得各個(gè)領(lǐng)域都開始了量化的過程。無論是歷史學(xué)家、企業(yè)還是政府,任何領(lǐng)域都會(huì)啟動(dòng)這一進(jìn)程。”美軍在2012年發(fā)布《大數(shù)據(jù)的研究和發(fā)展計(jì)劃》,將大數(shù)據(jù)存儲(chǔ)提升到國家安全級別;日本還在2013年發(fā)布了《關(guān)于打造前沿科技IT的國家宣言》,提出將大數(shù)據(jù)云計(jì)算升級為強(qiáng)國的戰(zhàn)略,從而提升日本的競爭水平。中國也在2014年首次復(fù)制了大數(shù)據(jù)工作報(bào)告,并在2015年發(fā)布了《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》。中國檔案管理工作正在經(jīng)歷從紙質(zhì)到電子、從人工到智能技術(shù)、從分散管理到數(shù)據(jù)共享的轉(zhuǎn)變。只有順應(yīng)時(shí)代的變化趨勢,推動(dòng)檔案的實(shí)施,才能保證我國的檔案管理工作不會(huì)落后。
3.2"數(shù)字中國"施工需求
在國家提出“移動(dòng)互聯(lián)網(wǎng)”和“寬帶中國”戰(zhàn)略,與國際合作伙伴數(shù)字經(jīng)濟(jì)深度合作后,2017年黨的十九大報(bào)告首次提出“數(shù)字中國”,進(jìn)一步推動(dòng)了國家信息化計(jì)劃。“數(shù)字中國”的核心是數(shù)據(jù),是數(shù)據(jù)與各行業(yè)的融合發(fā)展,需要大數(shù)據(jù)資源的數(shù)字化、智能化和自主化。以我國絕大多數(shù)國家檔案為例。雖然檔案電子信息化得到了推進(jìn),但相當(dāng)一部分檔案是電子檔案,電子信息化檔案存在格式不一、保存分散、資源數(shù)據(jù)庫標(biāo)準(zhǔn)不一等問題。難以形成聯(lián)動(dòng)和數(shù)字文件共享,容易造成碎片化。對于無紙化檔案的推廣,只是對檔案信息的圖示保存,缺乏科學(xué)的處理。檔案作為服務(wù)區(qū)域經(jīng)濟(jì)發(fā)展的下屬部門之一,只有實(shí)施檔案在線化,促進(jìn)檔案資源共享,充分挖掘大數(shù)據(jù)潛在價(jià)值,打造數(shù)字經(jīng)濟(jì),惠及民生,才能服務(wù)于《數(shù)字中國》建設(shè)。
3.3單位人事部門目前的發(fā)展需求
(1)避免文件擴(kuò)展的需要。如果不實(shí)現(xiàn)數(shù)字化歸檔,各行業(yè)的管理檔案必然會(huì)出現(xiàn)問題。如果文件數(shù)量逐年增加,*終會(huì)導(dǎo)致文件膨脹的現(xiàn)象。傳統(tǒng)的檔案擴(kuò)容是指由于電子檔案倉庫容量大,檔案數(shù)量急劇增加,導(dǎo)致存儲(chǔ)場所不足的現(xiàn)象。新征程中的圖書館擴(kuò)容現(xiàn)象,可以認(rèn)為是社會(huì)上各行業(yè)的檔案雖然是檔案數(shù)字化,電子檔案雖然是圖片化的,但只是簡單意義上實(shí)現(xiàn)檔案數(shù)字化,沒有構(gòu)建區(qū)域檔案工作數(shù)據(jù),導(dǎo)致數(shù)據(jù)存儲(chǔ)碎片化、重疊化。雖然與傳統(tǒng)的電子檔案相比,圖書館擴(kuò)張現(xiàn)象可以相對放緩,但*終很難產(chǎn)生圖書館擴(kuò)張。只有在數(shù)字技術(shù)基礎(chǔ)上進(jìn)一步驅(qū)動(dòng)大數(shù)據(jù),在數(shù)據(jù)基礎(chǔ)上有效獲取、存儲(chǔ)、處理和利用檔案,才能進(jìn)一步緩解圖書館擴(kuò)容現(xiàn)象。
(2)推進(jìn)人事檔案工作轉(zhuǎn)型的需要。隨著全球互聯(lián)網(wǎng)特別是移動(dòng)網(wǎng)絡(luò)的發(fā)展,給傳統(tǒng)的檔案信息化帶來了新的挑戰(zhàn)。人民群眾對信息的需求、各行業(yè)通過檔案大數(shù)據(jù)信息價(jià)值分析的需求、定制化服務(wù)的需求不斷提升,對信息資料的服務(wù)水平、流程效率、服務(wù)廣度提出了更高的要求。因此,要求檔案部門必須從大數(shù)據(jù)系統(tǒng)和大數(shù)據(jù)處理的角度構(gòu)建管理架構(gòu),完善系統(tǒng),整合管理檔案記錄,加強(qiáng)信息資源建設(shè),解決數(shù)字檔案孤島問題。
總之,通過改革創(chuàng)新實(shí)現(xiàn)檔案互聯(lián)網(wǎng)大數(shù)據(jù),是“互聯(lián)網(wǎng)大數(shù)據(jù)”時(shí)代人事檔案的生存法則。如何利用人工智能的快速發(fā)展開發(fā)人事檔案,如何應(yīng)用新技術(shù)、創(chuàng)新服務(wù)機(jī)制,給檔案保管帶來機(jī)遇和挑戰(zhàn),是目前檔案保管需要面對和解決的問題。更重要的是,人事檔案在開發(fā)檔案大數(shù)據(jù)時(shí),要根據(jù)檔案人工智能和業(yè)務(wù)功能的特點(diǎn),在傳統(tǒng)工作的基礎(chǔ)上,尋找適合自身發(fā)展的云計(jì)算之路。
庫房綜合智能
管理系統(tǒng)
本系統(tǒng)嚴(yán)格按照“嚴(yán)格、合理、可靠、經(jīng)濟(jì)、完善”和“無人值班、少人值守”的要求進(jìn)行設(shè)計(jì),具體原則如下:
? 系統(tǒng)選型高起點(diǎn):
★ 技術(shù)**性:選用新的專業(yè)技術(shù)與產(chǎn)品;
★ 系統(tǒng)高可靠性:系統(tǒng)的硬件和軟件均采用技術(shù)成熟的產(chǎn)品,平均無故障時(shí)間均在20萬小時(shí)以上;
★ 系統(tǒng)運(yùn)行管理方便:軟件系統(tǒng)中文化,操作方便;
★ 設(shè)計(jì)架構(gòu)**:系統(tǒng)采用真正的B/S+C/S架構(gòu),業(yè)內(nèi)唯一全程WEB支持的監(jiān)控平臺(tái)
★ 技術(shù)支持能力強(qiáng):承建單位技術(shù)實(shí)力強(qiáng),服務(wù)完善;
★ 系統(tǒng)集成度高:系統(tǒng)完美整合了設(shè)備實(shí)時(shí)監(jiān)控、運(yùn)行狀態(tài)、數(shù)據(jù)查詢、深度分析、信息告警等等;
★ 系統(tǒng)交互性好:用戶可通過PC及移動(dòng)終端實(shí)時(shí)查詢系統(tǒng)設(shè)備的各種參數(shù)與狀態(tài),掌握主動(dòng)權(quán);
★ 系統(tǒng)可擴(kuò)展性能強(qiáng):模塊化結(jié)構(gòu)有利于擴(kuò)容與擴(kuò)展。
★ 高可靠性保證:系統(tǒng)支持雙機(jī)/多機(jī)熱備方案,特殊應(yīng)用沒有后顧之憂;
? 投資少: 系統(tǒng)選型具有高性能價(jià)格比。
? 建設(shè)時(shí)間短:在較短的時(shí)間內(nèi)完成系統(tǒng)的安裝調(diào)試。
? 優(yōu)質(zhì)的服務(wù):本著“用戶**、服務(wù)至上”的原則。
庫房恒溫恒濕智能控制系統(tǒng):
★ 溫濕度:監(jiān)測檔案庫房內(nèi)重要區(qū)域的溫度、濕度數(shù)值及變化情況。
★ 空調(diào): 監(jiān)測空調(diào)的運(yùn)行狀態(tài),并可實(shí)現(xiàn)遠(yuǎn)程開關(guān)機(jī)啟停控制模式并調(diào)節(jié)溫度閾值及聯(lián)動(dòng)等。
★ 除濕加濕一體機(jī): 自動(dòng)設(shè)定一體機(jī)濕度,并對一體機(jī)運(yùn)行狀態(tài)及內(nèi)部模塊實(shí)時(shí)監(jiān)測。
庫房自動(dòng)防火防盜報(bào)警系統(tǒng):
★ 門禁管理: 采用進(jìn)門人臉識別+掌紋識別+刷卡+出門按按鈕的驗(yàn)證方式,實(shí)現(xiàn)對人員出入情況的管理。
★ 視頻圖像: 監(jiān)視庫房的實(shí)時(shí)圖像,并進(jìn)行視頻錄像。
★ 防盜: 紅外探測器,監(jiān)測檔案庫房人員活動(dòng)情況。
★ 防火: 煙霧報(bào)警測器,監(jiān)測檔案庫房內(nèi)的火警情況。
庫房自動(dòng)消毒滅菌系統(tǒng):
★ 臭氧消毒機(jī) 監(jiān)測臭氧消毒機(jī)的運(yùn)行狀態(tài)及參數(shù),并可實(shí)現(xiàn)遠(yuǎn)程開關(guān)機(jī)啟停控制。
庫房環(huán)境監(jiān)測系統(tǒng):
★ 漏水監(jiān)測: 區(qū)域式漏水, 米漏水感應(yīng)繩,監(jiān)測庫房內(nèi)除濕一體機(jī)以及墻壁四周有無漏水發(fā)生。
★ 毒害氣體: 監(jiān)測庫房內(nèi)部氣體是否毒氣及空氣質(zhì)量是否超標(biāo),并聯(lián)動(dòng)消毒機(jī)進(jìn)行空氣消毒。