在電子記錄轉(zhuǎn)換過程中利用人工智能發(fā)布數(shù)據(jù)的潛力
代理商在2022年年底到達(國家檔案館和檔案館)電子記錄管理截止日期的各個階段。事實上,在最近的數(shù)字政府研究所電子發(fā)現(xiàn)、記錄和信息管理虛擬會議上,活動組織者對觀眾進行了關(guān)于數(shù)字轉(zhuǎn)型參與者進展情況的調(diào)查。毫不奇怪,結(jié)果甚至是"進步","我們還有很長的路要走"和"不要問"。在我們與政府機構(gòu)的討論中,我們發(fā)現(xiàn)了一個類似的觀點。
無論代理機構(gòu)在哪里進行電子記錄管理,都應(yīng)該利用這一機會部署從這些信息中獲取洞察力的功能。然而,說起來容易做起來難,因為大多數(shù)機構(gòu)都在試圖發(fā)現(xiàn)信息的價值。它們擁有太多的非結(jié)構(gòu)化和非機密信息,或者缺乏分析這些信息的內(nèi)部資源和技能--或者兩者兼而有之。
NARA的截止日期要求所有機構(gòu)記錄在2022年年底前達到100%的數(shù)字化。今天的分布式組織環(huán)境的特點是系統(tǒng)多樣化,從各種數(shù)據(jù)源(包括物理和數(shù)字信息)中具有多種數(shù)據(jù)類型。這使負責實施NARA電子記錄管理的機構(gòu)記錄管理人員感到頭疼。然而,借助支持AI和ML分類、提取和豐富物理和數(shù)字內(nèi)容的內(nèi)容分析、數(shù)據(jù)管理和信息治理工具,代理可以成功地克服這些困難。
在數(shù)字轉(zhuǎn)換過程中,將人工智能和ML功能集成到Agent的信息管理程序中,使它們能夠自動地對物理和數(shù)字內(nèi)容進行分類、提取和豐富。在較高的層次上,三個步驟如下:
輸入記錄--該系統(tǒng)使用光學字符識別、圖像識別和視頻處理來提取信息并以電子格式保存。
通過使用AI/ML--將分類過程和實體提取與AI/ML策略相結(jié)合,系統(tǒng)將自動訓(xùn)練模型、應(yīng)用模型、捕獲反饋并為下一階段準備數(shù)據(jù)。
輸出--當數(shù)據(jù)準備就緒時,將其導(dǎo)出到數(shù)據(jù)可視化功能中,使代理能夠搜索、分析、查看和生成更多的洞察力,以便根據(jù)這些信息做出更好的決策。
AI/ML方法的好處
關(guān)于數(shù)字轉(zhuǎn)換和簡化記錄管理過程,合并AI/ML的具體好處包括:
元數(shù)據(jù)用于搜索和跟蹤。元數(shù)據(jù)標記是幫助組織正確分類、搜索和管理信息的數(shù)字化過程的一部分。元數(shù)據(jù)對于管理、訪問和最終跟蹤整個生命周期的信息至關(guān)重要。與AI/ML結(jié)合使用時,元數(shù)據(jù)可以提供有關(guān)代理記錄的重要信息,例如內(nèi)容是什么及其特性。
從多個來源提取數(shù)據(jù)。AI/ML系統(tǒng)可以幫助組織從孤立的來源獲取信息,并按類型和相關(guān)的元數(shù)據(jù)對每一信息進行分類。
數(shù)據(jù)分類。在AI/ML解決方案中,將監(jiān)督學習和非監(jiān)督學習結(jié)合起來,有助于避免理解當這些系統(tǒng)自動查找、分離和理解數(shù)據(jù)中任何意外文檔類時對所有文檔類的需求。該過程訓(xùn)練連接到AI/ML平臺的神經(jīng)網(wǎng)絡(luò),從而在完成文檔和元數(shù)據(jù)索引之后,建立基線庫,然后在基線庫中搜索模式和趨勢。
可視化的用戶界面。提高以通用格式查看/可視化信息的能力,可以提高整個組織的責任感和透明度,同時為決策者提供更有價值的數(shù)據(jù)。
不斷改進。AI/ML系統(tǒng)繼續(xù)使用人工校正和其他人工信號來改進電子學習,以提供更準確的結(jié)果。
雖然將所有記錄轉(zhuǎn)換成數(shù)字格式的過程可能令人望而生畏--特別是鑒于該機構(gòu)管理的記錄數(shù)量眾多,種類繁多,但它確實為該機構(gòu)提供了從這些信息中獲取價值的機會。通過將AI/ML技術(shù)集成到其記錄管理流程中,代理可以在其信息中釋放這一潛力,以幫助做出更好、更明智的決策,并加強其提供的所有服務(wù)。