廣東振越智能家具有限公司—主營(yíng):密集架,智能密集架,電動(dòng)密集架,檔案密集架,是一家專注檔案裝具設(shè)備生產(chǎn)廠家。
8 檔案 OCR質(zhì)量要求
8.1 識(shí)別準(zhǔn)確率
8.1.1 檔案 OCR對(duì)檔案中文、數(shù)字、英文印刷體的識(shí)別準(zhǔn)確率在95%以上。
8.1.2 檔案 OCR對(duì)常用簽名識(shí)別準(zhǔn)確率達(dá)到90%以上,手寫(xiě)體識(shí)別準(zhǔn)確率達(dá)到80%以上。
8.2 強(qiáng)抗噪能力
8.2.1 檔案 OCR應(yīng)當(dāng)具備對(duì)噪點(diǎn)的強(qiáng)抵抗能力,識(shí)別過(guò)程中能夠有效屏蔽較大程度的噪點(diǎn)干擾。
8.2.2 檔案 OCR 應(yīng)能準(zhǔn)確判別紙質(zhì)檔案數(shù)字復(fù)制件上的污點(diǎn)、污線、黑邊、紙張褪變斑點(diǎn)、水漬、污點(diǎn)、裝訂孔等,提高識(shí)別準(zhǔn)確率。
8.3 識(shí)別速度
8.3.1 識(shí)別速度指標(biāo)與識(shí)別準(zhǔn)確率指標(biāo)應(yīng)同時(shí)適用。
8.3.2 在主流計(jì)算機(jī)軟硬件平臺(tái)下,A4紙幅面中文識(shí)別速度不低于1000字/s,英文識(shí)別速度不低于2000字/s。
8.4 版面還原度
8.4.1 應(yīng)實(shí)現(xiàn)復(fù)雜版面的精確還原,采用分欄技術(shù),智能分析中文(簡(jiǎn)體、繁體)、英文字體,文、表、圖混排文本,識(shí)別后無(wú)需人工干預(yù),自動(dòng)還原排版。
8.4.2 識(shí)別后的文檔與原導(dǎo)入圖像版面還原度應(yīng)達(dá)到90%以上。
9 檔案 OCR成果的管理與應(yīng)用
9.1 成果管理
9.1.1 應(yīng)保持檔案 OCR成果各組成要素對(duì)應(yīng)的紙質(zhì)檔案數(shù)字復(fù)制件、檔案目錄、元數(shù)據(jù)之間的邏輯層次和關(guān)聯(lián)關(guān)系。
9.1.2 以純文本形式保存的檔案 OCR成果應(yīng)使用檔號(hào)作為文件名,可在存儲(chǔ)載體中以檔號(hào)為基礎(chǔ)逐級(jí)建立層次文件夾單獨(dú)保存,也可與紙質(zhì)檔案數(shù)字復(fù)制件統(tǒng)一保存。
9.1.3 支持全文檢索的雙層 PDF或 OFD文件可與對(duì)應(yīng)的紙質(zhì)檔案數(shù)字復(fù)制件統(tǒng)一存儲(chǔ)。數(shù)字檔案館(室)應(yīng)用系統(tǒng)應(yīng)記錄并維護(hù)不同文件版本之間的聯(lián)系。
9.1.4 檔案 OCR成果文件管理權(quán)限應(yīng)與紙質(zhì)檔案數(shù)字復(fù)制件相同。
9.1.5 OCR成果應(yīng)與紙質(zhì)檔案數(shù)字復(fù)制件同步開(kāi)展數(shù)據(jù)備份工作。
9.2 成果應(yīng)用
9.2.1 檔案 OCR成果應(yīng)通過(guò)數(shù)字檔案館(室)應(yīng)用系統(tǒng)實(shí)現(xiàn)全文檢索,提高檔案信息檢索效率。
9.2.2 可發(fā)揮檔案 OCR成果提取的歸檔信息和黨政機(jī)關(guān)公文要素的作用,輔助開(kāi)展檔案自動(dòng)著錄、目錄質(zhì)量核查,以及紙質(zhì)檔案數(shù)字復(fù)制件掛接準(zhǔn)確性核查等業(yè)務(wù)工作。
9.2.3 可利用檔案 OCR成果,結(jié)合數(shù)據(jù)挖掘技術(shù)開(kāi)展數(shù)據(jù)分析、知識(shí)管理、詞庫(kù)建設(shè)等工作。