👦 馬鈴薯先生手邊有一些文件
已經掃描好成PDF圖片檔
是繁體的,大約2300多頁
需要幫忙轉成word文字檔
💅透過e-mail 傳送檔案的雲端位置
📊下載後一共有105個檔案
👀文字辨識系統
又稱光學字元辨識系統
OCR(Optical Character Recognition)
指的是對文字資料的圖像檔案進行分析辨識處理
取得文字及版面資訊的過程所使用的系統軟體
1929年由德國科學家Tausheck最先提出概念
並申請了專利📌
📑文件內容越單純一致
辨識率越高
📑內容越複雜辨識率越低
👪一般而言
英文>中文橫書>中文直書>英文+中文+表格
>英文+中文+表格+圖片
>英文+中文+特殊字體+表格+圖片
>英文+中文+特殊字體+表格+圖片+浮水印
💁馬鈴薯先生所委託的文件
屬於最複雜的
沒有留言:
張貼留言