OCR 介紹

什麼是 OCR?
OCR 的主要辨識流程
OCR 的應用範圍


常見的文字辨識軟體(OCR 軟體)

什麼是 OCR?

OCR 是光學文字辨識,是從英文 Optical Character Recognition 翻譯而來,而OCR取自這三個英文字的第一個英文字,OCR的主要目的是將圖像中文字轉化成電腦能夠是別的電子訊號。

 

OCR 的主要辨識流程

假設您的文件,以經利用相機、掃描器硬體設備等輸入到電腦系統中,並且該文件來源無特別污損,文字無模糊或是破損的狀況,OCR 的軟體處理流程主要如下列所示:

  1. 影像傾斜校正:
    首先,OCR會先檢查原稿是否傾斜,如原稿傾斜,此步驟將原稿旋轉至水平或是垂直的位置,以提高辨識率。

  2. 圖文分析:
    利用圖文分析技術,判定文字區與圖像區,區隔之後進一步擷取文字區的文字部分。

  3. 文字自動轉正:
    選取部分文字區做0度、90度、180度、270度來選擇辨識率最高的角度,然後依照辨識最高的角度,將整個原稿轉正。

  4. 分割單字:
    將文章段落中的所有的文字、數碼、標點符號與空格切割出來。

  5. 擷取單字的特徵點做文字比對:
    OCR運用各種方法特徵擷取技術來擷取出單字最特別、最明確的部分,尤其是可以用來辨明與其他單字不同的特徵,進行與 OCR 文字資料庫比對的動作,並察看這個編譯過後的訊號,所相對應的最接近文字為何,而這個文字即是最後辨識的結果。

  6. 輸出辨識結果:
    最後每一個文字都辨識完了之後,即產出這一次的 OCR 的文字檔案。

貼心小叮嚀:

  • 如果您的使用重點在於較高的文字辨識效率,建議您在輸入數位化的文件時,採用黑白模式(Text mode),較高的解析度(300 dpi以上)。
  • 假使您的使用重點在於保留圖文一致的文件,並且利於後續的搜索,建議您在數位化文件時,直接選擇產出 Searchable PDF 檔案格式,您可以兼顧「視覺」與「搜尋」兩個目的。

OCR 的應用範圍

  • 建立各種知識資料庫:輸入大量各種報紙、中文書刊、雜誌等。
  • 節省人力個別打字的時間:如早期出版或發行的文章及圖書,利用 OCR 輸入至電腦,文字也可重新編排。
  • 結合語音輸出:將文字利用 OCR 辨識之後,利用電腦的語音輸出,可以讓不識字、視覺障礙、年長使用者以聽覺方式聽到文章。如:Plustek Book Reader.
  • 文字翻譯:使用者可以利用 OCR,將希望翻譯的文字段落或文章輸入電腦,另外再配合翻譯的軟體等,快速地將文字翻譯成其他語言。


常見的文字辨識軟體 (OCR 軟體)

  1. Abbyy FineReader 系列 - http://www.abbyy.com/
  2. I.R.I.S. ReadIris 系列 - http://www.irislink.com
  3. 力新國際 丹青 系列 - http://www.newsoft.com.tw/
  4. 精益科技 DI Express 6 - Plustek 公司最新推出的一款「智慧型文字辨識軟體」,專為亞太地區使用者所設計,支援繁體中文、簡體中文、日語、韓語與英語五種語言的文字辨識,可以將電腦中的影像檔案進行文字辨識處理後,儲存成為「可搜式PDF」(Searchable PDF) 檔案格式,方便日後利用搜尋功能,快速找到需要的資料。