字級設定:
OCR 的主要辨識流程

假設您的文件,以經利用相機、掃描器硬體設備等輸入到電腦系統中,並且該文件來源無特別污損,文字無模糊或是破損的狀況,OCR 的軟體處理流程主要如下列所示:

  1. 影像傾斜校正:
    首先,OCR會先檢查原稿是否傾斜,如原稿傾斜,此步驟將原稿旋轉至水平或是垂直的位置,以提高辨識率。
  2.  

     

  3. 圖文分析:
    利用圖文分析技術,判定文字區與圖像區,區隔之後進一步擷取文字區的文字部分。

     

     

  4. 文字自動轉正:
    選取部分文字區做0度、90度、180度、270度來選擇辨識率最高的角度,然後依照辨識最高的角度,將整個原稿轉正。

     

     

  5. 分割單字:
    將文章段落中的所有的文字、數碼、標點符號與空格切割出來。

     

     

  6. 擷取單字的特徵點做文字比對:
    OCR運用各種方法特徵擷取技術來擷取出單字最特別、最明確的部分,尤其是可以用來辨明與其他單字不同的特徵,進行與 OCR 文字資料庫比對的動作,並察看這個編譯過後的訊號,所相對應的最接近文字為何,而這個文字即是最後辨識的結果。

     

     

  7. 輸出辨識結果:
    最後每一個文字都辨識完了之後,即產出這一次的 OCR 的文字檔案。

     

 

貼心小叮嚀:

  • 如果您的使用重點在於較高的文字辨識效率,建議您在輸入數位化的文件時,採用黑白模式(Text mode),較高的解析度(300 dpi以上)。
  • 假使您的使用重點在於保留圖文一致的文件,並且利於後續的搜索,建議您在數位化文件時,直接選擇產出 Searchable PDF 檔案格式,您可以兼顧「視覺」與「搜尋」兩個目的。

 

 

| More