字級設定:
Searchable PDF 的檔案格式是如何產生的?

目前製作 Searchable PDF 的方式有兩種:

方法一:

利用市售的套裝軟體來產出或二次轉檔成為 Searchable PDF 檔案格式

如果要將電腦中原有的電子檔案,或是已經利用數位相機或是掃描設備數位化的圖像檔案,如 JPG、Tiff…等圖檔格式,另外轉換成可以被檢索的 Searchable PDF 檔案,需要透過專業的製作軟體來執行,例如:ABBYY FineReader、IRIS ReadIRIS 或 Adobe Acrobat 等軟體,這些軟體主要是利用光學文字辨識(OCR)技術來達成轉換 Searchable PDF 格式的目的。但是,專業軟體價格昂貴,使用者需要學習複雜的軟體操作。

方法二:

利用已經整合 Searchable PDF 紙本數位化解決方案的掃描器設備,直接將紙本文件產出Searchable PDF。

完美的解決方案除了包含適合需求的掃描器硬體設備,還要附上辨識當地語言能力的文字辨識軟體(OCR),與簡單容易操作的特性,沒有複雜的學習過程,輕鬆產出Searchable PDF的檔案格式。

以台灣地區為例,完美的Searchable PDF紙本數位化解決方案,需包含符合使用需求的掃描器設備,辨識繁體中文的 OCR,與使用者友善的管理介面之外,另外額外考量 OCR 文字辨識的直向中文排版方式,與直覺的單鍵式按鍵使用。使用者只要利用一個按鍵One Touch,無論是報章雜誌、帳單收據、書籍文宣、公文等重要的紙本文件,即可立即數位化成 Searchable PDF 文件檔案。所有的文件掃描與產出 Searchable PDF 檔案的作業一氣呵成,輕鬆應用不必耗時學習,絕對是最聰明划算的選擇。

小常識:

  • OCR 是將紙本文件製作成 Searchable PDF 的幕後推手,OCR 是 Optical Character Recognition 的英文縮寫,意即光學字元辨識。更多 OCR 的資訊,請參考OCR 的介紹。
  • 直向中文排版,中文有直書方式,一般來說,是由右到左編寫,與一般橫向書寫,由左到右編寫順序相反。

貼心小叮嚀:

  • 在華文地區,請確認選購的 OCR 軟體或是掃描器設備搭載的 OCR 軟體能夠辨識繁體中文,否則您所需要的文字必須額外耗時 Key-in。
  • 除了特地替華文地區設計的 OCR 軟體外,一般 OCR 的辨識方向,主要以橫向排版為主,因此碰到直向的排版文字,會發生句子意義不連貫的狀況。這在文字部分的後續使用,或是資料搜尋上,會產生極大的問題。
  • 請特別留意 OCR 軟體的功能中,已經包含產出 Searchable PDF 的功能。大部分的 OCR 軟體,僅在專業版本中才提供 Searchable PDF 的製作功能。

 

 

| More