什麼是PDF OCR?
PDF OCR(光學字元辨識)是把掃描 PDF 中以圖像形式存在的文字,轉成可選取、可搜尋、可被機器讀取的文字的過程。
PDF 大致分兩種:帶文字層的 PDF(數位原生,例如從 Word 或 LaTeX 匯出),文字可以直接讀取;以及掃描 PDF(紙本文件經拍攝或掃描而來),頁面只是一張寫著字的圖。沒有 OCR,第二種既無法搜尋,也無法複製、無法摘要。
OCR 引擎會分析頁面影像,找出行與字,辨識字形,重組單字與段落,最後把文字層加回 PDF,或單獨輸出一份文字檔。現代 OCR 改用深度神經網路取代過去的樣板比對演算法——在主要語言的乾淨印刷字上,準確率已超過 99%。
OCR 的品質會在以下情況下降:掃描歪斜、解析度低、墨色褪色;密集公式;多欄排版;以及訓練資料較少的文字系統。重要文件的良好做法是:以 300 dpi 彩色掃描、用現代引擎跑一輪,並在引用前審閱輸出。
你把 PDF 上傳到 Summio 時,App 會自動判斷是否需要 OCR,並在生成摘要前先跑一次。原始 PDF 與 OCR 文字都保留在你的帳號裡——不會被用來訓練任何 AI 模型。
了解更多 Summio →常見問題
PDF OCR 免費嗎?
Apple 內建的 PDFKit、Adobe Acrobat Reader 與絕大多數現代 PDF 工具都會免費提供 OCR,或收費極低。Summio 把 OCR 直接整合進 PDF 摘要流程裡,不需要額外步驟。
掃描書籍的 OCR 有多準?
主流語言、掃得乾淨的印刷頁面,現代 OCR 在字元層級的準確率超過 99%。掃描歪斜、褪色影印、特殊字型可能跌到 90% 以下,需要人工校正。
OCR 能辨識手寫 PDF 嗎?
舊一代 OCR 引擎對手寫處理不佳。新一代基於機器學習的 OCR(Apple Vision 框架、Google Document AI)對清楚的硬筆印刷體表現不錯,對行雲流水的草書仍較弱。
