Czym jest PDF OCR?
PDF OCR (optyczne rozpoznawanie znaków) to proces zamiany tekstu, który w zeskanowanym PDF jest jedynie obrazem, w tekst, który można zaznaczać, przeszukiwać i odczytywać maszynowo.
Pliki PDF są dwóch rodzajów: z warstwą tekstową (urodzone cyfrowo, eksportowane np. z Worda lub LaTeX) — tekst da się odczytać bezpośrednio; oraz zeskanowane (zdjęcie papieru lub przepuszczone przez skaner) — strona jest jedynie obrazem liter. Bez OCR drugiego typu nie da się przeszukać, skopiować ani streścić.
Silnik OCR analizuje obraz strony: wykrywa wiersze i znaki, rozpoznaje kształty (glify), rekonstruuje słowa i akapity, a następnie dodaje warstwę tekstową do PDF lub eksportuje osobny plik tekstowy. Współczesne silniki używają głębokich sieci neuronowych zamiast starych algorytmów dopasowywania szablonów; w głównych językach dokładność na czystym druku przekracza 99%.
Jakość OCR spada przy złych skanach (przekrzywienie, niska rozdzielczość, wyblakły tusz), gęstych wzorach, wielokolumnowym składzie i systemach pisma o ubogich danych treningowych. W ważnych dokumentach najlepiej skanować w kolorze przy 300 dpi, używać współczesnego silnika i przeglądać wynik przed cytowaniem.
Po przesłaniu PDF do Summio aplikacja automatycznie wykrywa, czy potrzebne jest OCR, i uruchamia je przed streszczeniem. Zarówno oryginalny plik, jak i tekst OCR pozostają na Twoim koncie — i nie są używane do trenowania żadnego modelu AI.
Dowiedz się więcej o Summio →Najczęstsze pytania
Czy PDF OCR jest darmowy?
Wbudowany PDFKit Apple, Adobe Acrobat Reader i większość nowoczesnych narzędzi PDF oferują OCR bezpłatnie lub za symboliczną opłatą. Summio osadza OCR bezpośrednio w przepływie streszczania PDF, więc nie trzeba osobnego kroku.
Jak dokładne jest OCR zeskanowanych książek?
W głównych językach na dobrze zeskanowanych stronach druku współczesne OCR osiąga ponad 99% dokładności na poziomie znaku. Przekrzywione skany, wyblakłe kopie i rzadkie czcionki mogą spaść poniżej 90% i wymagać ręcznej korekty.
Czy OCR działa na PDF-ach pisanych ręcznie?
Starsze silniki słabo radzą sobie z pismem ręcznym. Nowe silniki oparte na uczeniu maszynowym (Apple Vision, Google Document AI) działają rozsądnie na czytelnym, zbliżonym do druku piśmie; przy nieuporządkowanym piśmie ręcznym są mniej skuteczne.
