Szótár

Mi az a PDF OCR?

A PDF OCR (optikai karakterfelismerés) az a folyamat, amely a beszkennelt PDF-ben csak képként jelen lévő szöveget kijelölhető, kereshető, gép által olvasható szöveggé alakítja.

A PDF-fájlok kétfélék: szövegréteggel (digitálisan született, pl. Wordből vagy LaTeX-ből exportált) — a szöveg közvetlenül olvasható; és szkennelt (papír fotója vagy szkenneren áthaladt) — az oldal csak a betűk képeiből áll. OCR nélkül a második típusban nem lehet keresni, másolni vagy összefoglalót készíteni.

Az OCR-motor elemzi az oldal képét: sorokat és karaktereket azonosít, formákat (glifeket) ismer fel, szavakat és bekezdéseket rekonstruál, majd szövegréteget ad a PDF-hez vagy külön szövegfájlt exportál. A modern motorok mély neurális hálózatokat használnak a régi sablonillesztő algoritmusok helyett; a főbb nyelveken a pontosság tiszta nyomtatáson meghaladja a 99%-ot.

Az OCR minősége rossz szkenneknél (ferdeség, alacsony felbontás, halvány tinta), sűrű képletekben, többhasábos szedésben és kevés tanítóadattal rendelkező írásrendszereknél romlik. Fontos dokumentumokhoz a legjobb gyakorlat: színes szkennelés 300 dpi-n, modern motor és az eredmény átnézése idézés előtt.

Hol illik be a Summio

Amikor PDF-et tölt fel a Summióba, az alkalmazás automatikusan érzékeli, kell-e OCR, és az összefoglaló előtt lefuttatja. Az eredeti fájl és az OCR-szöveg is a fiókodban marad — és nem használjuk fel egyetlen AI-modell tanítására sem.

Tudj meg többet a Summióról →

Gyakori kérdések

Ingyenes a PDF OCR?

Az Apple beépített PDFKit-je, az Adobe Acrobat Reader és a legtöbb modern PDF-eszköz ingyenesen vagy jelképes áron kínál OCR-t. A Summio közvetlenül a PDF-összefoglaló folyamatába építi az OCR-t, így nincs szükség külön lépésre.

Mennyire pontos az OCR beszkennelt könyveken?

A főbb nyelveken jól szkennelt nyomtatott oldalakon a modern OCR karakterszinten 99% feletti pontosságot ér el. Ferdén szkennelt oldalak, halvány másolatok és ritkábban használt betűtípusok 90% alá eshetnek, és kézi javítást igényelhetnek.

Működik az OCR kézzel írt PDF-eken?

A régebbi motorok küzdenek a kézírással. A gépi tanuláson alapuló újabbak (Apple Vision, Google Document AI) ésszerűen boldogulnak a rendezett, szinte nyomtatottszerű írással; rendetlen kézírásnál kevésbé hatékonyak.