Mi az a PDF OCR?
A PDF OCR (optikai karakterfelismerés) az a folyamat, amely a beszkennelt PDF-ben csak képként jelen lévő szöveget kijelölhető, kereshető, gép által olvasható szöveggé alakítja.
A PDF-fájlok kétfélék: szövegréteggel (digitálisan született, pl. Wordből vagy LaTeX-ből exportált) — a szöveg közvetlenül olvasható; és szkennelt (papír fotója vagy szkenneren áthaladt) — az oldal csak a betűk képeiből áll. OCR nélkül a második típusban nem lehet keresni, másolni vagy összefoglalót készíteni.
Az OCR-motor elemzi az oldal képét: sorokat és karaktereket azonosít, formákat (glifeket) ismer fel, szavakat és bekezdéseket rekonstruál, majd szövegréteget ad a PDF-hez vagy külön szövegfájlt exportál. A modern motorok mély neurális hálózatokat használnak a régi sablonillesztő algoritmusok helyett; a főbb nyelveken a pontosság tiszta nyomtatáson meghaladja a 99%-ot.
Az OCR minősége rossz szkenneknél (ferdeség, alacsony felbontás, halvány tinta), sűrű képletekben, többhasábos szedésben és kevés tanítóadattal rendelkező írásrendszereknél romlik. Fontos dokumentumokhoz a legjobb gyakorlat: színes szkennelés 300 dpi-n, modern motor és az eredmény átnézése idézés előtt.
Amikor PDF-et tölt fel a Summióba, az alkalmazás automatikusan érzékeli, kell-e OCR, és az összefoglaló előtt lefuttatja. Az eredeti fájl és az OCR-szöveg is a fiókodban marad — és nem használjuk fel egyetlen AI-modell tanítására sem.
Tudj meg többet a Summióról →Gyakori kérdések
Ingyenes a PDF OCR?
Az Apple beépített PDFKit-je, az Adobe Acrobat Reader és a legtöbb modern PDF-eszköz ingyenesen vagy jelképes áron kínál OCR-t. A Summio közvetlenül a PDF-összefoglaló folyamatába építi az OCR-t, így nincs szükség külön lépésre.
Mennyire pontos az OCR beszkennelt könyveken?
A főbb nyelveken jól szkennelt nyomtatott oldalakon a modern OCR karakterszinten 99% feletti pontosságot ér el. Ferdén szkennelt oldalak, halvány másolatok és ritkábban használt betűtípusok 90% alá eshetnek, és kézi javítást igényelhetnek.
Működik az OCR kézzel írt PDF-eken?
A régebbi motorok küzdenek a kézírással. A gépi tanuláson alapuló újabbak (Apple Vision, Google Document AI) ésszerűen boldogulnak a rendezett, szinte nyomtatottszerű írással; rendetlen kézírásnál kevésbé hatékonyak.
