Qu’est-ce que la ROC d’un PDF (OCR) ?
La ROC d’un PDF (OCR — Optical Character Recognition) est le procédé qui transforme le texte présent uniquement comme image à l’intérieur d’un PDF scanné en texte sélectionnable, indexable et lisible par la machine.
Il existe deux types de PDF : ceux qui possèdent une couche texte (nés numériques — exportés depuis Word ou LaTeX par exemple), où le texte est lu directement, et les PDF scannés (papier photographié ou passé au scanner), où la page n’est qu’une image de texte. Sans OCR, on ne peut ni rechercher, ni copier, ni résumer le second type.
Un moteur OCR analyse l’image de la page, repère lignes et caractères, reconnaît les glyphes, reconstruit mots et paragraphes, et ajoute enfin une couche texte au PDF (ou produit un fichier texte séparé). Les OCR modernes utilisent des réseaux de neurones profonds plutôt que les anciens algorithmes par modèle — la précision sur du texte imprimé propre dans les langues majeures dépasse aujourd’hui 99 %.
La qualité d’OCR chute sur les scans médiocres (inclinés, basse résolution, encre passée), les formules denses, les mises en page multi-colonnes et les écritures peu représentées dans les données d’entraînement. Bonne pratique pour des documents importants : scanner à 300 dpi en couleur, lancer un moteur moderne et relire la sortie avant de la citer.
Lorsque vous téléversez un PDF dans Summio, l’application détecte automatiquement si une ROC est nécessaire et la lance avant le résumé. Le PDF original et le texte OCR restent dans votre compte — ils ne servent jamais à entraîner des modèles d’IA.
En savoir plus sur Summio →Questions fréquentes
L’OCR de PDF est-il gratuit ?
PDFKit d’Apple, Adobe Acrobat Reader et la plupart des outils PDF modernes proposent l’OCR gratuitement ou pour peu cher. Summio intègre l’OCR dans le résumé de PDF — pas d’étape supplémentaire à votre charge.
Quelle est la précision de l’OCR sur des livres scannés ?
Sur des pages imprimées bien numérisées et en langues majeures, l’OCR moderne dépasse 99 % de précision au caractère. Les scans tordus, les photocopies effacées et les polices inhabituelles peuvent tomber sous 90 % — une relecture manuelle est alors nécessaire.
L’OCR fonctionne-t-il sur des PDF manuscrits ?
Les anciens moteurs OCR gèrent mal l’écriture manuscrite. Les moteurs récents basés sur l’apprentissage automatique (framework Vision d’Apple, Google Document AI) traitent correctement les capitales d’imprimerie nettes et beaucoup moins bien la cursive.
