L’enjeu : rendre les documents scannés vraiment accessibles

Numériser un document, ce n’est pas le rendre automatiquement exploitable. La simple image d’un texte, comme une photo ou un PDF « image », reste inerte pour les technologies d’assistance. Selon l'Association Valentin Haüy, 80 % des documents transmis par email en entreprise sont au format PDF, mais près de la moitié ne sont pas accessibles car ce sont des scans d’images. Il est donc crucial d’opter pour des formats qui permettent une relecture, une navigation structurée et, si possible, l’adaptation à ses préférences d’affichage.

Du scan à la relecture : identifier les étapes clés

La transformation d’un document sur papier en format numérique accessible suit généralement ces étapes :

  • Numérisation (scanner ou smartphone)
  • Reconnaissance optique de caractères (OCR)
  • Export dans un format de sortie (Word, PDF, TXT, Daisy, ePub...)
  • Ouverture du fichier avec un lecteur d’écran, une synthèse vocale ou gros caractères

Le choix du format final est donc déterminant. Il conditionne la facilité de lecture, d’adaptation (taille, contraste), la possibilité de naviguer dans le document ou d’y ajouter des commentaires.

Quels formats de sortie privilégier ? Panorama des possibilités

Voici les principaux formats à considérer, leurs forces, leurs limites et les contextes où ils offrent la meilleure expérience.

1. PDF (Portable Document Format) : le plus répandu, mais sous conditions

  • PDF texte : issu d’un OCR réussi. Ce format garde la mise en page d’origine, tout en rendant le texte sélectionnable et lisible par les lecteurs d’écran. Pour la navigation structurée (titres, paragraphes), il est impératif que le PDF soit « balisé ». Selon l’association Apidae Accessible, moins de 5 % des PDF en circulation répondent entièrement aux critères d’accessibilité (balises, titres, texte alternatif...).
  • PDF image : à éviter. Il s’agit d’une simple photo ou scan, absolument inutilisable sans OCR.
  • Avantages : Compatibilité universelle, conservation des graphismes et annotations.
  • Inconvénients : Accessibilité très variable, fichiers lourds, navigation parfois fastidieuse sur les gros documents.

2. DOC / DOCX (Microsoft Word) : le champion de la flexibilité

  • Avantages : Textes toujours éditables, possibilité de modifier la police, la taille, les couleurs du fond, etc. Word permet également d’ajouter des commentaires ou des repères de navigation, utiles pour structurer le document après conversion.
  • Compatibilité : Excellente avec les lecteurs d’écran du marché (JAWS, NVDA, VoiceOver).
  • Particularités : Le format Word conserve les tableaux, listes, titres, ce qui facilite la navigation grâce aux raccourcis des aides techniques. Selon Microsoft Accessibility, la majorité des personnes malvoyantes utilisant Office adaptent la taille et le contraste du texte pour une lecture confortable.
  • Limite : La mise en page complexe (colonnes, images) n’est pas toujours fidèlement reproduite après OCR.

3. TXT (texte brut) : simplicité absolue pour lecture rapide

  • Avantages : Ultra-léger, lisible sur tout appareil, aucun formatage parasite. TXT évite aussi les obstacles de compatibilité rencontrés sur les anciens supports.
  • Idéal pour : Documents courts (notes, courriers), ou pour créer une base de travail à relire ultérieurement sur n’importe quel terminal (PC, smartphone, lecteur braille).
  • Limites : Perte totale des structures de page (titres, listes), pas d’images ni de mise en forme. Pour des ouvrages longs ou à la structure complexe, la navigation devient très difficile.

4. Daisy (Digital Accessible Information SYstem) : la référence pour la lecture structurée

  • Atout principal : Pensé pour la lecture audio structurée. Idéal pour les livres, manuels ou documents volumineux nécessitant une navigation par chapitres, sous-chapitres, pages.
  • Éléments intégrés : Voix audio structurée (humaine ou synthétique), synchronisation texte/voix, tables des matières interactives.
  • Limite : Création du format Daisy plus complexe (scission, balisage), nécessite un logiciel dédié à la lecture (AMIS, EasyReader, VoiceDream Reader…).
  • Selon la Bibliothèque Numérique Francophone Accessible (BNFA), la majorité des catalogues de livres adaptés sont proposés en Daisy, plébiscités par les lecteurs utilisant des plages braille et lecteurs audio.

5. ePub : le format moderne des livres numériques

  • Avantages : Mise en page « reflowable » (adaptable à l’écran), possibilité de grossir les caractères à volonté, navigation par chapitres, prise en charge des images alternatives. Particulièrement apprécié sur smartphones et liseuses (Bookeen, Kobo, iPad, Android).
  • Compatibilité : Excellente avec VoiceOver, TalkBack et de nombreux logiciels d’agrandissement.
  • Limite : Pour bénéficier d’un ePub accessible, il faut que la conversion à partir du scan ait bien reconstruit la structure du texte.
  • Selon EbookFriendly, l’ePub est aujourd’hui le standard n°1 pour les ouvrages numériques dans le monde francophone.

Critères de choix : à chaque usage son format de référence

  • Pour une lecture rapide et basique : TXT ou Word. Faciles à ouvrir, ils garantissent une lecture immédiate, en particulier pour les notes, courriers ou documents très courts.
  • Pour conserver la structure et naviguer aisément : Word ou PDF balisé. Recommandé pour les documents longs ou multi-parties (rapports, manuels, supports de présentation).
  • Pour lire « comme un livre » : Daisy ou ePub. Privilégier Daisy si l’audio et la navigation fine sont prioritaires, ePub si l’on veut bénéficier de l’adaptation visuelle sur liseuse ou tablette.
  • Pour l’archivage ou la diffusion universelle : PDF, mais à condition de bien vérifier l’accessibilité (contenu non vérouillé, texte sélectionnable, balises de structure présentes).

Concrètement, comment générer un bon format ?

Deux points critiques : qualité de l’OCR et choix du logiciel de conversion.

  • Les OCR modernes (ABBYY FineReader, KNFB Reader, Readiris, Tesseract...) proposent directement l’export vers Word, ePub, TXT ou Daisy avec reconnaissance automatique des titres, listes et tableaux. L’ABBYY FineReader, par exemple, permet de choisir entre plus de 15 formats de sortie, paramétrables selon ses besoins d’accessibilité.
  • Pour créer un PDF accessible, il faut :
    • Valider que le texte est bien « vrai » (pas une image)
    • Ajouter les balises de structure (logique de lecture, titres)
    • Vérifier la compatibilité avec un lecteur d’écran (Adobe Reader, JAWS, NVDA…)
  • Pour un document à lire sur une plage braille, privilégier un export Word ou TXT, pour limiter les perturbations dues à la mise en page graphique.
  • Pour la lecture sur smartphone avec synthèse vocale : ePub ou Word, exploitables par les applications VoiceDream Reader, EasyReader ou Apple Livres.

Focus : Les pièges courants à éviter lors de la conversion

  • Images de texte sans reconnaissance OCR : Le texte reste invisible pour les aides techniques.
  • Mise en page éclatée : Résulte d’une mauvaise reconnaissance (colonnes mélangées, mots “coupés”). Tester systématiquement la lisibilité après conversion.
  • Étiquettes de navigation absentes : Les titres ou sommaires non reconnus rendent la navigation fastidieuse ; structurer le document après conversion si besoin.
  • Protection par mot de passe : Certains PDF empêchent la lecture par les aides adaptées, vérifiez toujours les permissions à l’export.

Tableau comparatif : Forces et limites des principaux formats

Format Lecture synthèse vocale Navigation structurée Mise en page Poids du fichier Compatibilité
PDF texte Oui (si balisé) Oui/Non* Fidèle à l’original Élevé Universelle
Word (DOC/DOCX) Oui Oui Bonne (sauf cas complexes) Moyen Très large
TXT Oui Non Aucune Très léger Universelle
Daisy Oui (audio natif) Excellente Structurée Léger à moyen Spécifique
ePub Oui Oui Adaptable (« reflow ») Léger Très large

*PDF : navigation structurée uniquement si balisé correctement.

Ressources clés pour approfondir le sujet

Ouvrir le champ des possibles avec l’accessibilité numérique

Le choix du format n’est pas anodin. Il peut transformer un simple scan en véritable passerelle vers l’autonomie, à condition de prêter attention à la qualité de conversion, à la structuration et à l’adéquation entre format et usage. Maîtriser ces aspects permet de s’assurer que chaque document, même issu du papier, demeure lisible, navigable et adaptable selon ses besoins — que ce soit à la maison, en cours ou au travail. Et au fil de l’innovation technologique, les formats accessibles continueront d’évoluer pour ouvrir toujours davantage le champ des possibles.

En savoir plus à ce sujet :