Pourquoi le choix du format de fichier compte pour l’accessibilité numérique

L’accès à l’information pour les personnes aveugles ou malvoyantes dépend, en grande partie, de la compatibilité des formats de fichiers avec les lecteurs d’écran. Les études menées par le World Wide Web Consortium (W3C) et des organismes comme WebAIM pointent une évidence : même le contenu le mieux rédigé devient inutilisable s’il est enfermé dans un format inadapté ou mal structuré (WebAIM Screen Reader Survey #9). Or, en 2023, plus de 90% des personnes ayant recours à un lecteur d’écran sur ordinateur utilisent JAWS, NVDA ou VoiceOver, selon WebAIM, qui sont dépendants de la qualité et de la structuration des fichiers lus.

Un bon format de fichier ne se contente pas d’être “compatible” : il doit restituer le contenu (texte, images, structure, navigation, informations contextuelles) de manière claire, ordonnée et exploitable. Pour les auteurs ou les équipes qui publient des ressources, comprendre les forces et les faiblesses des principaux formats est devenu un enjeu de lisibilité et d’égalité d’accès.

Textes simples : la robustesse du TXT et ses limites

Le format TXT (texte brut) reste un socle incontournable. Dépourvu de balisage ou de mise en forme sophistiquée, il assure une prise en charge rapide par tous les lecteurs d’écran — sur PC, Mac, smartphones. Cette simplicité en fait l’un des formats les plus universels : pas d’éléments perturbateurs, une structure linéaire, aucun risque de balises non reconnues.

  • Points forts : Portabilité absolue, très léger, aucun risque de virus, ouverture garantie sur tous les systèmes.
  • Limites : Aucune hiérarchie (titres, paragraphes), pas de liens, pas d’images, aucune mise en valeur d’éléments importants.

En 2022, une étude du Centre pour l’Accessibilité Numérique (CAN) a montré que 7 sur 10 utilisateurs de lecteurs d’écran préfèrent les formats structurés (comme DOCX ou PDF balisé) pour les documents longs ou complexes, le TXT ne convenant qu’à des notes ou des textes courts.

Le DOCX : la polyvalence conditionnée à une structure rigoureuse

Le format DOCX (Microsoft Word) s’est imposé comme un standard pour l’échange de documents bureautiques. Son succès tient à la fois à sa compatibilité sur de nombreuses plateformes (Microsoft, LibreOffice, Google Docs…) et à sa capacité à intégrer une diversité d’informations (titres, tableaux, listes, liens).

  • Avantages : Structuration poussée (titres, styles, descriptions alternatives pour images), prise en charge avancée par JAWS, NVDA, VoiceOver, navigation facilitée par la table des matières.
  • Risques : Les styles mal utilisés (pas de titres structurés) nuisent à la navigation. Les images sans descriptions ("texte alternatif") sont ignorées ou inaccessibles.

Selon l'AFNOR, 60% des documents Word partagés dans l’éducation ou l’administration en France ne respectent pas les bonnes pratiques d’accessibilité (AFNOR - Accessibilité des documents). La structuration (usage des styles Titre 1, Titre 2, listes à puces…) reste le point névralgique : si elle est ignorée, un document DOCX devient aussi difficile à lire qu’un simple TXT.

Le PDF balisé : le roi contesté de la diffusion, sous conditions

Le PDF s’est imposé pour l’archivage et l’échange de documents officiels. Mais tous les PDF ne se valent pas : seuls les PDF balisés (balises de structure) garantissent une expérience correcte avec les lecteurs d’écran. Le PDF image (issu d’un scan, sans reconnaissance optique de caractères) est, lui, totalement inaccessible — à moins de passer par une étape d’OCR (reconnaissance optique de caractères).

  • Avantages des PDF balisés : Conservation de la mise en page, navigation par chapitre, tableaux lisibles, images accessibles si décrites.
  • Inconvénients : Un PDF non balisé (pur scan) est inutilisable pour un lecteur d’écran. La qualité du balisage varie beaucoup selon le logiciel d’origine. Les formulaires PDF restent difficiles à renseigner en accessibilité, bien que des progrès soient constatés depuis 2021 (Adobe - PDF Accessibility Overview).

D’après une étude menée par WebAIM en 2023, seuls 16,5% des PDFs étudiés dans les universités américaines étaient parfaitement accessibles dans leur format original (WebAIM - The WebAIM Million). La vigilance sur la provenance d’un PDF reste donc essentielle.

Les formats HTML : la référence pour le web

Sur le web, le format HTML — correctement balisé et respectant les standards du W3C — propose le meilleur rapport entre structuration, navigation et flexibilité. Les lecteurs d’écran détectent instantanément titres, liens, listes, images avec descriptions ("alt"), tableaux, et permettent une navigation ultra-rapide, à condition que le code soit bien fait.

  • Avantages : Navigation par en-tête et sections, saut rapide vers le contenu principal, liens contextuellement compréhensibles, compatibilité universelle.
  • Points d’attention : Une balise manquante (ex : titre absent) ou mal placée peut rendre le site inutilisable. Les images décoratives non masquées ou les carrousels non accessibles entraînent une "pollution" sonore ou de navigation.

Selon le W3C (2023), près de 96% des sites parmi le million les plus visités comportent des erreurs d’accessibilité, la majorité de ces problèmes étant liés à du HTML mal structuré ou à un usage inadéquat des rôles ARIA (WebAIM - The WebAIM Million).

D’autres formats spécifiques : EPUB, DAISY, RTF et au-delà

Certains formats ont été conçus spécifiquement pour une lecture adaptée ou enrichie :

  • EPUB 3 : Standard des livres numériques, il peut intégrer un balisage sémantique (titres, chapitres, listes, etc.), des images accessibles et même du texte alternatif, compatible avec de nombreux lecteurs d’écran (Thorium Reader, Voice Dream Reader). L’EPUB est fortement recommandé pour les ouvrages volumineux (manuels scolaires, romans…). Selon la DAISY Consortium, l’EPUB 3 est le format de choix pour le livre numérique accessible (DAISY Consortium - EPUB 3).
  • DAISY : Prévu pour l’audio-numérique structuré, permet la navigation rapide dans le livre (chapitres, paragraphes) et l’alternance texte/voix. Largement utilisé en bibliothèque spécialisée (BNFA, Éole, etc.).
  • RTF (Rich Text Format) : Plus souple que le TXT mais moins structurant que DOCX ; utilisé dans l’éducation car facilement convertible et peu lourd.

Quelles bonnes pratiques pour produire des fichiers accessibles ?

Pour que les formats de fichiers déploient toutes leurs qualités avec un lecteur d’écran, la forme ne suffit pas : le fond (la structuration de l’information) est décisif.

  1. Systématiser les styles : Toujours baliser titres et sous-titres dans Word ou Google Docs, utiliser les balises HTML appropriées (

    ,

    , etc.) dans les pages web.

  2. Ajouter du texte alternatif pour les images : Jamais d’image informative sans description succincte (sauf purement décorative, qui sera ignorée par un “alt vide”).
  3. Vérifier le balisage des PDF : Utiliser les outils de vérification d’Adobe Acrobat ou d’autres vérificateurs pour s’assurer de la présence de tags (éléments de structuration) et de la lecture correcte en mode “accessibilité”.
  4. Ellever la complexité superflue : Éviter les tableaux imbriqués, les champs de formulaire sans label ou les titres non hiérarchiques.
  5. Faire tester les fichiers par des utilisateurs concernés : Il n’est pas rare qu’un document techniquement “correct” reste pénible à naviguer en situation réelle.

À noter : la présence d’un “éditeur d’accessibilité” dans Word ou Acrobat permet en quelques minutes de détecter les erreurs les plus courantes.

Formats non recommandés ou à proscrire pour les lecteurs d’écran

Certains formats posent de sérieuses difficultés, tant pour la lecture que pour l’interactivité :

  • PPTX : Les présentations PowerPoint sont parfois très visuelles et rarement structurées pour la lecture linéaire. Les lecteurs d’écran peinent à rendre les animations, l’ordre de lecture n’est pas toujours évident (WebAIM - PowerPoint Accessibility).
  • Images et scans non traités (JPEG, PNG, TIFF…) : Sans offre de texte alternatif ou d’OCR, ces formats sont à éviter absolument pour tout document destiné à être lu.
  • Formats propriétaires anciens (WPS, DOC pré-2007, etc.) : Risques d’incompatibilité ou de perte de structuration.

Panorama des choix selon le contexte d'utilisation

Usages Format recommandé Pourquoi ce choix ?
Notes rapides, brouillon TXT Lecture instantanée et universelle, zéro obstacle
Document de type rapport, courrier, mémoire DOCX structuré Navigation par styles, descriptifs d’images
Document officiel, archivage PDF balisé Mise en page fidèle + structuration accessible
Livre numérique, manuel EPUB 3 / DAISY Navigation structurée, lecture continue ou audio
Ressource ou formation en ligne HTML (pages web) Navigation rapide, support natif par tous les lecteurs

Vers une information accessible par essence, pas par exception

Le choix du format de fichier ne se limite plus à une question de “confort” ou de compatibilité : il structure profondément l’expérience informative et le rapport à l’autonomie. Les progrès récents des logiciels de lecture et des standards de balisage prouvent que la qualité n’est plus un luxe d’initiés, mais un droit fondamental pour tous.

Adopter la bonne combinaison format + structuration, c’est accélérer le partage des connaissances et gommer les frontières entre public voyant et non-voyant. À l’ère de la transformation digitale, viser l’accessibilité n’est pas un supplément d’âme, mais la plus solide des bases pour que l’information circule — vraiment — sans obstacle.

Pour approfondir : Accede Web – Notions clés d’accessibilité des formats de fichiers, WebAIM – PDF accessibility, DAISY Consortium.

En savoir plus à ce sujet :