3.1 XML/HTML pour les EPUB, les sites internet
3.1.1 introduction au XML/HTML comme langages de balises lisibles par les machines et les humains.
Langages de balises lisibles par les humains et les machines.
Un langage de balises est un système d’annotation d’un texte à l’aide d’éléments encadrés par des balises. Exemple simple :
<h1>Titre</h1>
<p>Paragraphe de texte.</p>
Les balises indiquent la fonction du contenu, non son apparence. Ce n’est pas une mise en forme, mais une structuration sémantique (h1 pour titre de niveau 1 et pour paragraphe).
HTML (HyperText Markup Language) est le langage du Web. Il définit titres, paragraphes, listes, liens, images… Il est interprété par les navigateurs. Le standard aujourd’hui est HTML5 qui a introduit davantage de balises sémantiques pour une meilleure accessibilité (<article>, <section>, <nav>) et multimédia (<audio>, <video>). Ses normes sont définies par le consortium W3C.
XML (eXtensible Markup Language) est un métalangage. Il ne définit pas un vocabulaire précis, mais une syntaxe rigoureuse permettant de créer des vocabulaires pour structurer des données.
Exemple simple
<chapitre>
<titre>Introduction</titre>
<auteur>Nom</auteur>
</chapitre>
XHTML (eXtensible HyperText Markup Language) utilisé par les EPUB est une reformulation de HTML en syntaxe XML stricte.
Le HMTL5 est plus tolérant, le navigateur saura par exemple lire
<img src="image.jpg">
<p>Texte
invalide dans un EPUB qui n’acceptera que la syntaxe
<img src="image.jpg" alt="la description de l'image" />
<p>Texte</p>
Cette plus grande rigueur a pour but de favoriser l’interopérabilité, l’accessibilité et la pérennité du fichier. Un débat anime aujourd’hui la communauté du W3C : le prochain standard EPUB (4 ? 5 ?) qui succédera à l’EPUB 3 ne doit-il pas abandonner le XHTML pour le HTML5 du web ?
3.1.2 Distinguer structuration des contenus XML/HTML et présentation avec les CSS
En édition traditionnelle le maquettiste fixe l’apparence, le texte est inséparable de sa mise en page.
En XML / HTML, on décrit la nature du contenu, la présentation est appliquée ensuite à l’aide des feuilles de style en cascade (CSS). Cette dissociation de structure et de la présentation est au cœur du concept de publication multisupport.
3.1.3 le principe des feuilles de style dans les logiciels de traitement de texte et mise en page comme Word et Indesign.
Ce principe de l’utilisation de styles pour définir la présentation du contenu se retrouve dans les traitements de texte comme Word ou de mise en page comme Indesign. De nombreux éditeurs imposent une utilisation stricte de styles pour la préparation de copie à l’aide d’un traitement de texte afin de faciliter ensuite imports et exports multisupports.
Voir par exemple les modèles Word pour l’édition scientifique avec Lodel : https://github.com/OpenEdition/lodel/wiki/Modèle-de-document-pour-Microsoft-Word
3.2 L’interactivité
On distingue l’interactivité côté client avec le langage JavaScript et côté serveur le plus souvent à l’aide des langages PHP/SQL/python.
JavaScript associé à (X)HTML/CSS permet d’ajouter des fonctionnalités interactives d’affichage aux sites web et EPUB. Par exemple ouvrir une petite fenêtre contextuelle pour une note, afficher une image pleine page… Le script est téléchargé avec les fichiers (X)HTML et CSS et interprété par le navigateur ou le lecteur EPUB sur l’appareil de l’utilisateur.
Les langages côté serveur vont permettre d’interagir avec une base de données, générer des pages personnalisées. Ils s’exécutent donc en mode connecté sur un site web ou une app.
3.2 Les résolutions et les formats d’images RVB vs CMJN
La résolution d’une image s’exprime DPI (dots per inch) = nombre de points par pouce (2,54 cm). Il s’agit d’une densité de pixels rapportée à une dimension physique. Plus le nombre est élevé, plus l’image peut être imprimée finement. La norme de l’impression est 300 dpi (adaptée à la finesse de trame d’impression offset, l’œil humain ne distingue plus les points à distance de lecture normale). Une image de 3000 × 2000 pixels pourra être imprimée à 300 DPI jusqu’à environ 25 × 17 cm.
Les écrans affichent des pixels lumineux. Un écran Full HD affiche 1920 × 1080 pixels. Dans l’édition numérique on va davantage raisonner en pixels plutôt qu’en DPI même si la résolution va également avoir un sens. Par exemple un iphone 17 avec un écran de 6,3 pouces de diagonale a une résolution de 2 622 x 1 206 pixels à 460 pixels par pouces.
Le modèle de couleur RVB (Rouge – Vert – Bleu) est utilisé pour les écrans. Le modèle CMJN (Cyan – Magenta – Jaune – Noir) est utilisé pour l’impression. Passer du RVB au CMJN entraîne une perte de saturation, la modification des tons, l’aplatissement des contrastes. Un fichier CMJN affiché à l’écran paraît terne.
Vous pouvez par exemple convertir cette image RVB en CMJN à l’aide de Photoshop :

L’édition multisupport suppose par conséquent un traitement différencié des images selon les supports de publication.
3.3 Les livres numériques et l’accessibilité.
L’accessibilité est devenue une obligation réglementaire depuis la mise en application d’une directive européenne le 28 juin 2025 (voir document du ministère de la Culture) pour la production des livres numériques mais c’est aussi une marque de rigueur éditoriale, un argument de qualité, un élargissement du lectorat, une bonne pratique pour la bonne indexation et le référencement de la publication par les moteurs de recherche et IA.
L’accessibilité vise à rendre un livre numérique lisible, navigable et compréhensible par tous, y compris les personnes malvoyantes, dyslexiques,
lecteurs utilisant des dispositifs d’assistance.
L’EPUB 3 a été conçu pour intégrer nativement ces exigences suivant les recommandations et bonnes pratiques WCAG (Web Content Accessibility Guidelines) du W3C. Le consortium DAISY fournit des outils pour la lecture mais également pour vérifier et valider l’accessibilité des fichiers.
Le principe fondamental de l’accessibilité du EPUB repose sur la structure sémantique du balisage de son contenu et les alternatives textuelles aux images. Un EPUB reflowable est plus naturellement accessible qu’un EPUB Fixed layout et qu’un PDF. Un PDF scanné est inaccessible.
3.4 Les métadonnées et le format ONIX
ONIX (ONline Information eXchange) est le standard international d’échange de métadonnées dans l’édition. Il permet aux éditeurs de transmettre aux distributeurs, libraires et plateformes l’ensemble des informations commerciales et descriptives d’un livre. Il s’agit d’un fichier XML, structuré selon une norme précise, destiné à l’échange automatisé d’informations.
Exemple minimal
<Product>
<RecordReference>12345</RecordReference>
<NotificationType>03</NotificationType>
<ProductIdentifier>
<ProductIDType>15</ProductIDType>
<IDValue>9780000000000</IDValue>
</ProductIdentifier>
<DescriptiveDetail>
<ProductComposition>00</ProductComposition>
<ProductForm>DG</ProductForm>
<TitleDetail>
<TitleType>01</TitleType>
<TitleElement>
<TitleText>Titre du livre</TitleText>
</TitleElement>
</TitleDetail>
</DescriptiveDetail>
</Product>
Un fichier ONIX contient notamment :
Identification
- ISBN
- EAN
- Type de produit (imprimé, numérique, audio)
Descriptif bibliographique
- Titre
- Sous-titre
- Auteur(s)
- Contributeurs
- Résumé
- Mots-clés
- Classification (THEMA)
Données commerciales
- Prix
- Devise
- TVA
- Territoires de vente
- Disponibilité
Données techniques (ebook)
- Format (EPUB, PDF)
- DRM
- Taille du fichier
Données d’accessibilité
- Caractéristiques d’accessibilité
- Conformité WCAG
Ce fichier ONIX s’il peut être créé manuellement avec un éditeur XML est généralement généré par le distributeur numérique à partir des données fournies dans un formulaire par l’éditeur.