Peut-on utiliser quelques caractères spéciaux comme des ligatures — surtout la ligature o-e en français —, des guillemets ou apostrophes typographiques, des tirets longs...) afin de soigner la mise en page d'un texte?

Ces caractères spéciaux comptent parmi ce qui fait le plaisir de la lecture d'un ouvrage imprimé et il faut bien reconnaître en cette mi-2003 que l'affichage des pages HTML est très pauvre en comparaison, encore que la situation se soit sensiblement améliorée depuis les débuts.

Nous allons passer en revue les grandes lacunes historiques du HTML. Certaines ont été comblées, mais pas toutes.

Ligatures

Les français déploraient notamment l'absence de la ligature œ dans le jeu de caractères de base. On l'obtient maintenant sans difficulté par l'entité œ ou par le codage unicode œ.

De même, la majuscule Œ s'obtient par &Oelig; ou Œ

Tant qu'à faire, on pourrait aussi s'inquiéter des élégances typographiques que donnent les ligatures f-f, f-l, f-i, f-f-i, et f-f-l.
Ces ligatures sont bel et bien prévues dans les polices Unicode, mais dans ce que j'ai vu sur Mac ou sur Windows (quand ça marche :-)), seules les ligatures f-i et f-l sont vraiment dessinées, les autres n'étant que la juxtaposition des caractères isolés. Par ailleurs, la définition des écrans est beaucoup trop faible pour qu'on sente la différence pour des caractères de taille normale (c.à.d. 16 px ou moins).
Tirets

Trop souvent, les auteurs de pages HTML se contentent du seul signe «-», alors que le monde de l'impression utilise trois types de tirets:
— le tiret de césure (le même que le signe «-» du calcul). Comme le HTML ne fait pas de césure, celui-là ne nous intéresse pas beaucoup.
— le tiret moyen utilisé pour indiquer une gamme de valeurs numériques (dans les années 39–40, par exemple). Ce tiret s'obtient par l'entité – ou le codage unicode –.
— enfin, le tiret long de dialogue, celui-là même que nous utilisons pour cette liste. Il s'obtient par l'entité — ou le codage unicode —.
    Comparez ces trois types de tirets : --- ––– ———

Apostrophes et guillemets typographiques

Les double-quotes "..." ne devrait jamais être utilisées dans un texte en bon français. C'est une hérésie typographique héritée des limitations mécaniques des premières machines à écrire... et de l'informatique.

En français, on emploie des guillemets français «...». Les guillemets typographiques “...” sont employés dans d'autres langues (anglais). De même, il conviendrait d'oublier les bien tristes simple-quotes des informaticiens '...' au profit des apostrophes typographiques ‘...’

Le tableau ci-dessous présente les codage par entités ou par numéros unicodes pour ces caractères :
Caractère Entité
HTML
Numéro
unicode
Description
« « « guillemet français ouvrant
» » » guillemet français fermant
“ “ guillemet anglais ouvrant
” ” guillemet anglais fermant
‘ ‘ apostrophe ouvrante
’ ’ apostrophe fermante

En fait, les guillemets français s'obtiennent directement au clavier avec la plupart des logiciels wysiwyg, ou avec les éditeurs textes sous Windows ou Linux travaillant sous le charset ISO-8859-1. On n'a vraiment besoin de les coder que pour certains éditeurs textes sous MacOS.

Il existe d'autres types de guillemets ou d'apostrophes accessibles par entités, utilisés dans d'autres langues occidentales.
Une meilleure gestion des espaces

En français, la gestion des espaces autour des signes de ponctuation est assez compliquée. Notamment, il doit y avoir une petite séparation (espace fine) entre les signes de ponctuation {;!?} et le mot juste auparavant (au contraire de l'anglais qui colle ces signes). En plus, évidemment, il ne faut pas courir le risque que ce signe se décolle du mot et se retrouve isolé en tête d'une ligne ; il faut donc que ce soit un espace insécable. Hélas ! Le HTML ne dispose pour le moment que du   qui est bien trop grand (environ 4 fois trop...).

Il semble que le HTML ait bel et bien prévu des entités pour ces espaces spéciales («espace» est féminin en typographie), probablement   pour cette espace fine, mais manifestement, les navigateurs, même les plus conformes d'entre eux, ne sont pas encore au rendez-vous en 2003...

Par contre, la mauvaise gestion du passage des italiques au texte normal (IE4 et NN4) n’est plus qu'un mauvais souvenir :-)

Charles