Je me permet d’émettre cette petite remarque.
En HTML ou en XML, un document dans un langage donné doit porter la mention de la langue utilisée (xml:lang="EN") par exemple.
Donc, un visualiseur HTTP doit être capable de pouvoir choisir le bon jeu de caractère grâce à cette information de langue mais il est vrai que bien peu de pages se donnent la peine de fournir ce genre d’information.
Néanmoins, il reste vrai que les caractères chinois/japonais prennent bien plus de place en UTF-8. Là aussi XML fait quelque chose en acceptant la plupart des encodages standards en 8 ou 16 bits sans préférence de langue. Il ne faut donc pas désespérer.
Je me permet d’émettre cette petite remarque.
En HTML ou en XML, un document dans un langage donné doit porter la mention de la langue utilisée (xml:lang="EN") par exemple.
Donc, un visualiseur HTTP doit être capable de pouvoir choisir le bon jeu de caractère grâce à cette information de langue mais il est vrai que bien peu de pages se donnent la peine de fournir ce genre d’information.
Néanmoins, il reste vrai que les caractères chinois/japonais prennent bien plus de place en UTF-8. Là aussi XML fait quelque chose en acceptant la plupart des encodages standards en 8 ou 16 bits sans préférence de langue. Il ne faut donc pas désespérer.