turrier.fr

Source : ct|04.05.09

< Tutoriels Informatique, Multimédia, Chinois

Trouver le code unicode d'un idéogramme

Le code unicode d'un idéogramme quelconque, figurant dans un document électronique (document texte, page web, e mail...), peut être trouvé assez facilement. Il suffit de:
1) Sélectionner et copier cet idéogramme dans le presse papiers;
2) Coller cet idéogramme dans le bloc notes, puis enregistrer le fichier texte correspondant avec le format unicode;
3) Ouvrir le fichier texte avec un éditeur hexadécimal et regarder directement le code unicode de l'idéogramme.

Cette méthode nécessite d'utiliser un éditeur hexadécimal. Certains sont disponibles sur internet en version freeware. Par exemple, à la date d'écriture de ces lignes, l'éditeur hexadécimal "Frhed" (Free hex editor) est disponible à l'adresse http://frhed.sourceforge.net/.

Nous allons procéder de la façon suivante :
1) Télécharger et installer Frhed;
2) Sélectionner un idéogramme dans une page Web;
3) Enregistrer un fichier texte, contenant l'idéogramme;
4) Lire le code unicode de l'idéogramme, avec Frhed.

Télécharger et installer Frhed

Le téléchargement et l'installation de Frhed sont très simple et rapides. Saisissez "frhed" dans le moteur de recherche de Google.

google

Cliquez le lien Frhed - Free hex editor à l'adresse frhed.sourceforge.net.

frhed.sourceforge.net

Sur ce site, téléchargez la dernière stable de Frhed.

frhed

Le fichier n'est pas très gros et peut donc se télécharger assez rapidement.

frhed 1.4.2

Pour installer Frhed, cliquez sur ce fichier et suivez la procédure d'installation. Le programme s'installe par défaut dans le répertoire "C:\Program Files\Frhed".

frhed 1.4.2 setup

Une fois installé, Frhed peut être appelé depuis de menu Démarrer de Windows.

frhed

Séléctionner un idéogramme dans une page Web

Connectez-vous sur un site web chinois. Le site www.beijing.cn par exemple. Sélectionnez un idéogramme et copiez-le dans le presse-papiers.

beijing.cn

Enregistrer un fichier texte, contenant l'idéogramme

Ouvrez le bloc notes et collez l'idéogramme dans la zone de texte. Il est possible que celui-ci apparaisse sous la forme d'un petit carré.

bloc notes

Si c'est le cas, sélectionnez "Format/Police" et choisissez une police de caractères chinois.

format police

mingliu

Le caractère Chinois apparaît alors correctement dans le bloc note. Ajustez-le à la taille qui vous convient.
Il est à noter que la taille de caractère choisie est prise en compte par le bloc-note, mais elle ne sera pas enregistrée dans le document texte.

idéogramme 7532

Sélectionnez "Fichier/Enregistrer sous"

Fichier Enregistrer sous

Donnez un nom quelconque à votre fichier (essai.txt par exemple) et n'oubliez pas de spécifier le format unicode, sinon l'idéogramme ne sera pas correctement enregistré.

format unicode

Lire le code unicode de l'idéogramme, avec Frhed

Ouvrez le fichier essai.txt avec Frhed.

fffe

Les deux premiers octets afichés fffe signifient que le fichier est enregistré avec le format unicode. Les deux octets suivants 32 75 représente dans l'ordre inverse le code unicode de l'idéogramme. Dans notre exemple nous pouvons déduire que le code unicode de l'idéogramme est 75 32. Si vous voulez que le code unicode soit affiché dans l'ordre direct, il vous suffit de sauver le fichier texte avec le format unicode big endian.

unicode big endian

Les deux premiers octets sont également inversés. feff signifie que le fichier texte a été enregistré avec le format unicode big endian.

feff

En balayant la table des caractères de Windows (Accessoires/Outils Systèmes/Table des caractères) vous pouvez vérifier que l'idéogramme unicode 7532 est bien celui capturé sur la page Web.

Table des caractères


Valid XHTML 1.0 Transitional

© http://turrier.fr (2007)