Source : ct|04.05.09
< Tutoriels Informatique, Multimédia, Chinois
Le code unicode d'un idéogramme quelconque, figurant dans un document électronique (document texte, page web, e mail...),
peut être trouvé assez facilement. Il suffit de:
1) Sélectionner et copier cet idéogramme dans le presse papiers;
2) Coller cet idéogramme dans le bloc notes, puis enregistrer le fichier texte correspondant avec le format unicode;
3) Ouvrir le fichier texte avec un éditeur hexadécimal et regarder directement le code unicode de l'idéogramme.
Cette méthode nécessite d'utiliser un éditeur hexadécimal. Certains sont disponibles sur internet en version freeware. Par exemple, à la date d'écriture de ces lignes, l'éditeur hexadécimal "Frhed" (Free hex editor) est disponible à l'adresse http://frhed.sourceforge.net/.
Nous allons procéder de la façon suivante :
1) Télécharger et installer Frhed;
2) Sélectionner un idéogramme dans une page Web;
3) Enregistrer un fichier texte, contenant l'idéogramme;
4) Lire le code unicode de l'idéogramme, avec Frhed.
Le téléchargement et l'installation de Frhed sont très simple et rapides. Saisissez "frhed" dans le moteur de recherche de Google.
Cliquez le lien Frhed - Free hex editor à l'adresse frhed.sourceforge.net.
Sur ce site, téléchargez la dernière stable de Frhed.
Le fichier n'est pas très gros et peut donc se télécharger assez rapidement.
Pour installer Frhed, cliquez sur ce fichier et suivez la procédure d'installation. Le programme s'installe par défaut dans le répertoire "C:\Program Files\Frhed".
Une fois installé, Frhed peut être appelé depuis de menu Démarrer de Windows.
Connectez-vous sur un site web chinois. Le site www.beijing.cn par exemple. Sélectionnez un idéogramme et copiez-le dans le presse-papiers.
Ouvrez le bloc notes et collez l'idéogramme dans la zone de texte. Il est possible que celui-ci apparaisse sous la forme d'un petit carré.
Si c'est le cas, sélectionnez "Format/Police" et choisissez une police de caractères chinois.
Le caractère Chinois apparaît alors correctement dans le bloc note. Ajustez-le à la taille qui vous convient.
Il est à noter que la taille de caractère choisie est prise en compte par le bloc-note, mais elle ne sera pas enregistrée dans le document texte.
Sélectionnez "Fichier/Enregistrer sous"
Donnez un nom quelconque à votre fichier (essai.txt par exemple) et n'oubliez pas de spécifier le format unicode, sinon l'idéogramme ne sera pas correctement enregistré.
Ouvrez le fichier essai.txt avec Frhed.
Les deux premiers octets afichés fffe signifient que le fichier est enregistré avec le format unicode. Les deux octets suivants 32 75 représente dans l'ordre inverse le code unicode de l'idéogramme. Dans notre exemple nous pouvons déduire que le code unicode de l'idéogramme est 75 32. Si vous voulez que le code unicode soit affiché dans l'ordre direct, il vous suffit de sauver le fichier texte avec le format unicode big endian.
Les deux premiers octets sont également inversés. feff signifie que le fichier texte a été enregistré avec le format unicode big endian.
En balayant la table des caractères de Windows (Accessoires/Outils Systèmes/Table des caractères) vous pouvez vérifier que l'idéogramme unicode 7532 est bien celui capturé sur la page Web.
© http://turrier.fr (2007) |