Encodage / décodage

 Le texte peut être codé de plusieurs façons.  La plupartdes fichiers texte sont au format de codage appelé ANSI, permettant le codage compact d'un jeu de 256 caractères. Pour les usages européens ce codage est suffisant. Toutefois, l'encodage Unicode a été mis au point pour permettre de coder une quantité beaucoup plus importante de caractères, ce qui permet à un seul fichier de contenir du texte de plusieurs écritures, au prix d'une taille plus importante. Notepad++ va essayer de détecter automatiquement le codage utilisé à l'ouverture d'un fichier, mais il vous permet de le changer à l'édition. Pour changer simplement l'encodage de restitution (sans modifier le texte lui-même), sélectionnez l'une des options Encodage -> Encoder en.... Pour convertir le texte dans un autre codage, sélectionnez l'une des entrées Encodage -> Convertir en ....

 Il peut arriver qu'un fichier soit enregistré avec un codage que Notepad++ n'arrive pas à détecter correctement. Il s'agit d'une limitation technique et elle se produit parce que le fichier résultat ne stocke pas le type d'encodage. Cela n'est plus le cas si le fichier est enregistré avec une mode BOM (Byte Order Mark) indiquant le codage utilisé.

 Notepad++ offre les systèmes de codage suivants :
 ANSI
 Codage originel du format Windows, la plus petite taille possible pour le fichier. résultat, mais sujet ç des erreurs dues à l'utilisation de multiples pages de code (jeux de caractères différents). Une appelation plus correcte serait OEM.
 UTF-8
Codage Unicode, le plus utilisé sur Internet. Il code le maximum de caractère en caractère sur un octet, permettant de diminuer la taille du fichier. Toutefois, ce format autorise l'utilisation de caractères codés sur 2, 3 ou 4 octets, Une suite d'octets BOM figurera en en-tête du fichier pour mémoriser le codage utilisé.
 UTF-8 sans BOM
 Comme UTF-8, mais la BOM n'est pas ajoutée. Economise trois octets, mais rend plus difficile la détection d'encodage. Les anciens serveurs requièrent ce mode.
 UCS-2LE (Little Endian)
Tous les caractères sont encodés sur deux octets , les couples d'octets sont au format Little Endian. Un en-tête de 2 octets est ajouté au fichier.
 UCS-2BE (Big Endian)
Tous les caractères sont encodés sur deux octets , les couples d'octets sont au format Big Endian. Un en-tête de 2 octets est ajouté au fichier.

 En outre, depuis la version 5.6, Notepad++ supporte le changement de jeu de caractères utilisé pour afficher le texte au format ANSI, exactement comme vous le faites dans la plupart des navigateurs web. Ces encodages sont disponibles en utilisant les  jeux de caractères  ci dessus énumérés dans l'option  Encoder en ... Le codage initial de nouveaux documents peut être de n'importe quel type : Unicode, ANSI ou formats pris en charge.

Notepad++ déteccte l'encodage d'un document au moyen de techniques d'analyse sophistiquées. Vous pouvez tojours le changer si le résultat est incorrect. uand une référence à un document est inscrite dans une session, l'encodage utilisé est sauvegardé. Comme la détection est heuristique, elle peut parfois se tromper; vous pouvez la désactiver par Auto-détection de l'encodage sur l'onglet Divers des Préfére,ces.