Mapeamento de Caracteres Estendidos

Resumo comparativo de códigos de caracteres estendidos e latinos nos principais sistemas ou conjuntos de mapeamento e codificação de caracteres.

Márcio d'Ávila, 14 de agosto de 2004. Revisão 2, 16 de junho de 2007.
Categoria: Multimídia - Texto

Resumo de Conjuntos de Caracteres

Tabela comparativa do mapeamento de caracteres para os códigos de 0 a 255 (8 bits), nos conjuntos de caracteres mais comuns.

Faixa Padrão
ISO/IEC 8859-1
Windows-1252
(ANSI)
IANA (MIME)
ISO-8859-1
Unicode ISO 646
(ASCII)
ECS (DOS)
Decimal Hexa
0 - 31 0x00 - 0x1F não definido caracteres de controle C0
32 - 127 0x20 - 0x7F caracteres imprimíveis mais comuns (letras, números, símbolos)
128 - 159 0x80 - 0x9F não definido caracteres estendidos caracteres de controle C1 não definido caracteres
estendidos
160 - 255 0xA0 - 0xFF caracteres latinos

Correspondência de Caracteres (128 a 255)

Tabela de correspondência de caracteres estendidos e latinos entre os seguintes sistemas de mapeamento/codificação de caracteres, com exemplo de cada caractere visível resultante (Chr) e seu significado: Windows-1252 (ANSI) - Faixa Estendida (códigos 128-255), Unicode, DOS - Conjunto de Caracteres Estendido (Extended Character Set - ECS), Entidades HTML (&nome;).

Os códigos 160 a 255 (0xA0 a 0xFF) coincidem com o padrão ISO/IEC 8859-1 e o conjunto de caracteres MIME para Internet ISO-8859-1 definido pela IANA. Já os códigos 128 a 159 (0x80 a 0x9F) não são definidos no padrão ISO/IEC 8859-1; na definição IANA ISO-8859-1, correspondem ao conjunto de caracteres de controle C1.

Windows-1252 (ANSI) Unicode ECS
(DOS)
HTML
entity
Chr Significado
Dec Hex Dec U+ Hex Categoria
128 0x80 8364 U+20AC Currency euro símbolo do euro (União Européia)
129 0x81 129 U+0081 n/a (não usado)
130 0x82 8218 U+201A Punct. sbquo fecha-aspa simples inferior
131 0x83 402 U+0192 Latin B 159 fnof ƒ f minúsculo com gancho (florin)
132 0x84 8222 U+201E Punct. bdquo fecha-aspa dupla inferior
133 0x85 8230 U+2026 Punct. hellip reticências
134 0x86 8224 U+2020 Punct. dagger dagger (simples)
135 0x87 8225 U+2021 Punct. Dagger dagger (duplo)
136 0x88 710 U+02C6 Punct. circ ˆ circunflexo
137 0x89 8240 U+2030 Punct. permil por mil
138 0x8A 352 U+0160 Latin A Scaron Š S caron maiúsculo
139 0x8B 8249 U+2039 Punct. lsaquo abre-aspa angular (guillemet) simples (esquerda)
140 0x8C 338 U+0152 Latin A OElig Œ OE ligadura maiúsculo
141 0x8D 141 U+008D n/a (não usado)
142 0x8E 381 U+017D Latin A Zcaron Ž Z caron maiúsculo
143 0x8F 143 U+008F n/a (não usado)
144 0x90 144 U+0090 n/a (não usado)
145 0x91 8216 U+2018 Punct. lsquo abre-aspa simples (esquerda)
146 0x92 8217 U+2019 Punct. rsquo fecha-aspa simples (direita)
147 0x93 8220 U+201C Punct. ldquo abre-aspa dupla (esquerda)
148 0x94 8221 U+201D Punct. rdquo fecha-aspa dupla (direita)
149 0x95 8226 U+2022 Punct. bull marcador redondo grande (bullet)
150 0x96 8211 U+2013 Punct. ndash travessão simples (largura "n")
151 0x97 8212 U+2014 Punct. mdash travessão duplo (largura "m")
152 0x98 732 U+02DC S.M.L. tilde ˜ til
153 0x99 8482 U+2122 Letterlike trade marca comercial (trademark)
154 0x9A 353 U+0161 Latin A scaron š s caron minúsculo
155 0x9B 8250 U+203A Punct. rsaquo fecha-aspa angular simples (direita)
156 0x9C 339 U+0153 Latin A oelig œ oe ligadura minúsculo
157 0x9D 157 U+009D n/a (não usado)
158 0x9E 382 U+017E Latin A zcaron ž z caron minúsculo
159 0x9F 376 U+0178 Latin A Yuml Ÿ Y trema maiúsculo
ANSI Unicode ECS
(DOS)
HTML
entity
Chr Significado
Dec Hex Dec U+ Hex Categoria
160 0xA0 160 U+00A0 Latin nbsp   espaço não-separável
161 0xA1 161 U+00A1 Latin 173 ¡ exclamação (!) invertida (espanhol)
162 0xA2 162 U+00A2 Latin 189 cent ¢ símbolo de centavos (cents Inglaterra)
163 0xA3 163 U+00A3 Latin 156 pound £ símbolo da libra (pound Inglaterra)
164 0xA4 164 U+00A4 Latin 207 curren ¤ símbolo monetário internacional
165 0xA5 165 U+00A5 Latin 190 yen ¥ símbolo do yen (Japão)
166 0xA6 166 U+00A6 Latin 221 brvbar ¦ barra vertical separada
167 0xA7 167 U+00A7 Latin 245 sect § símbolo de seção
168 0xA8 168 U+00A8 Latin 249 uml ¨ trema
169 0xA9 169 U+00A9 Latin 184 copy © copyright (direito de reprodução)
170 0xAA 170 U+00AA Latin 166 ordf ª ordinal feminino
171 0xAB 171 U+00AB Latin 174 laquo « abre-aspa angular dupla (esquerda)
172 0xAC 172 U+00AC Latin 170 not ¬ negado (matemática)
173 0xAD 173 U+00AD Latin shy ­ hífen opcional
174 0xAE 174 U+00AE Latin 169 reg ® marca registrada
175 0xAF 175 U+00AF Latin 238 macr ¯ macron
176 0xB0 176 U+00B0 Latin 248 deg ° graus (círculo sobrescrito)
177 0xB1 177 U+00B1 Latin 241 plusmn ± mais ou menos
178 0xB2 178 U+00B2 Latin 253 sup2 ² 2 sobrescrito (ao quadrado, matemática)
179 0xB3 179 U+00B3 Latin 252 sup3 ³ 3 sobrescrito (ao cubo, matemática)
180 0xB4 180 U+00B4 Latin 239 acute ´ agudo
181 0xB5 181 U+00B5 Latin 230 micro µ símbolo de micro (mu grego)
182 0xB6 182 U+00B6 Latin 244 para símbolo de parágrafo (pilcrow)
183 0xB7 183 U+00B7 Latin middot · marcador redondo peq. (ponto central)
184 0xB8 184 U+00B8 Latin 247 cedil ¸ cedilha
185 0xB9 185 U+00B9 Latin 251 sup1 ¹ 1 sobrescrito
186 0xBA 186 U+00BA Latin 167 ordm º ordinal masculino
187 0xBB 187 U+00BB Latin 175 raquo » fecha-aspa angular dupla (direita)
188 0xBC 188 U+00BC Latin 172 frac14 ¼ um-quarto (1/4)
189 0xBD 189 U+00BD Latin 171 frac12 ½ um-meio (1/2)
190 0xBE 190 U+00BE Latin 243 frac34 ¾ três-quartos (3/4)
191 0xBF 191 U+00BF Latin 168 iquest ¿ interrogação (?) invertida (espanhol)
192 0xC0 192 U+00C0 Latin 183 Agrave À A craseado maiúsculo
193 0xC1 193 U+00C1 Latin 181 Aacute Á A agudo maiúsculo
194 0xC2 194 U+00C2 Latin 182 Acirc  A circunflexo maiúsculo
195 0xC3 195 U+00C3 Latin 199 Atilde à A til maiúsculo
196 0xC4 196 U+00C4 Latin 142 Auml Ä A trema maiúsculo
197 0xC5 197 U+00C5 Latin 143 Aring Å A círculo maiúsculo
198 0xC6 198 U+00C6 Latin 146 AElig Æ AE ligadura maiúsculo
199 0xC7 199 U+00C7 Latin 128 Ccedil Ç C cedilha maiúsculo
200 0xC8 200 U+00C8 Latin 212 Egrave È E craseado maiúsculo
201 0xC9 201 U+00C9 Latin 144 Eacute É E agudo maiúsculo
202 0xCA 202 U+00CA Latin 210 Ecirc Ê E circunflexo maiúsculo
203 0xCB 203 U+00CB Latin 211 Euml Ë E trema maiúsculo
204 0xCC 204 U+00CC Latin 222 Igrave Ì I craseado maiúsculo
205 0xCD 205 U+00CD Latin 214 Iacute Í I agudo maiúsculo
206 0xCE 206 U+00CE Latin 215 Icirc Î I circunflexo maiúsculo
207 0xCF 207 U+00CF Latin 216 Iuml Ï I trema maiúsculo
208 0xD0 208 U+00D0 Latin 209 Ð Eth maiúsculo (Islândia)
209 0xD1 209 U+00D1 Latin 164 Ntilde Ñ N til maiúsculo
210 0xD2 210 U+00D2 Latin 227 Ograve Ò O craseado maiúsculo
211 0xD3 211 U+00D3 Latin 224 Oacute Ó O agudo maiúsculo
212 0xD4 212 U+00D4 Latin 226 Ocirc Ô O circunflexo maiúsculo
213 0xD5 213 U+00D5 Latin 229 Otilde Õ O til maiúsculo
214 0xD6 214 U+00D6 Latin 153 Ouml Ö O trema maiúsculo
215 0xD7 215 U+00D7 Latin 158 times × símbolo de multiplicação/vezes (matemática)
216 0xD8 216 U+00D8 Latin 157 Oslash Ø O cortado maiúsculo
217 0xD9 217 U+00D9 Latin 235 Ugrave Ù U craseado maiúsculo
218 0xDA 218 U+00DA Latin 233 Uacute Ú U agudo maiúsculo
219 0xDB 219 U+00DB Latin 234 Ucirc Û U circunflexo maiúsculo
220 0xDC 220 U+00DC Latin 154 Uuml Ü U trema maiúsculo
221 0xDD 221 U+00DD Latin 237 Uacute Ý Y agudo maiúsculo
222 0xDE 222 U+00DE Latin 232 Þ Thorn maiúsculo (Islândia)
223 0xDF 223 U+00DF Latin 225 szlig ß s sharp (Alemanha, similar ao beta grego)
224 0xE0 224 U+00E0 Latin 133 agrave à a craseado minúsculo
225 0xE1 225 U+00E1 Latin 160 aacute á a agudo minúsculo
226 0xE2 226 U+00E2 Latin 131 acirc â a circunflexo minúsculo
227 0xE3 227 U+00E3 Latin 198 atilde ã a til minúsculo
228 0xE4 228 U+00E4 Latin 132 auml ä a trema minúsculo
229 0xE5 229 U+00E5 Latin 134 aring å a círculo minúsculo
230 0xE6 230 U+00E6 Latin 145 aelig æ ae ligadura minúsculo
231 0xE7 231 U+00E7 Latin 135 ccedil ç c cedilha minúsculo
232 0xE8 232 U+00E8 Latin 138 egrave è e craseado minúsculo
233 0xE9 233 U+00E9 Latin 130 eacute é e agudo minúsculo
234 0xEA 234 U+00EA Latin 136 ecirc ê e circunflexo minúsculo
235 0xEB 235 U+00EB Latin 137 euml ë e trema minúsculo
236 0xEC 236 U+00EC Latin 141 igrave ì i craseado minúsculo
237 0xED 237 U+00ED Latin 161 iacute í i agudo minúsculo
238 0xEE 238 U+00EE Latin 140 icirc î i circunflexo minúsculo
239 0xEF 239 U+00EF Latin 139 iuml ï i trema minúsculo
240 0xF0 240 U+00F0 Latin 208 eth ð eth minúsculo (Islândia)
241 0xF1 241 U+00F1 Latin 163 ntilde ñ n til minúsculo
242 0xF2 242 U+00F2 Latin 149 ograve ò o craseado minúsculo
243 0xF3 243 U+00F3 Latin 162 oacute ó o agudo minúsculo
244 0xF4 244 U+00F4 Latin 147 ocirc ô o circunflexo minúsculo
245 0xF5 245 U+00F5 Latin 228 otilde õ o til minúsculo
246 0xF6 246 U+00F6 Latin 148 ouml ö o trema minúsculo
247 0xF7 247 U+00F7 Latin 246 divide ÷ símbolo de divisão/dividido (matemática)
248 0xF8 248 U+00F8 Latin 155 oslash ø o cortado minúsculo
249 0xF9 249 U+00F9 Latin 151 ugrave ù u craseado minúsculo
250 0xFA 250 U+00FA Latin 162 uacute ú u agudo minúsculo
251 0xFB 251 U+00FB Latin 150 ucirc û u circunflexo minúsculo
252 0xFC 252 U+00FC Latin 129 uuml ü u trema minúsculo
253 0xFD 253 U+00FD Latin 236 yacute ý y agudo minúsculo
254 0xFE 254 U+00FE Latin 231 thorn þ thorn minúsculo (Islândia)
255 0xFF 255 U+00FF Latin 152 yuml ÿ y trema minúsculo

Currency = Currency Symbols
Latin = Latin Basic (ISO/IEC 8859-1 "Latin 1")
Latin A = Latin Extended-A
Latin B = Latin Extended-B
Letterlike = Letterlike Symbols
Punct. = General Punctuation
S.M.L. = Spacing Modifier Letters

Para saber mais:
Firefox - A web de volta
Creative Commons License

© 2003-2022, Márcio d'Ávila, mhavila.com.br, direitos reservados. O texto e código-fonte apresentados podem ser referenciados, distribuídos e utilizados, desde que expressamente citada esta fonte e o crédito do(s) autor(es). A informação aqui apresentada, apesar de todo o esforço para garantir sua precisão e correção, é oferecida "como está", sem quaisquer garantias explícitas ou implícitas decorrentes de sua utilização ou suas conseqüências diretas e indiretas.