Correo electrónico y unicode

Correo electrónico y unicode

Correo electrónico y unicode

Muchos clientes de correo electrónico hoy en día ofrecen soporte para Unicode en los cuerpos de mensaje. Aunque muchos no envían los mensajes en Unicode de forma implícita, e igualmente no todos los sistemas están configurados con tipografías capaces de mostrar el rango completo de caracteres Unicode.

El soporte de Unicode en las líneas de asunto (encabezados Subject: de los mensajes) y en las direcciones electrónicas es más problemático, puesto que es necesario coordinar varios estándares para manejar correctamente la presencia de datos no ASCII en un protocolo que originalmente fue diseñado solamente para este conjunto de caracteres:

  • RFC 2047 provee soprote para codificar valores no ASCII en los encabezados de un mensaje de correo electrónico (Véase encoded word)
  • RFC 3490 provee soporte para nombre de dominio no ASCII

Sin embargo, los nombre de los buzones (la parte de la dirección de correo electrónico que antecede al símbolo '@') aún está limitada al subconjunto de caracteres imprimibles de ASCII por la RFC 2822.

Soporte Unicode en el cuerpo del mensaje

Un mensaje con formato HTML puede usar entidades HTML para representar cualquier carácter en Unicode incluso si el contenido HTML del texto del mensaje utiliza una codificación antigua. El resto de este artículo asumirá que los mensajes de correo electrónico contienen texto (ya sean etiquetas HTML o texto plano) que usa un conjunto de caracteres que soporta completamente Unicode.

Como ocurre con todas las codificaciones aparte de ASCII, cuando se usa texto Unicode en un mensaje, debe hacerse uso de MIME para especificar que formato de transformación Unicode está siendo usado para el texto. Para utilizar Unicode en los encabezados de un mensaje, el texto Unicode tiene que ser codificado usando "Encoded-Word" de MIME, con un conjunto de caracteres Unicode.

UTF-7, aunque considerado en desuso, tiene una ventaja sobre otras codificaciones Unicode, y es que no require codificación adicional para soportar el límite de 7 bits de muchos servidores de correo legados en Internet. UTF-8 y UTF-16 por otra parte deben ser codificados usando base64 or quoted-printable para permitir una transmisión segura a través de servidores de correo que solo soportan 7 bit (por ejemplo, esos que no publican la extensión 8BITMIME).

Véase también

Enlaces externos

Categoía:Unicode

Obtenido de "Correo electr%C3%B3nico y unicode"

Wikimedia foundation. 2010.

Игры ⚽ Нужно сделать НИР?

Mira otros diccionarios:

  • Cliente de correo electrónico — Para una lista de este tipo de clientes, véase Anexo:Clientes de correo electrónico. Captura de pantalla de Mozilla Thunderbird 1.5.10. Un cliente de correo electrónico, o también llamado en inglés mailer o Mail User Agent (MUA) es un programa de …   Wikipedia Español

  • Clientes de correo electrónico — Anexo:Clientes de correo electrónico Saltar a navegación, búsqueda Lista de clientes de correo electrónico: Contenido 1 En el escritorio 2 En web 2.1 Online 3 …   Wikipedia Español

  • Anexo:Clientes de correo electrónico — Lista de clientes de correo electrónico. Contenido 1 En el escritorio 2 En web 2.1 En línea 3 En texto 4 …   Wikipedia Español

  • Multipurpose Internet Mail Extensions — Para otros usos de este término, véase Mime. Multipurpose Internet Mail Extensions o MIME (en español extensiones multipropósito de correo de internet ) son una serie de convenciones o especificaciones dirigidas al intercambio a través de… …   Wikipedia Español

  • Quoted printable — Saltar a navegación, búsqueda Quoted printable, o codificación QP, es una codificación que usa caracteres imprimibles (por ejemplo alfanuméricos y el signo de igualdad = ) para transmitir datos de 8 bit sobre un protocolo que solamente soporta 7… …   Wikipedia Español

  • UTF-7 — (7 bit Unicode Transformation Format) es una codificación de caracteres de longitud variable que fue propuesta para representar texto codificado con Unicode usando un flujo de caracteres ASCII, para ser usado, por ejemplo en mensajes de correo… …   Wikipedia Español

  • Anexo:Jerga informática — El lenguaje de la informática está caracterizado por emplear numerosos anglicismos, puesto que el idioma inglés se ha convertido en la lengua franca de la informática. El uso de algunas palabras difiere en España e Hispanoamérica. Índice: A B C D …   Wikipedia Español

  • Jerga informática — Anexo:Jerga informática Saltar a navegación, búsqueda El lenguaje de la informática está caracterizado por emplear numerosos anglicismos, puesto que el idioma inglés se ha convertido en la lengua franca de la informática. El uso de algunas… …   Wikipedia Español

  • Check Wikipedia — Wikiproyecto:Check Wikipedia Saltar a navegación, búsqueda Esta página contiene de forma consciente fallos ortográficos. Los bots no deben intentar corregirlos. Atajo PR:CWPR:CW …   Wikipedia Español

  • Wingdings — es un tipo de letra miembro de la familia tipográfica dingbat los cuales renderizan una variedad de símbolos. Fueron desarrollados originalmente en 1990 por Microsoft combinando caracteres: iconos Lucida, flechas, y estrellas licenciados de… …   Wikipedia Español

Compartir el artículo y extractos

Link directo
Do a right-click on the link above
and select “Copy Link”