Codificación de bytes pares

Codificación de bytes pares: Este artículo o sección sobre informática necesita ser wikificado con un formato acorde a las convenciones de estilo.
Por favor, edítalo para que las cumpla. Mientras tanto, no elimines este aviso puesto el 27 de junio de 2009.
También puedes ayudar wikificando otros artículos.

La codificación de los bytes pares es un forma simple de comprimir datos, los pares de bytes mas comunes en los datos son remplazados con un byte que no este presente en los datos originales. Se requiere de una tabla de "Emplazamiento o Reconstrucción" que contenga los pares de bytes originales y el que los remplaza.

Como codificar

Supongamos que tenemos que codificar el siguiente texto (o datos):

aaabaaabac

El par "aa" que ocurre con frecuencia en el texto, es remplazado por un byte que no es usado en el texto, ejemplo "Z" .Ahora en la tabla de reconstrucción esta :

Z <-- aa

Y el texto en entonces:

ZabZabac

El par "Za" ocurre con frecuencia, entonces tendrá que ser remplazado con un byte que no sea usado en el texto , "Y". (En este caso "Za" puede ser remplazada por "Z", siempre que cada ocurrencia de "Z" sea posteriormente remplazada) . La tabla de reconstrucción es entonces:

Z <- aa Y <- Za

Y el texto:

YbYbac

Otra vez más remplazamos el byte mas frecuente:

Z <- aa Y <- Za X <- Yb

Y el texto :

XXac

Este texto ya no debe ser comprimido con el mismo método ya que no hay un par de bytes que se repitan más de una vez. En el caso de que se remplace XX por X se estaría aumentando el tamaño del archivo en 2 bytes de más. Para descomprimir el texto simplemente hay que remplazar los pares de bytes en orden inverso.

Categoría:
Compresión de datos

Игры ⚽ Нужно решить контрольную?

Mira otros diccionarios:

Codificando los bytes pares — Saltar a navegación, búsqueda La codificación de los bytes pares es un forma simple de comprimir datos, los pares de bytes mas comunes en los datos son remplazados con un byte que no este presente en los datos originales. Se requiere de una tabla … Wikipedia Español
Compresión de datos — En ciencias de la computación la compresión de datos es la reducción del volumen de datos tratables para representar una determinada información empleando una menor cantidad de espacio. Al acto de compresión de datos se denomina compresión, y al… … Wikipedia Español
UTF-16 — que significa en ISO/IEC 10646:2003, “UCS Transformation Format for 16 Planes of Group 00.” es una forma de codificación de caracteres UCS y Unicode utilizando símbolos de longitud variable. Se halla oficialmente definido en el Anexo C de la… … Wikipedia Español
UTF-8 — (8 bit Unicode Transformation Format) es un formato de codificación de caracteres Unicode e ISO 10646 utilizando símbolos de longitud variable. UTF 8 fue creado por Robert C. Pike y Kenneth L. Thompson. Está definido como estándar por la RFC 3629 … Wikipedia Español
Jerga informática — Anexo:Jerga informática Saltar a navegación, búsqueda El lenguaje de la informática está caracterizado por emplear numerosos anglicismos, puesto que el idioma inglés se ha convertido en la lengua franca de la informática. El uso de algunas… … Wikipedia Español
Anexo:Jerga informática — El lenguaje de la informática está caracterizado por emplear numerosos anglicismos, puesto que el idioma inglés se ha convertido en la lengua franca de la informática. El uso de algunas palabras difiere en España e Hispanoamérica. Índice: A B C D … Wikipedia Español
ISO 10646 — Este artículo o sección se encuentra desactualizado. Es posible que la información suministrada aquí haya cambiado o sea insuficiente. El te … Wikipedia Español
BitTorrent (protocolo) — Para otros usos de este término, véase BitTorrent. BitTorrent es un protocolo diseñado para el intercambio de ficheros de igual a igual (en inglés: peer to peer o P2P). El protocolo BitTorrent fue desarrollado originalmente por el programador… … Wikipedia Español
Ethernet — Saltar a navegación, búsqueda Tarjeta de Red ISA de 10 Mbps … Wikipedia Español
Canal de fibra — Saltar a navegación, búsqueda El Canal de fibra, del inglés Fibre Channel, es una tecnología de red utilizada principalmente para redes de almacenamiento, disponible primero a la velocidad de 1 Gb/s, y posteriormente a 2, 4 y 8 Gb/s. El Canal de… … Wikipedia Español

Los diccionarios y las enciclopedias sobre el Académico

Codificación de bytes pares

Como codificar

Mira otros diccionarios:

Compartir el artículo y extractos

Los diccionarios y las enciclopedias sobre el Académico

Wikipedia Español

Codificación de bytes pares

Como codificar

Mira otros diccionarios:

Compartir el artículo y extractos

Link directo