Codificando los bytes pares

Codificando los bytes pares

Codificando los bytes pares

La codificación de los bytes pares es un forma simple de comprimir datos, los pares de bytes mas comunes en los datos son remplazados con un byte que no este presente en los datos originales. Se requiere de una tabla de "Emplazamiento o Reconstrucción" que contenga los pares de bytes originales y el que los remplaza.

Como codificar

Supongamos que tenemos que codificar el siguiente texto (o datos):

aaabaaabac

El par "aa" que ocurre con frecuencia en el texto, es remplazado por un byte que no es usado en el texto, ejemplo "Z" .Ahora en la tabla de reconstrucción esta :

Z <-- aa

Y el texto en entonces:

ZabZabac

El par "Za" ocurre con frecuencia, entonces tendrá que ser remplazado con un byte que no sea usado en el texto , "Y". (En este caso "Za" puede ser remplazada por "Z", siempre que cada ocurrencia de "Z" sea posteriormente remplazada) . La tabla de reconstrucción es entonces:

Z <- aa Y <- Za

Y el texto:

YbYbac

Otra vez más remplazamos el byte mas frecuente:

Z <- aa Y <- Za X <- Yb

Y el texto :

XXac

Este texto ya no debe ser comprimido con el mismo método ya que no hay un par de bytes que se repitan más de una vez. En el caso de que se remplace XX por X se estaría aumentando el tamaño del archivo en 2 bytes de más. Para descomprimir el texto simplemente hay que remplazar los pares de bytes en orden inverso.


Wikimedia foundation. 2010.

Игры ⚽ Поможем сделать НИР

Compartir el artículo y extractos

Link directo
Do a right-click on the link above
and select “Copy Link”