- Codificando los bytes pares
-
Codificando los bytes pares
La codificación de los bytes pares es un forma simple de comprimir datos, los pares de bytes mas comunes en los datos son remplazados con un byte que no este presente en los datos originales. Se requiere de una tabla de "Emplazamiento o Reconstrucción" que contenga los pares de bytes originales y el que los remplaza.
Como codificar
Supongamos que tenemos que codificar el siguiente texto (o datos):
aaabaaabac
El par "aa" que ocurre con frecuencia en el texto, es remplazado por un byte que no es usado en el texto, ejemplo "Z" .Ahora en la tabla de reconstrucción esta :
Z <-- aa
Y el texto en entonces:
ZabZabac
El par "Za" ocurre con frecuencia, entonces tendrá que ser remplazado con un byte que no sea usado en el texto , "Y". (En este caso "Za" puede ser remplazada por "Z", siempre que cada ocurrencia de "Z" sea posteriormente remplazada) . La tabla de reconstrucción es entonces:
Z <- aa Y <- Za
Y el texto:
YbYbac
Otra vez más remplazamos el byte mas frecuente:
Z <- aa Y <- Za X <- Yb
Y el texto :
XXac
Este texto ya no debe ser comprimido con el mismo método ya que no hay un par de bytes que se repitan más de una vez. En el caso de que se remplace XX por X se estaría aumentando el tamaño del archivo en 2 bytes de más. Para descomprimir el texto simplemente hay que remplazar los pares de bytes en orden inverso.
Categoría: Compresión de datos
Wikimedia foundation. 2010.