Compresión de datos

Compresión de datos

En ciencias de la computación la compresión de datos es la reducción del volumen de datos tratables para representar una determinada información empleando una menor cantidad de espacio. Al acto de compresión de datos se denomina compresión, y al contrario descompresión.

El espacio que ocupa una información codificada (datos, señal digital, etc.) sin compresión es el cociente entre la frecuencia de muestreo y la resolución. Por tanto, cuantos más bits se empleen mayor será el tamaño del archivo. No obstante, la resolución viene impuesta por el sistema digital con que se trabaja y no se puede alterar el número de bits a voluntad; por ello, se utiliza la compresión, para transmitir la misma cantidad de información que ocuparía una gran resolución en un número inferior de bits.

La compresión es un caso particular de la codificación, cuya característica principal es que el código resultante tiene menor tamaño que el original.

La compresión de datos se basa fundamentalmente en buscar repeticiones en series de datos para después almacenar solo el dato junto al número de veces que se repite. Así, por ejemplo, si en un fichero aparece una secuencia como "AAAAAA", ocupando 6 bytes se podría almacenar simplemente "6A" que ocupa solo 2 bytes, en algoritmo RLE.

En realidad, el proceso es mucho más complejo, ya que raramente se consigue encontrar patrones de repetición tan exactos (salvo en algunas imágenes). Se utilizan algoritmos de compresión:

  • Por un lado, algunos buscan series largas que luego codifican en formas más breves.
  • Por otro lado, algunos algoritmos, como el algoritmo de Huffman, examinan los caracteres más repetidos para luego codificar de forma más corta los que más se repiten.
  • Otros, como el LZW, construyen un diccionario con los patrones encontrados, a los cuales se hace referencia de manera posterior.
  • La codificación de los bytes pares es otro sencillo algoritmo de compresión muy fácil de entender.

A la hora de hablar de compresión hay que tener presentes dos conceptos:

  1. Redundancia: Datos que son repetitivos o previsibles
  2. Entropía: La información nueva o esencial que se define como la diferencia entre la cantidad total de datos de un mensaje y su redundancia.

La información que transmiten los datos puede ser de tres tipos:

  1. Redundante: información repetitiva o predecible.
  2. Irrelevante: información que no podemos apreciar y cuya eliminación por tanto no afecta al contenido del mensaje. Por ejemplo, si las frecuencias que es capaz de captar el oído humano están entre 16/20 Hz y 16.000/20.000 Hz, serían irrelevantes aquellas frecuencias que estuvieran por debajo o por encima de estos valores.
  3. Básica: la relevante. La que no es ni redundante ni irrelevante. La que debe ser transmitida para que se pueda reconstruir la señal.

Teniendo en cuenta estos tres tipos de información, se establecen tres tipologías de compresión de la información:

  1. Sin pérdidas reales: es decir, transmitiendo toda la entropía del mensaje (toda la información básica e irrelevante, pero eliminando la redundante).
  2. Subjetivamente sin pérdidas: es decir, además de eliminar la información redundante se elimina también la irrelevante.
  3. Subjetivamente con pérdidas: se elimina cierta cantidad de información básica, por lo que el mensaje se reconstruirá con errores perceptibles pero tolerables (por ejemplo: la videoconferencia).

Diferencias entre compresión con y sin pérdida

El objetivo de la compresión es siempre reducir el tamaño de la información, intentando que esta reducción de tamaño no afecte al contenido. No obstante, la reducción de datos puede afectar o no a la calidad de la información:

  • Compresión sin pérdida: los datos antes y después de comprimirlos son exactos en la compresión sin pérdida. En el caso de la compresión sin pérdida una mayor compresión solo implica más tiempo de proceso. El bitrate siempre es variable en la compresión sin pérdida. Se utiliza principalmente en la compresión de texto.
  • Un algoritmo de compresión con pérdida puede eliminar datos para reducir aún más el tamaño, con lo que se suele reducir la calidad. En la compresión con pérdida el bit rate puede ser constante (CBR) o variable (VBR). Hay que tener en cuenta que una vez realizada la compresión, no se puede obtener la señal original, aunque sí una aproximación cuya semejanza con la original dependerá del tipo de compresión. Se utiliza principalmente en la compresión de imágenes, videos y sonidos.

Véase también

Enlaces externos


Wikimedia foundation. 2010.

Игры ⚽ Поможем решить контрольную работу

Mira otros diccionarios:

  • Compresión de datos — La compresión consite en la reducción del volumen de información a tratar (procesar, transmitir o grabar). En principio, con la compresión se pretende transportar la misma información, pero empleando la menor cantidad de espacio. El espacio que… …   Enciclopedia Universal

  • Compresión de vídeo — La compresión de vídeo se refiere a la reducción del número de datos usado para representar imágenes de vídeo digital, es una combinación de la compresión espacial de imágenes y compensación de movimiento temporal. La compresión de vídeo es un… …   Wikipedia Español

  • Compresión de imagen — El objetivo de la compresión de imagen es reducir los datos redundantes e irrelevantes de la imagen para permitir su almacenamiento o transmisión de forma eficiente. Una gráfica mostrando la calidad relativa de varias configuraciones de jpg.… …   Wikipedia Español

  • Compresión fractal — La compresión fractal es un método de compresión con pérdida para imágenes digitales, basado en fractales. El método es el más apropiado para texturas e imágenes naturales, basándose en el hecho de que partes de una imagen, a menudo, se parecen a …   Wikipedia Español

  • Compresión de texturas — La compresión de texturas es una forma especializada de compresión de imagen diseñada para almacenar texturas en sistemas de renderizado de gráficos 3D por ordenador. Al contrario que los algoritmos de compresión de imagen convencionales, los… …   Wikipedia Español

  • Compresión de audio — Nota: la compresión de datos de audio, que es la reducción del número de la tasa de bits de las señales digitales de audio, no debe ser confundida con compresión de rango dinámico de señales. La compresión de audio es una forma de compresión de… …   Wikipedia Español

  • Compresión de Burrows-Wheeler — La Transformación de Burrows–Wheeler (BWT del inglés Burrows–Wheeler transform, también conocida como compresión por ordenación de bloques), es un algoritmo usado en técnicas de compresión de datos como en bzip2. Fue inventado por Michael Burrows …   Wikipedia Español

  • Compresión de audio — Nota: este artículo es acerca de compresión de datos de audio, que es la reducción del numero de la tasa de bits de las señales digitales de audio. No debe ser confundido con compresión de rango dinámico de señales.. Compresión de Audio es una… …   Enciclopedia Universal

  • Compresión — El término compresión puede tener significados diversos: En informática se refiere a la compresión de datos. En procesamiento de audio se refiere a la compresión de nivel de audio. En ingeniería se refiere al esfuerzo de compresión. Esta página… …   Wikipedia Español

  • datos — (as used in expressions) base de datos base de datos relacional bus de datos compresión de datos minería de datos datos de los sentidos encriptación de datos estruct …   Enciclopedia Universal

Compartir el artículo y extractos

Link directo
Do a right-click on the link above
and select “Copy Link”