Evaluación de técnicas de compresión para cadenas de bits sparse
Resumen
El propósito de la presente investigación consistió en medir el rendimiento de las técnicas de compresión Run Length Encoding (RLE), Huffman y compresión por índice, sobre cadenas de bits sparse generadas a través del algoritmo de Compresión Probabilístico basado en la Teoría de Información. El trabajo utilizó una metodología experimental propuesta por Rincón y colaboradores, manipulando las variables dependientes (relación y tiempo de compresión) e independientes (tamaño del archivo, tamaño del alfabeto y las técnicas de compresión). Los resultados obtenidos mostraron para la variable tiempo de compresión, que los algoritmos de Huffman y RLE son 60% más rápidos que la compresión por índice, mientras que para la variable relación de compresión el mejor resultado se obtuvo con el algoritmo de Huffman. De las tres técnicas investigadas el algoritmo de Huffman modificado fue el que ofreció los mejores resultados. Se hizo un análisis estadístico dividido en dos partes, la primera sin bloquear la variable independiente técnica de compresión y la segunda bloqueando la misma. De estos análisis se concluye que el tamaño del alfabeto influye en las variables dependientes, y que mientras mas sparse es el archivo, mayor será la relación de compresión y menor el tiempo empleado en comprimirlo.