El tamaño de los datos

Los grandes datos incluyen diferentes tamaños

Data sizesUn bit es un dígito del sistema de numeración binario, un sistema en el que los números se representan utilizando solamente las cifras cero y uno (0 y 1). Es uno de los que se utiliza en las computadoras, debido a que trabajan internamente con dos niveles de voltaje, por lo cual su sistema de numeración natural es el sistema binario (encendido 1, apagado 0). El bit es la unidad mínima de información empleada en informática, en cualquier dispositivo digital, o en la teoría de la información. El byte es una unidad de información utilizada como un múltiplo del bit, generalmente equivale a 8 bits.

A partir de aquí podemos establecer las posibilidades de equivalencia para comparar el tamaño de la información con objetos reales, o asimilables.

Vemos en la imagen, sacada de un infografía de Adeptia, la equivalencia de cada valor y su representación. Así, se entiende que un bit correspondería a un octavo de letra, mientras que el byte significa de una letra completa. Los siguientes múltiplos dan cuenta del tamaño de la información:

Un megabyte (MB) equivaldría en información al tamaño de un libro, por ejemplo una novela. Dependiendo de los métodos de compresión de datos y el formato de archivo, un megabyte de información más o menos puede ser una imagen de mapa de bits sin comprimir de 1000 × 1000 píxeles con 256 colores (profundidad de color de 8 bits por píxel); un minuto y cuatro segundos de música en formato mp3, comprimido a 128 kbit/s; o seis segundos de audio de CD sin comprimir. Un CD puede almacenar aproximadamente 700 MB, que equivalen a 80 minutos de música sin comprimir.

Un gigabyte (GB) podría representarse visualmente con el tamaño de 1.600 libros. El término giga proviene del griego γίγας /guígas/ que significa gigante. Un terabyte es la cantidad de información equivalente a un billón de bytes. Podemos representarlo con el tamaño de 1.600.000 libros. Adoptado en 1960, el prefijo tera viene del griego τέρας, que significa monstruo o bestia.

Un petabyte es una unidad de almacenamiento de información cuyo símbolo es PB, y equivale a 10 elevado a 15 bytes, es decir, 1.000.000.000.000.000 de bytes. Algunos ejemplos para ilustrar tal cantidad de información, aparte de la incluida en 160 millones de libros, serían: grabar a un persona durante 100 años en alta definición, multiplicar por 27 el tráfico de un mes cualquiera en Youtube, o los datos que maneja Google cada hora.

Por último, el exabyte vendría a representar 1.600 billones de libros en información. El tamaño de internet (entendido como almacenamiento digital global) se estima en cerca de 500 exabytes. Diariamente se producen 2,5 quintillones de datos a nivel mundial, así que la siguiente pregunta es ¿cómo y dónde se almacenan esos datos?

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *