Mover un petabyte de datos
(Mis más sentidas disculpas por publicar esta entrada y retirarla acto seguido: mis dedos se adelantaron a mi cerebro y la envié accidentalmente sin finalizarla o revisarla siquiera).
La semana pasada afirmé en una conferencia que sería más rápido enviar un petabyte de datos desde San Francisco a Hong Kong en barco de vela que mediante Internet.
Como a partir de entonces he recibido algunas preguntas al respecto, he aquí la justificación matemática (entre nosotros, mi formación como matemático me llevará probablemente a incurrir en algún que otro error "Off by one" en los cálculos realizados a continuación, así que no sean muy duros si meto la pata en algo).
Un petabyte son mil terabytes, lo que equivale a un millón de gigabytes o mil millones de megabytes. U ocho mil millones de megabits. ¿Me siguen hasta ahora?
Así pues, si tenemos una conexión a Internet de medio megabit por segundo, lo que sería relativamente alto en EE. UU. (aunque relativamente bajo comparado con el ancho de banda disponible en zonas residenciales de Korea, por ejemplo), nos llevaría dieciséis mil millones de segundos, o 266 millones de minutos, o 507 años transmitir esa cantidad de datos. ¿A que se puede llegar a Hong Kong en velero en menos tiempo? Si doblamos el ancho de banda a un megabit, el tiempo se divide por dos. Incluso a cien megabits (poco más o menos la cifra más alta para una conexión a Internet de que tengo noticia), la transferencia llevaría unos cuantos años.
Como Hal Stern me dijo en cierta ocasión, "Jamás subestimes el ancho de banda de una furgoneta tirando millas carretera abajo llena hasta los topes de cintas de datos". Con esto pueden hacerse una idea de por qué el almacenamiento en cinta es tan atractivo para muchas empresas que graban, compilan, transportan o simplemente archivan grandes volúmenes de datos, desde vídeos de vigilancia hasta comercio de datos. Actualmente, las cintas convencionales tienen una capacidad de 500 GB, y son fáciles de enviar en cajas de cartón mediante servicio exprés, de un día para otro.
¿Más ventajas de las cintas como formato de archivo? Cuando los datos no están siendo utilizados, no se consume electricidad. Consideremos ahora un petabyte de datos girando en el almacenamiento en disco más eficiente en cuanto a consumo energético que se pueda imaginar. Para que se hagan una idea, un petabyte de almacenamiento en disco activo equivale a más de 40 Thumpers, cada uno de los cuales consume más de un kW y pesa alrededor de 70 kg; no es precisamente ideal para transportar en velero o mandar en un sobre postal exprés, la verdad. Para que los datos estén disponibles, los discos deben de girar y mantenerse convenientemente refrigerados (esto no es necesario con las cintas).
Pero no hay soluciones universales, y la cinta no es perfecta para diversas aplicaciones (almacenamiento nearline, por ejemplo), pero desempeña un papel destacado en diversas aplicaciones particularmente exigentes y avanzadas en el campo de la informática de alto rendimiento, así como en sitios Web de relaciones sociales y agregación de contenidos (para los cuales acumular varios terabytes de datos al día es una nadería). En resumidas cuentas, el almacenamiento de datos en cinta no está restringido a bancos o empresas de telecomunicaciones con salas llenas de mainframes (aunque ese campo también se nos da bien).
Así que, efectivamente, es más rápido enviar un petabyte de datos en un velero que a través de Internet (al menos de momento, y con el ancho de banda del que disponemos la mayoría de los mortales).
Lo cual, dicho sea de paso, es otra razón para sacar a colación de nuevo nuestra campaña de Solaris en DVD: para mucha gente tiene más sentido recibir un DVD de 4 Gigabytes en su buzón de correo (y gratis) que bajárselo de nuestros servidores, megabit a megabit. Y aprovecho la circunstancia para pedirles disculpas por la lentitud de los envíos de DVD. La verdad es que no hemos estado muy finos precisamente, pero confío en que mientras escribo esto la situación haya mejorado (ostensiblemente).
Y no quiero ni pensar lo que supondría mover un zettabyte.
Posted on 03:45PM mar 16, 2007 |


















