Thursday Jun 26, 2008

Nos mudamos

No se que variante tematica tomara ahora mi blog, pero continuara AQUI:

http://ariel-hendel.blogspot.com

Espero encontrarnos alli.

digg del.icio.us
Friday Jun 13, 2008

Maldicion del Ganador

Redondeo esta serie de blogs sobre CMT dado que CMT ha hecho algo inconcebible. Habiendo comenzado como un intento radical de colocar todos los recursos computacionales en un solo zocalo de procesador junto a una amplia y abundante memoria y combinandose para obtener un sistema de Multiprocesador Simetrico precisamente de particular simetria. Pero ahora, con el procesador UltraSPARC T2 Plus, CMT se extiende a sistemas de mas de un zocalo. Saboreo lo paradojico de CMT, nacido como arquitectura de un solo zocalo, que trasciende a mas de uno, en tanto que los procesadores convencionales de zocalos multiples ya incorporan varios cores por zocalo. Confirma que la imitacion es la forma mas sincera de adulacion.

Cuando la realidad nos sorprende con un resultado opuesto al esperado podemos aliviar nuestro desconcierto saboreando lo paradojico y asi rescatar algun orden. Pues anticorrelacion tambien implica order y causalidad, y es mas tolerable que un caos con cero correlacion.

Disfrutar por ejemplo las paradojas diarias de la realidad chocando con los conceptos de mercados libres y la ausencia de parcialidades. Sin ir muy lejos como cuando IBM, HP, y Sun compiten en la venta de equipos de computacion, por ejemplo, para prospeccion de petroleo, y operan sujetos a la estricta ley que prohibe connuvencia y coordinacion de precios entre competidores. Paradojicamente estos productores de petroleo operan como un cartel a la hora de producir y vendernos su producto. Extran~a paradoja.

O bien cuando la importacion de sistemas a ciertos paises es frenada con trabas artificiales que favorecen a los competidores locales , pero sorprendentemente cuando esos paises nos venden zapatos resultan favorecidos por su condicion de "nacion favorita" y desplazan por ejemplo a zapatos del Brasil que son igualmente comodos y competitivos. Eso no es imparcialidad. En estos casos es mas dificil para un ingeniero disfrutar la paradoja sabiendo que su producto muere de obsolescencia en la espera regulatoria. Los zapatos se conservan mejor que las computadoras con el paso del tiempo.

Afortunadamente otros aspectos de nuestra profesion no sufren contradicciones paradojicas. Por ejemplo, un aspecto importante de nuestras vidas es el tema laboral. Tan central es el tema del empleo en este valle que desplaza al acalorado debate sobre el matrimonio y su exclusividad a parejas de hombre y mujer. Habiendo tantos hombres casados con sus trabajos en California tal exclusividad ya no existe.

La experiencia de un amigo que completo' su busqueda de trabajo confirma que esta puede ser un proceso sin paradojas ni arbitrariedades para benficio de ambas partes. Esa era mi impresion hasta que opino' mi hermano. Resulta que mi amigo intento' maximizar su beneficio y eliminar todo regateo. El regateo deja un mal sabor y perjudica el tono de una nueva relacion laboral. Por lo tanto el informo' a los empleadores interesados que haria una subasta sellada en una fecha dada y aceptaria la mejor oferta. Y asi fue, obtuvo las ofertas, y acepto' la mejor sin negociaciones.





Aparece mi hermano. Primero con el Teorema de Equivalencia del Ingreso muestra que los distintos tipos de subasta son equivalentes y ninguno es capaz de extraer la valuacion maxima de los participantes a menos que haya un numero infinito de empleadores. No es practico asistir a un numero infinito de entrevistas y si lo fuera seguramente tanto apreton de manos terminaria en artritis.

Segundo, la Maldicion del Ganador muestra que el postor ganador tiende a sobreestimar el valor del bien subastado. Justo cuando mi amigo acepta la oferta su nuevo jefe descubre que su nuevo empleado vale menos de lo que pensaba. Mal forma de empezar un nuevo trabajo...De acuerdo a la teoria de juegos mi amigo no pudo escapar las paradojas, pero lo visite' en su nuevo trabajo y ambas partes estan satisfechas, como es posible?

Bien, porque la paradoja sirva de refugio frente al desconcierto y la contradiccion no significa que detras de cada paradoja haya algo desagradable como para refugiarse. Digamos que la de mi amigo es una paradoja inocua.

Otra paradoja inocua son los sistemas CMT con zocalos multiples. La demostracion esta en los resultados, ya sea en publicaciones tecnicas como esta, o las voces informales de bloggers que han trabajado directamente y examinado temas como las asimetrias (NUMA) posibles, la escala del sistema operativo al llegar a 128 hebras, como soportar velocidades de 10G en la red, y que tan bien corre todo lo que sea Java en estos sistemas. Allan Packer creo un entrada CMT_goes_multi con todas estas perspectivas sobre el T2 Plus y multi-zocalos.

La llegada de CMT confunde las defincionies de lo que es un procesador (una pastilla, un core, una hebra) pero el zocalo se mantiene como un concepto invariante aun cuando los componentes mismos no usen zocalos y sean montados directamente. Cada vez mas un zocalo de procesador significa una unidad de interfase a memoria, ya que los procesadores contemporaneos han adulado imitando al CMT al incorporar sus controladores de memoria en el procesador. Y es esa unidad de memoria que trae cada zocalo lo que le da a un CMT multi-zocalo una configuracion de memoria superior, y ahi precisamente empezamos la discusion, la memoria de sistema y como optimizar su uso.

Los primeros sistemas de dos zocalos con el UltraSPARC T2 Plus salieron en Abril, y duplican el numero de hebras hasta 128 por sistema. Las variantes de Telco (para telefonia y NEBS) de estos sistemas vienen luego, y aumentan la aplicabilidad de CMT a la infraestructura de las redes que tanto nos interesa. Apenas lleguen se pueden encontrar aqui .



Technorati Profile
[ Technorati: NiagaraCMT, ]


Add to Technorati Favorites

digg del.icio.us
Friday Feb 01, 2008

Sesgo de Sobrevivente

A proposito de segundas generaciones, nuestra segunda generacion de sistemas ATCA trae 10G por todas partes. Este articulo en Eweek es del mes de Noviembre pasado, pero aun puede ser noticia al escribir estas lineas, dada lo poco que he escrito.

La armonia de ATCA con 10G resulta en canales de 10G entre las tarjetas y los switches sin recurrir a fibra optica. Esto elimina el costo dominante de 10G en servidores. Elimina tambien otro obstaculo en la adopcion de 10G, el de la necesidad de reemplazar tanto el switch como la interfase del servidor simultaneamente. La actualizacion de nuestra linea de ACTA es completa, y cubre tarjetas con procesadores UltraSPARC T2 y x86, trae dos interfaces de 10G en cada tarjeta (usando Neptune), 10G switch hacia la red externa, o a traves de los RTM (modulos de transicion) de cada tarjeta. Las tarjetas sirven como servidores convencionales o para procesamiento de paquetes (ver entrada anterior en mi blog).

Y justo cuando ATCA se pone interesante hay quien pregunta sobre un par de competidores que tiraron la toalla y abandonaron ATCA. Respondemos insistiendo que nos gustan los atributos tecnicos de ATCA, el mercado, y el hecho de ser un sistema respaldado por un standard. Pero a nivel superficial se podria sostener que nuestra opinion sufre del llamado “Sesgo de Sobrevivente”.

El Sesgo de Sobrevivente, efecto familiar en finanzas y estadistica, es el error causado al considerar muestras que sobrevivieron hasta el final del periodo de muestreo y excluir las otras. El ejemplo tipico es estimar el crecimiento de todas las empresas en una bolsa de valores sin considerar aquellas que quebraron.

Tuve una muestra reciente del Sesgo de Sobrevivente cuando el instructor concluia un curso de liderazgo, y al cierre, de postre digamos, intentaba calibrar nuestras preocupaciones profesionales usando como perspectiva las opiniones de personajes famosos sobre que es realmente importante en la vida, retrospectivamente. Yo objete callado. Senti que el exito de esas limunarias distorsionaba su sabiduria colectiva con Sesgo de Sobreviventes. Sus perspectivas desvalorizan las prioridades que consumen mi rutina diaria. Obviamente, ellos no tienen esas preocupaciones. Su obra esta hecha.





Eventualmente aisle dos objeciones en mi reaccion, una relativa a juicios emitidos a posteriori, cuando el desenlace es sabido; la otra relativa al efecto mismo de la sobrevivencia sobre la validez de la informacion.

La objecion temporal es contra la tendencia a menospreciar los puentes ya cruzados. Pues si nuestra meta es ser un vinculo fuerte en una cadena que continua en el tiempo, apenas la cadena continua nuestras opiniones y prioridades pierden relevancia. Mantengo mi objecion a juzgar prioridades pasadas.

En ausencia de tales objeciones temporales el valor de la perspectiva del sobreviviente puede depender de las caracteristicas del proceso. Como en aquella historia hipotetica del matematico convocado para recomendar como blindar las alas y los fuselajes de los aviones de la RAF. Luego de inspeccionar los orificios en los aviones que retornan de sus misiones, recominenda blindar precisamente las areas que consistemente no muestran orificios. Postulando que la ausencia de orificios no indica que el area no este expuesta a balas, sino que indica vulnerabilidad. Tal vez los aviones impactados en esas areas fueron los que no volvieron de su mision.

Esto ilustra que la validez (estadistica) de la informacion de sobreviviente depende de si la supervivencia es aleatoria o existe una correlacion. En este ejemplo, dada una muestra grande, el matematico puede determinar tanto la existencia de la correlacion asi como las areas a blindar.

Volviendo al tema ATCA, nuestra perspectiva parece valida ya que es emitida en el presente y no "a posteriori”. Y como el exito de Sun y sus productos Netra en el area de Telecomunicaciones no es casual, queda satisfecha la segunda condicion, la correlacion. Por ultimo, ademas de opiniones traemos esta nueva generacion de sistemas ATCA, reforzando los orificios en las alas de la primera generacion, y tal vez los de las alas de esos competidores que no volvieron de la mision.

Enlaces de hoy:

Servidores Sun Netra ATCA

Servidor ATCA con UltraSPARC T2

Servidor ATCA con Opteron

Processamiento de Paquetes a Alta Velocidad en UltraSPARC T2 - White Paper



Technorati Profile
[ Technorati: NiagaraCMT, ]


Add to Technorati Favorites

digg del.icio.us
Tuesday Oct 16, 2007

Quejadome de Darwin

Esta es una entrada especial en este blog amorfo inspirado originalmente en temas de "Chip Multi Threading". La llegada de la segunda generacion de sistemas de hebras multiples (el T5120 y familia, sistemas basados en el procesador UltraSPARC T2) es un paso evolucionario critico, y tambien una buena excusa para tocar el tema de la evolucion.

Interpretando a Darwin y su teoria de la evolucion como la seleccion natural de atributos hereditarios "utiles", mi queja es que tal seleccion solo funciona si los atributos perjudiciales se "manifiestan" antes de ser propagados. Si tenemos hijos a los veinte an~os pero nos enfermamos seriamente a los setenta, es demasiado tarde para que Darwin actue en mejora de la especie. Podriamos tal vez postular la evolucion hacia una especie perfectamente sana hasta su edad de reproduccion, pero ni un dia mas. Una especie parecida a las baterias recargables de Niquel-Cadmio casi.

Para evitar un altercado con Darwin, quien no esta aqui para defenderse, mejor desafiar a cientificos contemporaneos aduciendo que dada dicha evolucion podemos mejorar la longevidad de la especie, sin recurrir a los costos de la medicina, simplemente estirando la edad de reproduccion. Posterguemos los casamientos por unos 40 an~os y veremos la expectativa de vida despegar. Bien, habiendo irritado a la comunidad cientifica y quien sabe a quien mas, busco albergue en temas de tecnologia.

Tal vez el mundo se rija por Darwin, pero los sistemas de computadoras no van mutando atributos al azar perpetuamente a traves de generaciones de productos. Los atributos son puestos deliberada y frecuentemente. Antes que los creacionistas festejen lo "deliberado" de este proceso, puedo demoler la creacion inteligente de un solo golpe, un golpe de tres dedos para ser preciso. En cuanto a computadoras se trata la infame combinacion CTRL-ALT-DEL derrumba tanto la teoria de creacion inteligente como la de la evolucion.

La supervivencia de un producto y sus tecnologia es vulnerable a largo plazo, mucho mas que los dinosaurios lo fueran en su momento. Por eso la segunda generacion de un producto, como la T5120 o de una tecnologia, es un hito importante. Importante como elemento de continuidad de la familia y como el blanco de invariables mejoras tecnologicas. Mejoras tan esperadas y naturales como nuestro deseo que nuestros hijos superen nuestros logros.




CMT valsea con la cadencia de la Ley de Moore, y asi los sistemas T2 llegaron a menos de 24 meses de los T1. Y fiel a el espiritu de tal Ley, los sistemas T2 duplican el numero de hebras fisicas por procesador. La multiplicacion de hebras ha desplazado al aumento de velocidad del reloj como mecanismo evolutivo dominante en procesadores. Y resulta en un buen factor entero de 2x, en realidad mas que 2x, ya que el procesador T2 trae unidades de ejecucion mas rapidas, un cache mas grande y de mayor asociatividad, aceleracion criptografica, mayor ancho de banda a memoria, unidades de punto flotante en cada core, e interfase a redes de 10G nativas en el procesador mismo.

Al pie de esta pagina hay un par de enlaces con informacion abundante sobre las prestaciones de los sistemas T2 en distintos tipos de usos y pruebas, asi que me limito por ahora a hablar de temas de conexion de redes en el contexto del T2.

Las redes de alta velocidad han evolucionado en multiplos de diez. 100 Megabits por segundo alla por 1995, y dos factores de diez desde entonces nos han traido 10 Gigabits por segundo. En el mismo periodo si los procesadores mejoran en 2x cada dos an~os seria un factor de 64, mas o menos, sujeto a error de muestreo del periodo. La cuestion es como saltar entre procesadores y redes a medida que ambos van evolucionando a su ritmo. Cuando es el momento propicio para adoptar la proxima velocidad de red? La respuesta es clara si coincidimos en quien es central a nuestro parecer, el sistema o la red.

Los creyentes en la centralidad del sistema deben poner a los servidores en redes de 10 Gigabit apenas los servidores excedan rendimientos de 1 Gigabit. Pero quienes ven la infraestructura de la red como el valor supremo deben desplegar esa infrestructura con procesadores y servidores que puedan proveer mas que 10 Gigabits por segundo. Y como tampoco podemos contar con Copernico para dilucidar dilemas de centricidad, hemos construido el T2 y sus sistemas para satisfacer ambos casos. Sin concesiones.

Redes de 10 Gigabits por segundo construidas con procesadores estandar, en plataformas estandar y con la flexibilidad de que todo se puede hacer en software y lenguaje de alto nivel. En detalle, con dos interfases de 10 Gigabit Ethernet, sin el cuello de botella del bus de entrada y salida, procesamiento de packetes multi-hebra, virtualizacion, clasificacion de paquetes, aislamiento perfecto entre dominios (maquinas virtuales), procesamiento asimetrico, procesamiento serial de paquetes en hebras, el proyecto Crossbow en OpenSolaris, criptografia, eficiencias de procesamiento para paquetes cortos, todo eso existe y esta condensado en cualquier servidor basado en el T2.

Asi como una lectura seria de Darwin nos lleva a sus escritos, evaluar los meritos de SUNP (Sun's Unified Network Platform), consolidacion, procesamiento de paquetes, y la tendencia hacia construir redes basadas en servidores estandar en general empieza leyendo ponencias y evaluando estos sistemas con aplicaciones de referencia. Y se puede empezar por los enlances siguientes:

Procesamiento de Paquetes: High Throughput Packet Processing White Paper

Consolidacion: Radical Consolidation White Paper

T5120, T5220, T6320 System and blades Launch blogs

UltraSPARC T2 Systems Launch on the Web



Technorati Profile
[ Technorati: NiagaraCMT, ]


Add to Technorati Favorites

digg del.icio.us
Tuesday Aug 07, 2007

Ali G y Kanazawa sobre temas de UltraSPARC T2 (nacido Niagara 2)

Con el anuncio del procesador UltraSPARC T2 es hora
de cambiar mis versos sobre tecnologia y otras yerbas en favor de dos visitas especiales: Hirokasu Kanazawa y Ali G.

Hirokasu Kanazawa, un karateka muy fluido, muestra el poder de la combinacion de ataques. El golpe 1-2, una secuencia rapida de tecnicas de ataque donde la segunda es aun mas fuerte que la primera. Tal como en la secuencia de los procesadores CMT UltraSPARC T1 and T2 (tambien conocido como Niagara 2), una combinacion bien ejecutada es mas efectiva que la suma de sus partes.

Luego atendemos a nada menos que Ali G, convocando a un panel de expertos en ciencia y tecnologia. Ali G indaga sobre el tema de
computos en gran escala (a proposito del UltraSPARC T2), y en que medida beneficia nuestras vidas. Astutamente examina si
tales maquinas pueden de veras realizar multiplicaciones de numeros realmente grandes sin explotar (en una alusion clara
a los problemas de consumo y de disipacion termica que plagan a otros procesadores anteriores al CMT).

Dos tematicas cercanas a Niagara 2, por sendos personajes.

PLAY VIDEO (Quicktime)

PLAY


[ Technorati: NiagaraCMT, ]

digg del.icio.us
Thursday Jun 14, 2007

Nada es gratis

El tema de hoy es la aseveracion que nada es gratis, y para dilucidarla consulto a mi hermano, cuyas respuestas tienen mas sentido que mis preguntas, y a la red Internet. Especificamente la metafora anglosajona del “Free Lunch” denota obtener algo a cambio de nada. Esta expresion se remonta a una epoca de tabernas donde los clientes recibian comida gratis mientras consumieran bebidas. De alli que la expresion de “comida gratis” signifique costos ocultos, en este caso incluidos en el costo de la bebida.

Fue la variante italiana “E finita la cuccagna!” , exclamada por Fiorello La Guardia el dia de su asuncion a la Alcaldia de Nueva York, un llamado contra los timos gubernamentales. De gobiernos no se mucho, pero su llamado resuena en el aeropuerto que lleva su nombre en Nueva York, donde dificilmente uno encuentra una comida gratis o siquiera barata.

Milton Friedman popularizo la nocion que (no hay tal cosa como almuerzo gratis), pero paradojicamente la Diversificacion esta considerada un beneficio sin costo en el area de inversiones financieras. O bien Milton no conocia esta panacea, o los asesores financieros se confabulan para vendernos inversiones innecesarias.

Las leyes de Termodinamica eliminan la posibilidad de obtener benficios gratuitos en el area de la fisica, pero a pesar de los impedimentos teoricos como No Free Lunch Theorems, es dificil disuadir al publico en la busqueda de optimizaciones sin costo en el mundo de la informacion. Al fin y al cabo las carceles estan para los que violan las leyes pero no los teoremas. Según la clara opinion de mi hermano una mejor solucion a un problema dado solo significa que la solucion previa no era optima. Si uno suele dormir 14 horas cada dos dias, y luego descubre que se siente mejor durmiendo 7 horas cada dia, eso no significa que la nueva rutina de suen~o usando la misma proporcion de horas pueda ser llamada un beneficio gratuito. Acosado por la fuerza de sus analogias retrocedo y ofrezco un acuerdo:

Lo autenticamente gratuito debe ser repetible.

No solo un par de comidas gratis esporadicas, sino una manera sistematica de repetir una optimizacion. Atento a que lo repetible no requiere un perpetuum mobile ni una fuente de alimento infinita ya que la oficina de patentes en Washington ha dejado de patentar Movimiento Perpetuo sin un prototipo que funcione. Uno ha descubierto comida gratis si puede basar su dieta en ella.

Luego de pagar un par de vueltas la infraestructura de la red esta avida de comida gratis. Le apetecen nuevos servicios, mayores ingresos por usuario, menores costos operativos, y un perfil reducido.
No hay nada nuevo en los diagramas sobre el papel. Aparatos moviles y portatiles a la izquierda, algunas cajas y sistemas a la derecha, y la famosa nube en el medio. Los servicios fluyen de derecha a izquierda mientras el dinero va en la direccion opuesta. Los pacientes que ven redes de internet en el test de Rorschach tienen a sus psiquiatras perplejos.
La nube de los diagramas esta en todas partes. Lo que soy yo, yo veo gateways. Cada computador dentro de la nube, o conectado a la nube, transforma y mueve informacion entre sus interfaces. Veo transformaciones complejas en la nube, esa nube es puro gateways y no estoy loco doctor, incluso los miseros moviles de la izquierda del diagrama son gateways doctor, mediando entre humanos de un lado y la red del otro lado.

En redes de convergencia sobre IP estos gateways requieren la inteligencia para atravesar distintos protocolos a varios niveles. Los gateways construidos con procesadores tradicionales presentan una disyuntiva enter musculo y cerebro. La complejidad de procesar paquetes reduce el rendimiento. A medida que las telefonicas agregan servicios se reduce el rendimiento del gateway (o bien se aumenta el costo de cada sesion. Este balance entre trabajo y rendimiento es como transportar agua en baldes. El agua se reduce a medida que la distancia aumenta, pero esto se puede solucionar convocando a amigos fuertes. Pasando los baldes de uno a otro podemos mantener el ritmo de entrega de agua a cualquier distancia. Esto es repetible, entonces la Brigada de Baldes podria ser un caso de algo por nada, al menos mientra tenga suficientes baldes y amigos ociosos.

Del mismo modo podemos usar hilos de un procesador (threads) para serializar el procesamiento de paquetes en gateways. Podemos insertar hilos con etapas de procesamiento a medida que la complejidad requerida aumenta, sin sacrificar el rendimiento. Y para minimizar los costos de comunicación internos no hay nada mejor que hilos pertenecientes a un mismo procesador. Hoy por hoy el procesador de uso general con mayor cantidad de hilos es un CMT como el Niagara 2 de Sun. El hecho que tambien tenga interfaces de 10G en el procesador mismo lo convierte en una base ideal para gateways. El resto son detalles de software...

El enfoque de software es muy importante y merece una capitulo propio. Prometido. Hoy solamente sen~alamos que la ejecucion serial (tipo linea de montaje) es una manera interesante de explotar el paralelismo de ejecucion dada la futura abundancia de hilos de ejecucion en hardware. Aparenta ofrecer algo a cambio de nada, o sea rendimiento constante contra complejidad variable. En principio se basa en reclutar a amigos ociosos (hilos de CMT), quiene son convocados para esa linea de montaje usando la tecnologia de virtualizacion recientemente lanzada a traves de Logical Domains (check out http://www.sun.com/ldoms).



[ Technorati: NiagaraCMT, ]

Nota Bene: Traducido por el autor y allegados. Que trabajo dificil el de traducir, incluso cuando uno se traduce a si mismo

digg del.icio.us