27 sept 2011

Benchmarks, performance, peras y manzanas

Es interesante cómo los fabricantes de hardware gustan de comparar sus juguetes caros e intentar demostrar que son mejores que la competencia de formas muchas veces ridículas.
Es como cuando eramos niños y presumíamos de los autos que tenían nuestros padres para darle envidia a nuestro compañero de primaria. Que importaba si era un auto para pasear a la familia, si lo importante era que podía acelerar a 200 km/h?

Así como en los autos existen los caballos de fuerza o bhp, relación peso-potencia, el torque, la maniobrabilidad, etc., en el mundo de las TI contamos con valores como los SPECs, TPC o tpmc, 9s de disponibilidad, etc.

Pero la tecnología, al igual que los autos, suele tener un propósito específico. No es lo mismo tener que procesar tarjetas de crédito para millones de clientes, que procesar imágenes satelitales para análisis climatológico, o guardar la información de nuestro correo.

La gente de Oracle aparentemente olvida eso y nos trae anuncios fantásticos como este:

Es información pública que se puede obtener de la página de Oracle.

A primera vista suena fantástico! Una relación de 5.7 a 1 en precio, y me van a dar más Cores (volviendo a la analogía de autos: más CC), más performance de I/O (no aclaran de que configuración), igual capacidad y redundancia.

Ahora, que no está diciendo este anuncio?

1) El Exadata es un equipo que sólo procesa base de datos, no procesa aplicaciones como WebSphere, WebLogic, un WebServer o Business Intelligence, sólo la base de datos Oracle.
2) No hay un detalle de la configuración. En otro chart he visto una comparación similar y es el mismo equipo de IBM comparado con una configuración de 8.8 millones, versus este equipo de 3.3 mdd
3) Que los cores de los equipos Exadata son de procesadores Intel vs los procesadores Power7 del 795
4) El nivel de disponibilidad de la solución. Que diga que están en HA no es suficiente, no todas las soluciones de HA funcionan igual.
5) More I/O Performance: La velocidad de entrada salida es algo sumamente relativo en este tipo de ambientes, donde comparamos un dispositivo de IBM con discos externos, versus un equipo Exadata con discos "internos" o integrados en la solución. El I/O puede referirse al rendimiento que entregan los discos, a la velocidad de las comunicaciones, a la velocidad de la memoria...
6) Que necesitaremos más equipos en el ambiente de Oracle para poder correr cualquier tipo de solución, pues no hay servidores para procesar.
7) El costo del software y su mantenimiento.

Siempre he considerado que se debe pensar para qué, o estaríamos usando todos PCs para procesar información delicada. Se imaginan un banco procesando con un cluster de servidores Intel armados de forma casera para procesar nuestras transacciones?

Es cierto que con la tecnología actual, en equipo de cómputo empresarial se hace cada día más difícil el comparar peras con peras, pero evidentemente hay un límite, y siempre existirá una forma de comparar equipos de similares funcionalidades, el punto es que los fabricantes quieran llevarnos a un escenario justo.

19 sept 2011

Virtualización de Almacenamiento (Storage Virtualization)

Esta vez vamos a hablar de la virtualización de almacenamiento o "Storage Virtualization".

Hitachi Data System: Réplica entre diferentes tecnologías usando virtualización


Normalmente cuando hacemos referencia a la palabra "Storage" imaginamos automáticamente un disco o sistema de discos internos o externos. Lo cierto es que almacenamiento de datos comprende desde equipos con disco, cintas, dispositivos WORM (alguien los seguirá usando?), CDs/DVDs, dispositivos de conectividad de SAN (Storage Area Network) y software de administración y operación.

Tratando de ir en orden, existen diferente tipos de almacenamiento y podemos decir que casi todos pueden ser virtualizados, aunque con diferentes mecanismos.

Virtual Tape
Imaginemos una unidad de cinta empresarial de IBM

IBM TS3500 "Anaconda"

Arriba estamos viendo un TS3500 de IBM, también conocido como "Anaconda" pues se pueden concatenar varios cajones (hasta 16) para formar un único dispositivo robot de administración de cintas.
Es un equipo que permite ser conectado a un MainFrame o para consolidar los respaldos de múltiples servidores.
Imaginemos un precio de varios cientos de miles de dólares, quizá de hasta millones de dólares invertidos en esa caja.

Ahora apliquemos el sentido común: Cuantas horas al día podrá estar operando ese equipo? Aunque resulte un poco obvio no lo es tanto: 8 a 12 horas por día. Por qué?  Debido a que los respaldos se hacen en ventanas de tiempo en que los equipos no están operando (no siempre es así, pero la mayoría de las veces), lo cual suele ser fuera de los horarios de oficina.
Entonces parage

Como era de esperarse, existen dispositivos de Disco Virtual o Virtual Storage Devices. En esta categoría también caen algunos productos de virtualización de SAN, dada la funcionalidad que proveen.

IBM SAN Volume Controller


Existen diferentes dispositivos que proveen este tipo con funcionalidades diferentes y precios mconStor o Starwind.
También existen soluciones de respaldo, como CommVault, que incluyen características de VTL en el mismo software.


Virtual Disk Storage

Como era de esperarse, existen dispositivos de Disco Virtual o Virtual Storage Devices. En esta categoría también caen algunos productos de virtualización de SAN, dada la funcionalidad que proveen.

IBM SAN Volume Controller


Existen diferentes dispositivos que proveen este tipo con funcionalidades diferentes y precios muy variados, pero en esencia todos proveen ciertas características comunes:

1) Migración de información entre discos internos o externos sin interrumpir la operación
2) Jerarquización y migración de información de forma automática de acuerdo a su rendimiento o uso, a fin de usar el TIER de almacenamiento con el costo adecuado para el dato correspondiente.
3) Sobre-asignación (over-allocation) de espacio en disco: Permite asignar más espacio del que físicamente tenemos empleando técnicas de "Aprovisionamiento Delgado" (Thin Provisioning). De esta forma podemos hacer creer a nuestros servidores que contamos con más espacio del que físicamente tenemos, mientras el proveedor va surtiendo las partes, y sólo emplearemos el espacio que ocupamos en lugar del espacio asignado.
4) Consolidación de drivers: El contar con un único dispositivo que se comunique con el servidor, a pesar de ser más de uno el que brinde los discos, permite emplear menos drivers y simplificar la administración.
5) Consola de administración centralizada para todos los discos virtualizados
6)Unificación de réplicas de datos: A pesar de ser un tema en sí el de las réplicas de datos, podemos decir que por cuestiones de compatibilidad es prácticamente imposible replicar información entre diferentes equipos de diferentes fabricantes. La virtualización nos permite ver nuestro almacenamiento como una única piscina de discos, pudiendo mover información entre ellos o bien replicar remotamente esa información de manera transparente.

Podemos clasificarlos, a grandes rasgos, de la siguiente manera:

a) Equipos como el VSP de Hitachi Data Systems, NetApp o el IBM Storwize V7000 consisten de dispositivos de disco y que cuentan con funcionalidades de virtualización como un extra para publicar los discos de otros dispositivos como si fueran propios.
Las principales ventajas de estos equipos son el poder agregar mayor capacidad de disco de acuerdo a nuestra conveniencia y en el equipo que nosotros querramos.

b) Equipos de sólo virtualización: Gateways de NetApp, IBM San Volume Controller. Son equipos dedicados, basados en software, con funciones de virtualización. Por ser equipos dedicados muchas veces dan un muy buen desempeño. El IBM SVC actualmente ostenta el record de rendimiento en dispositivos de almacenamiento.

c) Soluciones de Software: Starwind IP SAN, FalconStor NSS, Compellent DataCore, etc. Suelen ser soluciones más económicas y por lo general ofrecen convertir a SAN sobre IP empleando el protocolo iSCSI, para evitar el uso de tarjetas especiales. Algunos son sistemas operativos completos, por lo general basados en Linux, o bien soluciones que corren sobre Servidores Windows.

d) Basados en el sistema operativo. Algunos sistemas operativos como el IBM i (anteriormente llamado OS/400) o Solaris cuentan con características de virtualización de discos y/o de cintas, empleando mecanismos propios del entorno.

Virtualización de respaldos

En realidad más que una solución de hardware o software suelen ser soluciones híbridas, donde el dominante es el servicio. También son llamadas soluciones de Cloud Híbrida de Respaldos.
Un ejemplo de ello es el equipo Secure2Disk de SUNGuard, que emplea un dispositivo para guardar los respaldos del equipo y luego subirlos usando un enlace seguro por Internet a un servidor "en la nube" brindado por el proveedor. La principal ventaja de estas soluciones es el no tener que adquirir equipos costosos, simplemente pagando una renta mensual por el espacio empleado.


Conclusiones

De la misma forma en que muchas veces cuando tenemos un martillo todo nos parece un clavo, si una "solución de virtualización" no está a la altura de nuestras necesidades, en realidad no es una solución.

Se de gente que  adquiere soluciones de virtualización de almacenamiento pensando que podrá reutilizar sus antiguos equipos de disco e intentar darles nueva vida. La realidad es que no siempre conviene mantener un costoso equipo con discos que tienen años y cuyo mantenimiento puede ser más elevado que comprar un dispositivo nuevo con funcionalidad superior.

El principal objetivo de toda solución de virtualización es reducir costos, sean costos directos o indirectos, de operación o de adquisición; o agregar nuevas funcionalidades. Al momento de diseñar nuestra solución deberemos tener esto muy en cuenta, o no agregará valor a nuestro negocio.

Cómo conectarme a un servidor remoto en una red protegida - Versión actualizada

En un artículo anterior describí cómo conectarse a un equipo remoto en una red protegida http://diego-k.blogspot.mx/2014/12/como-conectarme...