Cómo viajar en la transformación digital (IV)

ADI, Opinión

Comenzando a trabajar con el Modelo ADI

En el artículo anterior expliqué a alto nivel las áreas que se trabajan en el Modelo. A continuación, especificaré con mayor detalle qué se realiza en la primera etapa, exponiendo también ejemplos de mis experiencias reales.


Revisión de la calidad del Dato, soporte principal de la inteligencia empresarial

Actualmente, todo el mundo de TI sabe en qué consiste el Big Data: hace referencia al volumen de datos que se pueden recopilar en el día a día de los sistemas de información y procesos, y establece cinco directrices que describen la práctica, que son las 4Vs: Volumen, Velocidad, Variedad y Veracidad.

Adicionalmente, el Smart Data tiene un valor añadido con respecto el Big Data, y es que, aparte de almacenar información, el sistema es capaz de analizarla añadiendo una quinta V, en referencia al VALOR que aporta esa información.

Aunque todas las características nombradas (las 5 Vs) son importantes, establecemos como fundamentales y prioritarias en los proyectos las correspondientes a la Veracidad y el Valor, que son con las que hacemos el uso y análisis de los datos para ser más inteligentes; de ahí que la calidad del dato sea un factor fundamental como punto de partida en cualquier proyecto que se quiera realizar con datos, ya que será la materia prima para su explotación

Para saber qué calidad tienen mis datos, es básico realizar una auditoría de calidad del dato. El uso de una metodología propia, basada en el estándar internacional de minería de datos llamada CRISP-DM, permitirá cuantificar los datos mediante unos parámetros de calidad de datos trabajados en seis dimensiones y, en base a ellos, proponer las acciones correctoras necesarias para asegurar cualquier trabajo con los datos y su aplicación en modelos descriptivos, prescriptivos o predictivos.


Se han desarrollado diversos proyectos en el sector salud y otros sectores, donde se realiza la validación de la calidad del dato en base a las 6 dimensiones de datos, estableciendo por dimensión, la calidad del dato objetivo consensuada con negocio. En un solo proyecto hemos podido analizar 20 millones de observaciones sobre más de 500 indicadores.

Uno de los primeros pasos a establecer junto con los científicos de datos y Negocio, una vez se ha obtenido el conocimiento del Negocio, es fijar un umbral de calidad objetivo de los datos que se quieran establecer:

A continuación, se mide la calidad de los datos, a partir de un muestreo recogido de los Sistemas de Información empresarial, atendiendo a cada una de las seis dimensiones vistas anteriormente. Este proceso de medición debe llevarse a cabo de forma periódica, como medida para garantizar que la calidad de los datos no decrezca, y se mantenga en los márgenes establecidos por Negocio.

En el caso de que el resultado de la auditoría de calidad no supere el umbral prefijado por Negocio, se establecen diversos workshop de trabajo para ir depurando su calidad.


Conclusión: Vigila la salud de tus datos

Recientemente, ha habido una publicación del Banco Interamericano de Desarrollo (BID), donde indican que se espera que para el año 2020, los datos médicos se dupliquen cada 73 días y que a lo largo de su vida cada persona pueda generar más de un millón de gigabytes de información relacionada con su salud.

Como podemos ver, los datos están creciendo a un ritmo exponencial, y hay que hacer un uso eficiente de dicha información, por lo que es vital el mantenimiento de una buena salud de los datos.

Haciendo una analogía entre médico y paciente, el auditor del dato, actuaría como médico, realizando un chequeo al paciente, que serían los datos empresariales, para saber su estado general; pudiendo detectar a tiempo cualquier cuestión que pueda estar afectando a su salud, siendo de gran ayuda a la hora de plantear un tratamiento efectivo. No lo pienses más, y haz un chequeo a tus datos!