Los datos se están convirtiendo en la nueva materia prima de los negocios.

Craig Mundie, head of research and strategy, Microsoft

En BizMetriks adoptamos CRISP-DM como metodología estándar en el desarrollo de nuestras soluciones.

CRISP-DM , de Cross Industry Standard Process for Data Mining, es un modelo metodológico de Business Analytics y Data Mining que describe los enfoques comunes que utilizan los expertos en data mining.

Las flechas en el diagrama indican las dependencias más importantes y frecuentes entre fases. El círculo exterior en el diagrama simboliza la naturaleza cíclica del Business Analytics en sí, ya que el proceso continua después de la implementación de la solución retroalimentándose con los resultados obtenidos.

CRISP-DM divide el proceso de minería de datos en seis fases principales.


1

Comprensión del Negocio

Esta fase inicial se concentra en la comprensión de los requisitos y objetivos de negocio desde la perspectiva de una empresa, y a continuación convertir este conocimiento en una definición de problema de Business Analytics y un plan preliminar diseñado para lograr los objetivos.

  • Establecimiento de los objetivos del negocio (Contexto inicial, objetivos, criterios de éxito)
  • Evaluación de la situación (Inventario de recursos, requerimientos, supuestos, terminologías propias del negocio,…)
  • Establecimiento de los objetivos de la minería de datos (objetivos y criterios de éxito)
  • Generación del plan del proyecto (plan, herramientas, equipo y técnicas)



2

Comprensión de los Datos

La fase de comprensión de los datos se inicia con la recogida inicial de datos y prosigue con actividades que le permiten familiarizarse con los datos, identificar los problemas de calidad de los datos, descubrir los primeros conocimientos de los datos y/o detectar subconjuntos interesantes para elaborar hipótesis en relación a la información oculta.

  • Recopilación inicial de datos
  • Descripción de los datos
  • Exploración de los datos
  • Verificación de calidad de datos



3

Preparación de los Datos

La fase de preparación de datos cubre todas las actividades necesarias para construir el conjunto de datos final [datos que se introducirán en las herramientas de modelado] desde los datos en bruto iniciales. Las tareas de preparación de datos probablemente se realizarán varias veces y sin seguir un orden prescrito. Las tareas incluyen la selección de tablas, registros y atributos, así como la transformación y limpieza de datos para las herramientas de modelado.

  • Selección de los datos
  • Limpieza de datos
  • Construcción de datos
  • Integración de datos
  • Formateo de datos



4

Obtención de los Modelos

En esta fase se seleccionan y se aplican varias técnicas de modelado, y sus parámetros se calibran en sus valores óptimos. Generalmente existen varias técnicas para el mismo tipo de problema de minería de datos. Algunas técnicas tienen requisitos específicos sobre el formato de los datos. Por lo tanto, suele ser necesario regresar a la fase de preparación de datos.

  • Selección de la/s técnica/s de modelado
  • Diseño de la evaluación
  • Construcción del modelo
  • Evaluación del modelo



5

Evaluación de los Modelos

En esta etapa del proyecto se ha creado un modelo (o modelos) que parecen tener una alta calidad desde la perspectiva del análisis de datos. Antes de proceder al desarrollo final del modelo, es importante evaluarlo exhaustivamente y revisar los pasos ejecutados para crearlo, con el fin de asegurarse de que el modelo logra correctamente los objetivos de negocio. Un objetivo clave es determinar si existe algún problema de negocio importante que no se haya considerado suficientemente. Al finalizar esta fase debe llegarse a una decisión sobre el uso de los resultados de la minería de datos.

  • Evaluación de resultados
  • Revisión el proceso
  • Establecimiento de los siguientes pasos o acciones



6

Implementación

La creación del modelo generalmente no es el final del proyecto. Aunque el propósito del modelo sea aumentar el conocimiento que se tiene de los datos, el conocimiento adquirido deberá organizarse y presentarse de forma que el cliente pueda utilizarlo. A menudo implica la aplicación de modelos “vivos” en los procesos de decisión de una organización – por ejemplo, la personalización en tiempo real de páginas Web o la puntuación repetida de bases de datos de marketing. En función de los requisitos, la fase del despliegue puede ser tan sencilla como generar un informe o tan compleja como implementar un proceso repetible de minería de datos en toda la empresa. En muchos casos, es el cliente, no el analista de datos, quién lleva a cabo los pasos del despliegue. No obstante, aunque el analista realice las acciones de despliegue, es importante que el cliente sepa anticipadamente las acciones que deben llevarse a cabo para poder hacer un uso real de los modelos creados.

  • Planificación de la implementación
  • Planificación del monitoreo y mantenimiento
  • Generación de informe final
  • Revisión del proyecto


+

Si quiere saber más sobre CRISP-DM le recomendamos las siguientes lecturas:



El próximo paso para controlar mejor sus negocios es contactarnos:


TWITTER


[ síganos ]

GOOGLE +


[ agréguenos ]

LINKEDIN


[ síganos ]

EMAIL


[ escríbanos ]







Bizmetriks.

P: +54 911 2162-6704 - E: info@bizmetriks.com

  

BizMetriks (c) 2013 - todos los derechos reservados