Inteligencia empresarial y Big data: Modelo para la toma de decisiones en el Área comercial Business intelligence and Big data: Model for ...
←
→
Transcripción del contenido de la página
Si su navegador no muestra la página correctamente, lea el contenido de la página a continuación
Inteligencia empresarial y Big data: Modelo para la toma de decisiones en el Área comercial Business intelligence and Big data: Model for decision-making in the commercial area 1st Enrique Edgardo Condor Tinoco 2nd Norma L.Catacora Flores Universidad Nacional José María Arguedas Universidad Nacional José María Arguedas Facultad de Ingeniería Facultad de Ingeniería Andahuaylas, Apurímac, Perú Andahuaylas, Apurímac, Perú enricoti@unajma.edu.pe, enricoti@gmail.com nlcatacora@unajma.edu.pe https://orcid.org/0000-0002-2711-9517 https://orcid.org/0000-0001-6211-129X Resumen— Estudio descriptivo y practico sobre el desarrollo de [1] Una solución de inteligencia de negocios, es un un modelo para la toma de decisiones usando metodologías de conjunto de objetos que permiten a los datos ser transformados Inteligencia empresarial y Big data aplicado en el área comercial en información útil; estos objetos deben ser diseñados, de una empresa; el modelo se desarrolló usando la teoría que creados, procesados y finalmente aprobados para crear una presenta la metodología de Ralph Kimball y el modelo practico solución de trabajo; al crear una solución de inteligencia de de la metodología Hefesto mas las bondades que presenta Big negocios es importante, primero entender en qué consiste la data. El objetivo fue de contar con un modelo practico y sencillo solución, cómo cada componente es combinado para construir que ayude a implementar soluciones que permitan mejorar la un todo, y finalmente, cómo reconocerlo cuando tienes toma de decisiones. logrado tu objetivo. [2]Un término general de inteligencia de Palabras claves: Metodología Ralph Kimball, Hefesto, Big negocios incluye la aplicación, la infraestructura, las data, área comercial herramientas y las mejores prácticas que permiten el acceso y el análisis de la información para mejorarlas. En 1989 Howard Abstract— Descriptive and practical study on the development Dresner, un investigador de Gartner Group, popularizó el of a model for decision-making using business intelligence and acrónimo de BI (Business Intelligence o Inteligencia de big data methodologies applied in the commercial area of a Negocios), en el que indicó el conjunto de conceptos y company; the model was developed using the theory that métodos para mejorar la toma de decisiones en los negocios, presents the Ralph Kimball methodology and the practical utilizando sistemas de información de apoyo basados en model of the Hefesto methodology plus the benefits that Big data hechos o temas. En el blog de Mar Calvo [3] indica que presents. The objective was to have a practical and simple model cualquier empresa, puede beneficiarse del uso de la that helps implement solutions that improve decision-making. inteligencia de negocio, gracias al análisis de datos internos y Keywords: Ralph Kimball methodology, Hefesto, Big data, externos de las empresas; los beneficios son en las diferentes commercial area áreas, tales como: optimización del stock, fidelización de clientes y la captación de nuevos clientes; en la web de I. INTRODUCIÓN esan.edu.pe [4] señala los beneficios de la inteligencia de El área de comercial de una empresa genera información negocio en una empresa, indicando que elimina muchas valiosa para la toma de decisiones, por lo que, las empresas conjeturas y especulaciones que surgen dentro de una deben mejorar la administración de su información, una de las empresa, también identifica a los consumidores que más alternativas es implementar soluciones de inteligencia benefician a la rentabilidad de la empresa y sirve para detectar empresarial, también llamadas inteligencia de negocios BI. El las nuevas tendencias de los clientes en el mercado. concepto de Inteligencia empresarial y Big data han ido Una empresa tiene diferentes áreas, todas con un objetivo desarrollándose, es así que, se han diseñados una amplia común en beneficio de la empresa, no obstante, hay áreas que variedad de metodologías, aplicaciones y tecnologías que trabajan específicamente para cumplir con los requerimientos permiten, acceder, organizar, transformar, explorar y analizar de los clientes, dentro de ella se encuentra el área de los datos externos e internos de las empresas, con la finalidad comercialización, siendo uno de los más importante porque, de apoyar a tomar mejores decisiones a los encargados de es la primera en tener contacto con el cliente. En la web [5] dirigir una empresa. De esta manera, ambas tecnologías se indica, uno de los departamentos más importantes dentro de convirtieron en herramientas muy usada por las empresas y les las empresas es el comercial y se encarga de alcanzar permite conocer bien su negocio internamente y externamente los objetivos económicos de la empresa y afrontar con éxito con la finalidad que les permita maximizar sus resultados. La los continuos cambios que se presenta en el mercado en el que forma de procesamiento que realiza Big data actualmente en actúa la empresa. Siendo muy importante el área de el análisis de datos, permite gestionar data del pasado y actual comercialización. a tiempo real [6] La inteligencia de los negocios y su aplicación sirven Con inteligencia empresarial se puede intervenir en todas de soporte especial en la toma de decisiones en las las áreas de una empresa, analizando a los clientes, los organizaciones, de manera organizada y estructurada en los inventarios, la producción, los proveedores y socios, también niveles estratégico, táctico y operativo de la organización. a los competidores. Teniendo en cuenta la importancia de la BI y el impacto que causa, en el presente artículo se ha realizado un modelo de
inteligencia de negocio haciendo un análisis de las análisis y con gran velocidad de respuesta. En la mayoría de metodologías de Ralph Kimbal y Hefesto. los casos la creación de un datawarehouse es el primer paso, desde el punto de vista técnico, para implantar una solución Big data y la Inteligencia empresarial, son dos tecnologías completa de Business Intelligence. El término Datawarehouse que toda organización debe conocer para iniciar un cambio en fue acuñado por primera vez por Bill Inmon, y se traduce la forma de adquirir conocimiento para la toma de decisiones. literalmente como almacén de datos, según lo definió un la consultora Gartner [7] , durante el año 2019 y según la datawarehouse se caracteriza por ser: consultora Gartner, la primera prioridad de inversión para las empresas inmersas en procesos de transformación digital será Integrado. Los datos almacenados en el datawarehouse la analítica de datos (43%), seguida por deben integrarse en una estructura consistente de los diversos la ciberseguridad (43%) y las soluciones y servicios Cloud sistemas operacionales existentes. Computing (39%), es decir, necesidades sobre el dato que, hace que los nuevos líderes digitales precisen de Temático. Los datos se organizan por temas para facilitar conocimientos y competencias adicionales sobre estas su acceso y entendimiento por parte de los usuarios finales. tecnologías Por ejemplo, todos los datos de los clientes pueden ser consolidados en una única tabla del datawarehouse. Con la finalidad de sentar las bases del desarrollo del Histórico. La información almacenada en el modelo de inteligencia de negocio, al principio se aborda conceptos básicos dentro del contexto de la investigación, datawarehouse sirve para realizar un análisis de tendencias, de después se presenta el modelo propuesto en base a la los valores que toma una variable en el tiempo, para permitir metodología de Ralph Kimball y Hefesto mas Big data, realizar comparaciones. también se resumen ejemplos en cada etapa del modelo No volátil. Un datawarehouse existe para ser leído, pero planteado. no modificado; la información es por tanto permanente, El objetivo de la presente, es desarrollar un modelo para la significando solo la actualización del datawarehouse. toma de decisiones en el área comercial de una empresa con También, en un datawarehouse, es importante entender Inteligencia Empresarial y Big data, en cuanto a Inteligencia cuál es el proceso de construcción, denominado ETL empresarial se usó las metodologías de Ralph Kimball y (Extracción, Transformación y Carga), a partir de los sistemas Hefesto. operaciones de una empresa: II. MARCO TEÓRICO Extracción. Obtención de información de las distintas fuentes donde se encuentran los datos, tanto internas como A. Inteligencia de Negocios. externas. Según el autor Howson [8] indica que la inteligencia de Transformación. Filtrado, limpieza, depuración, negocios es un conjunto de tecnologías y procesos que homogeneización y agrupación de los datos de las distintas permiten a las personas de todos los niveles de las fuentes de bases de datos. organizaciones, tener acceso a datos y realizar su respectivo análisis. El autor también señala que la BI puede ayudar a Carga. Organización y actualización de los datos y los confirmar las decisiones que los individuos toman en cada metadatos en la base de datos datawarehouse. paso de un proceso; hace un listado de las ventajas de utilizar inteligencia de negocios, siendo los siguientes: reducción de Es el proceso de extraer y manipular datos de distintas costes y mayor eficiencia, más capacidad para tomar aplicaciones (internas y externas), para que una vez depurados decisiones, mejora la capacidad de respuestas y mejora la y especialmente estructurados sean almacenados en un visibilidad a la mayor comprensión del negocio. depósito de datos (datawarehouse) consolidado para el análisis del negocio de una empresa [11]. Inteligencia de negocios según los autores Curto Díaz y Conesa Caralt [9] mencionan, que es necesario que todas las C. Metologia de Ralph Kimball empresas de la actualidad tienen bases de datos que almacenan Sobre la metodología de Ralph Kimball en el libro The datos sobre sus actividades y procesos y son colaborados por Data Warehuose Toolkit [12] señala que es una metodología programas informáticos; por lo tanto, las empresas disponen empleada para la construcción de un almacén de datos por norma, de multitud de datos históricos de todas las (datawarehouse, DW) que no es más que, una colección de actividades realizadas y al ser refinados, agrupados, tratados y datos orientada a un determinado ámbito (empresa, analizados se pueden extraer información que permita ayudar organización, etc.), integrado, no volátil y variable en el a los gerentes en la toma de decisiones de la empresa. Para los tiempo, que ayuda a la toma de decisiones en las empresas que autores con la inteligencia de negocios nos permite responder la usan. Este ciclo de vida del proyecto de DW, está basado en preguntas como: ¿Quiénes son mis mejores clientes?, ¿Dónde cuatro principios básicos: se ubican?, ¿Qué compran?, ¿Qué los caracteriza?, ¿Cuáles líneas de productos son las más rentables?, ¿Qué productos • Centrarse en el negocio. son mis tops 10?, ¿Cuáles son mis peores 10?, ¿Qué productos • Construir una infraestructura de información adecuada. son los más vendidos este mes?, ¿El mes anterior? y ¿Dónde se concentran el 80% de mis ventas, mis gastos, mi • Realizar entregas de avances en incrementos significativos, rentabilidad? este principio se refiere a la creación de un almacén de datos en entregables con plazos de 6 a 12 meses. B. Datawarehouse [10] Es una base de datos corporativa de una empresa que • Ofrecer la solución completa a una organización. Se deberán se caracteriza por integrar y depurar información de una o más entregar herramientas de consulta, aplicaciones para fuentes diferentes, para luego procesarla permitiendo su informes y análisis avanzado, capacitación a los administradores y usuarios, soporte y documentación.
La construcción de una solución de DW/BI “Big data es la solución al crecimiento exponencial de los (Datawarehouse/Business Intelligence) es sumamente datos, en el momento en que se hace difícil su administración compleja, y Kimball propone una metodología que nos ayuda con respecto al almacenamiento, procesamiento y acceso” a simplificar esa complejidad. Las tareas de esta metodología [15]. se describen a continuación: [16] definen Big data como el conjunto de datos cuyo a) Planificación del proyecto tamaño va más allá de la capacidad de captura, almacenado, b) Definición de requerimientos del negocio gestión y análisis de las herramientas de base de datos. c) Modelado dimensional Como se podrá apreciar los conceptos van relacionados - Elegir el proceso de negocio con las Vs que se usan en Big data: volumen, velocidad, - Establecer el nivel de granularidad variedad, veracidad y valor. Existen autores que definen a Big - Elegir las dimensiones data en función a estas 5 Vs. En la web de la empresa - Identificar medidas y las tablas de hechos #Adncloud, se encuentran definidos estos 5 Vs, siendo los d) Diseño físico siguientes: e) Diseño e implementación del subsistema de extracción, transformación y carga (ETL) • Volumen f) Implementación Como hemos visto, la cantidad de datos se define “Big” no g) Mantenimiento y crecimiento de la datawarehouse cuando supera un tamaño definido, sino cuando su h) Especificación de aplicaciones de BI almacenamiento, procesamiento y explotación empieza a i) Diseño de la arquitectura técnica ser un reto para una organización. • Velocidad D. Metodologia Hefesto La segunda característica del Big Data está relacionada con En la web del autor Bernabeu [13]detalla sobre la el ritmo a los cuales los datos se están generando, que suele metodología Hefesto, indicando que es una propuesta que está aumentar constantemente y que necesita una respuesta en fundamentada en una extensa investigación, comparación de tiempo real por parte de las empresas. metodologías existentes y el aporte de su experiencia en el • Variedad proceso de diseño e implementación de datawarehouse. El Sin embargo, el reto principal del Big Data reside en la gran mismo autor indica que el principal objetivo de la metodología diferencia de formatos distintos en los cuales encontramos Hefesto es facilitar el arduo trabajo que significa construir un los datos y que pueden ir desde texto sencillo, a imágenes, datawarehouse desde cero. videos, hojas de cálculos y enteras bases de datos. La metodología tiene como punto de partida la recolección • Veracidad de requerimientos y necesidades de información de los Además, los datos tienen que ser confiables. Una gran usuarios y concluye con la confección de un esquema lógico cantidad de datos no tiene valor si son incorrectos y puede y sus respectivos procesos de extracción, transformación y ser altamente perjudicial, sobre todo en la toma de decisión carga de datos. Hefesto está compuesto por los siguientes automatizada. pasos: • Valor a) Análisis de requerimientos Finalmente, los datos y su análisis tienen que generar un o Preguntas del negocio beneficio para las empresas [17] o Indicadores y perspectivas F. Arquitectura de Big data o Modelo conceptual b) Análisis de data sources (OLTP) En la Universidad de Amsterdam [18] proponen una o Hechos e indicadores arquitectura de 5 niveles, la cual está basada en el análisis de o Mapeo la información y en el proceso que realizan los datos para el o Granularidad desarrollo de las transacciones. A continuación, la forma en o Modelo Conceptual Ampliado que se relacionan en los niveles y su respetiva interacción entre ellos: c) Modelo lógico del datawarehouse o Tipología o Tablas de dimensiones o Tablas de hechos o Uniones d) Integración de datos o Carga Inicial o Actualización E. Big data “Big data es una referencia a aquellos sistemas de información que manejan conjuntos de datos de gran volumen, de alta velocidad, de veracidad, de valor y de gran variedad de recursos, que demandan formas rentables e innovadoras de procesamiento de la información para mejorar la comprensión y la toma de decisiones” [14] Fig. 1. Arquitectutura de Big data, Estudiada en la Universidad de Amsterdam
G. Toma de Decisiones f) Implementación o Tablas de Dimensiones g) Mantenimiento y o Tablas de Hechos Amaya [19] menciona, que la toma de decisiones en una crecimiento de la o Uniones empresa constituye un proceso de selección entre las datawarehouse d) Integración de datos h) Especificación de o Carga Inicial diferentes alternativas posibles que se han generado. A partir aplicaciones de BI o Actualización de la elección de una alternativa se pasa al proceso de la i) Diseño de la arquitectura técnica planificación de actividades, desarrollo de las estrategias y Definición de la La metodología es de una La metodología es más práctica, formulación de programas y presupuestos. Para dirigir metodología formal y extensa con y orientada a desarrollarse en eficazmente una empresa pequeña y mediana se necesita bastantes parámetros que cortos tiempos la ejecución de la cumplir y su rigidez es solución de BI. La explicación utilizar los recursos disponibles de una manera eficiente, ya fuerte, También cuenta del desarrollo de la metodología que los recursos son limitados. La toma de decisiones se debe con abúndate teoría que se basa a ejemplos más actuales realizar en los diferentes niveles de una empresa, esto lleva a permite abarcar detalles que podrían tener algunas que la decisión individual de cada nivel afecta de una manera organizaciones. directa al desarrollo de todo el sistema organizado: El autor Plataforma de Ralph kimball, en el Hefesto está orientado al listan las fases de la planificación de toma de decisiones en desarrollo aspecto tecnológico no software libre. orienta a alguna función del análisis del valor., siendo los siguientes: plataforma, es general definición de objetivos, recogida de la Información, Fuente: Elaboración propia identificación de funciones y análisis de costes, propuesta de solución alternativas, evaluación de las soluciones propuestas, X. Lozada y otros autores [21] realizan análisis elección de las soluciones optimas y seguimiento y control. comparativo entre la metodología de Ralph Kimball y Hefesto H. Area comercial para su estudio “Análisis, diseño, construcción e implementación de un datawarehouse para toma de decisiones Una definición extensa y clara lo hacen en la Universidad y construcción de los KPI. para la empresa Kronosconsulting de Utel [20], “el área comercial es una de las más importantes CIA LTA”, en la TABLA II se muestra el análisis en la estructura de una organización, puesto que es la comparativo responsable de procurar la relación con los clientes y de la TABLA II. ANÁLISIS COMPARATIVO ENTRE LA METODOLOGÍA consecución de los objetivos de venta, es decir, son la fuente DE RALPH KIMBALL Y HEFESTO SEGÚN X. LOZADA Y OTROS principal de ingresos”. El mismo autor indica las principales AUTORES tareas del área comercial: ■ Planificación y control. Factores de análisis Ralph Ricardo ■ Estudio de mercado. Kimball Bernabeu (Hefesto) ■ Promoción y publicidad del producto. Flexibilidad Medio Alto ■ Ventas. Adaptable sobre cualquier SI SI tecnología III. METODOLOGÍA Afinidad con el sistema actual en Medio Alto desarrollo Para el desarrollo del modelo de inteligencia empresarial Tamaño del proyecto Todos Pequeño/Mediano para el área comercial, se ha realizado un análisis comparativo Tiempo en el análisis y diseño Costoso Medio (una sola de las metodologías de Ralph Kimball, Hefesto, y para vez) completar el análisis se evaluó una comparación entre Etapa de implantación SI NO inteligencia empresarial y Big Data. Para después plantear el Guías y practicas se aplican a SI SI SQL modelo del análisis realizado Fácil entendimiento NO SI principiantes A. Analisis comparativo de la metodologia de Ralph Revisión Post Implantación SI NO Kimball y Hefesto Documentación precisa Precisa Precisa Después de analizar las metodologías de Ralph Kimball y Perspectiva Estrella Estrella y Copo de Nieve Hefesto; se muestra en la Tabla I un análisis comparativo de Rápido acceso en el mundo Alta Media estas dos metodologías. Más usados en el mundo Baja Alta TABLA I. COMPARACIÓN ENTRE LA METODOLOGÍA DE RALPH KIMBALL Y HEFESTO B. Analisis comparativo de Inteligencia empresarial y Big Característica Ralph Kimball Hefesto data Enfoque de A un datawarehouse A un datawarehouse desarrollo Más que hablar de diferencias entre la Inteligencia de Arquitectura Bottom Up Hibrida negocios y el Big data, es claro dentro de las organizaciones Enfoque Diseño de datawarehouse Construcción de un filosófico datawarehouse se deben implantar estos como complementos, ya que podrían Enfoque de a) Planificación del a) Análisis de requerimientos ser muy potentes si se integran en el desarrollo de soluciones desarrollo por proyecto o Preguntas del Negocio para la toma de decisiones. En la TABLA III etapas b) Definición de o Indicadores y Perspectivas requerimientos del o Modelo Conceptual negocio b) Análisis de data sources c) Modelado (OLTP) dimensional o Hechos e Indicadores d) Diseño físico o Mapeo e) Diseño e o Granularidad implementación del o Modelo Conceptual subsistema de Ampliado extracción, c) Modelo lógico del transformación y datawarehouse carga (ETL) o Tipología
TABLA III. ANÁLISIS COMPARATIVO DE INTELIGENCIA • Planificar el uso de los recursos. EMPRESARIAL Y BIG DATA • Planificar el monitoreo de las actividades. Factores de Inteligencia Big data • Definir el cronograma´ análisis empresarial Lugar de un servidor central. los datos se almacenan Si realizamos un ejemplo de esta etapa, tendríamos lo almacenaje en un sistema de siguiente: ficheros distribuido Tipos de datos Tratamiento de datos Tratamiento de datos de • Descripción de la organización que analiza estructurados distintos formatos, Aproximadamente, en los años setenta se inicia el estructurados y no negocio; los fundadores son de la provincia de estructurados Andahuaylas, en ese entonces había poca población, Tipo de Bases Datawarehouse Data lake de datos sólo existían algunas casas en lo que hoy es la Fuentes de Datos internos de la Datos internos y ferretería Virgen de Cocharcas. Los fundadores información empresa: ventas, externos de la empresa: iniciaron la ferretería con la finalidad de contar con un transacciones, GPS, Redes sociales, negocio familiar. El nombre de la empresa se debe a distribuciones, etc. sensores, chats, etc. Oportunidad Permite mirar hacia el Permite mirar hacia el que la familia es creyente a la Virgen de Cocharcas en su análisis futuro y enfocarse en futuro y enfocarse en de datos detalles previstos por detalles que, a primera • Nombre de la empresa los desarrolladores de vista parecen no Ferretería Virgen de Cocharcas, la solución, los que les importantes, después permite tener demostrando ser fuente • Ubicación de la empresa oportunidades de grandes La ferretería está ubicada en la Av. Martinelly N 145, oportunidades en la provincia de Andahuaylas Procesamiento Procesamiento no Procesamiento paralelo paralelo, por lo que las masivo, muchas • Alcance de la investigación instrucciones no se instrucciones se ejecutan de manera ejecutan de manera La investigación se desarrolló en la ferretería Virgen simultánea simultánea Análisis Tendencias según los Tendencias según los de Cocharcas en el área comercial. predictivos tipos de datos que tipos de datos que analiza analiza • Actividades Información Los datos que procesa Los datos que procesa - Analizar la ferretería Virgen de Cocharcas histórica son históricos e son históricos e internos centrado en el área de ventas o comercialización, internos y externos dirigido por un Gerente de Ventas. Se debe analizar las compras, ventas, clientes y los IV. MODELO PROPUESTO materiales de ferretería y construcción. También se deben realizar entrevistas a los trabajadores del El modelo para la toma de decisiones en el área comercial área que se presenta, está desarrollado de las características - En función al análisis realizado construir el diseño relevantes de las metodologías de Ralph Kimball y Hefesto, de modelo para la toma de decisiones en la más un análisis realizado a las bondades que presenta Big ferretería Virgen de Cocharcas. data; y consiste en las siguientes etapas: a) Etapa de planificación del proyecto • Planificar el uso de los recursos. b) Análisis de requerimientos del área comercial Los softwares a usar son: Micorsoft SQL server c) Definir el modelo de la solución 2015, SQL Server Data Tools 2015, Power BI y d) Diseño Microsoft Office Excel 2016. e) Construcción f) Implementación Hadoop, Ambari, Flume, Hive, HBase A. Etapa de planificación del proyecto Los hardwares a usar son: Servidor Dell Poweredge T30, Intel Xeon E3-1225v5 3.3ghz,1tb y 2 laptops En esta etapa se realiza un plan, en donde se organiza las Laptop Asus X507uf-br043 15.6 I7 8g 1tb.vid 2gb actividades del proyecto, definiendo con claridad aspectos que Ddr5 van a encaminar el desarrollo del proyecto de inteligencia de negocio en el área comercial. En esta etapa se define en el plan B. Análisis de requerimientos del Area comercial los siguientes puntos: En esta etapa se debe aprender todo sobre el área • Descripción de la organización comercial, leer los documentos de gestión y normativos, los • Nombre de la empresa informes que se han generado sobre las ventas, clientes y • Ubicación de la empresa decisiones del área de comercialización de la empresa; • Misión y visión de la empresa también se entrevista a los trabajadores sobre los objetivos, dificultades y sobre sus ideas del área comercial. • Estructura organizacional • Descripción del problema El análisis de los requerimientos o necesidades para el área • Definir el objetivo comercial de los diferentes usuarios, es el inicio del modelo • Definir el alcance (entender los requerimientos del de la solución de inteligencia de negocios, ya que se negocio). identificarán con claridad las metas, objetivos y estrategias • Identificar las actividades que facilitaran el desarrollo del modelo, y lo más importante • Asignar los roles es conocer lo que esperan de la solución de inteligencia de negocio
Algunos ejemplos de los lugares donde se debe recabar la En esta etapa, después de haber realizado las encuestas y información del área comercial son: entrevistas; los requerimientos principales del gerente de ventas podrían ser: Fuentes de información interna 1. Ventas anuales, trimestrales, mensuales y diarias de • Plan Estratégico. un determinado producto 2. Clientes más frecuentes que adquieren un Revisar el Plan Estratégico identificando los determinado producto indicadores de gestión que permitan hacer seguimiento 3. Vendedores que han realizado mayores ventas en un a los objetivos establecidos. determinado periodo • Reportes del área de comercialización 4. Productos más vendidos en determinados tiempos 5. Lista de los clientes potenciales • Bases de datos C. Definir el modelo de la solución Revisar y analizar las bases de datos existentes en el área comercial. Aquí se presenta el modelo de datos actual, Es un proceso dinámico e iterativo, en las líneas siguientes la información que contiene estas bases de datos serán se indica los pasos. los datos de la solución de inteligencia de negocios por ello, es muy importantes su análisis. - Elegir el proceso a modelizar • Entrevista y encuestas Las metodologías de Inteligencia de negocio indican un análisis de requerimientos de toda la una organización y a) Personal de gestión va depender de la alta dirección elegir una área o tema, en este caso es el área de comercialización. Las preguntas van orientadas a conocer los objetivos, estrategias, metas e indicadores, con la - Identificar las dimensiones e indicadores finalidad de identificar los requerimientos funcionales y no funcionales que debe realizar la los indicadores, son valores numéricos y son medibles solución de inteligencia de negocio estos, representan lo que se desea analizar, por ejemplo: promedios o cantidades, etc. Entre los posibles requerimientos funcionales que se identifican son: Las dimensiones son las entidades por los cuales se quieren examinar mediante los indicadores, para ✓ Datos que deben ser ingresados al sistema. responder a las preguntas planteadas, por ejemplo: ✓ Descripciones de los resultados por cada reporte clientes, proveedores, docentes, etc. ✓ Descripción del flujo de la información de la solución de BI Al personal de gestión, se le pregunta sobre los ✓ Descripción de como el sistema cumplirá los indicadores más representativos del área de reglamentos y regulaciones del área comercial. comercialización y cuál es el análisis que se desea realizar, también se les pregunta sobre las perspectivas b) Personal del área de TI o dimensiones. Las preguntas orientadas al personal de TI, son: Las preguntas más frecuentes que se formulan en el área comercial, son los siguientes: - Disponibilidad de la data. - Calidad de la data ➢ Las ventas en un determinado periodo y lugar - Seguridad de la data - Hardware y software que procesa la información ➢ Números de clientes de un determinado periodo y - Como se desarrolla los reportes lugar - Se desarrolla análisis del web log del servidor que ➢ Las ventas por establecimientos y por periodos existe ➢ Los productos más vendidos por determinados Fuentes de información externa periodos y establecimientos. • Redes Sociales. - Mapear del origen de datos Estadísticas de los seguidores de las redes sociales que En esta parte debemos analizar las bases de datos han visto cierta publicidad, número de Likes, número de existentes e identificar sus características para veces que se comparte una publicidad y número de desarrollar el mapeo. Un ejemplo sería el siguiente: veces que fue comentado. • La dimensión Productos se relaciona con • Correos institucionales tabla Productos. Se revisa y analiza la dirección electrónica institucional • La dimensión Clientes se relaciona con la del área comercial, tales como: solicitudes de pedidos, tabla Clientes. número de atenciones de los pedidos. • La dimensión Tiempo se relaciona con el • Página web de la institución. campo fecha de la tabla ventas. • Blogs. • El indicador unidades vendidas se relaciona con el campo cantidad de la tabla detalle_ventas. - Nivel de granulidad
Una vez desarrollado el mapeo e identificado las función a cuál se adapta mejor para la solución de dimensiones e indicadores, en esta parte se especifica inteligencia de negocios. En la Figura 2 [23] se muestra el detalle de cada dimensión, la elección del detalle va un ejemplo depender de los requerimientos que se han realizado. Desde esta etapa ya se inicia con el desarrollo de los datamarts con sus respectivas dimensiones e indicadores que se han identificado. Con respecto a la dimensión tiempo, es muy importante determinar su detalle en base a los requerimientos del responsable (gerentes) del área comercial, ya que es la que determinará la granularidad del datamart, los datos más comunes que se usan son los siguientes: año, semestre, trimestre, meses, semana, día En esta etapa podríamos tomar como un ejemplo sencillo Fig. 2 Ejemplo de un modelo lógico básico del área comercial los siguientes puntos Desde un punto de vista interno tendríamos las - Modelo Físico dimensiones de la solución; estos teniendo en cuenta los El modelo físico es una representación gráfica detallada requerimientos que se han planteado. Las unidades de medida del datawarehouse, en donde se encuentran los del datamart serían cantidad y costo de la venta. Las datamarts, también se grafica la base de datos Big data: dimensiones son: estos se realizan de acuerdo al modelo lógico. El modelo - Dimensión Cliente físico se realiza teniendo en cuenta el cómo se desea - Dimensión Vendedor almacenar los datos en el datawarehouse y la base de - Dimensión Producto datos de Big data, por tal razón, en esta parte se analiza - Dimensión Tiempo que SGBD se va usar. Desde un punto de vista externo tendríamos las En el modelo físico debe responder a las siguientes dimensiones siguientes: preguntas propuestas por Ralph Kimball: - Dimensión preferencia del cliente ✓ ¿Cómo puede determinar cuán grande será el - Dimensión reacción del cliente sistema de DW/BI? - Dimensión tendencia ✓ ¿Cuáles son los factores de uso que llevarán a una configuración más grande y más compleja? D. Diseño ✓ ¿Cómo se debe configurar el sistema - Modelo conceptual ✓ ¿Cuánta memoria y servidores se necesitan? ✓ ¿Qué tipo de almacenamiento y procesadores? Con toda la información obtenida en el modelo de la ✓ ¿Cómo instalar el software en los servidores de solución del BI, se procede a desarrollar el modelo desarrollo, prueba y producción? conceptual como resultado del análisis realizado en los ✓ ¿Qué necesitan instalar los diferentes miembros del pasos previos. En la Figura 1 [22] se muestra un ejemplo equipo de DW/BI en sus estaciones de trabajo? ✓ ¿Cómo convertir el modelo de datos lógico en un modelo de datos físicos en la base de datos relacional? ✓ ¿Cómo conseguir un plan de indexación inicial? ✓ ¿Debe usarse la partición en las tablas relacionales? El componente del modelo físico incluye los siguientes elementos: Fig. 1 Ejemplo básico de un modelo conceptual. o Las tablas dimensiones y la tabla hechos o Las columnas o atributos de cada tabla - Modelo Lógico o Tipos de columnas, por ejemplo: entero, cadena, Teniendo como base el modelo conceptual creado, se decimal, etc. desarrolla el modelo lógico. El modelo lógico es una o Cada tabla debe tener su clave primaria y al estar representación gráfica que puede ser procesado y ser relacionado con otra tabla debe tener su clave guardado por un SGBD; en esta parte ya se define las foránea. Existen claves primarias simples y tablas dimensiones y la tabla de hechos, con sus compuestas, la tabla hechos siempre tiene una clave respectivos atributos. primaria compuesta, ya que está comprendida por Para desarrollo el modelo lógico debemos seleccionar las claves primarias de las tablas dimensiones. una de los esquemas siguientes: Esquema en estrella ó o La relación que existe entre las tablas, tenemos; de Esquema en Copo de Nieve; la selección se realiza en una a una, de una a muchas y de muchas a muchas.
Generalmente al desarrollar una datawarehouse las la solución. Para la selección de hardware y software se relaciones son de una a muchas. debe tener en cuenta los siguientes criterios: Un ejemplo de un modelo físico está en la Figura 3 [24] ✓ Criterios técnicos; plataformas donde se instalarán, y es el siguiente: origen de las bases de datos, lenguajes de programación, gestores de base de datos ✓ Criterios económicos; hay que tener en cuenta los costos de las licencias, el proceso de implantación, los servicios de consultoría. ✓ Criterios organizativos; evaluación de los cambios que se realizan en el área comercial. ✓ Facilidad de uso de las herramientas que se usaran en la solución de inteligencia de negocios ✓ Proveedores; si va usar herramientas con licencia, es importante conocer a los proveedores. Una vez seleccionada el software y hardware, el equipo de la solución de inteligencia de negocio debe proceder Fig. 3 Modelo físico básico del área comercial. a instalar las herramientas, de acuerdo al uso que se le Siguiendo el ejemplo que se está desarrollando en cada dará; habrá los que serán usados solamente por los que etapa del modelo planteado. El siguiente seria el modelo van a implementar la solución de inteligencia de lógico del área comercial de la ferretería se muestra en el negocio y los que van a usar los usuarios finales. siguiente Figura 4. - Desarrollo del Datawarehouse Según el diseño desarrollado, en esta parte se realiza la base de datos de tipo datawarehouse, comprendido por los datamart diseñados, si hay muchas datamarts se generan esquemas de tipo constelación. El Datawarehouse debe estar preparado para realizar el proceso ETL a través de una herramienta seleccionada; del mismo modo el datawarehouse debe estar preparado para que sea extraído sus datos con las herramientas OLAP y finalmente se haga los reportes para que pueda ser usado por los encargados de tomar decisiones en una empresa. Fig. 4 Modelo lógico del datamart del área comercial - Ejecución del ETL Y el diseño físico del área comercial sería el de la siguiente figura 5. Una vez construido el datawarehouse, se deberá proceder a poblarlo con datos, utilizando las técnicas de limpieza extracción y carga de estos datos. • Extracción. Es la extracción de los datos de las fuentes originales o bases de tipo OLTP. Estas fuentes, en ocasiones son de diversas bases de datos y almacenadas en diferentes gestores de base de datos. Para esta etapa se requiere de herramientas ETL, los datos a extraer deben contar con los permisos a las fuentes originales. También se debe definir con los usuarios el periodo de ejecución del ETL, cada mes, cada tres meses, etc. Fig. 5 Modelo físico del datamart del área comercial Para llevar a cabo el proceso de extracción, es E. Construcción importante responder algunas preguntas, tales como: - Evaluación y selección del hardware y software ✓ ¿Tienes identificado todos los fuetes de los datos? En esta parte se evalúa las diferentes herramientas y ✓ ¿La información a extraer se encuentra con los plataformas que existen para soluciones de inteligencia permisos formales? de negocios. Se realiza un análisis comparativo en ✓ ¿Se cuenta con las herramientas e infraestructura función a la propuesta de solución de inteligencia de suficientes para realizar la extracción? negocios, teniendo en cuenta el objetivo y el diseño de • Transformación
Una vez extraídos los datos de las diferentes fuentes realizar la carga. Un ejemplo de código SQL originales, se deber realizar las tareas que limpien y seria: trasformen los datos según formatos establecidos y SELECT clientes.id_cliente AS idclientesdim, coordinados con los administradores de la base de clientes.nombre AS nombredim datos y los usuarios de la solución de inteligencia de FROM negocio. En esta fase se debe tener en cuenta las clientes siguientes actividades: WHERE (clientesr.activo = 1) ✓ Establecer un formato de transformación de datos, con la finalidad de que los datos queden de una ➢ Una vez finalizado el poblamiento de datos de sola forma las tablas dimensiones, se procede a cargar los datos a la tabla hechos. ➢ Si en el origen se almacena con “H” para CREATE PROCEDURE llenarsehechosfactura AS hombre y “M” para mujer y en otro origen se almacena con 1 para hombre y 2 para mujer. BEGIN Se debe establecer un solo formatos para que INSERT INTO sea cargado en el destino (Hombre, varón, hechosfactura(idcliente,idvend,idproducto,idtiempo,canti masculino a H.) dad,total) SELECT DISTINCT ➢ Dividir o unir columnas. Por ejemplo, en la dwc.idcliente,dwv.idvend,dwp.idproducto,dwt.idtiempo,b columna nombre se podría establecer en el ddf.cantidad,bdf.total formato que sea: Columna nombre y FROM columna apellidos. bdfactura..factura as bdf inner join ✓ Seleccionar sólo las columnas que no tengan bdfactura..detalle_factura as bddf on valores nulos. bdf.idfact=bddf.idfact INNER JOIN dbfacturadw..dimcliente as dwc on ✓ Definir los nuevos valores para ser cargados. Por dwc.idcliente=bdf.idclient ejemplo, ventas = cantidad * precio unitario INNER JOIN dbfacturadw..dimvendedor as dwv ON dwv.idvend=bdf.idvend ✓ Generación de claves primarias en el destino INNER JOIN dbfacturadw..dimproducto as dwp ON dwp.idproducto=bddf.idproduct obtenidos de los campos de origen. INNER JOIN dbfacturadw..dimtiempo as dwt ON dwt.fecha=bdf.fecha ✓ Transponer las tablas con la finalidad de que los datos estén disponibles para la respectiva carga en END el destino. Después de cargar los datos al datawarehouse, estos Una estrategia es extraer los datos desde las tablas deben quedar listos para ser usados por herramientas destino y cargarlos en tablas temporales, pero OLAP. teniendo en cuenta los formatos establecidos en la - Desarrollo de los cubos OLAP. transformación. El desarrollo del cubo OLAP (On-Line Analytical • Carga Processing) permitirá la explotación de la información Es la parte final del proceso ETL y se debe tener en almacenada en el datawarehouse a través de cuenta los siguientes puntos herramientas de consulta y análisis de la información. ✓ Implementar políticas del tratamiento de Después de haber analizado y realizado el diseño se excepciones para evitar cargar datos erróneos, por procede a usar una herramienta para proceder con el ETL; un ejemplo, rechazar insertar un valor ejemplo de un proceso ETL diseñado con el software SQL Server Data Tools 2015, se muestra en la siguiente Figura 6. ✓ Carga de dimensiones. Al momento de poblar el datawarehouse, primero se carga en las tablas dimensiones, después en la tabla de hechos. Un ejemplo de seria el siguiente: ➢ Cargar datos a la tabla dimensión investigadores, con una consulta SQL desde el origen de los datos. ➢ Verificar con los usuarios si hay investigadores que no están activos (ejemplo, dejaron de trabajar en la universidad) Fig. 6 Proceso de ETL del área comercial realizado con SQL Server Data Tools 2015 ➢ Es importante que se tenga en cuenta los formatos establecidos en la transformación Y el diseño de un cubo OLAP del área de comercialización para construir las consultas SQL que van de la ferretería Virgen de Cocharcas sería el siguiente, tal como muestra en la Figura 7.
[6] E. d. C. Zarate Gallardo, «Inteligencia de negocios,» 07 11 2013. [En línea]. Available: https://www.gestiopolis.com/inteligencia-de- negocios#chicago. [Último acceso: 14 09 2018]. [7] P. Parada Torralba, «Big Data vs Business Intelligence ¿cuáles son sus diferencias?,» [En línea]. Available: https://www.iebschool.com/blog/big-data-business-intelligence- diferencias-big-data/. [Último acceso: 22 2 2020]. [8] C. Howson y M. J. Giralt Facha, «Business intelligence : estrategias para una implementación exitosa,» Mexico, McGraw Hill, 2009. [9] J. Conesa y J. Curto Diaz, «Introduccion al Businees intelligent,» España, Universitat Obeta de Catalunya, 2010, p. 236. [10] Sinnexus, «Datawarehouse,» [En línea]. Available: https://www.sinnexus.com/business_intelligence/datawarehouse.aspx. Fig. 7 Diseño del cubo OLAP del datamart del área de comercialización [Último acceso: 18 09 2018]. realizado en SQL Server Data Tools 2015 [11] R. Stackowiak y J. Rayman, «Oracle Data Warehousing and Business Intelligence Solutions,» Wiley, 2007, p. 386. F. Implementación [12] R. Kimball, «The Data Warehouse Toolkid,» Wiley, 1996, p. 374. La implantación, es tener la solución completa para la [13] D. Bernabeu y M. Garcia Mattio, «Hefesto Data Warehousing,» [En toma de decisiones con Inteligencia empresarial y Big data, línea]. Available: http://troyanx.com/Hefesto/index.html. [Último para ser usado en las instalaciones en donde fue destinado, la acceso: 23 08 2018]. actividad de instalación de la solución se desarrolla en [14] Gartner, «Gartner Glosary, Big Data,» 22 09 2013. [En línea]. Available: http://www.gartner.com/it-glossary/big-data/. [Último acceso: 11 10 coordinación con los usuarios, se realiza las pruebas antes de 2019]. ponerlo en ejecución. Es necesario capacitar a los usuarios de [15] Forrester, «The pragmatic definition of Big data,» 5 10 2012. [En línea]. la solución, entregarles los manuales, mantener una línea de Available: http://blogs.forrester.com/mike_gualtieri/12-12-05- comunicación entre los usuarios y el soporte de la solución. the_pragmatic_. [Último acceso: 8 10 2019]. [16] J. Manyka, M. Chul y M. Brown, Big Data: The next Frontier for V. CONCLUSIONES innovation, Mckinsey Global institute, 2011. La extensa teoría que proporciona la metodología de Ralph [17] Adncloud, Innovacion en la sociedad digital, «¿Que es Big Data y para Kimball y los casos prácticos que presenta la metodología que sirve?. Ejemplo de uso,» [En línea]. Available: https://blog.mdcloud.es/que-es-big-data-y-para-que-sirve/. [Último Hefesto mas las bondades de las tecnologías presentes en big acceso: 12 10 2019]. data, se puedo lograr obtener un modelo para la toma de [18] Universidad de Amsterdam, «Defining the Big Data Architecture,» 2013. decisiones concreta compuesta de 6 pasos destinados al área [En línea]. Available: comercial de cualquier empresa. http://bigdatawg.nist.gov/_uploadfiles/M0055_v1_7606723276.pdf/. [Último acceso: 1 02 2020]. En toda solución destinada a la toma de decisiones existe [19] J. Amaya Amaya, «Toma de decisiones gerenciales: Métodos un ingrediente que no debe faltar “confiabilidad” de la cuantitativos para la administración,» Eco Ediciones, 2010, p. 128. solución para la toma de decisiones y esta debe responder con [20] W. M. Solorio García, 16 1 2014. [En línea]. Available: facilidad a sus interrogantes que realiza un directivo de una https://www.utel.edu.mx/blog/10-consejos-para/definamos-el-concepto- empresa. trabajo-comercial/. [Último acceso: 15 01 2020]. Existen abundantes herramientas para soluciones de [21] X. Lozada Peñafiel, H. Cruz Tamayo, W. Perez Argudo y A. De la Torre Inteligencia empresarial y Big data para el usuario final, por Diaz, «Análisis, diseño, construcción e implementación de un datawarehouse para toma de deciciones y contruccion de los KPI. para la lo que la adaptabilidad al uso de estas debe ser muy fácil e empresa Kronosconsulting CIA LTA,» [En línea]. Available: intuitivo. Los ejemplos que se mostraron fueron realizados https://repositorio.espe.edu.ec/bitstream/21000/7942/1/AC-SI-ESPE- con el apoyo de los softwares SQL Server Data Tools 2015, 047750.pdf. [Último acceso: 2 09 2018]. Power BI y Microsoft Excel 2016. [22] D. Bernabeu, «Análisis de Requerimientos,» 07 05 2009. [En línea]. Available: https://www.dataprix.com/es/data-warehousing-y- metodologia-hefesto/551-paso-1-analisis-requerimientos. [Último acceso: 15 02 2020]. VI. REFERENCIAS [23] Bigeek, «Business Intelligence, Modelo Dimensional,» 9 10 2017. [En línea]. Available: https://blog.bi-geek.com/modelo-dimensional/. [1] R. Root y C. Mason, «Pro SQL Server 2012 BI Solutions,» Apress, 2012. [Último acceso: 14 03 2020]. [2] B. Harmsen y A. G. Garcia, «Qlikview for Developers,» Packt, 2017, p. [24] Bodega de Datos , «Diseño de una Bodega de Datos,» 12 03 2012. [En 546. línea]. Available: http://intelempresariall.blogspot.com/2012/03/diseno- de-una-bodega-de-datos.html. [Último acceso: 12 03 2020]. [3] M. Calvo, «Business intelligence: ¿Por qué lo necesito en mi empresa?,» 21 08 2019. [En línea]. Available: https://www.captio.net/blog/algunos- ejemplos-practicos-de-uso-de-business-intelligence. [Último acceso: 18 09 2019]. [4] ESAN, «Los aportes del Business Intelligence a una empresa,» 3 09 2018. [En línea]. Available: https://www.esan.edu.pe/apuntes- empresariales/2018/09/los-aportes-del-business-intelligence-a-una- empresa/. [Último acceso: 12 09 2018]. [5] F. Arroyo, «La importancia de la Dirección Comercial dentro de una Organización,» 06 07 2017. [En línea]. Available: http://www.smat.es/smat-opina/direccion-comercial-marketing/. [Último acceso: 09 08 2018].
También puede leer