Surge el concepto de Data Warehouse, como solución a las necesidades informacionales globales de la empresa. Este término acuñado por Bill Inmon, se traduce literalmente como Almacén de Datos. No obstante si el Data Warehouse fuese exclusivamente un almacén de datos, los problemas seguirían siendo los mismos que en los Centros de Información. La ventaja principal de este tipo de sistemas se basa en su concepto fundamental, la estructura de la información. Este concepto significa el almacenamiento de información homogénea y fiable, en una estructura basada en la consulta y el tratamiento jerarquizado de la misma, y en un entorno diferenciado de los sistemas operacionales. Según definió Bill Inmon, el Data Warehouse se caracteriza por ser: Integrado: los datos almacenados en el Data Warehouse deben integrarse en una estructura consistente, por lo que las inconsistencias existentes entre los diversos sistemas operacionales deben ser eliminadas. La información suele estructurarse también en distintos niveles de detalle para adecuarse a las distintas necesidades de los usuarios. Temático: sólo los datos necesarios para el proceso de generación del conocimiento del negocio se integran desde el entorno operacional. Los datos se organizan por temas para facilitar su acceso y entendimiento por parte de los usuarios finales. Por ejemplo, todos los datos sobre clientes pueden ser consolidados en una única tabla del Data Warehouse. De esta forma, las peticiones de información sobre clientes serán más fáciles de responder dado que toda la información reside en el mismo lugar. Histórico: el tiempo es parte implícita de la información contenida en un Data Warehouse. En los sistemas operacionales, los datos siempre reflejan el estado de la actividad del negocio en el momento presente. Por el contrario, la información almacenada en el Data Warehouse sirve, entre otras cosas, para realizar análisis de tendencias. Por lo tanto, el Data Warehouse se carga con los distintos valores que toma una variable en el tiempo para permitir comparaciones. No volátil: el almacén de información de un Data Warehouse existe para ser leído, y no modificado. La información es por tanto permanente, significando la actualización del Data Warehouse la incorporación de los últimos valores que tomaron las distintas variables contenidas en él sin ningún tipo de acción sobre lo que ya existía.
- DATA MART -
Un Datamart es una base de datos departamental, especializada en el almacenamiento de los datos de un área de negocio específica. Se caracteriza por disponer la estructura óptima de datos para analizar la información al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento. Un datamart puede ser alimentado desde los datos de un datawarehouse, o integrar por si mismo un compendio de distintas fuentes de información. Por tanto, para crear el datamart de un área funcional de la empresa es preciso encontrar la estructura óptima para el análisis de su información, estructura que puede estar montada sobre una base de datos OLTP, como el propio datawarehouse, o sobre una base de datos OLAP. La designación de una u otra dependerá de los datos, los requisitos y las características específicas de cada departamento. De esta forma se pueden plantear dos tipos de datamarts:
Datamart OLAP Se basan en los populares cubos OLAP, que se construyen agregando, según los requisitos de cada área o departamento, las dimensiones y los indicadores necesarios de cada cubo relacional. El modo de creación, explotación y mantenimiento de los cubos OLAP es muy heterogéneo, en función de la herramienta final que se utilice.
Datamart OLTP Pueden basarse en un simple extracto del datawarehouse, no obstante, lo común es introducir mejoras en su rendimiento (las agregaciones y los filtrados suelen ser las operaciones más usuales) aprovechando las características particulares de cada área de la empresa. Las estructuras más comunes en este sentido son las tablas report, que vienen a ser fact-tables reducidas (que agregan las dimensiones oportunas), y las vistas materializadas, que se construyen con la misma estructura que las anteriores, pero con el objetivo de explotar la reescritura de queries (aunque sólo es posibles en algunos SGBD avanzados, como Oracle).
- ETL -
Este termino viene de ingles de las siglas Extract-Transform-Load que significan Extraer, Transformar y Cargar y se refiere a los datos en una empresa. ETL es el proceso que organiza el flujo de los datos entre diferentes sistemas en una organización y aporta los métodos y herramientas necesarias para mover datos desde múltiples fuentes a un almacén de datos, reformatearlos, limpiarlos y cargarlos en otra base de datos, data mart ó bodega de datos. ETL forma parte de la Inteligencia Empresarial (Business Intelligence), también llamado “Gestión de los Datos” (Data Management).
La idea es que una aplicación ETL lea los datos primarios de unas bases de datos de sistemas principales, realice transformación, validación, el proceso cualitativo, filtración y al final escriba datos en el almacén y en este momento los datos son disponibles para analizar por los usuarios. Los más populares herramientas y aplicaciones ETL del mercado
- IBM Websphere DataStage (anteriormente Ascential DataStage y Ardent DataStage)
- Pentaho Data Integration (Kettle ETL)
- Una herramienta Open Source Business Intelligence
- SAS ETL Studio - Oracle Warehouse Builder
- Informatica PowerCenter
- Cognos Decisionstream
- Ab Initio
- BusinessObjects Data Integrator (BODI)
- Microsoft SQL Server Integration Services (SSIS)
- DATA MINING - (Minería de datos)
El datamining (minería de datos), es el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto.
Básicamente, el datamining surge para intentar ayudar a comprender el contenido de un repositorio de datos. Con este fin, hace uso de prácticas estadísticas y, en algunos casos, de algoritmos de búsqueda próximos a la Inteligencia Artificial y a las redes neuronales. De forma general, los datos son la materia prima bruta. En el momento que el usuario les atribuye algún significado especial pasan a convertirse en información.
Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretación que surge entre la información y ese modelo represente un valor agregado, entonces nos referimos al conocimiento. Aunque en datamining cada caso concreto puede ser radicalmente distinto al anterior, el proceso común a todos ellos se suele componer de cuatro etapas principales: - Determinación de los objetivos.
Trata de la delimitación de los objetivos que el cliente desea bajo la orientación del especialista en data mining. - Preprocesamiento de los datos. Se refiere a la selección, la limpieza, el enriquecimiento, la reducción y la transformación de las bases de datos. Esta etapa consume generalmente alrededor del setenta por ciento del tiempo total de un proyecto de data mining. - Determinación del modelo.
Se comienza realizando unos análisis estadísticos de los datos, y después se lleva a cabo una visualización gráfica de los mismos para tener una primera aproximación. Según los objetivos planteados y la tarea que debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en diferentes áreas de la Inteligencia Artificial. - Análisis de los resultados. Verifica si los resultados obtenidos son coherentes y los coteja con los obtenidos por los análisis estadísticos y de visualización gráfica. El cliente determina si son novedosos y si le aportan un nuevo conocimiento que le permita considerar sus decisiones.
En resumen, el datamining se presenta como una tecnología emergente, con varias ventajas: por un lado, resulta un buen punto de encuentro entre los investigadores y las personas de negocios; por otro, ahorra grandes cantidades de dinero a una empresa y abre nuevas oportunidades de negocios. Además, no hay duda de que trabajar con esta tecnología implica cuidar un sinnúmero de detalles debido a que el producto final involucra "toma de decisiones".
- REPORTING -
El reporting entendido como la elaboración de informes de gestión es una actividad compleja que debe emplear múltiples sistemas y recursos de información elaborados en el trabajo cotidiano para otros fines. Cuando las empresas tienen que elaborarlos se encuentran frecuentemente con los problemas derivados de una inadecuada gestión de la información. Las soluciones tecnológicas por sí solas no dan respuesta a las necesidades, a menos que estén insertas en un contexto de gobernanza de la información.
Los Objetivos de Desarrollo del Milenio que se lanzaron en 2000 fijaron el 2015 como el año objetivo. "Reconociendo el éxito de estos objetivos – y el hecho de que una nueva agenda de desarrollo se necesitaba para después de 2015 – los países acordaron en 2012 en Río+20, la Conferencia sobre el Desarrollo Sostenible, establecer un grupo de trabajo abierto para desarrollar un conjunto de objetivos de desarrollo sostenible. Después de más de un año de negociaciones, el Grupo de Trabajo Abierto presentó su recomendación para los 17 objetivos de desarrollo sostenible. Hay 17 objetivos de desarrollo sostenible con 169 metas a diferencia de los 8 Objetivos de Desarrollo del Milenio (ODM) con 21 metas. Los complejos desafíos que existen en el mundo hoy en día exigen que una amplia gama de cuestiones esten cubiertas.
Es, asimismo, fundamental abordar las causas fundamentales de los problemas y no sólo los síntomas. A diferencia de los ODM, que fueron elaborados por un grupo de expertos a puerta cerrada, los objetivos de desarrollo sostenible son el resultado de un proceso de negociación que involucró a los 193 Estados Miembros de la ONU y también la participación sin precedentes de la sociedad civil y otras partes interesadas. Esto llevó a la representación de una amplia gama de intereses y perspectivas. Los objetivos son de amplio alcance, ya que se abordarán los elementos interconectados del desarrollo sostenible: el crecimiento económico, la inclusión social y la protección del medio ambiente.
Los ODM se centraron principalmente en la agenda social. Los ODM estaban dirigidos a los países en desarrollo, en particular los más pobres, mientras que los objetivos de desarrollo sostenible se aplicarán a todo el mundo, los ricos y los pobres".
- ODS -
La Asamblea General de la ONU adoptó durante la Cumbre sobre el Desarrollo Sostenible, celebrada el 25 de septiembre, la Agenda 2030 para el Desarrollo Sostenible, un plan de acción a favor de las personas, el planeta y la prosperidad, que también tiene la intención de fortalecer la paz universal y el acceso a la justicia. Los Estados miembros reconocen que el mayor desafío del mundo actual es la erradicación de la pobreza y afirman que sin lograrla no puede haber desarrollo sostenible.
La Agenda 2030 plantea 17 Objetivos de Desarrollo Sostenible (ODS), con 169 metas de carácter integrado e indivisible que abarcan las esferas económica, social y ambiental. Mientras que sus antecesores, los Objetivos de Desarrollo del Milenio (ODM), tenían como destinatarios principales a los Estados, en los ODS las empresas juegan un papel protagonista.
En cuanto a los ODS que les pueden generar más oportunidades de negocio, mientras las compañías a nivel global creen que la creación de empleo será el objetivo que les pueda proporcionar más oportunidades de negocio, las compañías españolas destacan, en primer lugar, garantizar el acceso a energías asequibles, fiables, sostenibles y modernas.
- DASHBOARD -
Es una representación gráfica de los principales indicadores (KPI) que intervienen en la consecución de los objetivos de negocio, y que está orientada a la toma de decisiones para optimizar la estrategia de la empresa. Características de un dashboard estratégico
1. Número de KPIs: sólo aquellas KPIs (ni más, ni menos), necesarias (se suele hablar de entre 7 y 10 KPIs). No consiste en añadir datos por añadir, sino de mostrar de la forma más adecuada, aquellos que nos permitan tomar decisiones. Es una foto ‘fija’ de las KPIs que más influyen en la consecución de nuestros objetivos.
2. Segmentación y contexto: debe presentar estas KPIs de forma que estas sean relevantes (accionables) para el negocio.
3. Visualización: la persona que toma las decisiones debe ser capaz de interpretar fácilmente la información que está viendo. Por lo que el dashboard debe ser breve, hablar el mismo lenguaje del decisor y su representación gráfica la adecuada para los datos que representa y lo suficientemente visual, para que resulte atractivo su estudio. Los dashboards se suelen representar en el equivalente a un A4, pero existen herramientas de visualización de datos, que permiten profundizar en ellos desde el propio dashboard.
4. Análisis: además de las KPIs el dashboard debe acompañarse de un análisis sobre: lo ocurrido, las recomendaciones dadas y su potencial impacto sobre el negocio. El análisis debe recomendar acciones, no describirlas. Es decir, no podemos quedarnos en: “La tasa de conversión subió hasta el 2%”. Debemos explicar el origen de esa subida, que vamos a hacer para que se mantenga, que efecto va a tener esto en el negocio, etc. etc.
- CMI -
Se denomina Cuadro de Mando Integral (CMI) a una herramienta de gestión empresarial muy útil para medir la evolución de la actividad de una compañía y sus resultados, desde un punto de vista estratégico y con una perspectiva general. Gerentes y altos cargos la emplean por su valor al contribuir de forma eficaz en la visión empresarial, a medio y largo plazo. Saber establecer y comunicar la estrategia corporativa para alinear los recursos y las personas en una dirección determinada no es tarea sencilla, y un Cuadro de Mando resulta de gran ayuda para lograrlo.
A través de sus indicadores de control, financieros y no financieros, se obtiene información periódica para un mejor seguimiento en el cumplimiento de los objetivos establecidos previamente, y una visión clara del desarrollo de la estrategia. Así, y gracias a esta inteligencia empresarial, la toma de decisiones resulta más sencilla y certera, y se pueden corregir las desviaciones a tiempo. El uso y aplicación de un Cuadro de Mando Integral es no sólo posible sino también aconsejable para empresas medianas y pequeñas. Su efectividad no depende del tamaño de la compañía, así que tanto las grandes organizaciones como las PYMES pueden aprovecharse de sus enormes beneficios.
- BUSINESS INTELIGENCE -
Business Intelligence es la habilidad para transformar los datos en información, y la información en conocimiento, de forma que se pueda optimizar el proceso de toma de decisiones en los negocios. Desde un punto de vista más pragmático, y asociándolo directamente con las tecnologías de la información, podemos definir Business Intelligence como el conjunto de metodologías, aplicaciones y tecnologías que permiten reunir, depurar y transformar datos de los sistemas transaccionales e información desestructurada (interna y externa a la compañía) en información estructurada, para su explotación directa (reporting, análisis OLTP / OLAP, alertas...) o para su análisis y conversión en conocimiento, dando así soporte a la toma de decisiones sobre el negocio. La inteligencia de negocio actúa como un factor estratégico para una empresa u organización, generando una potencial ventaja competitiva, que no es otra que proporcionar información privilegiada para responder a los problemas de negocio: entrada a nuevos mercados, promociones u ofertas de productos, eliminación de islas de información, control financiero, optimización de costes, planificación de la producción, análisis de perfiles de clientes, rentabilidad de un producto concreto, etc... Los principales productos de Business Intelligence que existen hoy en día son:
- Cuadros de Mando Integrales (CMI)
- Sistemas de Soporte a la Decisión (DSS)
- Sistemas de Información Ejecutiva (EIS)
Por otro lado, los principales componentes de orígenes de datos en el Business Intelligence que existen en la actualidad son:
- Datamart
- Datawarehouse
Los sistemas y componentes del BI se diferencian de los sistemas operacionales en que están optimizados para preguntar y divulgar sobre datos. Esto significa típicamente que, en un datawarehouse, los datos están desnormalizados para apoyar consultas de alto rendimiento, mientras que en los sistemas operacionales suelen encontrarse normalizados para apoyar operaciones continuas de inserción, modificación y borrado de datos. En este sentido, los procesos ETL (extracción, transformación y carga), que nutren los sistemas BI, tienen que traducir de uno o varios sistemas operacionales normalizados e independientes a un único sistema desnormalizado, cuyos datos estén completamente integrados.
José.
No hay comentarios:
Publicar un comentario