Guia
Enviado por Programa Chuletas y clasificado en Otras materias
Escrito el en español con un tamaño de 36,05 KB
Que son las herramientas OLAP? OLAP es utilizado para contestar queries que proporcionan información acerca del negocio. OLAP queries típicamente ejecutan cálculos complejos, tal como comparaciones periodo sobre periodo, encontrar los N productos mas altos, análisis de series de tiempo y pronósticos de ventas. Los datos analizados a lo largo de múltiples dimensiones, tal como productos, geografía y tiempo. Por lo tanto este tipo de datos es frecuentemente llamado datos multidimensionales. Defina un cubo de datos. Un cubo de datos permite a los datos a ser modelados y vistos en múltiples dimensiones. Esta definido por dimensiones y hechos. Que es una jerarquía de concepto? Ejemplifique. Una jerarquía de concepto define una secuencia de mapeos desde un conjunto de conceptos de bajo nivel a un de alto nivel, conceptos mas generales. Considere una jerarquía de concepto para la dimensión localidad. Los valores de ciudad para la localidad incluyen Torornto, New York, Vancouver y Chicago. Cada ciudad, sin embargo, puede ser mapeada a una provincia o estado a la cual pertenece. Las provincias y estados pueden a su vez, ser mapeados a un país al cual pertenecen, tal como Canada, USA o México. Estos mapas forman una jerarquía de conceptos para la dimensión localidad, que hace un mapeo de un conjunto de conceptos de bajo nivel (ciudades) a un nivel superior, un concepto mas general (países). El ejemplo anterior se puede ilustrar en la siguiente figura:
Cual es el tema central de un modelo de datos multidimensional. El modelo de datos multidimensional esta típicamente organizado alrededor de un tema central, como las ventas por ejemplo. Este tema es representado por una tabla de hechos. Los hechos son medidas numéricas. Piense en ellos como cantidades por medio de las cuales queremos analizar relaciones entre dimensiones. Ejemplo de hechos para las ventas de un data warehouse incluyen: pesos_vendidos (cantidad de ventas en pesos), unidades_vendidas (número de unidades vendidas), cantidad_presupuestada. La tabla de hechos contiene los nombres de los hechos, o medidas, así como llaves a cada una de las tablas de dimensión relacionadas. Que es una jerarquía de conceptos? Una jerarquía de concepto define una secuencia de mapeos desde un conjunto de conceptos de bajo nivel a un de alto nivel, conceptos mas generales. Elabora la jerarquía de conceptos para las localidades de OLTP que se vio en clase. Elabora la jerarquía de conceptos para vendedores. En que consiste una operación roll-up?, explique y ejemplifique. Roll-up: La operación roll-up (también llamada drill-up) ejecuta agregación sobre el cubo de datos, ya sea subiendo en la jerarquía de conceptos para una dimensión o por reducción de dimensión. La figura 2.10 muestra el resultado de una operación roll-up realizada en en cubo central subiendo la jerarquía de conceptos para una dada localidad. Esta operación muestra los agregados de datos ascendiendo la jerarquía localidad desde el nivel de ciudad a el nivel de país. En que consiste una operación drill-down? Explique y ejemplifique. Drill-down: Esta es la operación inversa del Roll-up. Navega desde datos menos detallados a datos mas detallados. Drill-down se puede realizar o por bajando una jerarquía de conceptos para una dimensión o introduciendo dimensiones adicionales. La figura 2.10 muestra el resultado de una operación drill-own. realizada en el cubo central. En que consiste una operación Slice? Explique y ejemplifique. Slice and dice: La operación slice ejecuta una selección sobre una dimensión de un cubo dado, resultando un subcubo. La figura 2.10 muestra una operación slice donde los datos de venta son seleccionados desde el cubo central para la dimensión tiempo utilizando el criterio time = Q1. La operación dice define un subcubo realizando una selección sobre dos o mas dimensiones. En que consiste una operación Dice? Explique y ejemplifique. La operación dice define un subcubo realizando una selección sobre dos o mas dimensiones. En que consiste una operación Pivot? Explique y ejemplifique. Pívot (rotar): es una operación de visualización que rota los ejes de datos en la vista para proporcionar una presentación alternativa de los datos. Explique la escuela ROLAP en la industria OLAP. Desde que comenzó la industria OLAP, ha existido un debate acerca de la mejor manera de almacenar datos multidimensionales. Una escuela del pensamiento se avocó a almacenar los datos en tablas en bases de datos relacionales, las cuales son conocidas por su habilidad para escalar grandes cantidades de datos. Esta es conocida como Relational OLAP (ROLAP). En este caso el análisis de datos es hecho utilizando queries SQL. Todas las características discutidas en SQL serian útiles para ROLAP. Mencione las desventajas de la escuela MOLAP. Sin embargo, un problema mayor con esta aproximación es que los datos tienen que ser movidos desde la base de datos relacional, donde esta típicamente almacenado, a una base datos multidimensional para análisis. Esto significa que los datos tienen que ser replicados y podrían quedar fuera de sincronización. Explique tres componentes de la arquitectura OLAP para Oracle 9i. -Oracle 9i database y motor SQL -Espacios de trabajo analitico (Analytic workspaces)-Motor de calculos OLAP -Lenguaje de comandos DML de OLAP-Funciones de tablas SQL -Catalogo OLAP-ALAP API -BI beans Explique que es un espacio de trabajo analítico en Oracle Los espacios de trabajo analíticos permiten almacenar datos en una forma multidimensional. Como con la tablas relacionales, un espacio de trabajo analítico es poseído por algún esquema y utiliza una tablespace de Oracle para almacenarse. Se pueden utilizar espacios de trabajo analítico para almacenar datos que son utilizados en cálculos como son los pronósticos y asignaciones. Que es una dimensión en un formato multidimensional. Dimensión: a diferencia del objeto de dimensión de SQL, el cual expresa relaciones entre columnas, una dimensión en este mundo corresponde a una lista de valores. Estos son llamados dimensiones de valor. Por ejemplo una dimensión ciudad puede consistir de los valores Boston, Londres, San Francisco. Así no hay jerarquía que este implicada por una dimensión en si misma. Para especificar alguna relación entre varios valores en la dimensión, tu debes crear la relación. Explique la diferencia entre una dimensión basada en nivel y una padre – hijo Para que sirve el comando DEFINE? Para definir una variable Para que sirve el comando COMPOSITE? Lo siguiente es definir una dimensión COMPOSITE, la cual especifica que dimensiones se utilizaran juntas. Esto es útil cuando los datos no tienen todas la combinaciones de valores de clientes y tiempodim; en este caso un composite solo almacenará los pares relevantyes : DEFINE dims COMPOSITE Defina Minería de datos (Data mining)Minería de Datos es definido como el proceso de descubrir patrones (o modelos) de comportamiento en los datos. Simplemente podemos establecer que minería de datos se refiere a la extracción o “minería” de conocimiento de grandes cantidades de datos. Minería es un termino vivido que caracteriza el proceso que encuentra una pequeña cantidad de piedras preciosas de una gran cantidad de materia prima (roca). Así el término inapropiado minería nos lleva a los datos de manera análoga. ¿Qué es Knowledge Discovery?Mucha gente toma la minería de datos como un sinónimo de otro término popularmente utilizado, Knowledge Discovery in Databases (Descubrimiento del conocimiento en Bases de datos) o KDD. Data Transformation (Transformación de datos): donde los datos son transformados o consolidados en formas apropiadas para minería por medio de operaciones de agregación o resúmenes.Data mining (Minería de datos): proceso esencial donde métodos inteligentes son aplicados para extraer patrones de datos. Explique las siguientes fases de Knowledge Discovery:Data Ceaning, Data Integration y Data SelectionData Ceaning (Limpiado de datos): remoción de datos inconsistentes y ruido.Data Integration (Integración de datos): Múltiples fuentes de datos pueden ser combinadas.Data Selection (Selección de datos): donde datos relevantes a la tarea de análisis son recuperados de la base de datos) En que consiste la fase Pattern evaluation en Knowledge Discovery?Pattern evaluation (Evaluación de patrones): para identificar los patrones interesantes verdaderos representando el conocimiento basado en algunas medidas de interés.Knowledge Pesentation (Presentación del conocimiento): Donde técnicas de representación del conocimiento y visualización son utilizadas para presentar el conocimiento minado a el usuario. Explique como se clasifican las tareas de minería de datos, explique cada una.En general las tareas de minería de datos se pueden clasificar en dos categorías: descriptivas y predictivas:
TODO
CANADAUSAONTARIOTORONTOILLINOISCHICAGONEW YORKNEW YORKBUFALOVANCOUVERCOLUMBIA B.VICTORIACual es el tema central de un modelo de datos multidimensional. El modelo de datos multidimensional esta típicamente organizado alrededor de un tema central, como las ventas por ejemplo. Este tema es representado por una tabla de hechos. Los hechos son medidas numéricas. Piense en ellos como cantidades por medio de las cuales queremos analizar relaciones entre dimensiones. Ejemplo de hechos para las ventas de un data warehouse incluyen: pesos_vendidos (cantidad de ventas en pesos), unidades_vendidas (número de unidades vendidas), cantidad_presupuestada. La tabla de hechos contiene los nombres de los hechos, o medidas, así como llaves a cada una de las tablas de dimensión relacionadas. Que es una jerarquía de conceptos? Una jerarquía de concepto define una secuencia de mapeos desde un conjunto de conceptos de bajo nivel a un de alto nivel, conceptos mas generales. Elabora la jerarquía de conceptos para las localidades de OLTP que se vio en clase. Elabora la jerarquía de conceptos para vendedores. En que consiste una operación roll-up?, explique y ejemplifique. Roll-up: La operación roll-up (también llamada drill-up) ejecuta agregación sobre el cubo de datos, ya sea subiendo en la jerarquía de conceptos para una dimensión o por reducción de dimensión. La figura 2.10 muestra el resultado de una operación roll-up realizada en en cubo central subiendo la jerarquía de conceptos para una dada localidad. Esta operación muestra los agregados de datos ascendiendo la jerarquía localidad desde el nivel de ciudad a el nivel de país. En que consiste una operación drill-down? Explique y ejemplifique. Drill-down: Esta es la operación inversa del Roll-up. Navega desde datos menos detallados a datos mas detallados. Drill-down se puede realizar o por bajando una jerarquía de conceptos para una dimensión o introduciendo dimensiones adicionales. La figura 2.10 muestra el resultado de una operación drill-own. realizada en el cubo central. En que consiste una operación Slice? Explique y ejemplifique. Slice and dice: La operación slice ejecuta una selección sobre una dimensión de un cubo dado, resultando un subcubo. La figura 2.10 muestra una operación slice donde los datos de venta son seleccionados desde el cubo central para la dimensión tiempo utilizando el criterio time = Q1. La operación dice define un subcubo realizando una selección sobre dos o mas dimensiones. En que consiste una operación Dice? Explique y ejemplifique. La operación dice define un subcubo realizando una selección sobre dos o mas dimensiones. En que consiste una operación Pivot? Explique y ejemplifique. Pívot (rotar): es una operación de visualización que rota los ejes de datos en la vista para proporcionar una presentación alternativa de los datos. Explique la escuela ROLAP en la industria OLAP. Desde que comenzó la industria OLAP, ha existido un debate acerca de la mejor manera de almacenar datos multidimensionales. Una escuela del pensamiento se avocó a almacenar los datos en tablas en bases de datos relacionales, las cuales son conocidas por su habilidad para escalar grandes cantidades de datos. Esta es conocida como Relational OLAP (ROLAP). En este caso el análisis de datos es hecho utilizando queries SQL. Todas las características discutidas en SQL serian útiles para ROLAP. Mencione las desventajas de la escuela MOLAP. Sin embargo, un problema mayor con esta aproximación es que los datos tienen que ser movidos desde la base de datos relacional, donde esta típicamente almacenado, a una base datos multidimensional para análisis. Esto significa que los datos tienen que ser replicados y podrían quedar fuera de sincronización. Explique tres componentes de la arquitectura OLAP para Oracle 9i. -Oracle 9i database y motor SQL -Espacios de trabajo analitico (Analytic workspaces)-Motor de calculos OLAP -Lenguaje de comandos DML de OLAP-Funciones de tablas SQL -Catalogo OLAP-ALAP API -BI beans Explique que es un espacio de trabajo analítico en Oracle Los espacios de trabajo analíticos permiten almacenar datos en una forma multidimensional. Como con la tablas relacionales, un espacio de trabajo analítico es poseído por algún esquema y utiliza una tablespace de Oracle para almacenarse. Se pueden utilizar espacios de trabajo analítico para almacenar datos que son utilizados en cálculos como son los pronósticos y asignaciones. Que es una dimensión en un formato multidimensional. Dimensión: a diferencia del objeto de dimensión de SQL, el cual expresa relaciones entre columnas, una dimensión en este mundo corresponde a una lista de valores. Estos son llamados dimensiones de valor. Por ejemplo una dimensión ciudad puede consistir de los valores Boston, Londres, San Francisco. Así no hay jerarquía que este implicada por una dimensión en si misma. Para especificar alguna relación entre varios valores en la dimensión, tu debes crear la relación. Explique la diferencia entre una dimensión basada en nivel y una padre – hijo
REGION
Se puede pensar una relación como una tabla de dimensión entre padre – hijo en un esquema relacional. La siguiente figura muestra la diferencia entre una dimensión basada en nivel y una tabla de dimensión padre – hijo en el mundo real. CIUDADESTADOREGIONMonterreyNuevo LeónESTADO
NorteDFDFCentroSan Juan del RióQuerétaroBajíoVillahermosaTabascoSuresteCIUDAD
HijoPadreMonterreyHIJO
PADRE
Nuevo LeónNuevo LeónNorteSuresteN/DSan Juan del RíoBajío Que son la variables en un modelo multidimensional. Variable: Una variables es utilizada para almacenar datos y es equivalente a una tabla de hechos. Es definida con respecto a un conjunto especifico de dimensiones. LA siguiente figura muestra una fotografía conceptual de cómo los datos son almacenados en una variable. En este ejemplo la variable ventas es dimensionada por la geografía y el tiempo. Que es el OLAP DML? OLAP DML es un lenguaje poderoso pero muy simple que nos permite expresar un gran variedad de cálculos y hacer reportes tipo hojas de trabajo (Excel) sobre los datos almacenados en una área de trabajo analítica. Proporciona funciones para pronósticos, asignación, agregación, y cálculos financieros. Se puede ejecutar OLAP DML utilizando OALP Worksheet en el Oracle Enterprise Manager, utilizando el paquete DBMS_AW PL/SQL., o utilizando la clase SPLExecutor de OLAP API. Que son la dimensiones y variables en OLAP DML? Las dimensiones y variables son los elementos básicos de un formato de almacenamiento multidimensional. Se mostrará brevemente como son definidos, de modo que se puedan entender los ejemplos siguientes. Este ejemplo define un equivalente de la dimensión cliente con la jerarquía clinumero, cliciudad y cliestado: DEFINE clinumero DIMENSION TEXT DEFINE clicuidad DIMENSION TEXT DEFINE cliestado DIMENSION TEXT DEFINE clientes DIMENSION CONCAT (cli cuidad cliestado clinumero) DEFINE cliente.padres RELATION clientes- Las tareas de minería descriptivas señalan las propiedades generales de los datos en la base de datos.
- Las tareas de minería predictivas realizan inferencia sobre los datos actuales para hacer predicciones.
- Asociación (indirecto)
- Clustering (indirecto)
- Clasificación (directo)
- Asociación (indirecto)
- Clustering (indirecto)