YAM^2: a multidimensional conceptual model

Author

Abelló Gamazo, Alberto

Director

Saltor Soler, Fèlix

Codirector

Samos Jiménez, José

Date of defense

2002-04-26

ISBN

8469999850

Legal Deposit

B.46887-2002



Department/Institute

Universitat Politècnica de Catalunya. Departament de Llenguatges i Sistemes Informàtics

Abstract

ABRSTRACT<br/>This thesis proposes YAM^2, a multidimensional conceptual model for OLAP(On-Line Analytical Processing). It is defined as an extension of UML (Unified Modeling Language). The aim is to benefit from Object-Oriented concepts and relationships to allow the definition of semantically rich multi-star schemas. Thus, the usage of Generalization, Association, Derivation, and Flow relationships (in UML terminology) is studied.<br><br/>An architecture based on different levels of schemas is proposed and the characteristics of its different levels defined. The benefits of this architecture are twofold. Firstly, it relates Federated Information Systems with Data Warehousing, so that advances in one area can also be used in the other. Moreover, the Data Mart schemas are defined so that they can be implemented on different Database Management Systems, while still offering a common integrated vision that allows to navigate through the different stars.<br><br/>The main concepts of any multidimensional model are facts and dimensions. Both are analyzed separately, based on the assumption that relationships between aggregation levels are part-whole (or composition) relationships. Thus, mereology axioms are used on that analysis to prove some properties.<br><br/>Besides structures, operations and integrity constraints are also defined for YAM^2. Due to the fact that, in this thesis, a data cube is defined as a function, operations (i.e. Drill-across, ChangeBase, Roll-up, Projection, and Selection) are defined over functions. Regarding the set of integrity constraints, they reflect the importance of summarizability (or aggregability) of measures, and pay special attention to it.


Esta tesis propone YAM^2, un modelo conceptual multidimensional para OLAP (On-Line Analytical Processing). Éste se define como una extensión de UML (Unified Modeling Language). La intención es beneficiarse de los conceptos y relaciones de la Orientación a Objetos para permitir la definición de esquemas multi-estrella semánticamente ricos. Así, se estudia la utilización de relaciones de tipo Generalization, Association, Derivation, y Flow (en terminología UML).<br><br/>Se propone también una arquitectura basada en diferentes niveles de esquemas, y se estudian las características de cada uno de esos niveles. De esta arquitectura se obtienen dos beneficios. Primeramente, relaciona los Sistemas de Información Federados con los Almacenes de Datos, de manera que los avances en una de las áreas se puedan utilizar en la otra. Además, los esquemas de los Almacenes de Datos Departamentales son definidos de forma que estos se pueden implementar sobre diferentes Sistemas de Gestión de Bases de Datos, al mismo tiempo que ofrecen una visión común e integrada, que permite navegar entre las diferentes estrellas.<br><br/>Los principales conceptos de cualquier modelo multidimensional son los hechos y las dimensiones. Ambos son estudiados de forma independiente, basado en la asunción de que las relaciones entre los niveles de agregación son de tipo parte-todo (o composición). Así, los axiomas de la mereología son utilizados en ese análisis para demostrar algunas propiedades.<br><br/>Juntamente con las estructuras, operaciones y restricciones de integridad son también definidas para YAM^2. Debido al hecho de que, en esta tesis, un cubo de datos es definido como una función, la operaciones (Drill-across, ChangeBase, Roll-up, Projection, y Selection) son definidas sobre funciones. Respecto al conjunto de restricciones de integridad, estas reflejan la importancia de la sumarizabilidad (o agregabilidad) de las medidas, y presta especial atención a ello.


Aquesta tesi proposa YAM^2, un model conceptual multidimensional per OLAP (On-Line Analytical Processing). El model es defineix com una extensió d'UML (Unified Modeling Language). La intenció és aprofitar conceptes i relacions de la Orientació a Objectes per permetre la definició d'esquemes multi-estrella semànticament rics. Així, s'estudia la utilització de relacions del tipus Generalization, Association, Derivation, i Flow (utilitzant la terminologia d'UML).<br><br/>Es proposa una arquitectura basada en diferents nivells d'esquemes i es defineixen les característiques dels nivells. Els beneficis d'aquesta arquitectura tenen dues vessants. Primerament, relaciona els Sistemes d'Informació Federats amb els Magatzems de Dades, de manera que els avenços en els primers es puguin utilitzar en els segons. A més, els Magatzems de Dades Departamentals es defineixen de manera que es puguin implementar en Sistemes Gestors de Bases de Dades diferents, al mateix temps que ofereixen una visió integrada que permet navegar a través de diferents estrelles.<br><br/>Els principals conceptes de qualsevol model multidimensionals són els fets i les dimensions. Ambdós són analitzats de forma separada, basat en l'assumpció que les relacions entre els nivells d'agregació són de tipus part-tot (o composició). Així, els axiomes de la mereologia són utilitzats en l'anàlisi per provar algunes propietats.<br><br/>Juntament amb les estructures, operacions i restriccions d'integritat han estat definides per YAM^2. Degut al fet que, en aquesta tesi, un cub de dades es definit com una funció, les operacions (Drill-across, ChangeBase, Roll-up, Projection, i Selection) són definides sobre funcions. Respecte al conjunt de restriccions d'integritat, aquestes reflecteixen la importància de la sumaritzabilitat (o agregabilitat) de les mesures, i paren especial atenció a ella.

Keywords

Disseny multidimensional

Subjects

004 - Computer science and technology. Computing. Data processing; 68 - Industries, crafts and trades for finished or assembled articles

Knowledge Area

1203. Ciencia dels ordinadors

Documents

THESIS.pdf

1.199Mb

 

Rights

ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)