10 reglas esenciales para el modelado dimensional (2° parte)

Hace tiempo mencionamos las primeras 5 reglas para el modelado dimensional según Kimball y nos quedaron pendientes las otra cinco. Veamos cuales son:

Regla 6: Dimensiones con relaciones muchos a uno

Por lo general este tipo de relaciones se suelen desnormalizar y aplanar en una tabla. Si usted se ha dedicado mucho tiempo a modelar sistemas transaccionales, evite tentarse a normalizar este tipo de dimensiones o modelarlas como copo de nieve (snowflake). Es muy común tener varias relaciones 1:M resueltas en una sola tabla de dimensión. Relaciones del tipo 1:1, como la descripción de un producto relacionada con el código del mismo, son también resueltas de esta forma.

Regla 7: Guarde en tablas de dimensiones aquellos atributos que utilizará como etiquetas o filtros de informes

Todo tipo de atributos que crea que vaya a utilizar como etiquetas de reportes o como filtro de reportes guárdelos un tablas de dimensiones, y no en la tabla de hechos. Es aconsejable evitar valores nulos para los atributos de una tabla de dimensión, para estos casos complete los atributos nulos con el valor «NA» (Not Applicable), o algún otro valor por defecto.

Regla 8: Asegúrese que las dimensiones utilicen claves sustitutas (Surrogate Key)

La utilización de este tipo de claves nos darán una serie de beneficios como claves mas pequeñas, con lo cual las tablas de hechos serán más pequeñas, así como los índices utilizados. generando mejor performance. El uso de surrogate keys será útil si quiere hacer un seguimiento de los cambios de los atributos de la dimensión. También permiten mapear códigos de diferentes fuentes operacionales, y además, nos protegen de cambios inesperados en los sistemas transaccionales, como la recodificación de tablas maestras, reciclado de códigos de productos que ya no existen, entre otros.

Regla 9: Cree dimensiones conformadas para integrar datos a lo largo de la empresa

Las dimensiones conformadas son esenciales para un Data Warehouse corporativo. Administradas una sola vez en el ETL y utilizada en varias tablas de hechos, estas dimensiones proporcionan atributos consistentes a lo largo de diferentes modelos dimensionales y permiten hacer drill-across e integrar información de diferentes procesos de negocios. La reutilización de las dimensiones conformadas reduce el tiempo de salida al mercado mediante la eliminación de diseño redundante, sin embargo, estas dimensiones requerirán invertir en una buena administración de datos y en un modelo de gobernanza para las mismas.

Regla 10: Balancear los requerimientos de los usuarios con los cambios a realizar en los modelos dimensionales.

Los modelos dimensionales se extienden constantemente como consecuencia de los requerimientos que hace el negocio. Como encargado de mantener los diferentes modelos dimensionales, usted deberá balancear entre los requerimientos del negocio y el impacto que este tenga sobre los modelos.

Fuente: Kimball University

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *