.



   

 Каталог

Корпоративные порталы
Информационные порталы
Экспертные порталы
Порталы приложений
Порталы совместной работы
Порталы управления знаниями
Порталы интеграции корпоративных систем

Методологии
Системы поддержки принятия решений (Decision Support Systems — DSS)
Data Warehouse - хранилища данных
Data Mart - Витрины данных
OLAP (On-Line Analytical Processing) - интерактивная аналитическая обработка
Business Intelligence (BI) - бизнес-интеллект
Интеллектуальный анализ данных (Data Mining)
Управление знаниями (Knowledge Management)

Корпоративные сети
Экстранет (Extranet , Экстрасеть)
Защита корпоративных сетей
Интернет (Internet)
Интранет (Intranet)

О проекте

             

Портал о Корпоративных порталах
Консалтинг, создание, внедрение и поддержка

УслугиЭнциклопедияСтатьиРесурсыИсторияНовости
Главная > Энциклопедия > Методологии > Data Warehouse - хранилища данных
В З И К М О С Х Э     E H I O S     Все  

Хранилища данных (Data Warehouse)

Смотри также статью "Хранилища данных (Data Warehouse)" на сайте CorpSys.ru

Практически во всех информационных системах для хранения данных используются высоконадежные реляционные базы данных. 

Это очень сложные системы таблиц связанных по ключевым полям. Так, даже самые простейшие базы данных содержат более десятка таблиц, крупные же базы данных содержат сотни и тысячи связанных таблиц. Данные о каком либо предмете могут быть разбросаны по сотням таблиц, наименование же этого предмета (как и любого другого его параметра) хранится только в одной таблице. 

Такое построение обеспечивает высокую надежность и непротиворечивость базы данных –для изменения наименования предмета требуется поменять лишь одно поле в базе данных.  

Но это построение приводит и к серьезным трудностям при извлечении данных из базы. Даже простейшие запросы требуют обращений ко многим таблицам, причем вложенных обращений: в одной таблице выбираем индексы (ключи), а для каждого индекса ищем данные уже в другой таблице. Причем таких вложений может быть несколько, и объем вычислений растет в геометрической прогрессии. 

Это приводит и к большим затратам ресурсов и времени при обращении к базе данных, и к существенному ограничению в возможностях представления извлекаемых данных. 

Естественный выход –создание в базе данных специальных таблиц, данные в которых были бы максимально приближены к пользователю (объединяли бы всю необходимую информацию) и загружались бы из основных реляционных таблиц при их изменении. Или создание второй базы данных - пространственной базы данных допускающей хранение денормализованных, но максимально согласованных с потребителем информации данных. 

Таким образом, оптимальное хранилище данных (Data Warehouse) содержит реляционную базу данных, работающую на входе и обеспечивающую высокую надежность и непротиворечивость данных, и пространственную базу данных, содержащую данные, загружаемые из реляционной базы данных, но специально подготовленные и максимально приближенные к запросам пользователей, что обеспечивает максимальную производительность и наилучшую форму выдачи требуемой информации пользователю. 

Известны два основных подхода к архитектуре хранилищ данных. Это корпоративная информационная фабрика (Corporate Information Factory) Билла Инмона и Хранилище данных с архитектурой шины (Data Warehouse Bus) Ральфа Кимболла (Ralph Kimball).  

Корпоративная информационная фабрика 

Этот тип хранилища данных фактически содержит две базы данных: реляционную базу данных (исходных атомарных данных) и пространственную базу данных –базу презентационных данных, т.е. данных, подготовленных для анализа, базу, которая наполняется из реляционной базы данных.

 

 

Рис.1. Корпоративная информационная фабрика

 Хранилище данных с архитектурой шины 

Этот тип хранилища данных включает единую базу данных, как для атомарных данных, так и для презентационных данных. Запросы пользователей к хранилищу могут проводиться к различным уровням детализации данных, как к атомарным, так и к презентационным данным с различными уровнями агрегации.
 

 

Рис.2. Хранилище данных с архитектурой шины 

Оба подхода используют и хранение атомарных данных, и хранение данных подготовленных для выдачи потребителю и большой принципиальной разницы между ними нет.



10.05.2007

Кроме этой статьи Вы можете посмотреть по тематеке текущего раздела:
2 статьи в разделе "Статьи".
__________________
Версия для печати


Отзывы, комментарии и вопросы по статье

22.04.2010 14:23  Ярослав
Почему не вижу рисунков?



Добавить отзыв, комментарий или вопрос по теме статьи

Имя  
Текст    
На странице CorpSys.ru/Consultation/ Вы можете получить бесплатную консультацию по данным вопросам


 
 

        Поиск

   
        Расширенный поиск

Статьи

Закрома корпораций. Часть I. Что, зачем, как

Маркетинговое хранилище данных: эффективный инструмент для руководителей

Ресурсы

Хранилище данных (Data Warehouse). Обзор технологий

Особенности построения информационных хранилищ

Тенденции в области Хранилищ данных на 2007 год

Три основных недостатка современных хранилищ данных

Производительность систем Хранилищ данных (часть 1)

Архитектуры отчетности

Создание систем поддержки принятия решений на основе хранилищ данных

Что должен знать бухгалтер о хранении данных. Витрины данных

Основные подходы к архитектуре Хранилищ данных

Фундамент корпоративного самоанализа

Технологии DWH, OLAP и Data Mining в образовании

Практика построения хранилищ данных: SAS System

Обзор возможностей применения ведущих СУБД для построения хранилищ данных (DataWarehouse)

Microsoft облегчает создание хранилищ данных

Сходство и различия двух подходов к архитектуре Хранилищ данных

Технология построения информационного блока управленческой отчетности и аналитической обработки данных в сфере управления финансами. Часть 1. Построение хранилища данных

Архитектурные решения и моделирование данных для хранилищ и витрин данных

Хранилища, витрины. Что дальше?

Оцените, насколько совершенно ваше Хранилище данных

Хранилища данных в начале века

CorPortal.ru Все права защищены. Инспро

Рейтинг@Mail.ru
!