Теоретический курс Архитектура данных
7 октября
т.430000Что такое архитектура данных
Сегодня любое предприятие управляется данными. Многие компании создают и активно используют корпоративные хранилища данных (КХД, DWH — Data WareHouse), куда стекается информация из множества источников: интернет, внутренние и внешние информационные системы, технологическое оборудование и т.д. Традиционные принципы проектирования таких озер данных не справляются с требованиями современного бизнеса: огромные объемы разноформатных файлов, высокая скорость доступа к информации, облачная инфраструктура, гибкие настройки многопользовательского доступа. Архитектурное проектирование системы, включая построение модели данных — это фундамент, без подготовки которого невозможно построение надежного озера данных, традиционного хранилища или аналитической системы.
Технологии Big Data ориентированы на эффективное, безопасное и непротиворечивое управление данными в масштабе всего предприятия. Большинство бизнесов в качестве одного из ключевых направлений своего развития называют Data Centric (дата-центричность). Ожидается, что разработка и внедрение проектов BigData, таких как озера данных (Data Lake), расширят возможности «традиционных » DWH. Однако, всегда ли эти ожидания оправдываются? Все ли зависит от выбранного технологического стека? Что можно сделать, чтобы избежать фиаско Big Data-проекта? Как внедрить технологии Big Data в production, не разрушая существующие КХД, а дополняя их новыми функциональными возможностями? Ответить на эти вопросы поможет наш курс «Архитектура данных».
Кому нужны курсы по архитектуре Big Data
Теоретический курс Архитектура данных предназначен для ИТ-архитекторов, системных аналитиков и разработчиков, которым интересна тема проектирования моделей данных систем аналитического класса (озера и хранилища данных). Курс может быть также полезен руководителям Big Data-проектов и команд в области аналитики, а также специалистам направления Data Governance, ИТ-менеджерам и руководителям проектов по цифровизации.
Как построено обучение
- В результате обучения вы получите следующие знания и навыки:
- поймете базовые задачи Data Governance;
- разберетесь с основными положениями теории построения корпоративных хранилищ данных с учетом современных принципов и технологий Big Data;
- узнаете особенности процессов построения, внедрения и эксплуатации озер данных;
- получите базовые навыки обеспечения качества данных и эффективной эксплуатации корпоративных репозиториев.
Продолжительность: 6 дней, 24 академических часа
По окончании курса «Архитектура данных» в нашем лицензированном учебном центре «Школа Больших Данных», вы получите сертификат или удостоверение установленного образца, которые могут засчитываться в качестве свидетельств о повышении квалификации.
Программа курса Архитектура Данных
День 1-2
- Data Driven подход. Успехи. Проблемы. Эволюция. Внедрение Data Lake: что может пойти не так?
- Application Centric vs Data Centric. Когда, внедряя Big Data мы приближаемся к Data Centric, а когда отдаляемся?
- Какие проблемы мы не можем решить на уровне Data Lake/DWH. Задачи Data Governance.
- Корпоративная модель данных (EDM) как часть Data Governance
- Архитектор данных. Роли и задачи.
- Стандартизация работы с данными предприятия.
- Внедрение практик культуры работы с данными. Задачи. Процессы. Сложности.
День 3-4
Основные подходы к проектированию моделей данных ключевых компонентов Big Data-решений.
- Обобщенная схема архитектур -решений. Требования к компонентам и моделям данных.
- Понятие модели данных. Виды моделей данных. Их назначение и особенности.
- Реляционная модель данных. Нормализация и денормализация.
- Классическая концептуальная модель «сущность-связь» и ее расширения.
- Нотации и инструменты моделирования данных. Концептуальная, логическая и физическая модели данных.
- Ключевое отличие к построению моделей данных аналитических систем — работа со временем. Поддержка истории изменений.
- BEAM (Business Event Activity Modeling) — подход к проектированию моделей для аналитических задач
- Design-паттерны проектирования моделей данных
- Моделирования ядра. Подход Data Vault. Его преимущества и ограничения. Развитие подхода.
День 5-6
Основные подходы к проектированию моделей данных ключевых компонентов Big Data-решений. Метаданные. Эффективная загрузка данных.
- Итеративное развитие модели данных ядра
- Моделирование аналитических витрин. Подход Р. Кимбалла и его развитие.
- Отраслевые примеры моделей данных.
- Виды метаданных для аналитических систем.
Эффективное обновление данных. Управление загрузкой.
Подробности
- Дата:
- 7 октября
- Стоимость участия:
- т.430000
Организатор
- Сапулатова Сауле
- Телефон
- +7 (775) 192 35 35
- Электронная почта
- damakz.org@gmail.com
- Посмотреть Организатор сайт