Описание курса:
Курс нацелен на получение компетенций, необходимых для профессиональной деятельности аналитика данных для разработки и применения технологических решений в области искусственного интеллекта и в смежных областях.
Курс включает изучение методов и инструментальных средств решения задач искусственного интеллекта. Вы научитесь анализировать данные с помощью сервисов аналитики и BI-инструментов, освоите Python и SQL. Программа нацелена на формирование навыков применения методов обработки и хранения больших данных современными инструментами, а также навыков применения методов математической статистики, машинного обучения, глубокого обучения и интеллектуального анализа данных для решения прикладных задач.
Программа построена по модульному принципу, предполагает изучение теоретического материала и практическую отработку полученных знаний.
Аудитория:
• начинающие специалисты в области ИТ
• руководители
• аналитики
Необходимая подготовка:
• достаточный уровень базовых знаний в сфере ИТ
Программа курса:
Модуль 1. Введение в анализ данных
• Введение в анализ данных. Профессия Аналитик данных
• Определение искусственного интеллекта и BigData. Применения искусственного интеллекта в различных областях.
Модуль 2. Инструменты, библиотеки и технологии анализа данных
• Знакомство с синтаксисом языка Python и средой разработки Jupyter Notebook. Обзор языка R
• Работа с библиотеками Python
• Работа с внешним API и протоколом http. Парсинг Интернет-данных
• Системы обработки и анализа больших массивов данных (Hadoop, ETL, Spark и др.)
Модуль 3. Технологии хранения и обработки больших данных
• Виды представления данных: табличные, графовые, временные ряды. Качество данных, подходы и инструменты
• Платформы данных
• Введение в теорию БД. Основы языка SQL
• SQL базы данных
• Базы данных NoSQL
• Массово параллельная обработка и анализ данных
• Знакомство с СУБД Postgres. Обзор GreenPlum
• Моделирование данных
• Построение дашбордов с помощью Superset
Модуль 4. Математическое моделирование, машинное обучение и оптимизация
• Введение в теорию вероятностей. Базовые понятия
• Введение в математическую статистику. Статистические методы анализа данных
• Основные понятия и термины в машинном обучении и нейронных сетях
• Математические основы машинного обучения (линейная алгебра, статистика, оптимизация)
• Основные метрики оценки качества моделей машинного обучения
• Выбор и обработка данных для машинного обучения. Методы машинного обучения
• Построение моделей машинного обучения (регрессия, классификация, кластеризация, нейросети)
• Инструменты анализа данных и Machine Learning (Rapid Miner)
Модуль 5. Глубокое обучение и нейронные сети
• Введение в глубокое обучение и нейронные сети
• Обзор основных архитектур нейронных сетей. Сверточные и рекуррентные сети
• Обучение нейронных сетей с помощью TensorFlow и Keras
• Использование предварительно обученных моделей для классификации изображений и других задач
• Small Data Learning и Сиамские нейронные сети
Модуль 6. Продвижение продукта. Бизнес-метрики
• Введение в продуктовую аналитику
• Ключевые метрики роста продукта
• A/B-тестирование
Окончательная цена указывается в договоре на обучение.