Курс: Программирование на языке Python. Уровень 4. Анализ и визуализация данных на языке Python. Библиотеки Pandas, numpy, Matplotlib
Продолжительность курса: 40 ак. ч.
Описание курса:
Всего за несколько лет средства анализа данных, доступные разработчикам на Python, совершили рывок вперёд. Появились мощные пакеты, реализующие алгоритмы машинного обучения, обработку естественных языков, статистический анализ и визуализацию.
Инструменты языка Python просты в использовании, при этом имеют широкие возможности применения. Программирование на Python – простой и эффективный вариант для вхождения в популярную сферу Data Science.
Уникальная особенность языка – возможность быстрого встраивания анализа данных в веб-приложения.
Курс «Анализ и визуализация данных на языке Python. Библиотеки Pandas, numpy, Matplotlib»предназначен для тех, кто ищет гибкий инструмент обработки, анализа и визуализации данных и планирует применять свои навыки в работе большими массивами информации.
Слушатели изучат важнейшие и широко распространенные библиотеки numpy, Matplotlib и Pandas, которые массово применяются в различных областях производственной, финансовой и научной деятельности.
Обучение на курсе построено на примерах реальных проектов в области обработки данных.
Курс читается на базе операционной системы Linux, однако его материал может быть применен и на Windows.
Аудитория:
Курс предназначен для программистов, аналитиков, научных работников. Также курс может служить введением в Data Science.
Результат обучения:
После изучения курса слушатель будет уметь:
• Создавать и обрабатывать числовые массивы.
• Создавать диаграммы и графики различных видов и форматов.
• Объединять и переформировывать данные.
• Основы анализа и визуализации данных, применяемый для этой цели базовый инструментарий языка Python;
• Основные понятия и методики библиотеки numpy: массив, скаляр, массовая операция, основные операции с массивами, основные функции библиотеки;
• Библиотеку Matplotlib ее основные понятия и методики применения;
• Основные виды графиков и диаграмм, способы их построения;
• Основные понятия и методики библиотеки Pandas.
Программа курса:
Модуль 1. Установка и настройка программного обеспечения. Базовый инструментарий.
• Принципы организации и управления вычислениями. Используемые языки программирования и взаимосвязь между ними.
• Необходимые пакеты Python: numpy, Matplotlib, Pandas, Jupyter и другие.
• Дистрибутив Anaconda, его преимущества и недостатки.
• Установка пакетов в Linux.
• Установка пакетов в Windows. Возможные проблемы и методы их решения.
Модуль 2. Библиотека numpy. Вычислительные задачи.
• Понятие массива и его основные характеристики.
• Структура библиотеки.
• Типы данных библиотеки numpy.
• Принципы вычислений.
• Универсальные функции.
• Важнейшие стандартные функции.
Модуль 3. Практикум.
• Работа с массивами и матрицами
Модуль 4. Библиотека Matplotlib. Визуализация данных.
• Виды графиков и диаграмм.
• Основные элементы диаграммы.
• Создание диаграммы.
• Форматы изображений
Модуль 5. Практикум.
• График функции.
• Гистограмма.
Модуль 6. Библиотека Pandas. Статистика и анализ
• Объект Series.
• Объект DataFrame.
Модуль 7. Практикум.
• Первичная обработка данных.
• Загрузка и выгрузка данных.
• Организация колонок и строчек.
• Пропуски и повторы.
Модуль 8. Статистика. Временные ряды.
• Типы данных для представления времени.
• Объект Period.
• Основные операции статистики.
Модуль 9. Практикум.
• Статистика. Объединение и переформирование данных.
• Объединение данных.
• Сцепление и наложение (concatenating and stacking).
• Слияние (merging and joining).
Окончательная цена указывается в договоре на обучение.
Записаться на курс