онлайн
Курс: Аналитик Big Data

Освойте ключевые технологии, научитесь работать с большими данными, расширьте знания в аналитике и перейдите на новый уровень в профессии.
Инструменты: от SQL до Hadoop
- 6 месяцев
Длительность
- в удобное время
Онлайн
- на практике
Обучение
- навсегда
Доступ к курсу
Что вы получите
Профессиональный рост
гарантия роста навыков за время обучения
Поддержка
ментором
прохождение курса с удобной вам скоростью
Акцент
на практику
практика после каждой из 60 лекций на кейсах ведущих компаний рынка
Чему вы научитесь
Работать SQL
Научитесь писать запросы, работать с данными в базе без переноса в таблицы, загружать данные и сохранять историю, работать с разными форматами файлов
Использовать Python и библиотеки анализа данных
Автоматизировать работу с большими массивами, получать данные из внешних источников, обосновывать выводы, сделанные на основании данных
Строить системы анализа больших данных
Освоите Hadoop и MapReduce. Научитесь проверять гипотезы, изучите машинные методы для обработки данных, сможете выявлять скрытые аномалии в данных и строить прогнозные модели
Использовать сложную математику для анализа Big Data
Освоите необходимый математический аппарат для продуктивной работы с моделями данных, машинным обучением и нейронными сетями
Записаться на курс или получить бесплатную консультацию
Ответим на вопросы и расскажем про курс
Как проходит обучение
Изучаете тему
В курсе — полезные видеоуроки
Выполняете домашнее задание
В том темпе, в котором вам удобно
Общаетесь с наставником
Закрепляете знания и исправляете ошибки
Защищаете дипломный проект
И дополняете им свое портфолио
Курс по Big Data
  • 60 лекций и 60 практических заданий от практиков рынка с проверкой
  • Курс можно проходить со своей скоростью на нашей платформе
  • Нетворкинг: общение внутри группы курса и поддержка ментора
Программа курса (60 лекций и воркшопов)
Блок 1: "Получение и подготовка данных: SQL"
  • Основы SQL
  • Обновление, добавление и удаление данных. Работа с таблицами
  • Представления и хранимые процедуры. Особенности обработки транзакций
  • Расширенные возможности SQL и основные ограничения
  • Фильтрация данных и вычисляемые поля - практика (SELECT, SUM, AVG, GROUP BY, ..)
  • Группировка данных, подзапросы и объединение таблиц - практика (INNER, LEFT, RIGHT, DISTINCT, ..)
  • Обновление, добавление и удаление данных. Работа с таблицами (INSERT, UPDATE, DELETE, MERGE, FOREIGN KEY, ..)
  • Работа с популярными программами (MySQL, SQL Server, Redash, Tableau)
...
Блок 2: "Python, мат.модели и обработка данных"
  • Python: настройка окружения, базовые структуры данных и основные операторы
  • Python: работа с файлами и форматированный вывод
  • Python: пространства имен и области видимости, классы и объекты
  • Python: инструменты функционального программирования
  • Python: стандартные и сторонние библиотеки Python для анализа данных
  • Основы линейной алгебры и теории множеств
  • Методы математической оптимизации
  • Основы описательной статистики
  • Статистический анализ данных
...
Блок 3: "Построение Machine Learning моделей"
  • Линейные методы, логистическая регрессия и SVM
  • Деревья решений
  • Линейная и полиноминальная регрессия
  • Алгоритмы кластеризации
  • Способы повышения качества модели
  • Функции потерь и оптимизация
  • Оценка точности модели, борьба с переобучением, регуляризация
  • Улучшение качества модели
...
Блок 4: "Аналитика больших данных"
  • Машинные методы для обработки данных
  • Культура сбора и источники данных
  • Предобработка и визуализация данных в pandas
  • Улучшение качества работы с данными
  • Построение прогнозных и предсказательных моделей
  • Основы архитектуры хранения и обработки больших данных, виды обработки и масштабирования
  • Основы работы в Hadoop и MapReduce
  • Работа с облачными платформами: AWS, EMR, Azure
  • Продвинутые подходы в MapReduce
  • Работа в pyspark
  • Организация команды для работы с данными. CRISP-DM
...
Блок 5: Дипломная работа
  • Работа над дипломным проектом
  • Подготовка материалов
  • Сбор презентации
  • Финальная защита и консультации
Получить полную программу курса и консультацию
Ваши проф.навыки после курса
Machine Learning
Построение моделей. Линейные методы, логистическая регрессия и SVM
Продвинутая математика для ML
Методы математической оптимизации. Основы линейной алгебры и теории множеств
Построение ML-моделей
Построение прогнозных и предсказательных моделей
Продуктовые навыки
Построение и анализ MVP-решений, работа с HADI-циклами
Hadoop
Основы архитектуры хранения и обработки больших данных, виды обработки и масштабирования
Мат.статистика
Хороший уровень понимание базы мат.статистики, необходимый для работы с данными
Рекомендательные системы
Навык построения рекомендательных систем для различных отраслей
MapReduce
Продвинутые подходы в MapReduce работы с BigData
SQL
Продвинутый уровень анализа данных за счёт использования SQL-запросов
Python
Построение базовых отчётов и автоматизация работы с помощью библиотек Python
Визуализация данных
Навыки работы с OWOX, продвинутый уровень в Google Data Studio
Презентация данных
Подготовка отчётов и презентация результатов анализа данных
Цифровой сертификат
Выпускники получают сертификат об успешном прохождении курса, а также защищают дипломный проект
Успейте записаться на курс до повышения цен
Мы постепенно собираем группу и ближе к старту курса цена повышается каждую неделю
Дипломные проекты
Как дипломную работу можно взять проект с работы, личную идею или один из проектов, предложенных ментором
Кластеризация данных для сервиса страхования
Построение модели, работающей с BigData и автоматически относящей пользователей к компании к одной из заданных групп риска
Предсказательная модель оттока пользователей с веб-сервиса
Частотная задача построения модели (и системы нотификаций) прогнозирования ухода пользователей с сервиса с целью их удержания "на опережение"
Детекция фрода и нестандартного поведения
На примере заказов интернет-магазина определяем подозрительных пользователей с нестандартным поведением
Спикеры курса
  • Денис Соболев
    Skyeng
  • Илья Чухляев
    OWOX
  • Чайзат Ховалыг
    Точка банк
  • Анна Морозова
    Яндекс
Часто задаваемые вопросы
Стоимость обучения:
6.900 рублей / месяц
Скидка 35% для первых 20 студентов
Полная стоимость: 69.000 рублей 41.400 рублей