Машинное обучение и анализ данных

25, 28 октября, 1, 4, 8, 11, 15, 18, 22, 25 ноября 2017
Вебинар
Сложность: 4/10

Описание

Вы хотите получить востребованную профессию? Хотите начать зарабатывать на фрилансе без отрыва от основной работы?

На курсе Александр Крот рассмотрит практические навыки анализа данных, которые пригодятся любому в самых разных жизненных ситуациях:

  • выбор квартиры
  • подбор страховки
  • поиск недооцененных товаров в интернете
  • поиск лидеров мнения для продвижения товаров и услуг
  • автоматический анализ текстовых данных.

Мы рассмотрим не только классическую аналитику, но и такие разделы как Machine Learning, Deep Learning, Big Data. Не погружаясь глубоко в математическую составляющую данных методов мы покажем их главную практическую значимость.

Вопросы и консультации:

Регистрация на курсе вас ни к чему не обязывает. После регистрации мы свяжемся с вами, чтобы ответить на организационные, тематические или другие вопросы по курсу.

Или просто напишите Олегу Дюкелю на o.dyukel@red-circule.com

Количество мест и стоимость участия:

Первые пять билетов стоят 49,999 рублей.

Следующие пять билетов стоят 74,999 рублей.

Всего на курс мы возьмем 10 участников.

Внимание! Перенос даты:

Мероприятие переносится, о дате проведения сообщим позднее

Регистрация временно остановлена

Программа курса

  1. День первый Занятие 1. Знакомство с библиотеками Python

    начало 25 октября в 19:00, продолжительность2 ч.
    • Устанавливаем Python с помощью дистрибутива Anaconda 
    • Все необходимое для работы с аналитикой: методология Jupyter-тетрадок 
    • Что можно делать с помощью Python: анализ табличных данных, визуализация, машинное обучение, анализ неструктурированных данных 
    • Применение готовых функций библиотеки Pandas для быстрой работы с таблицами 
    • Пример анализа данных: поиск характеристик выживших людей в катастрофах (на примере Титаника)   
    • ДЗ. Исследование заемщика в кредитном скоринге.
  2. День второй Занятие 2. Визуализация данных

    начало 28 октября в 19:00, продолжительность2 ч.
    • Разбор предыдущего ДЗ 
    • Применение готовых функций библиотек matplotlib/seaborn для визуализации 
    • Создание дашбордов с помощью plot.ly 
    • Визуализация датасета Титаника 
    • Методы визуализации многомерных данных   
    • ДЗ. Визуальное исследование демографических данных.   
  3. День третий Занятие 3. Анализ временных рядов

    начало 1 ноября в 19:00, продолжительность2 ч.
    • Разбор предыдущего ДЗ 
    • Быстрый анализ временных рядов с помощью готовых функций и библиотек Python 
    • Сглаживание в временных рядах 
    • Метрики и оценки качества для временных рядов 
    • Кросс-валидация и подбор параметров 
    • Стационарность в временных рядах 
    • Избавление от нестационарности (SARIMA) 
    • Линейные модели   
    • ДЗ. Предсказание временного ряда цены акций 
  4. День четвертый Занятие 4. Обзор подходов машинного обучения

    начало 4 ноября в 19:00, продолжительность2 ч.
    • Разбор предыдущего ДЗ 
    • Учимся предсказывать будущее с помощью Machine Learning 
    • Виды задач и методы их решения 
    • Основные алгоритмы машинного обучения (kNN, лог-регрессия, SVM, Деревья решений) 
    • Как измерять качество алгоритмов? 
    • Быстрое прототипирование алгоритмов предсказания с помощью функций библиотеки Scikit-Learn   
    • ДЗ. Предсказание дефолта кредитного заемщика (кредитный скоринг)
  5. День пятый Занятие 5. Основы Web Scrapping

    начало 8 ноября в 19:00, продолжительность2 ч.
    • Разбор предыдущего ДЗ 
    • Парсинг данных с сайтов 
    • Быстрое прототипирование с помощью библиотеки urllib 
    • Структура страниц в Интернете - HTML, DOM-разметка 
    • Как выкачивать данные из соц. сетей? (Работа с API) 
    • Ограничения API и их обход  
    • ДЗ. Парсинг и сохранение HTML-страниц сайта Кинопоиска   
  6. День шестой Занятие 6. Выбор квартиры в Интернете

    начало 11 ноября в 19:00, продолжительность2 ч.
    • Разбор предыдущего ДЗ 
    • Анализ цен на жилую недвижимость  
    • Парсинг и сохранение данных 
    • Аналитика данных 
    • Построение моделей, генерация выводов по данным 
  7. День седьмой Занятие 7. Работа с текстовыми данными

    начало 15 ноября в 19:00, продолжительность2 ч.
    • Обзор современных задач обработки естественного языка (текстов) 
    • Обзор подходов к анализу текстов 
    • Быстрая работа с текстами в Python 
    • Извлечение сущностей из текста (Named Entity Recognition) 
    • Определение тональности текста (Sentiment Analysis)   
    • ДЗ. Автоматический анализ текстовых данных Кинопоиска
  8. День восьмой Занятие 8. Определение тональности текстов

    начало 18 ноября в 19:00, продолжительность2 ч.
    • Разбор предыдущего ДЗ 
    • Пример парсинга данных кинопоиска 
    • Работа с русским/английским языком 
    • Искусственный интеллект над текстами (bag of words, word2vec) 
    • Классификация/кластеризация текстов   
    • ДЗ. Классификация новостного потока по тональности 
  9. День девятый Занятие 9. Social Network Analysis

    начало 22 ноября в 19:00, продолжительность2 ч.
    • Разбор предыдущего ДЗ 
    • Введение в анализ сетей Алгоритмы обхода сетей и их визуализации 
    • Выделение лидеров мнений в сетях 
    • Поиск кратчайших путей, хабов, кластеризация  
    • Быстрое прототипирование алгоритмов с помощью библиотеки networkx   
    • ДЗ. Анализ данных соц. сети ВКонтакте
  10. День десятый Занятие 10. Другие области анализа данных

    начало 25 ноября в 19:00, продолжительность2 ч.
    • Разбор предыдущего ДЗ 
    • Новые подходы Machine Learning 
    • Подходы Deep Learning 
    • Обзор альтернативных инструментов для работы с данными

Что вы получите

  1. Научитесь делать аналитику на фрилансе для западных поставщиков (часовая ставка на платформах Upwor или kaggle.com доходит до $100 в час).  Это отличная "подработка", которая не отнимает много времени. Подойдет тем, кто пока не хочет менять текущую работу и хочет работать на западных рынках (фриланс там очень развит).
  2. Сделаете первый шаг к полноценному Data Scientist с ЗП от 140к рублей в крупной компании. По мнению Яндекса в течении 10 лет Data Scientist станет самой популярной профессией века.
  3. Научитесь использовать аналитику "в домашних условиях" при покупке квартиры, торговле на бирже и др. 
  • Количество часов: 20
  • Стоимость: 49999 ₽
  • Организатор: Красный Циркуль
  • Мест осталось: 5
загрузка изображения
Участвовать в вебинаре рекомендуется через браузер Chrome с выключенным Adblock
Ответы на часто задаваемые вопросы