Машинное обучение и анализ данных

25, 28 октября, 1, 4, 8, 11, 15, 18, 22, 25 ноября 2017
Вебинар

Описание

Вы хотите получить востребованную профессию? Хотите начать зарабатывать на фрилансе без отрыва от основной работы?

На курсе Александр Крот рассмотрит практические навыки анализа данных, которые пригодятся любому в самых разных жизненных ситуациях:

  • выбор квартиры
  • подбор страховки
  • поиск недооцененных товаров в интернете
  • поиск лидеров мнения для продвижения товаров и услуг
  • автоматический анализ текстовых данных.

Мы рассмотрим не только классическую аналитику, но и такие разделы как Machine Learning, Deep Learning, Big Data. Не погружаясь глубоко в математическую составляющую данных методов мы покажем их главную практическую значимость.

Количество мест и стоимость участия:

Первые пять билетов стоят 49,999 рублей.

Следующие пять билетов стоят 74,999 рублей.

Всего на курс мы возьмем 10 участников.

Программа курса

  1. День первый Занятие 1. Знакомство с библиотеками Python

    начало 25 октября в 00:00, продолжительность2 ч.
    • Устанавливаем Python с помощью дистрибутива Anaconda 
    • Все необходимое для работы с аналитикой: методология Jupyter-тетрадок 
    • Что можно делать с помощью Python: анализ табличных данных, визуализация, машинное обучение, анализ неструктурированных данных 
    • Применение готовых функций библиотеки Pandas для быстрой работы с таблицами 
    • Пример анализа данных: поиск характеристик выживших людей в катастрофах (на примере Титаника)   
    • ДЗ. Исследование заемщика в кредитном скоринге.
  2. День второй Занятие 2. Визуализация данных

    начало 28 октября в 00:00, продолжительность2 ч.
    • Разбор предыдущего ДЗ 
    • Применение готовых функций библиотек matplotlib/seaborn для визуализации 
    • Создание дашбордов с помощью plot.ly 
    • Визуализация датасета Титаника 
    • Методы визуализации многомерных данных   
    • ДЗ. Визуальное исследование демографических данных.   
  3. День третий Занятие 3. Анализ временных рядов

    начало 1 ноября в 00:00, продолжительность2 ч.
    • Разбор предыдущего ДЗ 
    • Быстрый анализ временных рядов с помощью готовых функций и библиотек Python 
    • Сглаживание в временных рядах 
    • Метрики и оценки качества для временных рядов 
    • Кросс-валидация и подбор параметров 
    • Стационарность в временных рядах 
    • Избавление от нестационарности (SARIMA) 
    • Линейные модели   
    • ДЗ. Предсказание временного ряда цены акций 
  4. День четвертый Занятие 4. Обзор подходов машинного обучения

    начало 4 ноября в 00:00, продолжительность2 ч.
    • Разбор предыдущего ДЗ 
    • Учимся предсказывать будущее с помощью Machine Learning 
    • Виды задач и методы их решения 
    • Основные алгоритмы машинного обучения (kNN, лог-регрессия, SVM, Деревья решений) 
    • Как измерять качество алгоритмов? 
    • Быстрое прототипирование алгоритмов предсказания с помощью функций библиотеки Scikit-Learn   
    • ДЗ. Предсказание дефолта кредитного заемщика (кредитный скоринг)
  5. День пятый Занятие 5. Основы Web Scrapping

    начало 8 ноября в 00:00, продолжительность2 ч.
    • Разбор предыдущего ДЗ 
    • Парсинг данных с сайтов 
    • Быстрое прототипирование с помощью библиотеки urllib 
    • Структура страниц в Интернете - HTML, DOM-разметка 
    • Как выкачивать данные из соц. сетей? (Работа с API) 
    • Ограничения API и их обход  
    • ДЗ. Парсинг и сохранение HTML-страниц сайта Кинопоиска   
  6. День шестой Занятие 6. Выбор квартиры в Интернете

    начало 11 ноября в 00:00, продолжительность2 ч.
    • Разбор предыдущего ДЗ 
    • Анализ цен на жилую недвижимость  
    • Парсинг и сохранение данных 
    • Аналитика данных 
    • Построение моделей, генерация выводов по данным 
  7. День седьмой Занятие 7. Работа с текстовыми данными

    начало 15 ноября в 00:00, продолжительность2 ч.
    • Обзор современных задач обработки естественного языка (текстов) 
    • Обзор подходов к анализу текстов 
    • Быстрая работа с текстами в Python 
    • Извлечение сущностей из текста (Named Entity Recognition) 
    • Определение тональности текста (Sentiment Analysis)   
    • ДЗ. Автоматический анализ текстовых данных Кинопоиска
  8. День восьмой Занятие 8. Определение тональности текстов

    начало 18 ноября в 00:00, продолжительность2 ч.
    • Разбор предыдущего ДЗ 
    • Пример парсинга данных кинопоиска 
    • Работа с русским/английским языком 
    • Искусственный интеллект над текстами (bag of words, word2vec) 
    • Классификация/кластеризация текстов   
    • ДЗ. Классификация новостного потока по тональности 
  9. День девятый Занятие 9. Social Network Analysis

    начало 22 ноября в 00:00, продолжительность2 ч.
    • Разбор предыдущего ДЗ 
    • Введение в анализ сетей Алгоритмы обхода сетей и их визуализации 
    • Выделение лидеров мнений в сетях 
    • Поиск кратчайших путей, хабов, кластеризация  
    • Быстрое прототипирование алгоритмов с помощью библиотеки networkx   
    • ДЗ. Анализ данных соц. сети ВКонтакте
  10. День десятый Занятие 10. Другие области анализа данных

    начало 25 ноября в 00:00, продолжительность2 ч.
    • Разбор предыдущего ДЗ 
    • Новые подходы Machine Learning 
    • Подходы Deep Learning 
    • Обзор альтернативных инструментов для работы с данными

Что вы получите

  1. Научитесь делать аналитику на фрилансе для западных поставщиков (часовая ставка на платформах Upwor или kaggle.com доходит до $100 в час).  Это отличная "подработка", которая не отнимает много времени. Подойдет тем, кто пока не хочет менять текущую работу и хочет работать на западных рынках (фриланс там очень развит).
  2. Сделаете первый шаг к полноценному Data Scientist с ЗП от 140к рублей в крупной компании. По мнению Яндекса в течении 10 лет Data Scientist станет самой популярной профессией века.
  3. Научитесь использовать аналитику "в домашних условиях" при покупке квартиры, торговле на бирже и др. 
  • Количество часов: 20
  • Стоимость: 49999 ₽
  • Организатор: Красный Циркуль
загрузка изображения
Участвовать в вебинаре рекомендуется через браузер Chrome с выключенным Adblock