Мы вам перезвоним!
Введение в науки о данных
Длительность: 28 занятий, 1 семестр
Уровень: Средний, от 13 лет
Нужно для: науки о данных.
Технологии: Python 3; Pandas, NumPy, SciKit Learn.
Стоимость обучения: 40 000 семестр (1430 руб/занятие), скидка до 70% по результатам вступительных испытаний.

Для поступления необходимо пройти вступительные испытания.
Курс «Введение в науки о данных» познакомит вас с одним из самых интригующих и востребованных направлений в компьютерных науках - анализом данных и машинным обучением.

На курсе вы изучите математические и технологические подходы к разработке искусственного интеллекта. Но под искусственным интеллектом здесь подразумевается не симуляция человеческого разума, а программы, способные самостоятельно обучаться и изменяться в процессе собственной работы.

К таким программам, например, относятся рекламные системы, которые запоминают ваши предпочтения, самоуправляемые автомобили, голосовые ассистенты (Siri, Алиса), программы, автоматически подбирающие план лечения для сложных заболеваний, ИИ, обыгрывающие самых крутых кибер-спортсменов и роботы, предсказывающие курсы акций. Такие алгоритмы сначала "обучаются" на больших объемах данных и автоматически "запоминают" закономерности, а затем используют эти данные для будущих "предсказаний".

Курс предназначен для школьников 8 класса и старше, хорошо знакомых с языком Python 3.

Курс состоит из 28 очных занятий (включая промежуточный и итоговый зачеты) длительностью в два академических часа. Помимо них вам в обязательном порядке потребуется около 4 часов в неделю на выполнение домашних заданий и самоподготовку.

Основой курса станет работа с наиболее популярными библиотеками для анализа, визуализации и машинного обучения: Pandas, Matplotlib и SciKit-learn. В процессе курса будут рассмотрены типовые подходы к задачам машинного обучения, процессы сбора, предобработки данных, подбора, настройки и обучения различных моделей машинного обучения. Будут рассмотрены как классические линейные модели, так и супер-современные алгоритмы ансамблевой классификации.
Программа курса
1
Сбор и визуализация данных
Знакомимся с Collab и Jupyter, парсим веб-сайты, собираем и анализируем собственный датасет в Pandas и Matplotlib.
2
Классификация и регрессия
Предсказываем стоимости кроссовок и результаты киберспортивных матчей.

Задачи машинного обучения (с учителем, без учителя): классификация, регрессия, кластеризация. Обучающая и тестовые выборки, модель, обобщающая способность, обучение, недообучение, переобучение, сложность. Предобработка данных, шкалирование признаков, разбиение категориальные признаки, работа с пропущенными значениями, конструирование и отбор признаков, решетчатый поиск.

kNN, линейные модели (линейная, гребневая и логистическая регрессия), деревья, ансамбли (случайный лес, xgboost, catboost), SVM.
3
Обработка текстовых данных
Лемматизация, стемминг, n-граммы, векторизация мешком слов, TF/IDF и word2vec.
4
Кластеризация
Автоматически находим похожие анекдоты в большом датасете.

PCA, kmeans, иерахическая кластеризация, DBSCAN.
5
Генетические алгоритмы
Учим компьютер играть в игры.
6
Рекомендательные системы
Используем SVD для поиска новых сериалов.
7
Итоговый зачет
Преподаватели
Бородин Ростислав
Ведущий разработчик Medsenger.ru, педагог дополнительного образования.
Образование: Прикладная математика и информатика, ФКН НИУ ВШЭ.
Специализация: frontend web, backend web, mobile dev, медицинская информатика.
Опыт работы со школьниками: 7 лет, GoTo, Политехнический музей, Лифт в Будущее, Гимназия 1576.
Емельяненко Дмитрий
Исследователь Deep Learning в Яндексе.
Образование: Программная инженерия, ФКН НИУ ВШЭ.
Место проведения
Адрес: Ленинский проспект, 2/4, Инжиниринговый центр МИСИС.

Метро: 3 минуты от метро Октябрьская.
Запись на первый семестр 2019/2020
Начало занятий - сентябрь 2019.