Мы вам перезвоним!
Введение в науки о данных
Длительность: 28 занятий, 1 семестр
Уровень: Средний, от 8 класса и старше.

Для поступления необходимо пройти вступительные испытания.
Курс «Введение в науки о данных» познакомит вас с одним из самых интригующих и востребованных направлений в компьютерных науках - анализом данных и машинным обучением.

На курсе вы изучите математические и технологические подходы к разработке искусственного интеллекта. Но под искусственным интеллектом здесь подразумевается не симуляция человеческого разума, а программы, способные самостоятельно обучаться и изменяться в процессе собственной работы.

К таким программам, например, относятся рекламные системы, которые запоминают ваши предпочтения, самоуправляемые автомобили, голосовые ассистенты (Siri, Алиса), программы, автоматически подбирающие план лечения для сложных заболеваний, ИИ, обыгрывающие самых крутых кибер-спортсменов и роботы, предсказывающие курсы акций. Такие алгоритмы сначала "обучаются" на больших объемах данных и автоматически "запоминают" закономерности, а затем используют эти данные для будущих "предсказаний".

Курс предназначен для школьников 8 класса и старше, хорошо знакомых с языком Python 3.

Курс состоит из 28 очных занятий (включая промежуточный и итоговый зачеты) длительностью в два академических часа. Помимо них вам в обязательном порядке потребуется около 4 часов в неделю на выполнение домашних заданий и самоподготовку.

Основой курса станет работа с наиболее популярными библиотеками для анализа, визуализации и машинного обучения: Pandas, Matplotlib и SciKit-learn. В процессе курса будут рассмотрены типовые подходы к задачам машинного обучения, процессы сбора, предобработки данных, подбора, настройки и обучения различных моделей машинного обучения. Будут рассмотрены как классические линейные модели, так и супер-современные алгоритмы ансамблевой классификации
Программа курса
1
Сбор и визуализация данных
Знакомимся с Collab и Jupyter, парсим веб-сайты, собираем и анализируем собственный датасет в Pandas и Matplotlib.
2
Классификация и регрессия
Предсказываем стоимости кроссовок и результаты киберспортивных матчей.

Задачи машинного обучения (с учителем, без учителя): классификация, регрессия, кластеризация. Обучающая и тестовые выборки, модель, обобщающая способность, обучение, недообучение, переобучение, сложность. Предобработка данных, шкалирование признаков, разбиение категориальные признаки, работа с пропущенными значениями, конструирование и отбор признаков, решетчатый поиск.

kNN, линейные модели (линейная, гребневая и логистическая регрессия), деревья, ансамбли (случайный лес, xgboost, catboost), SVM.
3
Обработка текстовых данных
Лемматизация, стемминг, n-граммы, векторизация мешком слов, TF/IDF и word2vec.
4
Кластеризация
Автоматически находим похожие анекдоты в большом датасете.

PCA, kmeans, иерахическая кластеризация, DBSCAN.
5
Генетические алгоритмы
Учим компьютер играть в игры.
6
Рекомендательные системы
Используем SVD для поиска новых сериалов.
7
Итоговый зачет
Через три месяца вы сможете...
  • Анализировать и визуализироваться данные с любых сайтов интернете.
  • Предсказать цены еще несуществующих кроссовок.
  • Заранее узнавать результаты спортивных и кибер-спортивных матчей.
  • Принять участие в хакатонах и олимпиаде НТИ.
  • Угадывать рейтинг фильма по его описанию...
О профессии
Науки о данных - это область на стыке математики и программирования, одним из практических применений которой является разработка искусственного интеллекта.

Эксперты в этой области занимаются машинным обучением: разработкой алгоритмов, которые обучаясь на больших объемах данных (Big Data), способны предсказывать курсы акций, диагностировать заболевания, собирать интересные материалы в "умную ленту" или рекомендовать вам интересные сериалы.

Обучаясь в Школе программирования Геккон, вы за два года научитесь использовать язык программирования Python 3 для обучения собственных моделей машинного обучения и нейронных сетей.
Преподаватели
  • Бородин Ростислав
    Ведущий разработчик Medsenger.ru, педагог дополнительного образования.
    Образование: Прикладная математика и информатика, ФКН НИУ ВШЭ.
    Специализация: frontend web, backend web, mobile dev, медицинская информатика.
    Опыт работы со школьниками: 7 лет, GoTo, Политехнический музей, Лифт в Будущее, Гимназия 1576.
  • Емельяненко Дмитрий
    Исследователь Deep Learning в Яндексе.
    Образование: Программная инженерия, ФКН НИУ ВШЭ.
Как поступить?
Заявка на сайте
Оставьте заявку по ссылке ниже и расскажите о себе. В течение нескольких дней с вами свяжется наш специалист и поможет определиться с выбором курса.
День открытых дверей
За неделю до начала курса мы проводим общее собрание, на котором вы сможете познакомиться с преподавателями и задать все интересующие вопросы.
Вступительные испытания
Материалы для подготовки мы пришлем вам по почте.
Экзамен позволит понять, готовы ли вы к курсу, а еще от него зависит стоимость обучения.
Начало занятий!
Если у вас еще остались сомнения, первые две недели можно попробовать побыть студентом. Оплатить курс потребуется на третьей неделе обучения.
Место проведения и стоимость занятий
Адрес: Ленинский проспект, 2/4, Инжиниринговый центр МИСИС.

Метро: Октябрьская.

Стоимость занятий зависит от результатов вступительных испытаний и составляет от
12 000 до 40 000 рублей
за 28 занятий (семестр).
Запись на первый семестр 2019/2020
Начало занятий - сентябрь 2019.