Делюсь материалами, которые в апреле 2019 года помогли мне найти стажировку по машинному обучению, а потом и работу (на работе занимаюсь NLP).
- студент школы 21 (необязательно)
- интересно машинное обучение
- хочется заниматься NLP или CV на стажировке
Выберите пункты гайда, которые интересны, но имейте в виду, что материалы гайда не включают следующие пункты, которые покрываются школьными проектами:
- основы программирования
- работа с командной строкой в unix
- работа с git
- составление резюме
- Гайд не ультимативный! Здесь приведены курсы, которые помогли мне + обогатил их, проработав год на позиции уже после стажировки.
- Все курсы - бесплатные.
- Если нужный материал есть на русском, оставляю ссылку и на него.
- Если хотите, чтобы процесс обучения был более продуктивным, пройдите/пролистайте Learning how learn. Проходится за один день, но может сэкономить вам много времени.
- Курс можно пройти за 9 недель учебы фуллтайм по 6 дней в неделю (+-)
- Я вставил мини-проекты, чтобы добавить практики. Но вы можете их заменить, на какой-то похожий аналог. Аналоги можно посмотреть python+ml или ml, но не забывайте, что это не должно занимать много времени.
- Оцените для себя время для "застревания". Это время, которое вы можете потратить на тему/задание внутри курса без продвижения вперед (например: 3 часа или день). Если в течение этого времени прогресса нет, то скипайте задание и переходите дальше.
- Есть русскоязычное коммьюнити по data science: ods
- Для тех, кто супер спешит: проходите только то, что написано курсивом.
- Python. Алгоритмы и структуры данных.
- Базовая математика для машинного обучения
- Введение в ML и классические алгоритмы
- Deep learning
- Для знакомства с питоном подойдет документация, так как в ней есть краткий курс. Русский/Английский. Если нет времени, то пройдите хотя бы до стандартной библиотеки (1-9 темы).
- Есть неплохой буткемп от 42-ai. Если нет времени, пройдите с 0 по 2 день.
- Понимание алгоритмической сложности, базовых структур данных и алгоритмов нужно на большинстве собесов (если не на всех). Intro to Data Structures and Algorithms . Несложный курс на питоне, которого хватит для понимания. Курс простой, поэтому пройдите все, даже если нет времени.
Напишите бота в телеге на питоне, исользуя любой публичный api.
- Задача минимум: Сделайте работающего бота хотя бы в google colab.
- Задача максимум: Возьмите машину на aws или gcs (на aws первый год бесплатный, на гугле дают 300$ на первый год). Оберните бота в докер, поднимите docker compose, прикрутите базу данных, чтобы сохранять юзеров, которые пишут в бота и все, что угодно до чего додумаетесь).
-
Список нужных тем. Если нет времени, отметил в доке то, что необходимо знать. Посмотрите два плейлиста 3blues1brown Essence of linear algebra, The Essence of Calculus. Если нет времени, видео от 3blues1brown смотрите только по темам, которые отмечены желтым в доке.
-
Data Science Math Skills. Если нет времени скипните теорию тем, которые знаете, просто проверив себя на решении квизов.
- mlcourse. Если нет времени, то пройдите темы 1-5, 7.
- MIT 6.S191 Introduction to Deep Learning. Курс вводный, но является хорошой базой + в практике знакомит с tensorflow. Если нет времени, пройдите 1-4 темы и решите первые две лабы.
- Нейронные сети и компьютерное зрение. Даже если нет времени, пройдите полностью
- Нейронные сети и обработка текста. Даже если нет времени, пройдите полностью
- Выберите активное соревнование. Посмотрите public kernels. Попробуйте улучшить результат (потратьте 2-3 дня, чтобы собрать собственный пайплайн и сделать первый сабмит).
Если будут вопросы, пишите в слаке школы, ник: jfrankly или в ods ibragim. Успехов!