🏃 Хакатоны: Лента х Яндекс Практикум, Samokat.tech
№ | Название проекта | Библиотеки/Инструменты | Краткое описание |
---|---|---|---|
1 | Lenta-time-series | Python , Java-Script , PostgreSQL |
Хакатон "Лента х Практикум". Прогноз временных рядов. |
2 | Samokat.tech | Python , Scikit-Learn , CatBoost |
Хакатон "Samokat.tech". Мэтчинг/классификация. |
3 | Matching | Pandas , Scikit-Learn , Faiss |
Сопоставление товаров из маркетплейса друг с другом. |
4 | SberMarket | Pandas , Scikit-Learn |
Прогнозирование заказов на маркетплейсе. |
5 | Fishki-CV | Pandas , TensorFlow , Skimage |
Обучение нейросети для сегментации изображений. |
6 | STEK-test | Python , PostgreSQL |
SQL функции выборки из БД + скрипт сортировки документов. |
7 | Tinkoff-start | Python |
Экзамены по программированию. |
Задачи регрессии
№ | Название проекта | Библиотеки/Инструменты | Описание |
---|---|---|---|
1 | Прогнозирование температуры стали | Scikit-Learn, Pandas, Matplotlib-pyplot |
Оптимизация производственных расходов комбината ООО «Так закаляем сталь». Требуется уменьшить потребление электроэнергии на этапе обработки стали. Необходимо построить модель, предсказывающая конечную температуру стали. |
2 | Определение возраста покупателей | Tensorflow-Keras, Pandas, GPU, Matplotlib-pyplot | Сетевой супермаркет «Хлеб-Соль» внедряет систему компьютерного зрения для обработки фотографий покупателей. Необходимо построить модель, которая по фотографии определит приблизительный возраст человека. |
3 | Прогнозирование заказов такси | Scikit-Learn, LightGBM, Pandas, Matplotlib-pyplot | Компания «Чётенькое такси» собрала исторические данные о заказах такси в аэропортах. Чтобы привлекать больше водителей в период пиковой нагрузки, нужно спрогнозировать количество заказов такси на следующий час. |
4 | Определение стоимости б/у автомобилей | Scikit-Learn, Pandas, LightGBM, Seaborn, Matplotlib-pyplot |
Сервис по продаже автомобилей с пробегом «Не бит, не крашен» разрабатывает приложение для привлечения новых клиентов. В нём можно быстро узнать рыночную стоимость своего автомобиля. |
5 | Выбор новой локации для нефтедобычи | Scikit-Learn, Pandas, Matplotlib-pyplot |
Компании «ГлавРосГосНефть» необходима модель машинного обучения, которая поможет определить регион, где добыча принесёт наибольшую прибыль. Проанализировать возможную прибыль и риски техникой Bootstrap. |
6 | Восстановление золота из руды | Scikit-Learn, Pandas, Seaborn, Matplotlib-pyplot |
Подготовьте прототип модели машинного обучения для «Цифры». Модель должна предсказать коэффициент восстановления золота из золотосодержащей руды. |
Классификация
№ | Название проекта | Библиотеки/Инструменты | Описание |
---|---|---|---|
1 | Фильтрация токсичных комментариев | Scikit-Learn, CatBoost, TensorFlow, GPU, Sentence-Transformers, TF-IDF | Интернет-магазин «Викишоп» запускает новый сервис: клиенты предлагают свои правки и комментируют изменения других. Магазину нужен инструмент, который будет искать токсичные комментарии и отправлять их на модерацию. |
2 | Прогнозирование оттока клиентов | Scikit-Learn, Pandas, Matplotlib-pyplot | Из «Бета-Банка» стали ежемесячно уходить клиенты. Необходимо спрогнозировать, уйдёт клиент из банка в ближайшее время или нет. |
3 | Рекомендации тарифов* | Scikit-Learn, Pandas, Matplotlib-pyplot | Оператор мобильной связи «Мегалайн» желает построить систему, способную проанализировать поведение клиентов и предложить пользователям новый тариф: «Smart» или «Ultra», поскольку многие клиенты пользуются архивными тарифами. (*) продолжение статистического анализа абонентов «Мегалайн». |
Аналитика
№ | Название проекта | Библиотеки/Инструменты | Описание |
---|---|---|---|
1 | Анализ рынка инвестиций (БД) | PostgreSQL | Необходимо проанализировать данные о фондах и инвестициях и написать SQL-запросы к базе. База данных хранит информацию о венчурных фондах и инвестициях в компании-стартапы. |
2 | Исследование продаж видео-игр в США, Европе и Японии. | Pandas, Seaborn, Matplotlib-pyplot, Scipy-stats | Интернет-магазине «Стримчик», который продаёт компьютерные игры по всему миру, планирует рекламную компанию. Необходимо выявить закономерности, определяющие успешность игры. Это позволит сделать ставку на потенциально популярный продукт. |
3 | Статистический анализ абонентов «Мегалайн»* | Pandas, Seaborn, Matplotlib-pyplot, Scipy-stats | Компания «Мегалайн» — федеральный оператор сотовой связи. Чтобы скорректировать рекламный бюджет, коммерческий департамент хочет понять, какой тариф приносит больше прибыли. (*) предварительный анализ для проекта "Рекомендации тарифов". |
4 | Анализ продаж квартир в С.Петербурге и области | Pandas, Seaborn, Matplotlib-pyplot | Необходимо научиться определять рыночную стоимость объектов недвижимости, и выявить параметры, которые на это влияют. Это позволит построить автоматизированную систему отслеживания аномалий и мошеннической деятельности для сервиса Яндекс Недвижимость. |
5 | Исследование надёжности заёмщиков | Pandas, Seaborn | Для кредитныго отдела банка необходимо провести исследование: выявить влияет ли семейное положение, количество детей клиента и др. факторы на погашения кредита в срок. |
6 | Яндекс.Музыка | Pandas | Сравнение пользователей Яндекс Музыка из Москвы и Петербурга. Проверка сформулированных гипотез. |
Защита персональных данных
№ | Название проекта | Библиотеки/Инструменты | Описание |
---|---|---|---|
1 | Кодирование конфиденциальной информации | Scikit-Learn, NumPy, Pandas, Matplotlib-pyplot |
Для страховой компании «Хоть потоп» необходимо разработать метод преобразования данных, чтобы по ним было сложно восстановить персональную информацию. |