Skip to content

Хакатон "Лидеры цифровой трансформации 2023". Задача №5. Поиск одинаковых товаров на маркетплейсе.

emille42/MarketplaceTaskHackaton2023

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

24 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Описание

В данном репозитории представлено решение задачи на хакатоне Leaders of Digital 2023. Задача №5 "Поиск одинаковых товаров на маркетплейсе". Реализована сиамская архитектура нейросети. Предтренированный на русских текстах BERT использовался для получения эмбеддингов. Классификация выполнялясь полносвязной нейронной сетью. Также были выполнены: генерация признаков из имеющихся данных. Обучение RandomForest, а также Randomized Search для CatBoost, что позволило повысить целевую метрику при решении задачи.

Запуск:

  1. Создайте virtual environment с python 3.11
  2. Установите зависимости: pip install -r requirements.txt
  3. Для выполнения ноутбуков вам понадобится датасет

About

Хакатон "Лидеры цифровой трансформации 2023". Задача №5. Поиск одинаковых товаров на маркетплейсе.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published