Articles / Bookmarks / Profile of maximw / Habr

Maxim W @maximw

backend developer

Profile Publications 4Comments 1.8KBookmarks 589

wileyfoxy Dec 6 2020 at 00:49

Хотите стать «учёным по данным»? Тогда не начинайте с машинного обучения

4 min

9.4K

Machine learning*Artificial Intelligence

From sandbox

Translation

Самое большое заблуждение начинающих data scientist'ов, или что лучше стоит делать вместо изучения машинного обучения.

Razoomnick Nov 27 2020 at 05:51

Как мы сделали автоматический подбор похожих товаров

7 min

5.5K

Website development*Algorithms*Development for e-commerce*E-commerce management*Start-up development

В прошлых статьях я рассказывал, как мы научились сопоставлять товары из разных источников и заполнять карточку товара — характеристики, изображения, описание. А когда цены поставщиков, цены конкурентов и характеристики товара известны, логичным продолжением стал поиск информации об аналогах или просто похожих по своим свойствам товарах.

Использовать это можно разными способами, например, показать покупателю несколько похожих позиций на карточке товара, возможно, какая-то ему приглянется больше. Если чего-то нет в наличии, список похожих товаров в наличии тоже будет не лишним. Второй вариант — дать эту информацию сотрудникам колл-центра, чтобы они могли быстрее (или в принципе могли) предлагать аналоги, если запрашиваемого товара нет в наличии, или аналог лучше подходит под пожелания клиента.

Как определить, что товары похожи? Можно сравнить характеристики, чем больше совпало, тем более похожи товары. Но это не работает так просто, к сожалению. На практике оказывается, что, как правило, почти не бывает товаров, где заполнены все характеристики. 80% — хороший результат. Во-вторых, какие-то характеристики важнее, чем другие. Например, телевизор с диагональю в 65 дюймов совершенно не похож на телевизор с диагональю 22 дюйма, хотя у обоих по 2 USB-порта. Или, другой пример, металлический корпус и алюминиевый корпус гораздо ближе друг к другу, чем к пластику, хотя это три разных значения.

Начнем сначала

Что делаем

Целевая аудитория

Metasploit

Чеклист проектов по машинному обучению

Советы по отделению отвлекающих факторов от полезных сведений