Удаленная работа карточки товаров

Удаленная работа карточки товаров

Удаленная работа карточки товаров

Удаленная работа карточки товаров


✅ ️Нужны деньги? Хочешь заработать? Ищешь возможность?✅ ️

✅ ️Заходи к нам в VIP телеграм канал БЕСПЛАТНО!✅ ️

✅ ️Это твой шанс! Успей вступить пока БЕСПЛАТНО!✅ ️

======================



>>>🔥🔥🔥(Вступить в VIP Telegram канал БЕСПЛАТНО)🔥🔥🔥<<<



======================

✅ ️ ▲ ✅ ▲ ️✅ ▲ ️✅ ▲ ️✅ ▲ ✅ ️






Работа Наполнение сайтов удалённо в России. Вакансии Наполнение сайтов удалённо в России

Удаленная работа карточки товаров

Работа: обработка анкет на дому в России - вакансий от прямых работодателей | Jobeka

Скоро на этот адрес придет письмо. Подтвердите подписку, если всё в силе. Только полноправные пользователи могут оставлять комментарии. Войдите , пожалуйста. Все сервисы Хабра. Как стать автором. Войти Регистрация. Как мы стали создавать карточки товаров автоматически Алгоритмы , Разработка под e-commerce , Управление e-commerce В своей прошлой статье я рассказал, как мы научились автоматически сопоставлять товары по наименованиям. Это дало возможность автоматизировать все, что связано с ценами и наличием. В этой статье я расскажу, как мы пошли дальше и автоматизировали работу с характеристиками и изображениями товаров. Это логичное продолжение развития продукта, учитывая надежную работу автоматического сопоставления товаров по наименованию. Проект по автоматизации мы выделили в отдельную компанию, а я рассказываю о проекте на примере одного из наших клиентов, и делюсь некоторыми данными клиента с его разрешения. Дальше будет небольшая вводная, а потом поговорим про алгоритмы, которые мы использовали. С чего мы начинали Исходное состояние год назад было таким: каталог на тысяч товаров, из них 70 тысяч есть в наличии. После запуска автоматического сопоставления и создания товаров о чем прошлая статья , каталог довольно быстро вырос до миллиона с небольшим товаров, из них тысяч товаров в наличии. Но для покупки в розницу были доступны только тысяч позиций, потому что у остальных не были заполнены характеристики. В зависимости от категории, чтобы товар появился в продаже, должен быть заполнен определенный процент характеристик. В некоторых категориях обязательно должно быть фото. Из тысяч товаров в продаже у тысяч не было изображений. Поясню, товары которые есть в наличии, но не продаются в рознице, могут продаваться в опте, там принято рассылать excel-файлы с наименованиями и ценами. Но b2b портал с карточками, несомненно, плюс. Ещё они могут размещаться на агрегаторах, где уже есть более подробная информация о товаре. Изображения и характеристики заполнялись в полуавтоматическом режиме. За этот год у нас появились и другие клиенты, и теперь я знаю, как построен процесс в десятке-другом относительно крупных магазинов, он более-менее стандартный. Программист, который занимается поддержкой сайта, время от времени пишет парсеры сайтов по тематике магазина. Дальше отдел контента в админке сопоставляет распаршенные товары и товары из каталога, а также категории в источнике и категории в каталоге. Потом в каждой категории для каждого свойства настраиваются соответствия, замены, конвертация единиц измерения. Карточки некоторых товаров заполняются полностью вручную. Небольшая часть товаров отдается внешнему подрядчику. Так было и у нашего клиента. Мы решили к вопросу подойти максимально системно и максимально автоматизировать процесс создания карточек товаров. Где мы берем данные В первую очередь встает вопрос, где взять исходные данные, и как много мы можем их получить. У нас есть два основных источника: файлы и API поставщиков те данные, которые мы нашли в интернете Второй пункт подразумевает парсинг сайтов. Мы сделали инфраструктуру для создания парсеров, которая позволяет настроить парсинг сайта примерно за полчаса. Потом на этой инфраструктуре сделали около сотни парсеров, на данный момент они уже собрали информацию о 16 миллионах товаров и скачали и загрузили на CDN 35 миллионов изображений и документов инструкций, datasheet. Во время сохранения изображений мы считаем их перцептивные хэши, чтобы потом быстро находить дубликаты, ниже поговорим об этом подробнее. Идеально, если парсер сам без подсказок и настроек сможет собирать информацию о товарах на любом сайте, но это далекие планы. Как мы заполняем карточку товара изображениями Это самая простая и очевидная часть. У нас уже есть механизм сопоставления товаров по наименованию, работает быстро и точно В данном случае нас интересуют false positive срабатывания, которых около 0. False negative практически не влияет на результат, потому что нет большой разницы, работаем мы в итоге с 10 или 11 источниками. Сопоставление работает со скоростью тысяч товаров в секунду, и все наши 15 миллионов товаров сопоставляются любому каталогу меньше, чем за час. На этом можно было бы и закончить, так как после сопоставления нам известны все изображения товара. Но на практике они дублируются на разных сайтах в разных сочетаниях, и правильно будет из набора похожих картинок выбрать лучшую по качеству, а остальные оставить в качестве вариантов на случай последующего ручного редактирования карточки товара. Определение похожих картинок происходит в два этапа. На первом этапе, при скачивании файла, для каждого нашего изображения мы считаем перцептивный хэш. Сначала убираем однотонный фон, обрезаем поля. Потом к получившемуся изображению применяем DCT хэширование. Об этом алгоритме когда-то была статья на Хабре. После сопоставления для каждого товара у нас есть набор изображений с уже подсчитанными хэшами, и нам нужно разбить его на кластеры, а потом из каждого кластера выделить самое качественное изображение. Размер такого набора может изменяться от нескольких единиц до нескольких сотен единиц, типичное значение — 10 — На таком размере можно применить алгоритм квадратичной сложности, основная операция — вычисление расстояния Хэмминга — производится очень быстро. Разбиваем изображения на кластеры мы следующим образом: первое изображение из набора образует первый кластер каждое следующее изображение сравнивается с первым изображением из каждого кластера если наибольший коэффициент сходства больше порогового значения, добавляем изображение в существующий кластер иначе создаем новый кластер из одного изображения После этого из каждого кластера мы берем самое качественное изображение. В первом приближении качество определяется размером и разрешением изображения. Чем больше размер и разрешение, тем лучше, но отношение размера к разрешению должно лежать в разумных пределах. Такого анализа на практике хватает. Дальше есть еще один нюанс. Картинки для товара мы нашли автоматически, но, все-таки, пока что человек главнее. И если человек решил изменить очередность изображений, у него должна быть такая возможность. Рабочим вариантом с учетом этого оказался такой подход: все изображения, которые были изменены вручную а под изменением здесь подразумевается максимально широкий набор действий: подтверждение, исключение, изменение очередности , навсегда остаются на своих местах. Все остальные изображения мы можем менять в будущем в автоматическом режиме. Как мы заполняем карточку товара свойствами Со свойствами дела обстоят немного сложнее, чем с картинками. Потом описали единицы измерения и способы их конвертации. На данный момент их уже больше ста, от метров до децибел. Все они распределены по группам в зависимости от размерности, и внутри группы могут быть приведены друг к другу. Например, лошадиные силы можно конвертировать в ватты, а люмены в ньютон-метры — нельзя. Далее мы попытались процесс заполнения свойств разбить на независимые шаги так, чтобы каждый шаг можно было улучшать и тестировать отдельно от остальных. Для каждого товара из каталога мы выполняем следующие операции: сопоставляем товару товары из источников по наименованию у нас это сложный процесс, детально он описан в прошлой статье формируем список определений свойств, которые нужно заполнить формируем список свойств из всех сопоставленных товаров сопоставляем каждому определению из пункта 2 список значений из пункта 3 преобразуем список в одно значение Рассмотрим подробнее на примере два последних пункта. Рабочий, но не окончательный вариант выглядит так: совпадают названия без предлогов и единиц измерения с точностью до перестановок и окончаний одно из названий включает другое порядок слов и окончания не учитываем совпадение с учетом синонимов совпадает размерность единиц измерения или значение совпадает с одним или несколькими вариантами в случае свойств с выбором. У нас эти пункты реализованы как независимые алгоритмы для каждого случая, поэтому каждый можно улучшать отдельно от других. В пункте с синонимами мы внесли вручную несколько самых очевидных пар и отложили до лучших времен. Дальше, возможно, попробуем выделить синонимы автоматически, используя данные из заполненных свойств. Кроме того, из одного источника мы можем взять только одно значение, поэтому у каждого из алгоритмов есть приоритет, он определяет порядок выполнения алгоритмов. После этой операции у нас останется такой набор значений: Мощность кВт : 1,8 Мощность: 1. Для каждого типа у нас независимый алгоритм. В случае с числом и единицей измерения мы делаем следующее: для каждого значения пытаемся определить единицу измерения. Если это не удалось, или ее размерность не совпадает с размерностью свойства, игнорируем это значение в дальнейшем. У нас останется такой набор значений: Мощность кВт : 1,8 Мощность: 1. Тут стараемся учесть все возможные форматы: с запятой и точкой для разделения целой и дробной части, с запятыми и пробелами для отделения тысяч, сокращения вроде тыс. Получается следующее: Вт Вт Вт Вт Этот набор нужно привести к единственному значению. В случае единственного значения в наборе, используем его. Если значений больше одного и они совпадают, так даже лучше. Если значений больше одного и они не совпадают, берем наиболее часто встречающееся. Если такого нет, не заполняем свойство автоматически. Это был пример для свойства числового типа, для других типов последние шаги отличаются и учитывают их особенности. Что касается ручного редактирования, то со свойствами мы поступаем точно так же, как с изображениями. Все, что было изменено или подтверждено вручную, автоматически измениться больше не может. Все остальное — может. Как мы тестируем проект У этого проекта есть замечательная особенность: ядром является технология, целиком состоящая из задач на оптимизацию. Более того, у большинства этих задач нет точного решения, и для них мы придумали собственные критерии, которые учитывают скорость и точность. Вот где действительно нужны тесты. Архитектура проекта устроена таким образом, что сложные алгоритмы, насколько это возможно, разбиты на простые шаги. Для каждого шага есть критерий оптимизации и набор тестов. Упор на точность, но и скорость учитываем. По крайней мере, смотрим было-стало после каждого изменения. Каждый такой шаг напоминает задачу спортивного программирования, и у нас есть возможность сравнить результаты после каждого изменения. Результаты Более точно оценить результаты можно будет через пару месяцев работы в продакшене. На данный момент прошло меньше недели. За это время мы смогли добавить на сайт примерно тысяч товаров, которые раньше не продавались из-за отсутствия свойств или изображений. Цель на перспективу — полностью отказаться от ручной работы для наполнения каталога. Думаю, по результатам нескольких месяцев мы этого достигнем. Укажите причину минуса, чтобы автор поработал над ошибками. Реклама AdBlock похитил этот баннер, но баннеры не зубы — отрастут Подробнее. Читают сейчас. Разговор с майнером Chia, имеющим 1ПБ ёмкости 82,2k Редакторский дайджест Присылаем лучшие статьи раз в месяц Скоро на этот адрес придет письмо. Razoomnick Razoomnick. Платежная система. Похожие публикации. У курьеров выкупают реже 3 2,8k 7 Минуточку внимания. Что обсуждают. Комментарий переводчика, или никто никого не обучает 2,5k Насколько экологична атомная энергетика? На самом деле так же, как солнечная и ветровая 28,5k Самое читаемое. Ваш аккаунт Войти Регистрация. Настройка языка. О сайте. Служба поддержки. Мобильная версия. Интерфейс Русский. Сохранить настройки.

Купил пиццу за биткоины

Заполнение карточек на сайте | ВКонтакте

Что из перечисленного служит примером портфельных инвестиций

Удаленная работа карточки товаров

Как мы стали создавать карточки товаров автоматически / Хабр

Удаленная работа карточки товаров

Тинькофф инвестиции кто создает биржевые фонды

К основному капиталу относятся денежные средства

Удаленная работа и вакансии : «наполнение сайта» в России | Поиск работы с ГородРабот.ру

Удаленная работа карточки товаров

Акция купи 4

Заработать в эйвон в интернете

Работа в интернете - контент-менеджер

Удаленная работа карточки товаров

Ю сахаровская куда уходят деньги

Удаленная работа и вакансии : «наполнение сайта» в России | Поиск работы с ГородРабот.ру

Report Page