Онлайн
Здравствуйте! Я помогу разобраться в работе платформы.
Технический разбор pipeline парсинга промышленной номенклатуры из произвольных таблиц.
Каждое предприятие ведёт учёт номенклатуры по-своему. Задвижка 30с41нж Ду150 Ру16 может быть записана десятком разных способов в разных Excel-файлах.
Наш pipeline состоит из трёх этапов. Первый — структурный анализ файла: Claude определяет логические колонки даже если шапка отсутствует или сдвинута. Второй — нормализация каждой строки: извлечение категории, типа, материала, размеров, стандарта.
Третий этап — построение векторных представлений через Cohere multilingual-v3. Это даёт нам семантический поиск, который находит аналоги даже при разных формулировках.
Точность нормализации на тестовом наборе из 50K реальных позиций — 94.2%. Время обработки одного Excel-файла на 5K строк — менее 90 секунд.
Раз в две недели — кейсы клиентов, технологические разборы, аналитика рынка.