Введение
Наш новый клиент — крупная сеть аптек, работающая на рынках Москвы и Санкт-Петербурга. Задача, которую они перед нами поставили, была одновременно простой и сложной: провести мониторинг цен и наличия товаров у их основного онлайн-конкурента — apteka.ru. Целью этого проекта было получение данных по ключевым категориям товаров: биологически активным добавкам (БАДы), витаминам, средствам для похудения и жиросжигателям.
Федеральная сеть аптек стремилась получить конкурентное преимущество, анализируя ценообразование и наличие товаров у конкурента. В условиях жесткой конкуренции на рынке фармацевтики, особенно в двух крупнейших городах России, информация о ценах и наличии товаров становится решающим фактором для бизнеса.


рис.1. Сайт-донор
Вводные данные
Работа началась с изучения структуры сайта и API-конкурента. Данные по категориям товаров формировались с помощью обращений к API — https://api.apteka.ru/Search/CategoryUrl. Пример запроса выглядел следующим образом:


Последний параметр, categoryUrl, указывает путь к категории и может быть получен из ссылки на нее.
Для изменения города, при каждом запросе отправлялся PUT-запрос на https://api.apteka.ru/City/UserCity с указанием ID города в теле запроса. В ходе работы столкнулись с тем, что любые запросы блокировались при открытых devtools в браузере, что усложняло автоматизацию процесса на раннем этапе.
Сложности
Вскоре стало очевидно, что наш проект не будет таким простым, как могло показаться на первый взгляд. apteka.ru активно блокировала любые попытки автоматизированного сбора данных, что требовало нового подхода. Запросы, отправляемые с открытыми devtools, немедленно блокировались, и даже частая смена прокси-серверов не давала стабильных результатов.
Решение
Для решения этой задачи мы разработали полумануальный метод сбора данных. Наш подход состоял из следующих шагов:
- Открытие необходимой категории на сайте.
- Нажатие кнопки «Собрать», запускающей автоматический сбор данных со страницы.
- Автоматический переход на следующие страницы категории и сбор данных.
Этот метод позволил обойти блокировки, так как процесс имитировал поведение реального пользователя. После завершения сбора данных формировался и скачивался Excel-файл с необходимой информацией.
Результаты
В итоге наша команда успешно реализовала проект, предоставив клиенту данные по ценам и наличию товаров у конкурента. Полученная информация позволила федеральной сети аптек не только оптимизировать свои цены, но и улучшить ассортимент, что, в конечном итоге, привело к увеличению продаж и доли рынка. Примеры выгрузок есть на скриншотах.


рис.2. Готовые данные из категории “Добавки и витамины для похудения”


рис.3. Готовые данные из категории “Жиросжигатели”
Заключение
Этот кейс показал, что даже в условиях жесткой блокировки и сложностей с автоматизацией, можно найти эффективные решения. Полумануальный метод сбора данных доказал свою эффективность и позволил достичь поставленных целей. Мы уверены, что наш опыт поможет другим компаниям в решении подобных задач.
Если у вас есть похожие задачи или вам нужны услуги профессионального парсинга и мониторинга цен, свяжитесь с нами прямо сейчас.
Контактная информация:
Компания: ParsingMaster
Сайт: parsingmaster.com
Email: info@parsingmaster.com
Telegram: parsingmaster_manager
Телефон: +7 (920) 909-36-72
Заказать звонок
Чтобы заказать обратный звонок, заполните и отправьте форму ниже.
Оставляя заявку вы можете быть уверены:
От нас не будет никакого спама
Менеджер свяжется с вами в течение 30 мин.
(Рабочее время: Пн-Пт с 9:00 до 18:00 (GMT+3, Мск)
В кратчайшие сроки решим вашу задачу

