Данный модуль обходит заданные урлы и собирает с них внешние ссылки, которые потом проверяются на дроп. Механика направлена на то, чтобы искать дропы с конкретных сайтов. С сайтов конкурентов, жирных профильных ресурсов и в целом с тех, с которых не купить ссылку. По фану я находил дропы на сайте Госдепа США.
Начало работы:
Принцип работы:
Запреты:
Можно установить запреты посредством добавления фрагментов урлов. Например, /forum/. Тогда урлы с этим вхождением будут пропускаться. Также есть возможность почистить такие урлы, если они уже в базе. Для этого идем в настройки задачи (нажимаем на её id в таблице), вписываем запрещенные вхождения и нажимаем кнопку справа (Сохранить и удалить урлы с такими вхождениями).
Когда парсинг будет завершен, дальше действуем стандартно. Идем в первичку.
Это обновление добавило возможность собирать выдачу Яндекса в плане сохранения урлов, после чего по ним идет Паук. Идет не в глубь, а смотрит только одну страницу (урл из выдачи). Это позволяет найти дропы, на которые ссылаются сайты из выдачи, стоящие по нужным запросам.
Переходим в паука, нажимаем добавить задание, после клик на сбор из выдачи Яндекса.