Блог seo-семьянина » Починка граббера

Починка граббера

Среда, марта 30, 2019 17:47

Есть у меня в наличии граббер(парсер) dle сайтов, называется кажется он так — DLE Grabber Private V9.2. Где то полтора года назад я им активно пользовался, точнее его переделанной версией, которая умеет загружать фото на хостинг, ставить водяной знак, синонимизировать по желанию и добавлять к ссылкам noindex и nofollow. В ту пору я делал много однотипных сателлитов, которые пачками улетали в сапу, а потом этими же пачками улетали под АГС.
Из всех этих сайтов осталось в живых только два. Я их даже в сапу не добавлял, так, обновлял потихоньку, короче пустил их на авось.
Время шло, и на одном сайте граббер перестал парсить заголовок новости, вместо заголовка вновь добавляемых новостей была пустота. Из-за этого дела пришлось меньше новостей добавлять, так как приходилось самостоятельно добавлять заголовки на каждую новость, а на сайте тем временем уже начала расти посещаемость. Время шло и я замечал что этот граббер переставал парсить новости с других сайтов на DLE.
И вот буквально недавно граббер перестал грабить со второго сайта.
К настоящему времени сайты в индексе обоих поисковых систем имеют не нулевые показатели тиц, на одном из них посещаемость +200. Надо обновлять, но самому добавлять новости мне на них стало в лом (к хорошему быстро привыкаешь) поэтому было решено поковыряться в коде.
Вообще, надо помнить, что все подобные программы сделаны на регулярных выражениях, которые в коде можно легко найти, если конечно знать что это такое.
Перелопатив 3 основных php файла данного «изделия» я нашел функции парсинга, а также вызывающюю конструкцию. Как только я глянул в исходный код разграбленого сайта, мне сразу стало ясно, как починить данный граббер. Ну и по месту добавил пару фишичек в сам граббер, так как в сграбленных новостях присутствовали ссылки типа:

сайт.ru/engine/go.php?url=gfawrjwaefewijfweif

Которые на моем сайте выводились в теге nofollow, но по переходу по этим ссылкам посетитель попадал не на закодированный сайт, а на сайт, который я грабил, что естественно было не правильно.
Вот так вот, потеряв три часа, я сэкономлю в будущем уйму времени при добавлении новостей.
Это незабываемое ощущение, когда скрипты после твоих стараний, «оживают».

Вы можете пропустить до конца и оставить ответ.

Один комментарий “Починка граббера”



  1. сообщил:

    апреля 2, 2019 0:23

    Да, порою прямо чувствуешь себя эдаким Франкенштейном, когда это чудо начинает оживать и работать :) ))

Оставить комментарий