Поиск уникального контента. Связка AntiPlagiarism.NET и XEvil
1. Парсим бинг с помощью X-Parser-Light
2. Проверяем статьи с помощью AntiPlagiarism.NET
3. Разгадываем капчи с помощью XEvil 4.0
Все.... :)))))
С выходом последних обновлений google BERT, как то тяжелее стало «кормить» google копипастными статьями. Задался вопросом, где можно взять уникальный контент в больших объемах и, естественно, бесплатно. Итак, зарывшись в просторы интернета, я нашел несколько тем, которыми пользуются вебмастера.
1. Парсинг web.archive.org
2. Спин
(размножение) контента
3. Генерация
контента
4. Покупка
дешевого контента
5. Обучение
нейронных сетей
Но эти
темы мне как то не внушали надежды на успех. Либо через сложность реализации,
либо через бесперспективность метода.
Как всегда
пришлось думать. Поразмыслив я пришел к выводу, что нужно искать забаненые
сайты в google. На данный момент мне просто нужен
уникальный контент без особого упора на качество. Изначально я понимал, что
удача может оказаться не на моей стороне.
Для начала
я достал с полки старый добрый X-Parser-Light
и спарсил 500 статей по гемблингу.
Дальше я
добавил все эти статьи в AntiPlagiarism.NET. Включил проверку yandex+google
И
запустил программу в работу. Секунд через 30 на меня начали огромным скопом сыпаться
капчи yandex. Я переставил программу на сервер,
где у меня установлен Xevil
Настройка
программы AntiPlagiarism.NET + XEvil
занимает
20 секунд.
Вставляем
ключ c XEvil в
поле ключ. Как видите, на правой половине скриншота, яндекс капчи решаются со
100% вероятностью. Версия XEvil 4.0 уже умеет распознавать знаки препинания и спецсимволы.
Гугл
не хотел поддаваться. Пришлось прикрутить приватные прокси и все заработало как
нужно.
Я поставил эту конструкцию на сервере, а сам пошел за пивом. Вернувшись, в папке
результатов уже лежало 15 статей, которые, по мнению программы, были
уникальными. Я допарсил еще 20к статей и поставил на проверку.
Что
делать с такими статьями решайте сами. Я делаю сателиты и доры под гемблинг.
Можно так же использовать под прогоны. Можно генерить доры на трастовых форумах,
блогах и профилях.
Данный тест ярко продемонстрировал, что можно парсить яндекс с
помощью связки X-Parser-Light +XEvil
Что и будет темой моей следующей статьи.
Доброго времени суток.
ОтветитьУдалитьНе подскажите где и как искать забаненые сайты в google
Их сейчас очень много. Любой поисковик, Бинг, к примеру. Можно искать в топ миллион сайтов (особенно старых базах, за прошлый месяц и так далее.) Там точно был трафик.
ОтветитьУдалитьПривет у тебя можно заказать парсинг статей по тематикам?
ОтветитьУдалитьКупи Xparser или если нужно очень много a-parser один раз настрой и всю жизнь радуйся.
Удалить