Наша взаимовыгодная связь https://banwar.org/
Повернемося до проблеми дубльованого контенту .
Рано чи пізно перед кожним вебмайстром стає питання, де брати унікальний контент. Тирити - невигідно, переписувати - довго, замовляти на стороні - дорого ... Замкнуте коло виходить.
Елі, автор блогу Blue Hat Seo , пропонує два варіанти вирішення проблеми. Цією записи вже більше ніж півроку, тому тема напевно проскакувала в Рунеті. Однак якщо таке було, я це точно пропустив 🙂
Archive.org
Сайт Archive.org - ідеальне місце для пошуку покинутого контенту. З його допомогою ви можете переглянути архіви багатьох авторитетних каталогів статей і новинних сайтів і знайти записи, які колись підкорювали топи пошукових систем, але вже назавжди випали з видачі. Для прикладу візьмемо сайт CNN.com.
1. Відкрийте сайт Archive.org і введіть в пошук назву цікавить вас сайту.
2. Виберіть дату постарше. Вірогідність випадання старих сторінок з пошуку дуже висока.
3. Виберіть потрібну категорію.
4. Виберіть статтю, відповідну тематиці вашого сайту.
5. Введіть в Google запит site: _адрес_статьі_ і подивіться результат. В ідеалі він повинен виглядати так:
Правда, якщо прибрати з запиту www, то Google все-таки знаходить 1 сторінку 🙂, тому даний приклад кілька невдалий.
6. Скопіюйте текст статті на свій сайт.
От і все. Проблема унікального контенту вирішена 🙂
Для даного методу вибирайте великі авторитетні сайти. Так ви швидше знайдете, що вам потрібно. Зважайте на те, що Archive.org не завжди видає необхідні сторінки, хоча вони і присутні в його архіві. Крім того, деякі сайти, наприклад, ezinearticles.com , Закривають свої архіви через robots.txt.
Якщо ви збираєтеся генерувати контент в промислових масштабах, вам підійде наступний метод.
Карта сайту
Якщо на сайті присутня карта, ви можете легко знайти всі адреси сторінок з даного домену. Коли у вас буде список адрес, ви зможете прогнати його за запитом site: ... і знайти сторінки, які випали з індексу.
- Знайдіть карту сайту і розпарсити з неї адреси окремих сторінок.
- Напишіть скрипт, який зміг би прогнати всі ці адреси за запитом site: ...
- Якщо пошуковик показує результат вище нуля, видаляйте адресу.
- Перевірте список залишилися адрес вручну і знайдіть серед них цікаві для вас статті.
Недолік даного методу в тому, що парсинг карти видає дуже багато непотрібних результатів, на зразок пошукових запитів по сайту. Щоб уникнути цього, виберіть папку або піддомен з вашої тематики і працюйте тільки з нею. Якщо вам, наприклад, потрібні статті по автомобілебудуванню, виберіть розділ карти, що містить папку domain.com/autos або піддомен autos.domain.com.
Як варіант, ви можете шукати "унікальний" контент в кеші віддалених сторінок. На багатьох сайтах використовується стандартна сторінка помилки 404. Введіть запит site: domain.com "Sorry this page can not be found" і перевірте кеш цих же сторінок в інших пошукових системах.
Етичний момент: Не забувайте ставити посилання на оригінал (хоча б на головну сторінку сайту). Незважаючи на те, що для пошукача ваш контент буде 100% унікальним, у нього все ж є автор, якого потрібно хоч якось віддячити.