Пошук унікального контенту

Archive.org
Карта сайту

Наша взаимовыгодная связь https://banwar.org/

Повернемося до проблеми дубльованого контенту .

Рано чи пізно перед кожним вебмайстром стає питання, де брати унікальний контент. Тирити - невигідно, переписувати - довго, замовляти на стороні - дорого ... Замкнуте коло виходить.

Елі, автор блогу Blue Hat Seo , пропонує два варіанти вирішення проблеми. Цією записи вже більше ніж півроку, тому тема напевно проскакувала в Рунеті. Однак якщо таке було, я це точно пропустив 🙂

Archive.org

Сайт Archive.org - ідеальне місце для пошуку покинутого контенту. З його допомогою ви можете переглянути архіви багатьох авторитетних каталогів статей і новинних сайтів і знайти записи, які колись підкорювали топи пошукових систем, але вже назавжди випали з видачі. Для прикладу візьмемо сайт CNN.com.

1. Відкрийте сайт Archive.org і введіть в пошук назву цікавить вас сайту.

org і введіть в пошук назву цікавить вас сайту

2. Виберіть дату постарше. Вірогідність випадання старих сторінок з пошуку дуже висока.

Вірогідність випадання старих сторінок з пошуку дуже висока

3. Виберіть потрібну категорію.

Виберіть потрібну категорію

4. Виберіть статтю, відповідну тематиці вашого сайту.

Виберіть статтю, відповідну тематиці вашого сайту

5. Введіть в Google запит site: _адрес_статьі_ і подивіться результат. В ідеалі він повинен виглядати так:

В ідеалі він повинен виглядати так:

Правда, якщо прибрати з запиту www, то Google все-таки знаходить 1 сторінку 🙂, тому даний приклад кілька невдалий.

6. Скопіюйте текст статті на свій сайт.

От і все. Проблема унікального контенту вирішена 🙂

Для даного методу вибирайте великі авторитетні сайти. Так ви швидше знайдете, що вам потрібно. Зважайте на те, що Archive.org не завжди видає необхідні сторінки, хоча вони і присутні в його архіві. Крім того, деякі сайти, наприклад, ezinearticles.com , Закривають свої архіви через robots.txt.

Якщо ви збираєтеся генерувати контент в промислових масштабах, вам підійде наступний метод.

Карта сайту

Якщо на сайті присутня карта, ви можете легко знайти всі адреси сторінок з даного домену. Коли у вас буде список адрес, ви зможете прогнати його за запитом site: ... і знайти сторінки, які випали з індексу.

Знайдіть карту сайту і розпарсити з неї адреси окремих сторінок.
Напишіть скрипт, який зміг би прогнати всі ці адреси за запитом site: ...
Якщо пошуковик показує результат вище нуля, видаляйте адресу.
Перевірте список залишилися адрес вручну і знайдіть серед них цікаві для вас статті.

Недолік даного методу в тому, що парсинг карти видає дуже багато непотрібних результатів, на зразок пошукових запитів по сайту. Щоб уникнути цього, виберіть папку або піддомен з вашої тематики і працюйте тільки з нею. Якщо вам, наприклад, потрібні статті по автомобілебудуванню, виберіть розділ карти, що містить папку domain.com/autos або піддомен autos.domain.com.

Як варіант, ви можете шукати "унікальний" контент в кеші віддалених сторінок. На багатьох сайтах використовується стандартна сторінка помилки 404. Введіть запит site: domain.com "Sorry this page can not be found" і перевірте кеш цих же сторінок в інших пошукових системах.

Етичний момент: Не забувайте ставити посилання на оригінал (хоча б на головну сторінку сайту). Незважаючи на те, що для пошукача ваш контент буде 100% унікальним, у нього все ж є автор, якого потрібно хоч якось віддячити.

Разработка сайта для Вашего бизнеса. Веб дизайн. Дизайн логотипа, фирменного стиля, рекламная фотография . Комплексный рекламный креатив.

Пошук унікального контенту

Archive.org

Карта сайту

Записи по темі:

Подобаються статті? Підписуйтесь на розсилку!