Google отримав патент на новий метод боротьби з спамом

6 січня 2010 | Рубрика: Новини

Індексуючи різні документи, знайдені в мережі, і прагнучи забезпечити користувачів найбільш якістною видачею, пошукова система покладається не тільки на контент знайдених сторінок - вона також враховує кількість і якість посилань, що ведуть на дану сторінку.

Пошукова система - наприклад, Google - може вирішити, що ваша сторінка релевантна для користувача запиту, грунтуючись на її вміст і на тексті посилань, що вказують на дану сторінку.

Вона також може спробувати скласти деяке уявлення про «стосунки» між сторінками, подивившись на структуру їх посилальних зв'язків. Для цієї мети Google використовує систему Pagerank, що обчислює міру важливості окремих сторінок за допомогою аналізу мережі посилань. Ця міра важливості може бути спрощено представлена як вірогідність того, що користувач виявиться на цій сторінці, випадковим чином клікая за посиланнями в процесі вільного інтернет-серфінгу.

Отож, на кінцеве ранжування сторінок впливає комбінація трьох основних чинників: релевантність контенту сторінки введеному запиту, текст посилань, що вказують на сторінку, а також міра важливості цієї сторінки, що виводиться із структури її посилальних зв'язків з іншими сторінками. Google може коригувати ранжування топових документів, використовуючи сигнали зовсім іншої природи, проте саме ці фактори впливають на те, чи побачать цю сторінку кінцеві користувачі.

Системи посилального ранжирування зразок Pagerank виявляються далеко не ідеальним рішенням. Посиланнями можна маніпулювати, прагнучи вивести ту чи іншу сторінку в топ.

Патент, отриманий Google днями, описує, як можна виявити і нейтралізувати маніпуляції з посиланнями і тим самим відсіяти з видачі сторінки, які отримали високий Pagerank завдяки посилальної спаму.

Лінкоферми і злочинні групи
Пошукова система може подивитися, чи не володіють чи прямі посилання на цю сторінку, деякими специфічними властивостями, якими навряд чи будуть мати чесні посилання.

У патенті Google виділяється два основних види посилального спаму - лінкоферми і злочинні групи. Далі детально описується, як їх можна відрізнити від цілком невинних посилань, що вказують на цілком безневинні сторінки.

Лінкоферми
Лінкоферма складається з великої кількості сторінок, створених в першу чергу для того, щоб вказувати на одну єдину центральну сторінку, штучно збільшуючи запобіжний її важливості. Типовим прикладом може послужити інтернет-магазин з безліччю прихованих від користувача сайтів-пустушок, що посилаються на його головну сторінку. Якщо пошукач вважатиме за потрібне їх враховувати ці посилання, вони можуть допомогти інтернет-магазину вибратися в топ.
Статті, що ведуть на центральний ресурс лінкоферми, як правило мають дуже низьку степів важливості (низький PageRank). У той же час дійсно важливі ресурси швидше за все будуть мати посилання не тільки з незначні сторінок, але і з сайтів з високим PageRank.

Злочинні групи
Злочинна група являє собою набір сторінок, пов'язаних з допомогою т.зв. кільцевої перелінковки - вони активно посилаються один на одного, взаємно збільшуючи свою вагу і вводячи в оману пошукові системи. Якщо пошукачі не суммеет відсіяти ці посилання, подібна поведінка буде сприяти нечесній просування в топ.

Статті, що утворюють злочинну групу, не мають схильності посилатися куди-небудь назовні, за межі групи. Це дозволяє відрізнити їх від нормальних сторінок, що заробили свій авторитет чесним способом.

Реакція на штучне збільшення важливості
Якщо будь-яка сторінка або група сторінок виявилася спіймані на спам-лінковке, пошукова система, в соотсветствіі з патентом, повинна спробувати вирахувати кількість «штучно створеній важливості» щоб адекватним чином скорегувати видачу.

На першому етапі жива людина або спеціальний алгоритм повинні докладно вивчити виявлені сторінки, щоб переконатися, що вони дійсно є спамом. Якщо перевірка дала позитивний результат, можуть бути прийняті наступні заходи:

1. Посилання, розміщені на цій сторінці, можуть взагалі не враховуватися в системі Pagerank.
2. Вага посилань, розміщених на даній сторінці, може бути пропорційно зменшено (посилання на інші сторінки стають менш важливими).
3. Посилання із цієї сторінки можуть одержати заздалегідь певний штраф, що зменшує їх важливість.
4. Важливість сторінки може бути зменшена у спосіб, не пов'язаних безпосередньо з системою Pagerank.
5. Важливість сторінки може бути зменшена у спосіб, не пов'язаних безпосередньо з системою Pagerank, проте її посилання також отримають свій штраф.

Залишити коментарій