Дэнни Салливан в последнем выпуске Search Engine Update описывает многочисленные случаи повышенного ранжирования в результатах поиска страниц сайтов, попавших в базу Альтависты с помощью программы Trusted Feed. Напомню, что участие в программе Trusted Feed позволяет сайтам еженедельно предоставлять список страниц, снабженных описанием в формате XML, при этом страницы безоговорочно включаются в базу, никак не выделяются в результатах поиска, индексация текста самих страниц не производится. Т.е., поисковик считает такую страницу поступившей из надежного источника и включает ее в базу, используя представленную информацию для ранжирования и вывода описания страницы. Салливану удалось найти довольно много примеров, подтверждающих его догадку о преимуществах, получаемых такими страницами в результате участия в программе Trusted Feed. Во-первых, это возможность попадания в базу динамически генерируемых страниц. Во-вторых, намного легче экспериментировать с такими страницами - гарантировано еженедельное обновление результатов. Но это лишь очевидные выгоды. В качестве примера приведены страницы портала Buy.com, встречающиеся в результатах поиска по запросам “saturday night live”, “tape media” и “marine life”. Таких страниц в обычном случае на сайте портала не существует - это результаты поиска самого портала по указанным запросам. При этом пользователь попадает на страницу http://www.buy.com/clickfrom/searchengine.asp?sURL=/retail/searchresults.asp%3Fquerytype=home%26qu=, где после ‘qu=’ следует текст запроса, а тэги title, description, keywords и body содержат однотипный текст+текст запроса. Т.е. страница генерируется динамически, в зависимости от нужного запроса. Салливан называет эти страницы типичными дорвеями, и, в принципе, он прав. Всем основным признакам дорвея они отвечают. Представители Altavista, разумеется, отрицают наличие какого-либо преимущества от участия в Trusted Feed. Главный разработчик системы, Ян Педерсен, называет это скорее проблемой поиска, чем злым умыслом. “Это больше отражает наши проблемы со смешиванием этого контента с результатами нормального индексирования, чем политику компании”, - говорит он. Проблемы смешивания заключаются, например, в определении link popularity для этих страниц. Поскольку они не находятся по ссылкам с других страниц, такой параметр для них рассчитать попросту невозможно. Он определяется на основании аналогичного параметра сайта, где они находятся, с некоторым уменьшением, поскольку речь идет о внутренних страницах сайта. Впрочем, и сам Салливан не видит ничего особенно плохого в том, что на вершине результатов поиска по коммерческим запросам находятся явно коммерческие страницы. Учитывая, что результаты поиска по тем же запросам в Google довольно похожи на таковые в Альтависте, стоит сделать вывод о реальной ценности таких страниц. Полная версия статьи доступна подписчикам Search Engine Watch.
356 Прочтений • [Интересный способ заспамить Altavista] [20.04.2012] [Комментариев: 0]