Зная, как это работает, и что Google в некоторых случаях воздействует на результаты PageRank, мы в состоянии решить, что именно Google может делать.
Перед тем как начинаем вычислять PageRank, предположим, что ссылки некоторого сайта особенно хорошие. Скажем, страница B — это страница на Yahoo или DMOZ (каждый из которых демонстрирует этот вид воздействия); вместо установки их начальных значений в 1 мы можем установить их в 100 или большее число. 9 Делая это, мы предполагаем, что Google незначительно изменяет веса PageRank, зависящие от этой страницы.
Мы можем проделать обратное, только в меньшей степени. Предположим, что страница B признана спамом. Если мы установим начальное значение веса PageRank в ноль, то ее вес вначале не будет иметь никакого влияния, но станет вскоре получать влияние, пока будут существовать сайты, ссылающиеся на нее.
Имейте это в виду: в PageRank мы можем легко увеличить важность ссылок страницы, сделав их настолько важнее, насколько мы хотим, однако, обратное не верно — PageRank значительно препятствует возможности уменьшить важность ссылок страницы. 10
Это, как раз то, что происходит с сайтами, зарегистрированными в Yahoo и DMOZ. Каждая страница Yahoo и DMOZ, кажется, имеет увеличенный вес, поэтому сайты, зарегистрированные в этих двух каталогах получают славное небольшое увеличение веса PageRank.
Так вот, разве не могли они корректировать вес PageRank страницы B после каждой итерации вычислений? Да, они могли, но Google работает с миллионами страниц [уже с миллиардами — прим. А. С.], и должен был бы корректировать вес всех подобных страниц каждый раз. Это сделало бы алгоритм оччеееенннннь оччеееенннннь медленным.
А как насчет установки веса PageRank после всех вычисления и получения конечных весов страниц? Да, они могут и, несомненно, делают это. Однако, это имеет большее отношение не к обработке ссылок, а к изменению индивидуальных результатов. Предположим, что главная страница Google недостаточно высока для Google. Они могут просто изменить это. Или если страницы результатов поиска Google имеют PageRank, они могут просто это убрать. Это шаг после обработки данных.
Заметьте, однако, что есть небольшая особенность в применении Гуглом этого метода для исключения спамеров из индекса. Не полагайте, что если ваш вес PageRank внезапно стал равен нулю, то Google использовал данный метод для обнуления веса. Намного легче всего лишь запретить страницу целиком. Запрещение также более логично, потому что оно убирает влияние, которое, в противном случае, ваша страница получит в процессе вычисления PageRank. Нулевой вес PageRank, в большинстве случаев, появляется из-за других факторов, таких как проблема временных вычислений.
Что это все означает?
Вес PageRank — самый трудный для манипулирования фактор при оптимизации страниц. Хотя его влияние не так велико, как верят некоторые, если вы можете понять его правильно, то вы имеете достаточно хорошее преимущество перед вашими конкурентами. Вес PageRank трудно как получить, так и удержать. Нижеприведенная информация действительно доводит это до крайней степени. На практике вы могли использовать все или часть, в зависимости от того, насколько конкурентоспособным вы себя чувствуете, и того, насколько сильна конкуренция.
Есть три основных области, которые стоит осмотреть и, возможно, изменить, когда вы пытаетесь оптимизировать ваш вес PageRank:
Страницы, которые вы выбираете для получения ссылок на вас, т. е. какие из них вы отбираете и как много усилий тратите на получение ссылок.
Те, кого вы выбираете, чтобы сослаться на них со своего сайта, и на какой странице вашего сайта вы помещаете их ссылку.
Внутренняя навигационная структура и связи ваших страниц — с целью создания максимальной обратной связи PageRank.
Ссылки на ваш сайт
Когда вы ищете ссылки на ваш сайт, с точки зрения исключительно PageRank можно подумать, что следует просто искать страницы с самым высоким Тулбаровским весом PageRank. (В то же время держа в уме, что каждая страница сайта имеет свой собственный вес PageRank, поэтому вы должны рассмотреть вес «страницы ссылок», или какой бы то ни было страницы, где будет расположена фактическая ссылка.) Однако, эта точка зрения некорректна. Если вы не перепрыгнули прямо в этот раздел, то вы, вероятно, определите, почему это так. Вес PageRank, получаемый с ссылкой, намного сложнее, чем это упрощение. Мог быть случай, когда это было приемлемым приближением… но не больше. По мере того как все больше и больше людей пытаются и получают ссылки только с сайтов с высоким значением веса, это становится все менее и менее выигрышным предложением.
Настоящий вес PageRank отдельной страницы делится среди ссылок на этой странице (помните расчеты MiniRank?) Поэтому, ссылки со страниц, которые имеют одинаковый вес PageRank, не всегда созданы равными. Это зависит от того, со сколькими ссылками делит ссылающуюся страницу ваша ссылка. Например, ссылка со страницы с весом PageRank 4 может быть лучше, чем ссылка со страницы с весом PageRank 6, если на странице с PR 4 меньше общее число ссылок. Возможно, что страница с PR 2 может даже быть лучше для просьбы о ссылке, чем страница с PR 7. В данный момент недостаточно доступной информации, чтобы узнать, до какой степени это простирается. Однако, это достаточно значимо, чтобы было бессмысленно просто выбирать сайты с большим весом в качестве основной стратегии получения ссылок. Есть также другая, более прозаичная причина, почему эта стратегия получения ссылок может быть не лучшей; сайты с высоким весом PageRank часто разборчивы в том, на какие сайты ставить ссылку, что делает получение ссылки с них более трудным, чем с сайтов с низким весом. Однако, сайтам, сражающимся со своими числами весов PageRank, следует быть более восприимчивыми к обмену взаимными ссылками с другими сайтами.
Сейчас давайте рассмотрим обратную связь. Предположим, например, что есть две самостоятельных страницы на сайтах других людей, каждая из которых имеет вес PageRank 4. Обе страницы имеют по 10 ссылок на другие страницы. Но ваша страница, на которую вы хотите получить с них ссылки, уже имеет ссылку на страницу на втором сайте. Получая ссылку со второго сайта, вы порождаете обратную связь, и получаете больший вес PageRank, чем если бы получили ссылку с первого сайта! Это чрезмерное упрощение; фактически, циклы обратной связи могут стать даже более сложными. Помните, что число ссылок на странице, ссылающейся на вас, будет менять величину обратной связи, и т. д.
Можете ли вы вычислить все это для заданной страницы? Нет — и я не могу. Мой совет, поэтому, таков — получайте ссылки с сайтов, которые кажутся подходящими и имеют хорошее качество, независимо от их текущего веса PageRank. Если они релевантны вашему сайту, и сами высококачественные сайты, они либо помогут вашему весу PageRank сейчас, либо сделают это в будущем. Чтобы на самом деле сделать ваш вес PageRank классным, зарегистрируйтесь в DMOZ и Yahoo с целью воспользоваться искусственно увеличенным весом, который они обеспечивают.
Ссылки с вашего сайта
Чтобы рассмотреть наилучшую стратегию простановки ссылок с сайта, вначале нам нужно рассмотреть ссылки, указывающие на
ваш сайт. Под этим я подразумеваю, что нам надо предположить, что у вас есть ссылки, указывающие на ваш сайт из каталогов, подобных DMOZ и Yahoo, которые дают ему небольшое славное приращение веса PageRank. Используя внутренние страницы сайта, вы можете управлять обратной связью значительно лучше, чем используя ссылки на внешние страницы. Это приводит к правилу…
В общем случае, вам будет нужно сохранить вес PageRank внутри вашего сайта.
Это означает, что вам нужно будет ссылаться наружу только со страницы вашего сайта, которая имеет низкий вес PageRank, и которая также содержит значительное число внутренних ссылок (т. е. ссылок, указывающих на другие страницы вашего сайта).
Итак, когда вы ставите ссылку наружу, вы отдаете предпочтение тем страницам, которые либо ссылаются на ту страницу вашего сайта, которая находится страницей выше ссылочной страницы [например, если внешняя страница A ссылается на вашу страницу B1, которая, в свою очередь, ссылается на вашу страницу B2, на которой и расположена ссылка на внешнюю A — прим. А. С.], либо которые ссылаются на ту страницу, которая ссылается на страницу, ссылающуюся на вашу ссылочную страницу [A -> B1, B1 -> B2, B2 -> B3, B3 -> A — прим. А. С.] (т. е. вы получите большее увеличение веса PageRank, если ссылки со внешних сайтов не указывают на вашу ссылочную страницу).
Как мы можем осуществить это? Одним способом будет написание обзоров сайтов, на которые мы ссылаемся, на отдельной странице нашего сайта, и обеспечение ссылки на эти обзоры вместе с каждой гиперссылкой на внешний сайт. Необязательно, но будет неплохо, если эти страницы будут открываться в другом окне но НЕ ДЕЛАЙТЕ это на JavaScript, потому что роботы поисковых систем не могут следовать по ссылкам на JavaScript.
Например, мы можем сделать что-то подобное с каждой ссылкой на внешний сайт:
Search Engine Systems — это лучшие в мире поисковомашинные существа Читайте мой хвалебный обзор здесь.
Проверьте, что страница обзоров ссылается назад на страницу, которая находится выше в структуре вашего сайта. (Лучше всего, если это будет ваша главная страница, но любая важная страница также подойдет.) Сделав это, мы значительно сократили количество веса PageRank, которому вы позволяете покинуть сайт, и обеспечили, что большая часть веса PageRank, которая остается, также увеличивается эффектом обратной связи! Мы нацелили эту обратную связь на главную страницу, чтобы гарантировать, что меньше веса передается назад вашей ссылочной странице (что было бы упущенной возможностью), и больше остается где-либо на вашем сайте. На вашей ссылочной странице также нужно поставить ссылки на главную страницу и другие значимые страницы сайта. Однако, не ставьте других ссылок на странице с обзором (кроме ссылки на главную страницу). Очень хорошо, если кто-то ставит ссылку на вашу страницу с обзором, поэтому, вдобавок, вы можете дать знать сайту, что вы рецензировали его — вполне возможно, что вы получите две ссылки с этого сайта (одну на ваш сайт и одну на обзор чужого сайта). Все очень трудно для понимания в текстовой форме, поэтому давайте займемся упрощенным примером, чтобы показать принцип и продемонстрировать его действие.
9 Как уже было сказано в примечании 8, оригинальный алгоритм PageRank не добавляет новый вес, вычисленный на предыдущей итерации, к старому, а заменяет им старый вес. Следовательно, какой бы начальный вес мы ни задавали страницам, это лишь увеличит время работы алгоритма на несколько итераций, но результат будет тем же самым. Утверждение Криса верно лишь для его упрощенного алгоритма MiniRank, который неприменим в поисковиках. Дело в том, что у MiniRank отсутствует сходимость, т. е. в работе алгоритма нет такой точки, когда можно сказать, что значения весов страниц на данной итерации вычислены с нужной точностью. Он будет работать вечно. Поэтому, воздействие на вес сайта невозможно до начала работы алгоритма PageRank.
Если коррекция все-таки происходит, есть два очевидных способа ее осуществления. Первый — корректировать веса нужных страниц на каждой итерации. Но как? Устанавливать в фиксированное значение? Какое? Или увеличивать пропорционально реальному весу? Мало того, что такие действия замедлят работу алгоритма, так еще неизвестно, как это повлияет на его сходимость. Второй способ — корректировать вес нужных страниц после окончания работы алгоритма — тоже не подходит, потому что тогда теряется суть идеи — увеличение веса хороших сайтов, которые, в данном случае, являются сайтами, вручную проверенными командами Yahoo и DMOZ, за счет поднятия веса самих каталогов.
Однако, есть еще менее очевидный способ, который позволяет не только поднять вес Yahoo и DMOZ, но и сохранить идеологию PageRank (вес страницы — это вероятность посещения ее пользователем). Его предложил
Марк Хоррэл (Mark Horrell). Существует понятие висящих ссылок (dangling links) — это такие ссылки, которые указывают на страницы, не содержащие ни одной ссылки. Они мешают работе алгоритма, потому что неясно, как должен распределяться вес таких страниц. Согласно оригинальному PageRank, эти ссылки просто убираются до начала вычислений, и возвращаются после их окончания. Так вот, Марк предположил, что, вероятно, ссылки могут не убираться, а просто их вес направляется на хорошие сайты (Yahoo, DMOZ). Например, таким образом, как если бы на тупиковых страницах было лишь две ссылки — на эти каталоги. Если вдуматься, то это очень логично. Логично с точки зрения пользователя — попав на страницу, где нет ни одной ссылки, куда он перейдет? Скорее всего, наберет в браузере адрес какого-либо хорошего сайта. А ведь именно таким сайтам оказывается поддержка за счет увеличения веса каталогов! Логично с точки зрения поисковика — мы избегаем нескольких лишних итераций алгоритма (на убирание висящих ссылок и их восстановление). Вполне может быть, что Марк набрел на истину. [Прим. А. С.]
Назад к тексту
10 Под словами «мы можем» автор имеет в виду «Google может», точнее, это по силам тому, кто способен воздействовать на реализацию алгоритма PageRank в конкретном поисковике. [Прим. А. С.]
Назад к тексту
815 Прочтений • [Растолкованный PageRank, часть 4] [20.04.2012] [Комментариев: 0]