Возможно вы искали: 'Catz 5'

May 10 2025 03:06:55
  • Как сделать 8Gamers.Ru домашней страницей?
  • Игры
    • База данных по играх
    • Игровые новости
    • Игровая индустрия
    • Обзоры на игры
    • Прохождения игр
    • Гайды к играм
    • Превью о играх
    • Игровые тизеры
    • Игровые арты
    • Игровые обои
    • Игровые скриншоты
    • Игровые обложки
    • Игровые трейлеры
    • Игровое видео
    • Вышедшие игры
    • Ближайшие релизы игр
  • Кино и ТВ
    • База данных по кино
    • Статьи о кино
    • Постеры
    • Кадры из кино
    • Кино трейлеры
    • Сегодня в кино
    • Скоро в кино
  • Комиксы и манга
    • Манга по алфавиту
    • База данных по комиксах
    • Читать онлайн комиксы
    • Читать онлайн манга
    • База персонажей
  • Читы и коды
    • Чит-коды для PC игр
    • Чит-коды для консольных игр
    • Трейнеры
    • Коды Game Genie
  • Моддинг
    • Модификации
    • Карты к играм
    • Программы для моддинга
    • Статьи о моддинге
  • Геймдев
    • Всё о создании игр
    • Список движков
    • Утилиты в помощь игроделу
    • Конструкторы игр
    • Игровые движки
    • Библиотеки разработки
    • 3D-модели
    • Спрайты и тайлы
    • Музыка и звуки
    • Текстуры и фоны
  • Рецензии
    • Игры
    • Кино
    • Аниме
    • Комиксы
    • Мангу
    • Саундтреки
  • Саундтреки
    • Лирика
  • Файлы
    • Патчи к играм
    • Русификаторы к играм
    • Сохранения к играм
    • Субтитры к кино
  • Медиа
    • Видео
    • Фото
    • Аудио
    • Фан-арты
    • Косплей
    • Фото с виставок
    • Девушки из игр
    • Рисунки
    • Рисуем онлайн
    • Фотохостинг
  • Юмор
    • Анекдоты
    • Афоризмы
    • Истории
    • Стишки и эпиграммы
    • Тосты
    • Цитаты
  • Флеш
    • Азартные
    • Аркады
    • Бродилки
    • Гонки
    • Для девочек
    • Для мальчиков
    • Драки
    • Квесты
    • Леталки
    • Логические
    • Мультфильмы
    • Открытки
    • Приколы
    • Разное
    • Спорт
    • Стратегии
    • Стрелялки
Статистика

Статей: 87772
Просмотров: 95968184
Игры
Injustice:  Gods Among Us
Injustice: Gods Among Us
...
Dark Souls 2
Dark Souls 2
Dark Souls II - вторая часть самой хардкорной ролевой игры 2011-2012 года, с новым героем, сюжето...
Battlefield 4
Battlefield 4
Battlefield 4 - продолжение венценосного мультиплеер-ориентированного шутера от первого ли...
Кино
Steins;Gate
Steins;Gate
Любители японской анимации уже давно поняли ,что аниме сериалы могут дать порой гораздо больше пи...
Ку! Кин-дза-дза
Ку! Кин-дза-дза
Начинающий диджей Толик и всемирно известный виолончелист Владимир Чижов встречают на шумной моск...
Обзоры на игры
• Обзор Ibara [PCB/PS2] 18339
• Обзор The Walking ... 18780
• Обзор DMC: Devil M... 19858
• Обзор на игру Valk... 15864
• Обзор на игру Stars! 17746
• Обзор на Far Cry 3 17928
• Обзор на Resident ... 16008
• Обзор на Chivalry:... 17490
• Обзор на игру Kerb... 17965
• Обзор игры 007: Fr... 16596
Превью о играх
• Превью к игре Comp... 17940
• Превью о игре Mage... 14444
• Превью Incredible ... 14702
• Превью Firefall 13455
• Превью Dead Space 3 16321
• Превью о игре SimC... 14709
• Превью к игре Fuse 15425
• Превью Red Orche... 15528
• Превью Gothic 3 16329
• Превью Black & W... 17338
Главная » Статьи » Разное » Евгений Трофименко на NetPromoter '09: Использование особенностей языка запросов поиска Яндекса для исследований

Евгений Трофименко на NetPromoter '09: Использование особенностей языка запросов поиска Яндекса для исследований

Евгений Трофименко, начальник отдела исследований и аналитики корпорации РБС, тема доклада: Использование особенностей языка запросов поиска Яндекса для исследований Доклад Евгения состоял из трех частей: - особенности работы операторов исключения, особенности отработки контекстных ограничений - результаты мониторинга “прямого эфира” Яндекса - возможности использования поисковых операторов для мониторинга изменений алгоритма Яндекса Оператор минут не применяется к текстам ссылок. оператор ~~ вычищает нпс-результаты из выдачи можно узнать, как Яндекс расширяет запрос пользователя, особенности контекстных ограничений Оператор присутствие + (плюс) - слово обязано находиться Операторы исключения: ~~ (тильда) исключение в пределах документа; ( ~ предложения) - недокументированный: был исключением в контексте Возможный контекст поиска? документ (текст), предложение (текст) ссылки (анкор-файл) расстояние в несколько слов или предложений, явно указанных операторами /(-N +N) или &&/(-N +N) Поиск точно знает, что есть и чего нет в тексте страницы поиск не уверен, что знает абсолютно все тексты ссылок поиск работает и по текстам, и по ссылкам поэтому при исключении слов у поиска два варианта: исключать то, что есть в тексте страницы и искать по тексту ссылок “не знать” о его существовании - оператор “минус”- оставляем нпс делать вид, что ссылок не существует “~~” - исключаем нпс Запрос : что найдем? слово - документы, содержащие слово в текстах или во входящих ссылках -слово - исключаются документы, которые содержат слово в тексте В итоге остаются - найденные по ссылкам документы (сниппет может быть из Я.Каталога) Для чего это полезно: как эксперимент, для поиска ссылок с конкретными словами Добавляя в любой запрос исключение ~абракадабры, удаляем нпс Полезно, для оценки доли найденных по ссылке в выдаче. [слово-слово]: удаляет найденные по ссылкам результаты, все - по данному запросу Расширение пользовательских запросов Яндекс всегда мог переформулировать запросы (колдунщик), но редко это делал. Сейчас это происходит в потоке. гостиницы в Москве - Московские гостиницы mazda - мазда МГУ - московский государственный университет при исключении слова из запроса - в выдаче остаются и подсвечиваются переформулировки (+ найденное в урл) слова запроса - слово - оставляет смесь переформулировок и нпс слово запроса ~~!! (слово) - РАБОТАЕТ Правда, работает индивидуально: разный результат гостиницы в москве —> гостиницы москвы (переколдовывает) гостицы Москвы —> гостиницы в Москве (НЕ РАБОТАЕТ) Кондунщик - расстановка неявных для пользователя ограничений на расстояние между словами, известен с 2004 года При поиске новый год - (от 1 +3 расстояние год новый до “новый [*][*] год” По статистике запросов РБС - перебираем и смотрим как узнать реальные ограничения на расстояние между словами. Вывод: перебор вариантов не дает результатов. Выдача по непереколдованному запросу - отличается. Контекстные ограничения в Яндексе. В релизе Магадан сказано, что смягчили фильтрацию отбора документов, которая дает возможность найти слова запроса, находящиеся далеко друг от друга. Берем +новый +год, оба должны находиться. ~~ (+новый&+год), исключаем результаты поиска, в которых слова находятся “слишком близко”. Смотрим, как меняется число найденных документов и надеемся, что постепенно при увеличении расстояния оно станет нулевым тогда, когда расстояние совпадает с расстоянием в заколдованном запросе… Число результатов “далее, чем” - находятся документы даже с расстоянием до 1000 предложений! Точное количество найденных документов смотрим через Яндекс.XML Из документации Яндекса phrase - число документов с буквальным соответствием запросу strict - число документов с вхождением всех слов запроса в ИСКОМЫЙ КОНТЕКСТ all - общее число при strict - есть ноль Вывод: Яндекс внутри своих алгоритмов знает, что контекстное ограничение существует и он может их показать. Сейчас в пределах 7 предложений, но не везде. Вопрос в том, что это за релевантность strict, зачем она нужна? пример: нпс - результат в котором очень большое расстояние между словами отдельная ссылка с одним из двух слов если смотреть xml, то видно только 1 ссылка с приоритетом all Вывод : есть контекст all - в который запихивают всякую чепуху, и его выдают в выдачу. Такой результат можно найти в разных запросах. Статистика использования операторов в поиске Яндекса: Пробуем регулярно пробивать прямой эфир и искать неправильные символы - смотрим, примерно 300 результатов. 50% - это ошибки, далее - поиск дублей, операторы других поисковых сиситем и исследования (великих людей). В будущем может быть по-другому. ошибки - * перед доменом перед кавычкой + фраза в кавычках - 15% site: url: Не всегда понятно, что хотели люди, но посмотреть очень интересно Например, часть запросов говорит о: поиск главного домена + ты последний сбор форумов сбор баз переформулировок мониторинг мониторинг телефонов - ограничение по расстоянию Самое интересное: отсутствие в прямом эфире результатов пробивки проиндексированности url=”domain/path” при этом операторы domain rhost присутствуют Вопрос: почему результаты проверки из сапы не видны? Ответ: возможно, из-за того, чтобы задавить и не искажать статистику Директа. Но это в лучшем случае, а в худшем… Анализ и мониторинг алгоритма Существуют вечные основные запросы современности? Влияет ли тиц на выдачу? Почему Википедия рулит всех? мало пассажей в результате - к чему релевантность - страницы или сайта и так далее Пробуем анализировать: Составим группы запросов, разбитые по числу слов в запросе и посмотрим, как именно изменяются средние по больнице параметры во времени. То есть, мы понимаем, что тиц на выдачу не влияют - но вдруг, он как то влияет на самом деле - а мы не замечаем? Как отличить апдейт от релиза, если мы анализируем по базе документов? Как взвешивать параметры? - по принципу видимости - больше место - ниже вес - сумма видимости по топ 50 равна 1 - сумма весов 1-10 вдвое выше 11-20 WT (pos) =0.074*2^(-pos/10) 03 марта Яндекс почистил выдачу и удалил большое число дублей Результат - сократилось число индексации страниц старых сайтов Смотрим дальше: взвешенный тиц в районе 3 числа - сначала резко подскочил, а потом упал, причем значительно. А по операторам domain и rhost - взвешенный тиц не менялся. Вывод: взвешенные параметры - очень хороший инструмент для анализа, ну и тиц на выдачу не влияет, но как-то связан. Вопрос - какая польза РБС от таких исследований? Ответ - исключения в принципе полезны, но пока все это не нужно; если что, мы можем понимать, как и что изменилось в выдаче, находить новые операторы, понимать, как изменился алгоритм. Обзор подготовила Катерина Баукина
639 Прочтений •  [Евгений Трофименко на NetPromoter '09: Использование особенностей языка запросов поиска Яндекса для исследований] [20.04.2012] [Комментариев: 0]
Добавил: Ukraine Vova
Ссылки
HTML: 
[BB Url]: 
Похожие статьи
Название Добавил Добавлено
• Евгений Трофименко на NetPromoter '... Ukraine Vova 20.04.2012
Ни одного комментария? Будешь первым :).
Пожалуйста, авторизуйтесь для добавления комментария.

Проект входит в сеть сайтов «8Gamers Network»

Все права сохранены. 8Gamers.NET © 2011 - 2024

Статьи
Рецензия на Pressure
Рецензия на Pressure
Чтобы обратить на себя внимание, начинающие маленькие разработчики, как правило, уходят в жанры, ...
Рецензия на Lost Chronicles of Zerzura
Рецензия на Lost Chron...
Игры, сделанные без любви и старания, похожи на воздушный шар – оболочка есть, а внутри пусто. Lo...
Рецензия на The Bridge
Рецензия на The Bridge
«Верх» и «низ» в The Bridge — понятия относительные. Прогуливаясь под аркой, можно запросто перей...
Рецензия на SimCity
Рецензия на SimCity
Когда месяц назад состоялся релиз SimCity, по Сети прокатилось цунами народного гнева – глупые ош...
Рецензия на Strategy & Tactics: World War 2
Рецензия на Strategy &...
Название Strategy & Tactics: World War II вряд ли кому-то знакомо. Зато одного взгляда на ее скри...
Рецензия на игру Scribblenauts Unlimited
Рецензия на игру Scrib...
По сложившейся традиции в информационной карточке игры мы приводим в пример несколько похожих игр...
Рецензия на игру Walking Dead: Survival Instinct, The
Рецензия на игру Walki...
Зомби и продукция-по-лицензии — которые и сами по себе не лучшие представители игровой биосферы —...
Обратная связь | RSS | Донейт | Статистика | Команда | Техническая поддержка