Добавить в цитаты Настройки чтения

Страница 20 из 35

Вот почему нередко бывает ситуация, что поисковая машина по запросу результат выдает, а попытка перейти на страницу по ссылке, полученной в ответ на запрос, безрезультатна – ее может уже просто не быть на прежнем месте, но паук на нее давно не заходил, поэтому поисковая система об удалении страницы не знает. Весь комплекс процессов, описанных выше, называется индексацией.

Описание языков запросов различных поисковых машин

Умение искать информацию с помощью поисковых машин очень важно для создания и последующей раскрутки блога.

Благодаря поисковым машинам можно своевременно собирать информацию, появляющуюся в Интернете по теме, которой посвящен блог. Это, в свою очередь, дает возможность своевременно прокомментировать ситуацию и разместить на своем блоге готовый материал, предложив его вниманию читателей. Важно, что язык запросов поисковой машины работает не только при поиске во всем Интернете, но и при поиске по блогам и форумам, что значительно расширяет возможности блоггера. Несмотря на то, что принципы языка современных поисковых машин действительно одинаковы, синтаксис запросов у них различен. Некоторые операторы языка запросов универсальны, но большинство – нет.

Рассмотрим языки запросов трех основных поисковых машин, работающих с русскоязычными текстами, более подробно.

Поиск в Яндексе

Лучшая, на наш взгляд, работа по изучению операторов поисковой машины Яндекс, выполнена специалистом из Санкт-Петербурга Денисом Фурсовым. На его блоге в статье «Хозяйке на заметку. Поиск через Яндекс для специалистов»[19] постоянно публикуются результаты исследований, отслеживаются, оцениваются и обсуждаются изменения в работе операторов поисковой машины Яндекс (рис. 22).

Рис. 22. Внешний вид страницы «Хозяйке на заметку. Поиск через Яндекс для специалистов»

Ниже речь пойдет о том, как с помощью специальных фильтров, основанных на булевой алгебре, создавать запросы, максимально соответствующие потребностям специалиста, который ищет информацию в Интернете. При изучении этого вопроса не следует забывать, что компьютер очень исполнителен, но лишен способности думать, поэтому следует составлять запрос исходя из того, что он будет обработан буквально, а не с учетом того, что же на самом деле имел в виду пользователь, создавая обращение к поисковой машине. Лучше всех эту мысль проиллюстрировал летом 2005 года Алексей Амилющенко, главный аналитик отдела маркетинга Яндекса, на таком примере.

Вот еще одна история с семинаров, но ее приходится рассказывать не очень часто. Иногда случается, что заходит разговор о том, что хорошо бы поисковым системам учитывать не только слова, которые есть в индексируемых документах, но и смысл написанного. В ответ говорю, что знаю фразу, про которую и человек-то не скажет, о чем это. Вот она: «Эти типы стали есть в прокатном цехе». И что тут написано? Я вижу минимум три смысла. Не подглядывайте в ответ сразу (он ниже). Попробуйте сначала самостоятельно… Обычно, когда зал видит это предложение, сначала становится тихо (видно, что думают), потом начинаются смешки (до кого-то дошло). Потом хихикают уже все. Но к делу, что же здесь все-таки написано?

1. Скучный такой вариант: «Эти типы стали (варианты металлопроката) есть (имеются в наличии) в прокатном цехе».

2. Более творческий, с элементами мизантропии: «Эти типы (неприятные автору личности) стали (начали) есть (принимать пищу) в прокатном цехе».

3. Несколько надуманный, конечно, и тем не менее: «Эти типы стали (варианты металлопроката) есть (надлежит принимать в пищу) в прокатном цехе».

Вот видите, даже протеиновые мозги не справляются, а вы хотите, чтобы силиконовые умели[20].

Текст запроса мы будем помещать в квадратные скобки для того, чтобы визуально его выделить. Если уважаемый читатель решит ввести приведенные ниже запросы в поисковую строку поисковой машины, чтобы проверить их работоспособность на практике, то эти квадратные скобки вводить не надо.

Итак, перейдем непосредственно к операторам запросов Яндекса.

Логическое «И». Яндекс поддерживает три разных оператора, относящихся к логическому «И», что делает его самым гибким из всех поисковиков, работающих с русским языком. Столь развитая, практически уникальная, система операторов поисковых запросов дает возможность предельно точно настроить запрос и сформировать такой фильтр для данных в Интернете, который максимально качественно выбирает нужную информацию и отсекает ненужную.

Пробел. Слова, разделенные пробелом, должны быть недалеко друг от друга.

Специалисты поясняют, что термин «недалеко» фиксированной величиной не является и меняется в зависимости от того, с какими словами оператор «пробел» в каждом конкретном случае используется.

Если слова часто употребляемые, то «недалеко» – значит на расстоянии нескольких слов друг от друга. Если слова редко встречаются в обиходе, то даже их нахождение в разных концах документа будет восприниматься как «недалеко».

При этом, несмотря на то, что логическое «И» в общем виде булевой алгебры подразумевает присутствие всех упомянутых слов, Яндекс тем не менее действительно выдает сначала те документы, в которых есть все ключевые слова, упомянутые в запросе. Но после этого он дает и те, в которых содержатся не все ключевые слова.

На наш взгляд, сказанного об операторе «пробел» достаточно, для того чтобы решать основные проблемы, связанные с поиском в Интернете. Но на самом деле решение вопроса о том, что такое «не очень далеко» и «очень далеко», с точки зрения Яндекса, вопрос не простой, и для полного его понимания мы вновь рекомендуем держать в поле зрения статью Дениса Фурсова.

Мы еще неоднократно обратимся к этому замечательному руководству.

ПРИМЕР

Запрос: [маркетинг менеджмент]



Результат поиска: страниц – 7 174 687, сайтов – не менее 2070, в каталоге – 57.

В выдаче: менеджмент и маркетинг в бизнесе.

Амперсанд (&). Слова, разделенные амперсандом, находятся в одном предложении.

Внимание! Амперсанд должен быть отделен пробелами с двух сторон от любых других слов.

ПРИМЕР

Запрос: [маркетинг & менеджмент]

Результат поиска: страниц – 2 628 927, сайтов – не менее 1670, в каталоге – 53.

В выдаче: Маркетинг Менеджмент: Главная 2006 «Маркетинг Менеджмент».

Двойной амперсанд (&&). Слова, разделенные двойным амперсандом, находятся в любом месте одного и того же документа.

ВНИМАНИЕ! Между амперсандами не должно быть пробелов, но сам оператор должен быть отделен пробелами с двух сторон от любых других слов.

ПРИМЕР

Запрос: [маркетинг && менеджмент]

Результат поиска: страниц – 9 665 609, сайтов – не менее 1948, в каталоге – 57.

В выдаче будут присутствовать, например, учебные планы вузов, в которых слова «маркетинг» и «менеджмент» находятся в разных частях текста, в том числе на разных страницах опубликованного в Интернете многостраничного плана занятий.

Чтобы наглядно это увидеть, мы рекомендуем читателям нажать в результатах выдачи гиперссылку «Сохраненная копия», которая есть под каждым результатом поиска. В этом случае слова, которые есть в запросе, будут подсвечены в тексте и сократится время на их поиск.

Логическое «НЕ». Логическое «НЕ» представлено двумя операторами. Прежде чем рассказать о них, отвечу на вопрос, который часто возникает у людей, впервые приступивших к изучению операторов поиска. Они говорят: «Зачем нужно логическое “НЕ”? Можно ведь просто его не вводить, и тогда оно нам не понадобится!» Ответ таков: «Если мы сами решаем, что нам вводить, а что нет, то это утверждение справедливо. Но проблема в том, что обычно в выдаче принудительно оказывается “мусор”, и часто нет другого способа избавиться от него, кроме как убрать эти слова при помощи логического “НЕ”. Так, например, если вас интересует конек крыши, то по слову “конек” в выдаче будут и роликовые, и фигурные коньки, и даже Конек-Горбунок. Для них-то логическое “НЕ” и придумано». Итак, перейдем к двум оператором логического «НЕ» в Яндексе.

19

Фурсов Д. Хозяйке на заметку. Поиск через Яндекс для специалистов // www.community.livejournal.com/kubok/45852.html

20

www.company.yandex.ru/blog/index.xml?&msg=100030&month=8