Добавить в цитаты Настройки чтения

Страница 32 из 65

Обратите внимание, что сайты ранжированы по статистике посещаемости, то есть наиболее популярные сайты в списке идут первыми. После названия сайта идет его краткое описание, впрочем не страдающее полнотой информации. Название сайта – это гиперссылка, каждую из которых лучше открывать в новой вкладке, чтобы результаты поиска оставались неприкосновенными, ведь вам к ним нужно будет возвращаться, чтобы открыть новую ссылку. Создайте в Закладках папку Работа и поместите туда закладки сайтов, которые вы планируете посещать в дальнейшем. Практика показывает, что наиболее посещаемых и, следовательно, наиболее полезных с точки зрения поиска информации сайтов в каждой данной рубрике немного. Посмотрите, как снижается посещаемость хотя бы в первой десятке сайтов поиска работы: если у первого в списке 25,5 тыс. посетителей, то у десятого (его на картинке не видно) менее 4 тыс.

Рис. 3.112. Главное окно программы Rambler

Для интересующихся подробностями несколько определений.

Хост – это уникальная пара IP-адреса и IP-адреса прокси-сервера (если посетитель им пользуется). Уникальность сохраняется в течение одного дня, недели или календарного месяца – в зависимости от типа предоставляемой статистики. Новым считается уникальный хост, с которого еще не было зарегистрировано ни одного посещения с начала текущего календарного месяца.

Визит – это загрузка посетителем страницы сайта, на которой установлен счетчик.

Счетчиками называются крохотные программы, которые устанавливаются на Web-страницах и ведут подсчеты посещаемости.

Посетители – считаются по количеству файлов cookie, которые выдаются каждому посетителю. Если в браузере посетителя отключен прием cookie, то посетитель сайта не засчитывается.

Рис. 3.113. Результаты поиска

Наибольшее распространение в Интернете получил второй вид поисковых служб – С автоматическим обновлением каталогов. В основе каждой такой службы лежит использование программы-«паука», которая постоянно «ползает» по паутине Internet и автоматически собирает информацию о страницах. На самом деле таких «пауков» используют и Службы с ручным обновлением каталогов, только для решения другой задачи. Там они проверяют а не устарело ли содержимое сайтов, занесенных в базу. Если, например, какая-то вакансия закрывается, то ее податель удаляет ее с сайта, а ссылка на нее в базе останется, создавая и работодателям и соискателям кучу лишних проблем. Чтобы их не возникало, робот-«паук», обнаружив, что ссылка в базе никуда больше не ведет, удалит ее.

На практике большинство современных поисковых систем предоставляют пользователю оба варианта поиска – на выбор, но на практике гораздо чаще пользуются поисковой службой с автоматическим обновлением каталогов.

Для поиска информации в иноязычных (обычно англоязычных) сегментах Интернета обычно пользуются иностранными поисковыми системами, такими, например, как www.yahoo.com, www.altavista.com, www.hotbot.com, и другими, но они требуют знания английского языка.

В русском сегменте Интернета можно выделить четыре наиболее популярные поисковые системы:

• Яndex (www.yandex.ru);

• русский филиал международного проекта Google (www. google.ru);

• Апорт (www.aport.ru);

• Рамблер (www.rambler.ru).





Вы можете спросить: а зачем, собственно, четыре поисковика? Достаточно и одного... Это так и не так. Во-первых, каждая поисковая система имеет свои, фирменные алгоритмы работы, поэтому, если вы попробуете поискать одно и то же разными поисковиками, результаты получатся не полностью идентичными. Иногда это оказывается весьма полезным. Во-вторых, современные поисковые системы, как правило, входят в состав так называемых интернет-порталов, которые кроме поиска предоставляют множество других услуг. Например, Яndex предлагает бесплатные почтовые ящики, показывает сводку погоды, котировки Центробанка, телепрограмму, афишу кино и многое другое (рис. 3.114). Не все, однако, знают, что некоторое поисковые системы имеют «облегченное» окно, в котором размещены только те элементы, которые необходимы для поиска. У Яndex это www.ya.ru, а у Апорта www.au.ru (рис. 3.115 и 3.116).

Рис. 3.114. Окно Яndex

Рис. 3.115. Окно Апорт-Лайт

Рис. 3.116. Окно облегченной версии Яndex

Главным элементом окна любой поисковой системы является специальное поле, куда нужно ввести запрос.

Запрос – это входное сообщение для поисковой системы, содержащее требование на выдачу информации.

Определение звучит внушительно и не очень-то понятно, но на самом деле все обстоит не так уж сложно. В самом простом случае запросом будет то, что вы хотите найти. Например, вы хотите с помощью поисковой системы Яndex узнать расстояние от Земли до Луны. Напишите в строке поиска расстояние до Луны и нажмите кнопку Найти. Через несколько секунд вы получите результат (рис. 3.117). Перейдя по первой же ссылке, на сайте www.astrolab.ru вы прочитаете, что «Луна движется вокруг Земли не по окружности, а по эллипсу, поэтому ее расстояние от Земли не остается постоянным. В среднем оно составляет 384 400 км». Задача решена. Просто, не правда ли?

Рис. 3.117. Результат поиска

На практике, однако, для поиска нужной информации нередко приходится перерыть буквально горы Web-страниц, и, чтобы сделать поиск наиболее эффективным, полезно научиться правильно составлять запросы. Американский писатель Роберт Шекли завершил свой рассказ «Верный вопрос» словами: «Чтобы правильно задать вопрос, нужно знать бo?льшую часть ответа». Это в полной мере относится к работе с поисковыми системами. Например, если вы в строке поиска напишете реферат по биологии, то Яndex выдаст вам ссылки более чем на 200 тысяч страниц. И что вы с ними будете делать? Значит, запрос должен быть максимально конкретным. С другой стороны, если вы попробуете найти «ихтиофауна реки Клязьма» (именно так как написано, в кавычках, скоро автор объяснит, зачем они нужны), вы получите нулевой результат: Искомая комбинация слов нигде не встречается. Значит, слишком детальные запросы тоже не годятся. Как же правильно составлять запросы? Давайте обсудим этот важный вопрос более подробно на примере поисковой системы Яndex.

Современные поисковые системы учитывают грамматические формы слов, составляющих запрос. Такой поиск называется морфологическим.[24] Из школьных уроков русского языка мы помним, что слова могут иметь разные формы (падежи, единственное и множественное число и т. д.). Особенность морфологического поиска состоит в том, что, в какой бы форме ни стояло слово в тексте страницы (даже отличной от формы слова в запросе), оно будет найдено. Например, если задан запрос «идти», то в результате поиска будут найдены документы, содержащие слова «идти», «идет», «шел», «шла» и т. д. На запрос «окно» будет выдана информация, содержащая и слово «окон», а на запрос «отзывали» – документы, содержащие слово «отозвали».

При выборе форм слова для поиска Яndex различает части речи. Например, если вы задали запрос «компьютер» (существительное), то будут найдены страницы со словами «компьютера» или «компьютерами», но не «компьютерный» (прилагательное).

Если вам нужно найти точную цитату, заключите текст в кавычки. Например, если вам нужно узнать, кто является автором крылатых слов «Посев научный взойдет для жатвы народной», поместите их в строку поиска в кавычках, и в первой же десятке найденных ссылок будет указано имя автора – Дмитрий Менделеев.

24

Морфология – раздел грамматики, изучающий структуру слова и его грамматические формы.