Страница 30 из 68
Коперник Десктоп больше подходит для человека, который знает, что такое Булева алгебра и которого не смущает англоязычный интерфейс.
Яндекс, на наш взгляд, за счет упрощения языка запросов настольной поисковой программы, утратил свое главное преимущество – способность составить точный поисковый запрос.
Если же пользователь не испытывает необходимости в составлении точного запроса, то Яндекс Десктоп – лучшее решение, нежели продукт Коперника, поскольку он прощает большее количество ошибок и неточностей.
Особенности фактического языка запросов обеих испытанных программ. Яндекс Десктоп:
– воспринимает слова в любой их форме, и возможности отменить процесс образования производных от исходного слова нет. Причем, не работают ни стандартный для поисковой машины Яндекс оператор «!», находящийся перед словом, ни заключение запроса в двойные кавычки;
– не проводит различий между заглавной и прописной буквами в тексте;
– ищет по целому слову, изменяя его, по фрагменту слова поиск не выполняется;
– не поддерживает функцию принудительного включения слова в результат поиска. Если из двух слов, соединенных логическим «И» в пределах текста есть только одно, этот документ все равно попадет в выдачу, даже если перед обоими словами стоит знак «плюс»;
– оператор логическое «И» внутри одного предложения («&») при этом действует;
– оператор расстояния между словами не действует;
– логическое «НЕ» существует, но всегда относится ко всему тексту (что соответствует двойной тильде «~~»);
– точная фраза (оператор «кавычки») действует;
– логическое «ИЛИ» также действует.
Коперник Десктоп:
– выдает результат в зависимости от того, с заглавной или прописной буквы написано слово. Эта зависимость исчезает, если перед словом поставить логическое «ИЛИ» (оператор OR – заглавными буквами);
– ищет информацию по фрагменту слова;
– словоформы не поддерживает. Если нужно любое производное от искомого понятия, надо написать его не до конца, чтобы все варианты окончаний могли быть добавлены к этому фрагменту;
– если в запросе два слова связаны логтческим «И», представляет в выдаче только те тексты, в которых обязательно есть оба слова (напоминаем, что лучше писать слово без окончания, если нет уверенности в том, в какой форме оно присутствует в тексте);
– логическое «НЕ» представляет знаком «минус», действие которого распространяется на любой фрагмент текста.
Мониторинг изменений на сайтах в Интернете
Ни специалисту конкурентной разведки, ни сотруднику отдела маркетинга или сбыта недостаточно просто знать, на какой страничке Интернета содержится нужная информация. Надо иметь возможность своевременно и точно отслеживать изменения на этой страничке. Каждый может себе представить, насколько сложна, а чаще всего и вовсе неосуществима эта задача. Вряд ли даже самый внимательный и скрупулезный человек в состоянии быстро и точно оценить изменения в тексте – скажем, в прайс-листе, – занимающем пять страниц.
Для решения подобной проблемы несколькими компаниями разработано специальное программное обеспечение – так называемые «сторожевые роботы»: ознакомившись со страницей, они сохраняют ее образ в своей базе данных, а при повторном посещении сравнивают актуальное состояние ресурса с этим образом. Программа отмечает изменившиеся места, которые становятся похожи на выделенные маркером фрагменты текста на бумажном носителе. Более того, удаленние кусков материала также фиксируется многими программами данной категории – как правило, внизу страницы, дабы не мешать восприятию человеком информации. «Сторожевые роботы» могут запускаться пользователем вручную, а могут и работать автоматически, по расписанию.
Предлагаем рассмотреть эти программы более подробно.
Сторожевой робот WebSite-Watcher
Программа выпущена в Германии, ее официальный сайт – http://www.aignes.com. Стоимость продукта составляет около 40 долл. США за индивидуальную лицензию. Кроме того, пользователю дается 30-дневная полнофункциональная версия, дабы он успел удостовериться в необходимости ему этого продукта. Заплатить за WebSite-Watcher требуется лишь один раз, после чего все обновления становятся доступны бесплатно и на неограниченный срок.
Интерфейс программы поддерживает русский и украинский языки, однако раздел «Помощь» до выхода в свет версии 4.06 был написан на английском. После появления версии 4.06 на сайте программы по адресу http://www.aignes. com/wswtrans.htm стал доступен exe-файл (wswhelp_russian.exe), который присоединяет к WebSite-Watcher справочную информацию на русском языке. Работа с русским языком не вызывает у программы никаких проблем. Продукт довольно часто обновляется. Так, на момент написания книги была доступна версия 4.10.
WebSite-Watcher работает как клиент на компьютере пользователя. Это значит, что все закладки и конфигурации хранятся локально на жестком диске компьютера и сервер хозяина не участвует в процессе поиска. Производитель утверждает, что выход в Интернет требуется продукту лишь для посещения страниц, проверяемых пользователем.
Что же может проверять программа?
Любые web-страницы с текстовым содержанием, независимо от расширения файла. То есть статичные страницы (с расширением файла. htm или. html) и динамичные страницы (с расширением. asp,php и так далее). WebSite-Watcher также выделит цветом все изменения в тексте.
RSS/Atom feeds. Страницы RSS/Atom преобразовываются в читаемый html-формат и могут обрабатываться как обычные web-страницы.
Страницы, защищенные паролем. Для таких страниц вы можете записать макрокоманду, после автоматического выполнения которой ресурс будет проверен на обновление.
Форумы. Они обрабатываются как обычные страницы с небольшой оптимизацией, например, специальной технологией подсветки изменений.
Страницы с Javascript. Для таких страниц WebSite-Watcher поддерживает отдельную и более сложную технологию преобразования динамически сгенерированного содержания ресурса в статичное содержание.
Изображения. Если Вы отслеживаете изображение, WebSite-Watcher способен обнаружить его обновление. Изменения в изображении не подсвечиваются.
Двоичные (бинарные) файлы. WebSite-Watcher может обнаруживать обновление двоичных файлов (например, файлы zip или exe) сравнением даты документа, его размера и/или части его содержания (двоичные файлы не будут полностью загружаться при проверке на обновление).
Файлы PDF и Flash. Они обрабатываются как двоичные файлы. WebSite-Watcher не подсвечивает изменения в их содержании.
FTP-файлы и каталоги. WebSite-Watcher поддерживает отслеживание таких документов и каталогов. FTP-файлы могут проверяться по их дате/размеру или содержанию.
Интранет. Все страницы в сети Интранет могут быть проверены подобно обычным web-страницам.
Локально хранящиеся файлы. WebSite-Watcher может отслеживать любой файл на вашем жестком диске.
По крайней мере, такие данные приводит сам производитель.
После того, как WebSite-Watcher установлен и запущен на компьютере, в правом верхнем углу всех наиболее распространенных браузеров (в частности, Internet Explorer, Mozilla Firefox, Opera) появляется значок программы, представляющий собой стилизованный глаз.
Добавление закладки в перечень закладок может производиться двумя способами.
1. Непосредственно из браузера.
Таким образом можно добавить к закладкам ту страницу, которая в настоящий момент загружена в браузере. При щелчке любой кнопкой мыши по значку WebSite-Watcher в правом верхнем углу браузера появляется всплывающее меню, первый пункт которого «Добавить в закладки». После того, как выбирается этот пункт, появляется следующее окно, в котором URL страницы уже автоматически внесен в соответствующее поле. Вам остается лишь ввести ее имя вручную (причем оно не имеет никакого значения для компьютера и служит только для того, чтобы можно было определить, для чего та или иная закладка нужна, потому и назначается пользователем произвольно). Версия 4.10 позволяет обойтись даже без ручного ввода названия страницы, поскольку программа может автоматически брать это название на самом ресурсе.