Страница 33 из 68
Архив сайтов Internet Archive Wayback Machine
Электронный адрес – http://web.archive.org.
Каждый, кто собирал информацию по интересующей его проблеме за достаточно длительный период, знает, как порой бывает важно найти сведения, опубликованные на сайте несколько лет назад. Иногда это просто необходимо: в частности, в случае обнаружения новых тенденций в развитии объекта, которое требует ретроспективной оценки времени их появления. Либо возникновения новой темы для изучения событий на рынке и, как следствие, сравнения реакции на них с тем, как вели себя в подобной ситуации участники рынка в прошлом. Конечно, специалист конкурентной разведки всегда старается архивировать интересующую его информацию. Однако в реальной жизни бывает так, что проблема просто не входила в сферу его интересов до определенного момента либо на предприятии эта служба появилась позже тех событий, которые и стали предметом ее пристального внимания.
В таком случае на помощь нередко может прийти сервис, который нам также рекомендовал Arthur Weiss. Этот Internet Archive Wayback Machine, его изображение представлено на рис. 21. Сервис позиционируется как «Библиотека Интернета». Пауки, принадлежащие Internet Archive Wayback Machine, посещают веб-сайты и сохраняют архивную копию на сервере «библиотеки». Как написано на странице этого ресурса, интересующего нас сайта может и не оказаться в архиве. Например, в случае если паук не может его прочитать, поскольку тот защищен одним из способов, описанных нами в соответствующем разделе данной книги.
Сервис Internet Archive Wayback Machine некоммерческий. Он работает с 1996 г. и, как утверждают его владельцы, существует на пожертвования меценатов и благодаря технической поддержке крупных интернет-компаний, таких как Alexa. Ежемесячно архив увеличивается в объеме на 20 терабайт. Ценным нам видится то обстоятельство, что Internet Archive Wayback Machine отслеживает копии даже тех сайтов, которых больше не существует в Сети.
Для того, чтобы увидеть сохраненную версию нужного сайта, достаточно ввести в окно, расположенное в верхней части главной страницы, адрес ресурса и нажать клавишу «Take me Back». После этого пользователю будет предложен архив по запрошенному ресурсу. В пределах этого архива можно ознакомиться с копией сайта за искомую дату. На рис. 22 показан список копий ресурса «Росбизнесконсалтинг».
Рис. 21. Главная страница Internet Archive Wayback Machine.
Рис. 22. Архив по сайту РБК
Архив, расположенный на сервере в Сан-Франциско, поражает своими возможностями. Вот как выглядела страница этого известнейшего интернет-ресурса 10 декабря 1997 г. (рис. 23).
Рис. 23. Страница ресурса РБК от 10 декабря 1997 г.
Надо сказать, что, помимо функций обеспечения нужд непосредственно конкурентной разведки, наши источники рассказывали о случаях, когда этот ресурс помогал компаниям в сборе доказательств по фактам информационной войны против них. Как правило, в таких ситуациях, когда нападающая сторона «затирала» сведения на сайте, Internet Archive Wayback Machine позволял доказать факт распространения порочащих организацию данных.
Один из источников автора сообщил о факте, когда наличие копии сайта в архиве Internet Archive Wayback Machine позволило доказать в споре с контролирующими органами, что сайт, существование которого вызывало сомнения у контролеров, действительно существовал в тот период, когда компания получила деньги за его разработку и «раскрутку».
Мониторинг появления новых сообщений на сайте
Программы, которые устанавливаются на персональном компьютере и позволяют видеть все, что происходит с ресурсом, – не единственный инструмент мониторинга его модификаций. Преимущество таких программ – в том, что они фиксируют изменения, которые касаются даже одного-единственного слова.
К недостаткам «сторожевых роботов» мы бы отнесли то обстоятельство, что работают они лишь на том компьютере, на котором непосредственно установлены. Технически возможно перенести базу данных с машины на машину, однако программу придется вновь инсталлировать на тот компьютер, с которого планируется осуществлять контроль изменений в Интернете. Кроме того, «сторожевые роботы» небесплатны.
В связи с этим, представляют практический интерес два бесплатных сервиса, доступных любому пользователю с любой машины, которая подключена к сети. Речь идет об агрегаторах новостей и о новостях по запросу пользователя.
Новости по запросу пользователя.
В Яндексе, Гугле и некоторых других информационных системах этот сервис работает достаточно давно.
Рассмотрим его более подробно на примере Яндекса (рис. 24). Для того, чтобы им воспользоваться, необходимо ввести запрос в строку поиска. Введем следующее: «курс доллара резко возрос», – а затем дождемся загрузки результатов.
Если после появления результатов кликнуть по гиперссылке «Новости» под поисковой строкой, то откроется страница, на которой справа содержится гиперссылка с текстом:
«Подписка на новости по запросу „курс доллара резко …“.
Рис. 24. Подписка на Новости Яндекса по запросу.
Переход по этой гиперссылке приведет пользователя еще на одну страницу, на которой ему будет предложено авторизоваться. Как обычно принято на Яндексе, для авторизации используются те же логин и пароль, которые пользователь задействует для доступа к своему почтовому ящику на Яндексе. После авторизации в почтовый ящик подписчика будут приходить все новости, обнаруженные Яндексом по этому запросу. Пользователь может добавлять подписки на новости по другим запросам, а может удалять те из них, которые перестали быть ему нужны.
По мере появления новой информации в Яндексе по конкретному запросу, в почтовый ящик подписчика будут приходить ссылки и сниппеты (фрагменты текста), при переходе по которым пользователь получит возможность ознакомиться с содержимым страницы в подлиннике.
Правда, хотим напомнить, что новостями Яндекс считает те ресурсы, которые были проиндексированы им недавно. Истинный возраст информации на этих страницах может быть сколь угодно большим, но поисковиком они будут восприниматься как новые на том основании, что он о них узнал с опозданием.
Такой сервис существует и в Гугле, он называется GoogleAlert (что можно перевести как «Часовой от Гугла» или «Сторож от Гугла») и расположен по адресу http://www.googlealert.com/.
После того, как пользователь авторизуется, а также укажет адрес своей электронной почты, ему будет предложено ввести в поисковую строку фразу, по которой он намерен получать новости.
Когда в Гугле появится свежая информация по запросу, поставленному на мониторинг, адресат получит виртуальное письмо, содержащее ссылки на страницы, отвечающие заданным критериям.
В целом, хочется отметить, что сервисы Гугла развиваются настолько стремительно, что мы уверены: к моменту публикации этой книги появятся новые программы, часть из которых еще находится в состоянии бета-тестирования, а часть пока только претендует на звание перспективных планов компании.
Напомним о существовании универсального способа быть постоянно в курсе всех новинок Гугла. Дело в том, что вокруг этой поисковой (и просто сервисной) системы уже сложилось сообщество энтузиастов, которые любят ресурс и постоянно отслеживают, а также тестируют его новинки. Читателю достаточно выбрать нужные группы пользователей и поставить их на мониторинг любым удобным способом, либо просто периодически читать их переписку на форумах. Чтобы попасть на страничку с Группами Гугла, вам нужно перейти по ссылке «Группы» на первой странице.