Евгений Ющук Интернет-разведка. Руководство к действию
Введение
Эта книга предназначена не только для специалистов по конкурентной разведке, но и для всех специалистов, которые используют Интернет в своей повседневной работе как современный, эффективный, быстрый и недорогой инструмент. То есть практически для всех, кто имеет отношение к бизнесу: будь то производственное предприятие, торговая фирма, финансовое учреждение либо консалтинговая компания.
Представленные здесь практические советы помогут вам не просто выстоять в конкурентной или информационной борьбе, но и победить в ней, опираясь, в том числе, и на скрытые от обычного пользователя возможности Интернета, и персонального компьютера.
Методы работы, изложенные в книге, прошли «обкатку» в отечественной и зарубежной конкурентной разведке и доказали свою эффективность. Автор лично убедился в реальной пользе практического применения каждого данного им совета. Предлагаемые вашему вниманию рекомендации помогли повысить конкурентоспособность и эффективность работы самых разных организаций – от крупных производственных и дистрибьюторских компаний федерального и регионального уровня, государственных учреждений и силовых структур до розничных торговых сетей и предприятий сферы услуг, небольших кафе и ресторанов.
Сфера конкурентной разведки, в силу своей специфики, первой находит новейшие, передовые способы работы с информацией, делая выводы о возможных преимуществах и недостатках того или иного решения.
Современная конкурентная разведка, которая еще недавно воспринималась в нашей стране как часть службы безопасности компании, сегодня шагнула далеко за пределы этих узких рамок и стала инструментом специалистов отделов маркетинга, сбыта, стратегического планирования, равно как и инструментом топ-менеджера, от решения которого зависит успех или провал предприятия на рынке и даже само его выживание.
Инструменты конкурентной разведки, опираясь на отточенные разведкой общие принципы работы с информацией, эффективно используют специалисты по информационным войнам.
Вот почему эта книга будет полезна руководителю и менеджеру любой компании в той же мере, что и специалисту по конкурентной разведке. А кого-то, возможно, она подтолкнет к тому, чтобы сделать конкурентную разведку своей второй специальностью.
Конкурентная разведка как адаптированная к бизнесу версия государственной разведки, не имеет ничего общего с детективами. И она на самом деле гораздо ближе к маркетингу и информационно-аналитической работе, нежели к Службе безопасности компании. Причем, одинаково заблуждаются как те, кто при слове «разведка» представляет себе погони, перестрелки и тайное проникновение во вражеский сейф при непосредственном участии длинноногой блондинки, так и те, кто считает, что разведка заключается в сборе информации.
Ошибочность таких подходов хорошо иллюстрируют слова Иссура Хареля (Issur Harel), первого главы израильской разведки Моссад, пересказанные нам Артуром Вейсом (Arthur Weiss) в кулуарах конференции SCIP в Лондоне в 2005 г.:
Мы работаем не с несомненными фактами. Мир разведки – это мир вероятностей. Сбор информации – как правило, не самая сложная задача. Что действительно сложно – так это ее правильная интерпретация. Анализ информации – самая главная часть работы разведки. А Джеймсу Бонду в реальной жизни места нет.[1]
Для того, чтобы лучше понять, что и скакой целью мы будем рассматривать далее, напомним несколько основных терминов, которые использует конкурентная разведка.
Специалисты конкурентной разведки оперируют пришедшими из государственной разведки ключевыми понятиями – «объекты» (Targets) и «источники» (Sources).
Объекты – это люди или документы, которые могут ответить на интересующие вас вопросы. Как правило, это первичные носители нужных сведений.
Источники – это люди или средства, которые могут помочь получить доступ к нужному человеку и информации напрямую или опосредованно. В этом случае их иногда называют подысточниками.
Источники, если говорить о человеческих ресурсах, бывают внешними и внутренними.
Внутренние источники работают на вашем собственном предприятии.
Внешние источники работают на ваше предприятие, но не являются его сотрудниками. К этой категории обычно относят консультантов и клиентов. Кто-то из них работает за деньги, кто-то – бесплатно (либо бескорыстно, либо решая с вашей помощью какие-то свои задачи). К внешним источникам могут относиться и аналитики, специализирующиеся на исследуемой вами отрасли, и журналисты, пишущие на интересующие вас темы. Нередко такие люди, хорошо информированные в определенных специфических областях, официально продают имеющиеся у них сведения – в форме консалтинговой услуги или аналитического отчета.
Очень часто бывает, что ваши внутренние источники могут вывести на источники внешние.
Кроме того, источники подразделяют на первичные и вторичные.
Первичные источники – те, которые получили информацию непосредственно от объекта и передали ее вам. Полученной из первичных источников можно считать также информацию, которую вы добыли самостоятельно (например, лично посчитали количество грузовиков на парковке перед складом вашего конкурента).
Вторичные источники (или подысточники) получили информацию «из вторых рук».
Кроме того, считаем нужным напомнить, что никакая разведка невозможна без четкого целеуказания. Специалист конкурентной разведки не может начинать работу, не имея ясного представления о том, на какой вопрос он ищет ответ. А в идеале он должен еще и представлять себе, что руководитель намерен делать с полученными данными, поскольку в таком случае специалист крнкурентной разведки сможет работать максимально эффективно.
Надеемся, что этот краткий повтор основных терминов, относящихся к работе с информацией, напомнит вам, что специалист любой разведки не имеет права уклоняться в сторону различных интересных фактов, которые встретятся ему в ходе работы, а должен работать целенаправленно, для того, чтобы найти ответ на вопрос, ради которого вся работа и проводится. Мы уже очертили круг людей, которым эта книга, на наш взгляд, может быть полезна, поэтому для краткости в дальнейшем будем говорить только о специалистах конкурентной разведки, имея в виду при этом всю целевую аудиторию книги.
Наша книга практически полностью посвящена Интернету как инструменту конкурентной разведки. У человека неподготовленного это может создать иллюзию, что работа с глобальной информационной сетью – и есть конкурентная разведка.
На самом деле это не так.
Интернет – ее инструмент. Он имеет свои плюсы и минусы. Случается, что он действительно помогает решить главную задачу, поставленную перед специалистом конкурентной разведки руководителем компании, однако это скорее исключение из общей ситуации. В целом Интернет – важный, но ограниченный в своих возможностях инструмент, играющий в конкурентной разведке заметную роль. Заметную, но все же не ведущую. А потому его нельзя переоценивать, хотя и недооценивать тоже не следует.
Интернет часто незаменим в начале операции конкурентной разведки, потому что он обычно позволяет быстро и недорого «прицелиться», то есть сориентироваться в ситуации в целом, наметить объекты, располагающие нужной информацией, а также источники, которые позволят эту информацию получить.
Кроме того, Интернет удобен для получения справочной информации, а также иногда позволяет отслеживать динамику фактов или мнений по тем или иным вопросам.
Действительно, бывает и так, что Интернет позволяет получить ответы на все вопросы, которые стоят перед специалистом разведки. Иногда складывается ситуация, когда Интернет вообще позволяет получить информацию от первичного источника (например, когда вы получаете на Интернет-форуме ответ на прямо заданный вопрос от человека, личность которого вам достоверно известна, и который является объектом применительно к вашей операции). Однако значительно чаще для выполнения поставленной задачи специалисту конкурентной разведки приходится выходить «в поле» и работать с людьми, либо с документами вне Интернета.
Работа «в поле» – наиболее значимая по результатам часть конкурентной разведки, но она останется за пределами настоящей книги. Здесь мы сознательно сосредоточимся только на работе с Интернетом и покажем, как выполнить ее максимально эффективно.
Подобно боевой авиации, которая обеспечивает выяснение обстановки там, куда невозможно просто прийти, и позволяет воздействовать на противника, оставаясь невидимой за облаками, Интернет позволяет удаленное, бесконтактное, а порой и незаметное для объекта наблюдение за ним или поиск его следов на другом конце Земного шара.
Как и армия без авиации, конкурентная разведка без Интернета работать не может.
Авиация коренным образом изменила характер войны, систему обороны и саму организацию армии. Интернет же буквально вдохнул новую жизнь в конкурентную разведку.
Роль Интернета в конкурентной разведке гораздо существеннее, нежели в разведке государственной. Хотя надо отметить, что последняя – в силу всемирной компьютеризации – решает с его помощью все более и более широкий круг вопросов.
В общем, мы считаем, что не надо рассматривать Интернет как панацею, следует научиться правильно пользоваться им в целях конкурентной разведки, и тогда уже делать вывод о том, насколько эффективным может быть его применение в конкретном виде бизнеса.
А разные виды бизнеса действительно неодинаково зависят от Интернета. Ведь даже на уровне бытовой логики понятно, что операторы сотовой связи и производители агустителей для йогуртов используют в своем бизнесе глобальную сеть в различной степени.
Читатель этой книги познакомится с разными аспектами работы с Интернетом. Здесь есть как развернутое объяснение принципов работы поисковых машин и описание языков запросов самых популярных из них, информация о конкретных ресурсах Интернета, полезных в работе специалиста конкурентной разведки, так и тонкости приемов работы и «потайные ходы», которые позволяют в рамках закона и этики решать поставленные задачи.
Интернет как уникальный инструмент маркетинга
Среди множества преимуществ Интернета как инструмента маркетинга можно выделить два основных.
Во-первых, Интернет предлагает для исследования практически любых процессов такие возможности, какие не предоставляет никакой другой источник информации. Это относится также и к возможностям продвижения компании или ее продукции.
Во-вторых, Интернет позволяет следить за тенденциями развития потребительских предпочтений. Более того, он способен их формировать. А принимая во внимание практически равные возможности пользователей сети в донесении до людей своей точки зрения, Интернету под силу вовремя исправлять ситуацию при ее неблагоприятном развитии.
Интернет как инструмент PR
Всемирная Паутина для специалистов по PR стала инструментом мониторинга и формирования общественного мнения. Немаловажно, что Интернет позволяет проводить мониторинг, не обнаруживая перед окружающими своего интереса к тому или иному событию или явлению.
Дешевизна, оперативность и относительная (а порой и полная) анонимность вброса информации открывают перед специалистами PR новые возможности, хотя и ставят их перед лицом новых угроз. Так, с одной стороны, удобно, когда можно развить целую дискуссию и увести за собой людей, интересующихся той или иной темой, но с другой стороны, участились и случаи, когда в Интернете инспирируется ложная информация, а затем со ссылкой на нее начинается волна в печатных СМИ. Данная книга покажет, как специалист PR может использовать в своих интересах особенности Интернета, и одновременно научит выявлять, и нейтрализовать активность противника.
Принципы организации и поиска информации в Интернете
Поиск информации в Интернете проводится двумя основными способами – с помощью каталогов (их еще называют директориями) и с помощью поисковых машин.
Директории обеспечивают контекстный поиск для структурированного просмотра, тогда как поисковые машины, как следует из их названия, контекста не обеспечивают, однако позволяют находить конкретные слова или фразы.
Директории можно уподобить оглавлению книги, а поисковые машины – предметному указателю.
Часто поисковые системы объединяют в себе как поисковую машину, так и директории.
Это хорошо видно на примере первой страницы Яндекса, где под поисковой строкой размещается список директорий, которые позволяют пользователю уточнять запрос по мере продвижения в глубь каждой из них.
Ввиду того, что принцип организации директорий понятен каждому, кто пользовался библиотечным каталогом – а среди читателей таких, смеем полагать, подавляющее большинство, – мы не будем подробно останавливаться на технике работы с директориями и уделим больше внимания работе с поисковыми машинами. В завершение же разговора о каталогах приведем пример «цепочки», по которой осуществляется поиск в каталоге Яндекса: Бизнес > Реклама > Реклама в Интернете.
Все поисковые машины работают по одному и тому же алгоритму и основаны на одних и тех же принципах. Различия между ними возникают лишь на уровне технической реализации этих принципов в работе.
Чтобы понять принцип работы поисковой машины, попробуем разделить вопрос на две части: на чем основан поиск и как он реализован.
На чем основан поиск
Все поисковые машины базируются на трех основных операторах, лежащих в основе Булевой алгебры (ее также называют Булевой логикой или Boolean).
Это логические операторы «И», «ИЛИ» и «НЕ». Работают они следующим образом.
1. Логическое «И». Если между двумя словами в запросе стоит оператор «И», то в результате поиска будут найдены лишь те документы, в которых содержатся оба слова. Так, например, по запросу собака И кошка будет найден документ, содержащий предложение «собака гналась за кошкой», документов же, состоящих из текста «кошка отдыхала» или «корм для собак», мы не увидим.
2. Логическое «ИЛИ». Если между словами стоит оператор «ИЛИ», то результа том поиска станут документы, в которых содержится хотя бы одно из этих слов.
Если мы не сделаем специальных ограничительных оговорок, то материалы, в которых оба эти слова присутствуют, также будут найдены.
По запросу собака ИЛИ кошка мы получим документы, исключенные в прошлом запросе и содержащие текст «кошка отдыхала» или «корм для собак», а также материал с предложением «собака гналась за кошкой».
3. Логическое «НЕ». Если два предыдущих оператора описывали те слова, ко торые вы хотите включить в запрос, то оператор «НЕ» слова из запроса исклю чает. Пользователи, впервые сталкивающиеся с операторами запросов, нередко высказывают удивление: мол, не проще ли и вовсе не включать ненужное слово в запрос? Зачем вводить дополнительный оператор? Увы, нет. Не проще.
На самом деле, чтобы понять важность логического оператора «НЕ», имеет смысл вспомнить, что наш запрос не создает в Интернете ничего нового. Мы лишь выуживаем то, что нам нужно, из имеющегося огромного, но все же конечного массива. При этом необходимо отсечь информационный мусор. Его-то мы и отсекаем с помощью оператора «НЕ». К сожалению, не нам решать, увидим ли мы этот мусор в выдаче. Так, например, по запросу сведений о коньке крыши неизменно появляется информационный мусор в виде документов о Коньке-Горбунке, фигурном катании, хоккее, лошадях и т. п. Без логического «НЕ» тут никак не обойтись.
Давайте рассмотрим примеры работы логического оператора «НЕ».
По запросу собака НЕ кошка будет найден документ, содержащий текст «корм для собак», а вот документы со словами «кошка отдыхала» или «собака гналась за кошкой», и даже «корма для собак и кошек» из выдачи будут исключены.
Часто встречается чуть более сложный вариант написания запроса, который содержит все или почти все вышеперечисленные операторы. В этом случае лучше пользоваться таким элементом, как круглые скоби. Скобки позволяют отделять однотипные слова запроса от остальных. Кроме того, самому составителю при этом визуально гораздо удобнее различать отдельные фрагменты запроса. Мы не будем чересчур теоретизировать о скобках, а просто продемонстрируем работу указанного элемента на конкретных примерах. На наш взгляд, так будет понятнее, как и для чего используются скобки.
Так, запрос пушистые И (собаки ИЛИ кошки)
позволит получить документы, относящиеся как к пушистым собакам, так и к пушистым кошкам – по отдельности или вместе. Скобки при этом «раскрываются» по обычным арифметическим правилам вынесения за скобку общего множителя (для тех, кто не любит математику, поспешим сказать, что болеше углубляться в нее мы не будем). А вот запрос пушистые И (собаки ИЛИ кошки) НЕ (собаки И кошки)
выдаст документы, в которых написано про пушистых собак или пушистых кошек, но не будет содержать текстов, где одновременно будут упомянуты и кошки, и собаки.
Еще раз повторимся, все поисковые машины сегодня работают на основе анализа этих трех операторов, хотя нюансы их написания в разных поисковых машинах могут отличаться.
Как поиск реализован
Каждая полноценная поисковая машина располагает собственным штатом роботов, или пауков. Их еще называют краулерами (crawlers) и спайдерами (spiders,). Это программы, которые перескакивают со страницы на страницу и сканируют находящиеся на них тексты, не вникая при этом в их содержание. После чего сбрасывают документы на серверы своих хозяев и идут к следующим страницам. Как паук определяет, куда ему пойти? Он находит так называемую гиперссылку (ту самую, при наведении на которую курсор приобретает вид раскрытой ладони, и при клике по которой происходит переход на другую страницу) и идет по ней. Вот почему, если на страницу не ведет ни одна ссылка, паук на нее тоже не придет. Исключение составляет ситуация, когда владелец страницы вручную сообщит о ней поисковой машине, заполнив специальную форму на сайте поисковой машины.
На сервере поисковой машины текст разбивается на отдельные слова, каждому из которых присваиваются координаты, после чего они заносятся в таблицу сервера вместе со ссылкой на тот адрес в Интернете, по которому текст размещался в момент посещения его пауком.
Сам по себе поисковик представляет собой большую локальную сеть, состоящую из мощных компьютеров с огромным объемом дисковой памяти. Эти машины разделены на подгруппы (так называемые кластеры), между которыми распределяется информация, собранная пауками.
Когда поисковая система получает запрос, она ищет ответ именно в своей таблице, а не в Интернете.
При этом важно понять, как паук решает, с какой частотой ему следует посещать ту или иную страницу. Выглядит этот алгоритм приблизительно следующим образом. Поработав со страницей, паук возвращается на нее, н у, например, через две недели. И если видит, что никаких изменений не произошло, он планирует следующее посещение через более длительный период – скажем, через месяц. А если и тогда не обнаружит ничего нового, то наведаетсяя сюда еще позже, месяца через полтора-два.
Вот почему нередко бывает так, что поисковая машина по запросу результат выдает, а попытка перейти на страницу по полученной ссылке безрезультатна – вероятнее всего, никакой страницы уже просто не существует на прежнем месте, но паук на нее давно не заходил, и, соответственно, поисковая система о ее удалении не знает.
Весь комплекс процессов, описанных выше, называется индексацией.
История развития поисковых машин
История эволюции поисковых машин наиболее полно, на наш взгляд, представлена в книге признанных экспертов в области невидимого интернета Криса Шермана и Гарри Прайса «Невидимый Интернет».[2]
До середины 1960-х годов компьютеров было немного. Изолированные друг от друга, они не могли обмениваться информацией.
В 1962 г. профессор Ликлайдер (Licklider) из ведущего технического вуза США – Массачусетского Технологического института – сформулировал концепцию глобальной компьютерной сети «Galactic Network». Идея начала воплощаться в жизнь сотрудником американского министерства обороны Ларри Робертсом (Larry Robberts), который через четыре года после публикации статьи профессора предложил объединить отдельные компьютеры министерства в сеть, описанную Ликлайдером. Таковы предпосылки возникновения сети «ARPANET», которая затем превратилась в то, что сегодня величают Интернетом. Первый узел «ARPANET» появился в 1969 г., и следующие несколько лет к нему подключались университеты и различные контрагенты, работавшие по заказам военного ведомства США.
В 1973 г. американское министерство обороны инициировало новую программу, предполагавшую обеспечивать надежную связь компьютеров между собой с помощью очень большого числа различных соединений. Целью такого решения было повышение устойчивости системы к попыткам массированно нарушить электронные средства коммуникации. Поскольку все это происходило во времена «холодной войны», речь шла об устойчивости к устрашающим последствиям, которыми грозило стратегическое ядерное противостояние. Поскольку «ARPANET» представлял собой одну-единственную сеть, что на системном уровне понижало его способность сопротивляться разрушениям, возникла идея создания «сети из сетей», которая теоретически могла бы быть бесконечно большой. Этот проект и назвали «Internetting», а саму сеть «Internet».
По мере того, как количество присоединенных к Интернету машин увеличивалось, объективно назрел вопрос о необходимости инструментов, позволяющих легко находить текст и другие файлы на удаленном компьютере, в идеале – на любом, где бы он ни располагался в Сети.
Доступ к файлам на самых ранних этапах развития Интернета осуществлялся в два этапа, каждый из которых выполнялся вручную: специальные команды вводились с клавиатуры. Кстати, тогда компьютеры могли управляться лишь специалистами, способными вводить команды в соответствующую строку. Графического интерфейса, позволяющего комфортно работать с машиной неподготовленному человеку, еще не изобрели. Так вот первым делом с помощью программы Telnet устанавливалось прямое соединение с компьютером, на котором находится нужный файл. На данном этапе лишь налаживалась связь, ничего и никуда в этот момент еще не передавалось. И только затем с помощью специальной программы – FTP – можно было этот конкретный файл взять.
Очевидно, что на поиски нужного документа уходила масса времени: требовалось знать точный адрес компьютера, на котором он находится.
Между тем файлов становилось все больше, интерес к ним постоянно рос, и для того, чтобы найти адрес одного из них, обычно приходилось обращаться в дискуссионные группы с просьбой о помощи и в надежде на то, что кто-нибудь из собеседников подскажет заветный адрес, по которому хранится нужная информация.
В результате, стали появляться специальные FTP-серверы, которые представляли собой хранилище файлов, организованных в директории, по принципу хранения информации на персональном компьютере. Такие серверы существуют и по сей день.
Первый работоспособный, общедоступный инструмент поиска файлов, хранящихся на FTP-серверах, назывался «Арчи» (Archie) и был создан в 1990 г. группой системных администраторов и студентов старших курсов Университета Мак Джил (McGill) в Монреале. «Арчи» был прототипом сегодняшних поисковых машин, но значительно более примитивным и ограниченным в своих возможностях. Он бродил по Интернету, разыскивал файлы на разных FTP-серверах и загружал список директорий каждого найденного сервера на собственный, формируя общий каталог.
Этот каталог затем обрабатывался и хранился в центральной базе данных, внутри которой можно было организовать поиск. Поиск на собственном компьютере к тому моменту существовал уже издавна и, несмотря на то, что тоже требовал ввода команд, трудностей в работе не создавал. Однако без специальной подготовки использовать компьютер полноценно человек не мог. База данных находилась в университете Мак Джилл и обновлялась ежемесячно.
В 1991 г. команда Марка Мак Кахилла (Mark McCahill) из Университета Миннесоты создала программу «Голден Гофер» (Golden Gopher – в переводе с английского «золотоискатель» или «старатель»), которая совмещала в себе оба протокола – Telnet и FTP. Все, что нужно было сделать пользователю для получения доступа к нужной информации, – щелкнуть по гиперссылке, приведенной в меню. Таким образом, впервые в истории вводить какие-либо команды уже не требовалось, так что отныне по ресурсам Интернета люди могли «бродить» и без специальной подготовки.
Программа показывала пользователю последовательно возникающие пошаговые меню, что позволяло ему без проблем идти в глубь базы директорий, все более приближаясь к специфическим документам, которые и составляли цель поиска. Этот алгоритм, по сути, сохранен и сегодня в Каталогах, расположенных в Интернете.
Стало возможно получать как текстовые документы, так и графические, и музыкальные, без привязки к какому-то определенному формату. А самое главное, стало в принципе возможно легко найти и получить в Интернете нужную информацию.
Однако проблемы все же оставались. Одна из них, и довольно серьезная, была связана с тем, что компьютеры были построены на разных платформах, которые порой не понимали друг друга. Тут можно провести аналогию с людьми, которые говорят на совершенно разных языках и потому не могут построить более или менее осмысленную беседу. В те времена между собой конкурировали не операционные системы, как сейчас, а производители компьютерного «железа». Сегодня в меньшей степени важно, кто произвел компьютер. Гораздо существеннее, что на нем установлено: Windows, Linux, Mac OS или какая-то другая система. А тогда именно производители «железа» определяли лицо Интернета.
Объективно назревала идея, согласно которой компьютеры разных платформ должны иметь возможность работать в одном протоколе, позволяющем просматривать страницы вне зависимости от того, на какой конкретно машине эти страницы созданы. Требовалось придумать такой универсальный протокол и сделать его удобным для пользователей. Первым, кто догадался объединить известную к тому времени простую форму гипертекста с универсальными коммуникационными протоколами, был Тим Бернерс-Ли (Tim Berners-Lee).
Чтобы пользователь получил в руки независимый от платформы и при этом простой инструмент, Бернерс-Ли создал HTML (HyperText Markup Language, то есть Язык гипертекстовой разметки). Все Web-документы, отформатированные с помощью тегов HTML, видны совершенно одинаково во всем мире, вне зависимости от типа компьютера, на котором человек открыл страницу сайта. Поэтому и сегодня при переводе файла в формат HTML, например, на машине, работающей под управлением операционной системы MacOS, можно быть уверенным в том, что этот файл будет выглядеть точно так же и на компьютере, работающем под управлением Windows.
Затем Бернерс-Ли придумал Universal Resource Identifier – метод стандартизации адресов, при котором компьютерам в Интернете присваиваются уникальные адреса (сегодня мы их называем URL, это то, что в привычном для пользователя виде обычно начинается с «www»). Наконец, изобретатель собрал вместе все эти элементы, создав систему в форме Web-серверов, которые хранят HTML-документы и предоставляют их другим компьютерам, создавая HTML-запросы о документах по определенным URL.
Но Бернерс-Ли хотел видеть Интернет как информационное пространство, в котором можно получить свободный доступ к данным любых типов. На ранних этапах развития глобальной Сети преобладали простые текстовые документы HTML. К тому времени существовали системы поиска информации на локальных машинах, поэтому появилось несколько серверов, которые пытались проиндексировать какую-то часть страниц Web и прежде, чем отправляться за чем-то в Интернет, предлагали поискать необходимые сведения на этих серверах.
При этом основная проблема заключалась в том, чтобы отыскать страницы, которые в принципе можно бы было индексировать. Поскольку Интернет лишен централизованной структуры и общего оглавления, единственный способ, позволявший добиться этого, состоял в поиске ссылки на страницу и переходе по этой ссылке, с последующим добавлением найденного ресурса к индексу.
Однако вскоре возникла еще одна проблема. Наиболее популярные страницы посещались пауками чаще остальных, так как на них указывало максимальное количество ссылок. Пауки, количество и возможности которых были ограничены, «зависали» на таких страницах и впустую расходовали ресурсы, оставляя непосещенным множество других адресов, пока еще менее популярных. Для решения этой проблемы требовалось создать программу, которая позволила бы игнорировать уже проиндексированные страницы и сосредоточиться на поиске новых. Иначе это грозило проблемой с ресурсами.
В 1993 г. студент-физик Массачусетского технологического института Мэтью Грей (Mathew Gray) создал первый широко известный Web-робот, названный «World Wide Web Wanderer» или просто «Вандерер», что в переводе с английского означает «скиталец» или «странник». Дело в том, что Грей заинтересовался статистикой. Результатом такого увлечения стало появление «странника»: изобретение было призвано помочь студенту проанализировать размеры Интернета и скорость его роста. «Вандерер» просто приходил на страницу и определял сам факт ее существования, не занося в базу содержимого найденного адреса. Несмотря на то, что создатель робота не преследовал никаких других целей, его детище, фактически дебютировавшее в «забеге» прогрессивных интернет-находок, легло в основу более сложных программ, которые к умению «скитальца» перемещаться по Сети добавили способность сохранять содержимое страниц в базе данных после их посещения.
Случилось так, что 1994 г. стал переломным в истории создания поисковых машин. Студент выпускного курса Вашингтонского университета Брайан Пинкертон (Brian Pinkerton) устал от бесконечной череды электронных писем, которые посылали ему друзья, с информацией о хороших сайтах, найденных ими в Интернете. Безусловно, сайты ему были нужны, однако шквал посланий с их адресами раздражал, а посещение всех страниц отнимало уйму времени. Однако Пинкертон нашел решение проблемы – он создал робота, которого назвал WebCrawler (что-то вроде «вездеход для Интернета»). «ВебКраулер», как и «Вандерер», ползал со страницы на страницу, запоминая при этом весь текст Web-документа и сохраняя его в базе данных, которая была доступна поисковым словам. Изобретатель представил свое детище публике в апреле 1994 г., причем сделал это виртуально – через Web-интерфейс. База данных в тот момент содержала информацию с 6000 самых разных серверов. Уже через неделю она начала расширяться, причем ежедневный прирост составлял более 100 новых серверов. Так родилась первая поисковая машина.
Тогда же был введен в обиход интернетчиков термин «краулер» или «паук», который применяется, как мы уже говорили, и по сей день.
Ну а далее ситуация развивалась еще более стремительно. Крис Шерман и Гари Прайс приводят такую хронологию возникновения и развития современных поисковых машин.
1994 г. – WebCrawler, Lycos, Yahoo!
1995 г. – Infoseek, SavvySearch, AltaVista, MetCrawler, Excite. Появление метапоисковых машин.
1996 г. – HotBot, LookSmart.
1997 г. – NorthernLight.
1998 г. – Google, InvisibleWeb.com.
1999 г. – FAST.
2000 г. и далее – Сотни новых поисковых машин.
Русскоязычные поисковые машины появлялись в такой последовательности:
1996 г. – Rambler ();
1997 г. – Yandex ();
2004 г. – русскоязычная версия Google () и русскоязычная версия Yahoo! ().
Из чего состоит сайт
Прежде, чем перейти к описанию языка запросов поисковых машин, рассмотрим, из каких элементов, с которыми предстоит работать пауку, состоит обычно сайт.
Надо сказать, что язык HTML достаточно прост и логичен. Он представляет собой способ разбивки текста с помощью специальных элементов – тегов, которые определяют структуру и внешний вид текста при просмотре его в браузере. О тегах следует знать, что они всегда парные и что они бывают открывающими (обозначают начало определенного форматирования) и закрывающими (обозначают его окончание). Закрывающий тег – такой же по написанию, как открывающий, но перед ним стоит косая черта.
Приведем пример очень простого сайта (рис. 1).
Рис. 1. Пример сайта, как его видно в браузере Мозилла Файрфокс.
Наверху страницы, изображенной на рисунке, то есть не в тексте сайта, а на верхнем поле рамки страницы, рядом с круглым значком браузера, расположена надпись: «Показываем устройство сайта». Она находится в так называемом заголовке страницы (который заключен между открывающим тегом <TITLE> и закрывающим тегом </TITLE>). Обращаем ваше внимание на то, что это заголовок именно всей страницы, а не текста.
Посередине представленного рисунка жирным курсивом выведено: «Это простой сайт». Данная надпись – и есть заголовок текста. Шрифт фразы «Это простой сайт» по размеру превосходит шрифт текста на сайте, он специально выделен как заголовок текста. При разметке с помощью HTML этот текст расположен ниже тега <TITLE>, но при этом вместе с тегом <TITLE> находится внутри тега <Head>. То есть содержимое, заключенное в <TITLE>, – это часть того, что находится в <Head>. Такое расположение дает дополнительную возможность пауку лучше определять ключевые слова на сайте. Ведь если слова вынесены в заголовок текста или, тем более, всей страницы, вероятность того, что страница и текст посвящены теме, формулируемой этими словами, повышается.
Ниже фразы «Это простой сайт» приведены четыре варианта написания основного текста сайта:
– обычный;
– жирный (пишется под тегом <B>);
– курсив (пишется под тегом <i>);
– текстовая гиперссылка (пишется под тегом <A HREF=. ru>«Текст гиперссылки»</A>).
Основной текст сайта, вне зависимости от того, каким вариантом шрифта он написан, располагается внутри тега <BODY>. Именно содержимое тега <BODY> представляет собой основной объект для паука и рассматривается им как текст страницы (собственно, это действительно текст страницы).
Чтобы увидеть внутреннюю разметку сайта, надо в браузере Мозилла Файрфокс навести курсор на любой незанятый текстом участок поля и нажать правую кнопку мыши. В всплывающем меню следует выбрать пункт «Просмотр исходного кода страницы».
Применительно к сайту, который мы рассматривали на рис. 1, этот исходный код будет выглядеть следующим образом:
<HTML>
<HEAD>
<TITLE>
Показываем устройство сайта:
</TITLE>
<CENTER>
<B><I>
<SPAN STYLE=«font-size: large»>Это простой сайт</SPAN>
</CENTER>
</B></I>
</HEAD>
<BODY>
<P>
Это текст на сайте. Обычный шрифт.
</P>
<P>
<B>
Жирный шрифт.
</B>
</P>
<P>
<I>
Курсив. </I>
</P>
<A HREF=;«А это – гиперссылка»</A>
</BODY>
</HTML>
Здесь можно увидеть все элементы, описанные нами выше. Кроме того, в исходном коде видны теги <P>, которые обеспечивают расположение текста в новой строке и с промежутком по отношению к тексту, расположенному в предыдущей строке.
Разметка HTML по умолчанию не предполагает переноса текста и его форматирования. Поэтому текст, не содержащий никаких тегов, воспроизводится подряд, но с соблюдением пробелов между словами. Для того чтобы текст оказался написан не просто в новой строке, а с промежутком относительно находящейся выше строки, используется, как мы уже показали, тег <P>, а для того, чтобы текст был написан в новой строке, но без промежутка между выше– и нижерасположенной строками, применяется тег <BR>.
Начало сайта, созданного с помощью разметки HTML, отмечено тегом <HTML>, а его окончание – тегом </HTML>.
Описание языков запросов различных поисковых машин
Язык запросов поисковой машины Яндекс
Лучшая, на наш взгляд, работа по изучению операторов поисковой машины Яндекс выполнена специалистом из Санкт-Петербурга Денисом Фурсовым. На его ресурсе[3] постоянно проводятся дополнительные исследования, отслеживаются и оцениваются изменения в работе операторов указанной поисковой машины.
Ниже речь пойдет о том, как с помощью специальных фильтров, основанных на Булевой алгебре, создавать запросы, максимально соответствующие потребностям специалиста, который ищет информацию в Интернете.
При изучении этого вопроса, не следует забывать, что компьютер очень исполнителен, но лишен способности думать, поэтому следует составлять запрос, исходя из того, что он будет обработан компьютером буквально, а не с учетом того, что же на самом деле имел в виду пользователь, создавая свое обращение.
Лучше всех эту мысль проиллюстрировал летом 2005 г. Алексей Амилющенко, главный аналитик отдела маркетинга Яндекса на следующем примере.
Вот еще одна история с семинаров, но ее приходится рассказывать не очень часто. Иногда случается, что заходит разговор о том, что хорошо бы поисковым системам учитывать не только слова, которые есть в индексируемых документах, но и смысл написанного. В ответ говорю, что знаю фразу, про которую и человек-то не скажет, о чем это. Вот она.
Эти типы стали есть в прокатном цехе.
И что тут написано? Я знаю, минимум, три разных смысла. Не подглядывайте в ответ
сразу (он ниже). Попробуйте сначала самостоятельно…
Обычно, когда это предложение видит зал, сначала становится тихо (видно, что думают),
потом начинаются смешки (до кого-то дошло), потом хихикают уже все.
Но к делу, что же здесь все-таки написано?
1. Скучный такой вариант.
Эти типы стали (варианты металлопроката) есть (имеются в наличии) в прокатном цехе.
2. Более творческий, с элементами мизантропии.
Эти типы (неприятные автору личности) стали (начали) есть (принимать пищу) в прокатном цехе.
3. Несколько надуманный, конечно, но…
Эти типы стали (варианты металлопроката) есть (надлежит принимать в пищу) в прокатном цехе.
Вот видите, даже протеиновые мозги не справляются, а вы хотите, чтобы у силиконовых это получалось.
Текст запроса мы будем помещать в квадратные скобки [] для того, чтобы визуально выделить его из текста книги. Если уважаемый читатель решит ввести приведенные ниже запросы в поисковую строку поисковой машины, чтобы проверить их работоспособность на практике, то эти квадратные скобки вводить не надо.
Итак, перейдем непосредственно к операторам запросов Яндекса.
1. Логическое «И».
Яндекс поддерживает три разных оператора, относящихся к логическому «И», что делает его самым гибким из всех поисковиков, работающих с русским языком. Столь развитая, практически уникальная система операторов поисковых запросов дает возможность предельно точно настроить запрос и сформировать такой фильтр для данных в Интернете, который максимально качественно выбирает нужную информацию и отсекает ненужную.
1.1. Пробел.
Слова, разделенные пробелом, должны располагаться недалеко друг от друга. Специалисты поясняют, что термин «недалеко» отнюдь не фиксированная величина и меняется в зависимости от того, с какими словами указанный оператор в каждом конкретном случае используется. Если они часто употребляются, то «недалеко» – значит, на расстоянии нескольких слов друг от друга. Если же они редко встречаются в обиходе, то даже их нахождение в разных концах документа будет восприниматься как «недалеко».
При этом, несмотря на то, что логическое «И» в общем виде Булевой алгебры подразумевает присутствие всех упомянутых слов, Яндекс, тем не менее, действительно выдает сначала те документы, в которых есть все ключевые слова, представленные в запросе. После чего начинает выдавать документы, в которых на одно ключевое слово меньше, чем в запросе, затем – на два слова меньше и так далее.
Запрос: [маркетинг менеджмент]
Результат поиска: страниц – 2 442 393, сайтов – не менее 1456
В выдаче: Маркетинг, Финансы, Реклама, Менеджмент
1.2. Амперсанд (&).
Слова, разделенные амперсандом, находятся в одном предложении. Важно: амперсанд должен быть отделен пробелами с двух сторон от любых других слов.
Запрос: [маркетинг & менеджмент]
Результат поиска: страниц – 1 190 379, сайтов – не менее 1093
В выдаче: … Филип Котлер в краткой форме представляет все наиболее значительные и интересные положения самой известной своей работы «Маркетинг менеджмент»…
1.3. Двойной амперсанд (&&).
Слова, разделенные двойным амперсандом, находятся в любом месте одного и того же документа.
Важно: между амперсандами не должно быть пробелов, но сам оператор должен быть отделен пробелами с двух сторон от любых других слов.
Запрос: [маркетинг && менеджмент]
Результат поиска: страниц – 3 641 056, сайтов – не менее 1 295
В выдаче, к примеру, будут присутствовать учебные планы вузов, в которых слова «маркетинг» и «менеджмент» находятся в разных частях текста, в том числе – на разных страницах опубликованного в Интернете многостраничного плана занятий.
Чтобы увидеть это наглядно, читатели могут нажать в результатах выдачи гиперссылку «Найденные слова», которая приводится во всех итогах поиска. И тогда слова, которые есть в запросе, будут подсвечены и не придется тратить время на их «отлавливание» в тексте.
2. Логическое «НЕ».
Логическое «НЕ» представлено двумя операторами.
Прежде чем рассказать о них, отвечу на вопрос, который часто возникает у людей, впервые приступивших к изучению операторов поиска: «Зачем нужно логическое „НЕ“? Его ведь можно и вовсе не вводить, и тогда оно нам не понадобится!». Отвечаем: если мы сами решаем, что нам вводить, а что нет, то это утверждение справедливо. Но проблема в том, что часто в выдаче принудительно оказывается «мусор» и другого способа избавиться от него, кроме как убрать эти слова при помощи логического «НЕ», у нас нет. Так, например, если вас интересует конек крыши, то по слову «конек» в выдаче окажется информация и о роликовых, и о фигурных коньках, и даже о Коньке-Горбунке. Для таких-то случаев логическое «НЕ» и придумано.
Итак, вернемся к нашим операторам.
2.1. Тильда (~).
Знак тильды – это верхняя левая клавиша на буквенно-цифровой клавиатуре. Символ вводится на английском регистре с нажатой клавишей SHIFT. Как и амперсанд, тильда должна быть отделена пробелами с обеих сторон. Часто допускают ошибку, «приклеивая» тильду к следующему за ней слову. Иногда отсутствие пробела между тильдой и последующим словом не влияет на результат, но бывает и наоборот, поэтому лучше внимательно проследить за пробелами вокруг этого знака.
Тильда означает, по аналогии с диаметрально противоположным символом – амперсандом, что слова не должно быть в предложении.
Запрос: [маркетинг ~ менеджмент]
Результат поиска: страниц – 12 604 153, сайтов – не менее 4442
В выдаче: … комплексный подход к услуге интернет-маркетинга, охватывающий все возможности для продвижения интернет-представительств компаний в сети Интернет.
2.2. Двойная тильда (~~).
По аналогии с двойным амперсандом, двойная тильда пишется слитно внутри самого этого оператора, но отделяется от остальных слов пробелами с обеих сторон.
Она означает, что слова, которое за ней расположено, не должно быть в документе совсем.
Запрос: [маркетинг ~~ менеджмент]
Результат поиска: страниц – 9 675 995, сайтов – не менее 3 976
В выдаче: Форум по маркетингу и рекламе – Маркетинг и Реклама, маркетинговые коммуникации, виды рекламы: реклама в СМИ (печатная реклама, телереклама, радиореклама), наружная реклама, BTL: POS-материалы, У вас есть вопрос по маркетингу и рекламе?
Обратите внимание: в результатах выдачи слова «маркетинг» и «маркетингу» выделены как релевантные, «маркетинговые» же – нет. Это происходит потому, что термин «маркетинг» – существительное, а «маркетингу» – его словоформа, тогда как «маркетинговые» – совсем другая часть речи, а отнюдь не производное от слова «маркетинг». Подобное явление надо учитывать, если вы рассчитываете на способность Яндекса самостоятельно перебирать словоформы. Игнорирование этого факта нередко приводит к искажению результатов выдачи и также является частой ошибкой начинающих специалистов по поиску в Интернете.
На самом деле, в Яндексе есть еще один оператор логического «НЕ», который обозначается знаком «минус». По мнению Дениса Фурсова, с которым автор полностью согласен, _ «минус» – это не всегда корректно работающая двойная тильда, поэтому пользоваться им смысла нет. Мы не знаем наверняка, но предполагаем, что знак «минус» в качестве логического «НЕ» – это способ унифицировать Яндекс с другими поисковыми машинами, поскольку в большинстве своем они обозначают логическое «НЕ» именно этим знаком. Мы не пользуемся оператором «минус» при поиске в Яндексе.
3. Логическое «ИЛИ» (оператор |).
Логическое «ИЛИ» представлено оператором, имеющим вид вертикальной черты |.
На клавиатуре этот оператор находится обычно выше (реже он расположен ниже) клавиши Enter и вводится в английском регистре, при нажатой клавише SHIFT.
В подавляющем большинстве случаев оператор | и слова, с которыми он используется, заключаются в скобки, так как чаще всего этот оператор относится сразу к двум и более словам.
Если мы хотим сделать запрос, который должен показать, что нас интересует документ, содержащий в одном предложении слова «маркетинг» и «менеджмент», но при этом нигде по тексту не должно быть слов «курс», «работа», «конференция», «теория», «книга», «семинар», «бизнес», «прибыль», «клиент», то сформулировать его необходимо следующим образом:
[маркетинг & менеджмент ~~ (курс | работа | конференция | теория | книга | семинар | бизнес | прибыль | клиент)]
Результат поиска: страниц – 46 082, сайтов – не менее 1483
В выдаче: Форумы на Sostav.ru / Доска объявлений / Продам Маркетинг Менеджмент Котлера
Или:
Ответы к госам по дисциплине Маркетинг – Менеджмент (по конспектам преподавателей СПбГУ)
Обратите внимание, что скобки, как в арифметике при вынесении за скобку общего множителя, позволяют распространить действие оператора «двойная тильда» на все слова, расположенные внутри них.
Кстати, для удобства восприятия этот запрос лучше оформить так, чтобы слова «маркетинг» и «менеджмент» были сгруппированы. Смысловой нагрузки это не несет, а потому и на выдачу не влияет, однако снижает вероятность того, что вы сами запутаетесь в своем запросе, если он будет достаточно длинным. Соответственно, мы бы советовали обратиться к поисковику так:
[(маркетинг & менеджмент) ~~ (курс | работа | конференция | теория | книга | семинар | бизнес | прибыль | клиент)]
4. Яндекс учитывает морфологию слов.
Это означает, что Яндекс по запросу «Учет» выдаст результаты, содержащие слова «Учету», «Учетом», «Учетов» и т. п., которые он выделяет как релевантные теме поиска.
Запрос: [Учет]
В выдаче: Последний день сдачи индивидуальных сведений персонифицированного учета истекает 1 марта 2006 года.
Результат поиска: страниц – 23 287 782, сайтов – не менее 13 745
Запрос: [Учетом]
ведение бухгалтерского учета поставщика, прежде всего учета реализации
В выдаче: Учет русской морфологии Подсветка найденных…Yandex поисковая система с учетом морфологии русского языка Россия…
Результат поиска: страниц – 23 675 161, сайтов – не менее 13 745
5. Можно отключить поддержание морфологии слов.
Если слова с изменяющимися окончаниями «замусоривают» результаты, то можно принудительно заставить Яндекс искать только слова в нужной словоформе. Это бывает полезно, например, при совпадении названия компании с общеупотребительными словами. Скажем, маловероятно, чтобы фирма «Река» упоминалась в публикациях со словами «Реке» или «Реку».
Для того чтобы принудительно искать только нужную словоформу в Яндексе, используют оператор восклицательный знак. Он пишется слитно со словом, которое за ним следует, как если бы этот символ был первой его буквой.
Запрос: [!Река]
В выдаче: Рекламное агентство Река – размещение рекламы…
Результат поиска: страниц – 2 267 142, сайтов – не менее 4976
А если запрос сделать без восклицательного знака: Река
В выдаче: Речные круизы по рекам России и Европы
Результат поиска: страниц – 10 470 689, сайтов – не менее 13 932
Видно, что количество страниц и сайтов в случае запроса с оператором «восклицательный знак» уменьшается почти в пять раз за счет исключения форм слова «река», таких как «реки», «рекой», «рекам» и пр.
6. Заглавные и строчные буквы.
Яндекс периодически меняет некоторые нюансы в этом вопросе, стараясь, однако, придерживаться главного правила: слова, написанные с маленькой буквы, будут выдаваться и с маленькой, и с заглавной, а слова, написанные с заглавной буквы, будут выдаваться только с заглавной. Изменения, которые периодически происходят в подходах Яндекса к этой проблеме, обычно касаются попыток исправить наиболее распространенные ошибки пользователей. Ознакомиться с текущим состоянием дел можно как на странице помощи самого поисковика, так и в работе Дениса Фурсова. Однако для эффективной работы достаточно просто следовать приведенному в этом разделе правилу.
Если же слово написано целиком заглавными буквами, Яндекс будет рассматривать его как представленное прописными. То есть, результаты ввода в поисковую строку понятия «РИТЕЙЛЕР» будут такими же, как и в том случае, если мы оформим запрос иначе – «ритейлер».
Запрос: [бухгалтерский Учет]
Результат поиска: страниц – 556 606, сайтов – не менее 1984
В выдаче: … Положение по бухгалтерскому учету «Учет основных средств» ПБУ 6/01»
Запрос: [бухгалтерский учет]
Результат поиска: страниц – 5 742 378, сайтов – не менее 2169
В выдаче: …постановка, восстановление и ведение бухгалтерского учета
7. Обязательное включение слов запроса в выдачу.
Чтобы искомые слова непременно присутствовали в документах к выдаче, используется оператор «плюс» (+).
Для того чтобы наглядно показать работу этого оператора, сделаем запрос со словами, которые редко оказываются в одном документе. При этом разделим их пробелом.
А затем сделаем точно такой же запрос, но поставим знак «плюс» перед каждым словом, запретив тем самым Яндексу выдавать документы, в которых набор искомых терминов неполный.
Результаты отличаются разительно – вместо тридцати трех тысяч страниц в первом случае, во втором мы имеем всего восемь!
Запрос: [литейщик провизор стоматолог маркшейдер]
Результат поиска: страниц – 33 005, сайтов – не менее 1192
Запрос: [+литейщик +провизор +стоматолог +маркшейдер]
Результат поиска: страниц – 8, сайтов – не менее 4 В выдаче:
ОК 010-93: Общероссийский классификатор занятий (ОКЗ)
… 222 1 Специалисты в здравоохранении (кроме медицинских сестер) 2221 5 Врачи 2222 9
Стоматологи 2223 2 Ветеринары 2224 6 Фармацевты 2229 4 Специалисты-…
Образование в Кузбассе
Литейщик пластмасс Литейщик цветных металлов…
№ 257 від 27/07/1995, Покажчик, Класифікатор, Держстандарт України для детского и подросткового возраста 2222.1 23667 – Научный сотрудник (стоматология) 2222.2 20459 – Врач-стоматолог 2222.2 20462 – Врач-стоматолог… 8122.2 13382 7 Листобойщик 8122.2 13384 2 Литейщик вакуумного, центробежно-вакуумного и центробежного литья 8122.2 13388 19 Литейщик изделий из…
Оператор «плюс» бывает незаменим и в тех случаях, когда есть необходимость обязательно включить в выдачу стоп-слова.
Очень хорошо это описано в работе Дениса Фурсова.
Если какие-то слова должны быть в результатах, поставьте перед ними +'. Помогает со стоп-словами. Сейчас Яндекс, кажется, учитывает стоп-слова только в запросе из трех и менее слов (даже не операндов!). +не покупай (samsung|lg) позволит найти негативные отзывы о продукции этих фирм (сравните с простым 'не покупай (samsung|lg)).
Запрос: [+не покупай (samsung | lg)]
Результат поиска: страниц – 5 314, сайтов – не менее 1227
В выдаче:
phorum – Основной форум – Re: ЛЮДИ, не покупайте Samsung 753 DFX в Wellcome
ЛЮДИ, не покупайте Samsung 753 DFX в Wellcome новое
Запрос: [не покупай (samsung | lg)]
Результат поиска: страниц – 779 096, сайтов – не менее 629
В выдаче: Купля продажа мобильных телефонов на Buy-Mobile.ru – Мобильный друг ждет!
текст ссылок: купить lg бу дешево… купить lg или sony…
Правда, Яндекс игнорирует стоп-слова как-то бессистемно. Так, запросы:
[+не покупай (троллейбус | автобус)]
и
[не покупай (троллейбус | автобус)] —
дают одинаковое количество результатов, в которых слово «не» учитывается как релевантное. Тем не менее, поскольку нет возможности проверить, как Яндекс отреагировал на запрос в каждом конкретном случае, мы рекомендуем воспользоваться советом Дениса и ставить «плюс» перед стоп-словами, как, впрочем, и перед теми словами, которые вы обязательно хотели бы видеть в выдаче.
8. Поиск точной фразы.
Не исключено, что вам понадобится найти определенную цитату либо рекламный слоган какой-либо компании.
Для этого используется оператор «двойные кавычки», аналогичные тем, что применяются в прямой речи.
В выдаче при поиске цитаты будут присутствовать документы, содержащие все слова искомой фразы, в той же форме и последовательности, что и в оригинальной ее версии.
Важно помнить, что точной цитата будет лишь в том случае, если кроме фразы, указанной в кавычках, в запросе не будет никаких лишних слов. Если помимо фразы в кавычках появится еще хотя бы одно слово, Яндекс будет выдавать документы, которые содержат все слова цитаты, сохранит их последовательность, варьируя при этом их формы. Как следствие, количество документов в выдаче заметно возрастет. Яндекс называет это «слова идут подряд».
Запрос: [ «ты всегда думаешь о нас»]
Результат поиска: страниц – 2905, сайтов – не менее 778
В выдаче:
Tefal – ты всегда думаешь о нас! Онли!!
Tefal, ты всегда думаешь о нас!
X-файлы – Тефаль, ты всегда думаешь о нас.
Тефаль, ты всегда думаешь о нас! (антиреклама 1) (Николай Якимчук) | Проза. ру…
Электронный журнал со свободной публикацией произведений. Ежедневные редакторские обзоры лучших произведений.
Интересно понаблюдать при такой слаженности результатов за тем, как работает оператор исключения слова из предложения:
Запрос: [ «ты всегда думаешь о нас» ~ (tefal | тефаль)]
Результат поиска: страниц – 307 773, сайтов – не менее 1197
В выдаче:
Конференции – АвтоКазань – АвтоКазань. Ru
а я вот всегда думал (+) >> OldDaddy 20.05.2005 17:21:24
Chel.ru – Новости бизнеса. Справочник промышленных, торговых, общественных и…
Почему-то я всегда думала, что практические статьи д.б. написаны ПОНЯТНЫМ языком.
Открытки Всегда думаю о тебе!!
> Красивые фотографии, открытки > Открытки > Всегда думаю о тебе!! Я Всегда думаю о тебе!!
9. Слова находятся на определенном расстоянии.
Этот оператор очень часто используется на практике, так как позволяет достаточно четко ограничить поиск. Вид он имеет следующий: /n, где n, по определению самого Яндекса, – это «максимально допустимое расстояние между двумя любыми словами запроса».
Денис Фурсов дает такое определение оператору: «Расстояние между словами».
Мы предлагаем следующим образом запомнить значение цифры в операторе: эта цифра (n) показывает, каким по счету будет второе слово после первого.
Например, если в запросе написано:
[годовой /1 отчет],
то в выдаче будет присутствовать фраза «годовой отчет». Потому что слово «отчет» будет первым после слова «годовой». Если в запросе написано:
[годовой /2 отчет]
то в выдаче может появиться «годовой финансовый отчет», потому что слово «отчет» может быть вторым после слова «годовой», а первым может быть любое другое слово.
Надеемся, мы объясняем доступно, потому что хотим рассказать еще о двух нюансах оператора расстояния между словами.
На самом деле, по запросу:
[годовой /2 отчет]
документы, содержащие выражение «годовой отчет», также будут выданы, потому что меньшее значение расстояния возможно, а большее – нет. Мало того, в выдачу попадет не только сочетание «годовой отчет», но и «отчет годовой». Расстояние между словами распространяется на оба слова.
Если же есть необходимость ограничить выдачу фразой «годовой отчет», исключив из нее выражение «отчет годовой», то оператор можно написать вот так:
[годовой /+1 отчет].
Это практически эквивалентно запросу: [годовой /1 отчет ~ «отчет годовой»].
Количество документов в выдаче совпадает, и в первых рядах в момент составления запроса был документ:
Годовой отчет – 2005. О книге.
Только с «Годовым отчетом – 2005» от журнала «Главбух» вы получите удобный мини-справочник по годовому отчету…
Мы не будем чрезмерно загружать читателя описанием оператора расстояния между словами, так как сказанного вполне достаточно для работы, а изучение всех нюансов функционирования поискового движка Яндекса не входит в круг основных наших задач.
Чтобы увидеть разницу между наличием и отсутствием знака «плюс» в операторе расстояния между словами, проведем напоследок такой эксперимент: сначала сделаем запрос, который позволяет появиться в выдаче документам, содержащим, согласно оператору расстояния, как фразе «годовой отчет», так и «отчет годовой», при этом исключив из результатов «годовой отчет»; а затем создадим запрос, требующий, за счет написания оператора расстояния между словами, выдачи только «годового отчета», и убедимся, что при попытке исключения конкретной фразы «годовой отчет» результат получить не удастся.
Запрос: [годовой /1 отчет ~ «годовой отчет»]
Результат поиска: страниц – 2042, сайтов – не менее 701
В выдаче:
Энциклопедии и словари
Энциклопедии и словари
ОТЧЕТ ГОДОВОЙ
Запрос: [годовой /+1 отчет ~ «годовой отчет»]
Результат поиска: страниц – 0
10. Числоформы (термин, введенный Денисом Фурсовым).
Для того чтобы при запросе какого-либо нужного номера (например, номера приказа или телефона) в выдаче вам не попадались посторонние ИНН, маркировки радиоламп и микросхем, а также прочие лишние результаты, рекомендуется перед номером, который вы ищете, поставить восклицательный знак или взять его в кавычки.
Сами номера надо написать во всех возможных вариантах, разделив их оператором «ИЛИ» и объединив в круглую скобку.
Запросы:
[(тел | телефон) (!123-45-67 |!1234567)]
и
[(тел | телефон) («123-45-67» | «1234567»)] —
дадут одинаковые результаты, в выдаче мы увидим следующее:
Все услуги через телефоны доступа – Услуги – Главная страница || Инфосвязь. Например, чтобы позвонить из Москвы в Москву на номер 123-45-67, достаточно ввести телефон 1234567, что будет аналогично введению номера 84951234567!… абонента (в этом случае на дисплее вашего мобильного телефона будет отображаться следующая запись, например для телефона 123-45-67 в Санкт-Петербурге…
11. Поиск на определенном сайте.
Оператор имеет вид url=*. Хотим обратить внимание читателя на то, что на сайте Яндекса этот оператор имеет вид url=/* с косой чертой в конце. Наш опыт показывает, что эта косая черта ухудшает результаты выдачи, поэтому мы рекомендуем записывать оператор без нее, как было показано в начале этого подраздела.
Что касается знака «звездочка» в конце адреса, то это символ маски, который означает, что нас устраивает любая страница сайта, адрес которой начинается так, как написано слева от указанного символа.
Чтобы воспользоваться оператором, позволяющим проводить поиск на определенном сайте, лучше скопировать этот оператор целиком из таблицы на сайте Яндекса, нежели вводить вручную, а затем заменить в нем адрес на нужный пользователю. Так можно свести к минимуму риск орфографической ошибки.
Операторы поиска на определенном сайте можно сгруппировать так, чтобы поиск проводился на группе сайтов. Денис Фурсов приводит такой пример поиска слова «работа» на сайтах и , который находит в общей сложности порядка 800 страниц:
Запрос: [работа && (#url=«*» | #url=«*»)]
Результат поиска: страниц – 791, сайтов – не менее 2
В выдаче:
Работа, вакансии, подбор персонала, резюме, поиск работы – SuperJob.ru
Работа: быстрый поиск работы
Еще работа»
(25 КБ) 05.03.2006
и
Кадровое агентство Коллекция Открытий —… кадры, работа в Минске, работа в… Кадровое агентство Коллекция Открытий – работа, подбор персонала, кадровые агентства, трудоустройство, персонал, кадровый, кадры главная | о нас | подбор персонала | поиск работы | контакты | карта (16 КБ) 16.11.2005
12. Оператор ссылки (link).
Этот оператор показывает, какие внешние сайты содержат ссылку на сайт, указанный в запросе. Это один из самых важных для конкурентной разведки операторов, поскольку позволяет найти друзей или союзников конкурента, часто ведет на личные странички бывших либо нынешних сотрудников компаний, может обнаружить размещенные членами их персонала объявления о поиске работы или, например, выявить аффилированные структуры.
Записывается оператор следующим образом:
link=/*
Как и в предыдущем случае, мы рекомендуем убирать последнюю косую черту, после которой следует символ «звездочка». Если надо найти ключевое слово в ссылающихся на сайт страницах, то оператор link сочетается с обычными ключевыми словами, отделяясь от них двойным амперсандом. Например, зададим поиск понятия «креатив» в сайтах, ссылающихся на адрес издательства «Вершина»: .
Запрос: [креатив && link=*]
Результат поиска: страниц – 238, сайтов – не менее 26
В выдаче:
Консалтинг и тренинги Москвы | Новости | Вышла книга Блестящие ответы на трудные…
ТРИЗ и технологии креатива
msk.treko.ru/show_news_476 (23 КБ) 02.03.2006
При этом можно еще раз проиллюстрировать влияние знака «плюс» на результат выдачи в Яндексе. При запросе:
[+креатив && link=*]
Результат поиска: страниц – 10.
Остальные страницы, показанные в предыдущем запросе, ссылались на сайт издательства «Вершина», но слова «креатив» не содержали.
13. Оператор поиска в заголовке страницы.
Для тех, кто не занимается сайтами профессионально, напомним, что заголовок страницы – это то, что написано на синем (для Windows XP) поле в самом верху экрана, как бы уже за пределами страницы, на ее рамке. А с точки зрения разметки HTML, эта часть сайта заключена внутри тега <TITLE>.
Яндекс справедливо считает, что если ключевое слово содержится в самом заголовке страницы, значит, она однозначно имеет непосредственное отношение к запросу.
Синтаксис оператора выглядит таким образом (на примере поиска слова «разведка» на страницах, содержащих в заголовке словосочетание «ИПК УГТУ»):
Запрос: [+разведка && $title (ИПК УГТУ)]
Результат поиска: страниц – 1
В выдаче:
Институт переподготовки кадров УГТУ (ИПК УГТУ) – Екатеринбург, Свердловская…
… проф. бухгалтеров, семинары и тренинги по управлению недвижимостью, изменениями, бизнес-разведке, технологиям продаж, тренинги личностного роста. (13 КБ) 18.06.2005
Остальные операторы языка запросов Яндекса представляют меньший практический интерес, хотя и значительно расширяют возможности поиска. Ознакомиться с ними можно на странице помощи в Яндексе,[4] пройдя по ссылкам Помощь > Синтаксис запросов.
Поиск в Гугле (Google)
Гугл (google.ru) становится все более популярным. За ним стоит колоссальный финансовый ресурс, которым грамотно распоряжаются. Так, по информации из интервью инженера по программному обеспечению Google Мэта Катса, уже в 2002 г. «каждые 28 дней Google индексировал 3 млрд веб-документов, в том числе более трех млн новых страниц каждый день».
Этот поисковик в чем-то проигрывает Яндексу, а в чем-то выигрывает у него. Поскольку Для удобства читателя при рассказе об операторах Гугла будем в ряде случаев проводить их сравнение с аналогичными операторами Яндекса.
1. Основы поиска.
Чтобы ввести запрос, напечатайте ключевые слова и нажмите ENTER либо щелкните кнопку «Поиск в Google».
Гугл использует интеллектуальную технику анализа текстов, которая позволяет искать важные и вместе с тем релевантные страницы по вашему запросу. Для этого система анализирует не только саму страницу, которая соответствует запросу, но и те, которые на нее ссылаются, чтобы определить ценность этой страницы для целей вашего поиска. Кроме того, Гугл предпочитает страницы, на которых ключевые слова, введенные вами, расположены недалеко друг от друга.
2. Показ ключевых слов в результатах.
Каждый раз в списке найденных страниц Гугл показывает отрывок из текста на странице, выделяя в нем ключевые слова. Тем самым облегчается их обнаружение по всему тексту.
Второй способ увидеть ключевые слова – загрузить страницу по ссылке «Сохранено в кэше». Недостаток данного способа (хотя конкурентной разведкой это нередко рассматривается как преимущество) – в том, что вы видите не ту страницу, которая есть сегодня, а т у, которая сохранена в базе Гугла. Изначально эта опция была придумана для того, чтобы сохранить возможность просмотра страницы даже в тех случаях, когда сервер, на котором она расположена, недоступен.
Третий способ – традиционный для просмотра текста в браузере – заключается в использовании сочетания клавиш CTRL+F. В результате должно появиться окно «найти», в которое необходимо ввести искомые слова. Раскладка клавиатуры, установленная в этот момент на компьютере, значения не имеет.
3. Логическое «И».
В отличие от Яндекса, в Гугле всего одно логическое «И», оно наиболее близко к рассмотренному ранее поисковому механизму «&&» в сочетании с оператором «плюс», поставленным перед каждым словом запроса.
Это логическое «И» позволяет выдавать документы, которые принудительно содержат ключевые слова в любом месте текста. По умолчанию при написании слов запроса через пробел Гугл ищет документы, содержащие все слова запроса.
Запрос: [литейщик провизор стоматолог маркшейдер]
Результаты 1 – 10 из примерно 18 для литейщик провизор стоматолог маркшейдер
В выдаче:
Общероссийский классификатор занятий ОК 010-93 (ОКЗ) (утв…
Общероссийский классификатор занятий ОК 010-93 (ОКЗ) (утв. постановлением Госстандарта
РФ от 30 декабря 1993 г. N 298) Russian Classification of Occupations…
Работа для вас в Самаре. Поиск работы, подбор персонала, вакансии…
Медсестра (стоматологический кабинет, ЕТС). Тел. 39-52-53, Адрес: ул… провизор (аптека, в/о,
наличие сертификата, опыт работы в производственной аптеке,…
Интересно, что Гугл может показать и те источники, кoтopые ключевых слов не содержат, однако они присутствуют в ссылках на показанную страницу. В таком случае при просмотре информации с помощью ссылки «Сохранено в кэше» будет видна надпись: «Эти слова присутствуют только в ссылках на эту страницу».
Описанный механизм работы Гугла хорошо виден, если посмотреть ключевые слова на странице сайта о работе в Самаре, сохраненной в кэше.
Эти слова выделены:
литейщик провизор маркшейдер
А это слова присутствеют только в ссылках на страницу:
стоматолог
4. Логическое «ИЛИ».
Оно пишется с помощью оператора OR. Обратите внимание: оператор этот должен быть написан заглавными буквами и отделен пробелами с обеих сторон от слов, расположенных перед ним и после него.
Важно знать, что, в отличие от Яндекса, Гугл не поддерживает такой оператор, как скобки.
Запрос: [литейщик OR провизор OR стоматолог OR маркшейдер]
Результаты 1 – 10 из примерно 2 030 000 для литейщик OR провизор OR стоматолог OR маркшейдер
5. Заглавные буквы или строчные?
В отличие от Яндекса Гугл не различает регистр букв. Все буквы воспринимаются как строчные, вне зависимости от того, как их вводили в поисковую строку. Запросы:
[Эйфелева Башня], [Эйфелева башня] и [эйфелева башня]
дадут одинаковые результаты.
Результат поиска на момент написания книги:
Результаты 1 – 10 из примерно 543 000 для Эйфелева Башня.
Результаты 1 – 10 из примерно 543 000 для эйфелева башня.
6. Стоп-слова.
Во вспомогательных инструкциях (хэлпах) написано, что Гугл, подобно большинству поисковых систем, игнорирует стоп-слова. Кроме того, хэлпы утверждают, будто, как и многие другие поисковики, Гугл имеет механизм принудительного включения стоп-слов в результаты поиска. К таким элементам относится большинство артиклей английского языка, союзов и предлогов русского языка.
В реальности ситуация, похоже, складывается иначе.
Тест: вводим по-русски букву [в]
Результат:
Результаты 1 – 10 из примерно 48 600 000 для в.
Вводим по-английски артикль [the]
Результат:
Результаты 1 – 10 из примерно 8 670 000 000 для the.
7. Оператор «Плюс» (+).
Тем не менее, бывают ситуации, когда надо принудительно включить в текст какое-либо слово, которое может иметь варианты написания. В хэлпе Гугла приводится пример с запросом «Star Wars Episode I», где римская единица представляет собой латинскую букву «I» («ай»). Если сделать запрос просто как:
[Star Wars Episode I], —
то результат будет следующий:
Результаты 1 – 10 из примерно 13 200 000 для Star Wars Episode I.
В том числе в выдаче появятся слова
«Episode II», «Episode IV» и т. п.
Если сделать запрос:
[Star Wars Episode +I], —
то результат будет такой:
Результаты 1 – 10 из примерно 9 290 000 для Star Wars Episode +I.
И в него войдут только тексты, содержащие слово «Episode I».
8. Морфология слов.
Гугл не поддерживает морфологию слов. Их изначально следует вводить в нужных формах. Правда, отчасти это компенсируется интеллектуальной системой поиска, которая может найти нужную словоформу в ссылках на страницу. Чтобы проверить утверждение об отсутствии поддержки морфологии, возьмем такое языковое сочетание, по которому можно увидеть все без исключения результаты. А сочетание следующее: «Глоклая куздра».
Тест:
Запрос:
[глоклая куздра]
Результаты 1–4 из примерно 16 для глоклая куздра.
В выдаче три адреса:
1.
2. =
3. -08-07
Запрос:
[глоклую куздру]
Результаты 1–1 из 1 для глоклую куздру.
В выдаче один адрес:
gb.anekdot.ru/vm.html?file=vm&date=1998-08-07
Запрос:
[глоклой куздре]
Результат: Не найдено ни одного документа, соответствующего запросу глоклой куздре.
Правда, это не мешает Гуглу иногда выделять по запросу «площадь» слово «площади» как релевантное. Однако подобное встречается на странице выдачи, но не в кэше.
Просто для сравнения приведем результат Яндекса. По всем трем запросам о «глоклой куздре» система дала на момент написания книги одинаковый результат:
Результат поиска: страниц – 13, сайтов – не менее 5.
9. Улучшение запроса во время поиска.
Поскольку Гугл выдает все слова, которые вы вводите в запросе, имеет смысл составлять новые запросы, содержащие те слова, которые вы забыли ввести в начале поиска, но обнаружили в ходе его выполнения в найденных текстах. В ряде случаев это помогает улучшить результат. Подчеркнем особо – это должны быть именно отдельные запросы. Добавление же новых слов к уже имеющемуся списку порой приводит к излишнему сужению диапазона результатов, ведь Гугл будет пытаться выдать документ, в котором содержатся все искомые слова.
10. Исключение слов из запроса. Логическое «НЕ».
Как известно, часто при составлении запроса встречается информационный мусор. Чтобы его удалить, стандартно используется оператор исключения – логическое «НЕ». В Гугле такой оператор представлен знаком «минус». Здесь он идентичен поисковому механизму Яндекса «двойная тильда» («~~»), исключающему слово из всего документа. Используя его, можно исключать из результатов поиска те страницы, которые содержат в тексте определенные слова.
Тест:
Запрос:
[Журавль колодец]
Результаты 1 – 10 из примерно 778 для Журавль колодец.
Запрос:
[Журавль колодец-птица]
Результаты 1 – 10 из примерно 715 для Журавль колодец – птица.
Запрос:
[Журавль —колодец-птица]
Результаты 1 – 10 из примерно 120 000 для Журавль – колодец – птица.
Запрос:
[Журавль – колодец-птица – птиц]
Результаты 1 – 10 из примерно 106 000 для Журавль – колодец – птица – птиц.
Запрос:
[Журавль – колодец – птица – птиц – журавли]
Результаты 1 – 10 из примерно 104 000 для Журавль-колодец-птица-птиц-журавли.
11. Поиск точной фразы.
Найти точную фразу, как мы уже говорили, требуется либо для поиска текста определенного произведения, либо для поиска определенных продуктов или компаний, в которых название или часть описания представляет собой стабильно повторяющееся словосочетание. В отличие от Яндекса, который может менять формы слов, входящих в текст, заключенный в кавычки, Гугл такой способностью не обладает. Мы отмечали, что эта система словоформы вообще не поддерживает.
Чтобы справиться с поиском точной фразы при помощи Гугла, требуется заключить запрос в кавычки (имеются в виду двойные кавычки, которые применяются, например, для выделения прямой речи).
Забавным, но показательным примером может быть задание из учебника русского языка для 7 класса под ред. Н. М. Шанского, где на стр. 45 предлагается разделить текст на абзацы. Автор – М. Шолохов. Произведение не указано. Приведем фрагмент текста:
[ «За Доном в лесу прижилась тихая, ласковая осень. С шелестом падали с тополей сухие листья. Кусты шиповника стояли, будто объятые пламенем, и красные ягоды в редкой листве их пылали, как огненные язычки.»].
Введем этот текст в кавычках в Гугл и получим следующий результат:
Результаты 1 – 10 из примерно 15 для «За Доном в лесу прижилась тихая, ласковая осень. С шелестом падали с тополей сухие листья. Кусты шиповника стояли, будто объятые пламенем, и красные ягоды в редкой листве их пылали, как огненные язычки».
Как выяснилось, этот фрагмент относится к произведению «Тихий дон» (книга четвертая). Курьез же состоит в том, что у М. Шолохова этот текст оказался вообще не разбитым на абзацы.
Гугл воспринимает в качестве знаков, связывающих слова в единую фразу, не только кавычки, но и такие символы, как дефис, слэш (косая черта), точка, знак равенства, апостроф.
Результаты 1 – 10 из примерно 27 400 для мать-и-мачеха.
Результаты 1 – 10 из примерно 27 300 для мать/и/мачеха.
Результаты 1 – 10 из примерно 27 300 для мать=и=мачеха.
Результаты 1 – 10 из примерно 27 300 для мать.и. мачеха.
Результаты 1 – 10 из примерно 27 300 для мать'и'мачеха.
Во всех вышеприведенных случаях первым в выдаче стоит текст, фрагмент которого приведен ниже:
«Мать-и-мачеха (Tussilago farfara) – одно из самых раноцветущих растений: зацветает в… Как лекарственное растение мать-и-мачеха применяется, прежде всего,…».
При этом все три слова:
«мать», «и», «мачеха» —
рассматриваются как отдельные, но стоящие рядом и в этой же самой последовательности.
Интересно, что по запросу:
[мать-и-мачеха] —
оказалось на 100 документов больше, чем по остальным, но если взять это слово в кавычки, то результат уравнивается:
Результаты 1 – 10 из примерно 27 300 для «мать-и-мачеха».
Чтобы прояснить этот казус, введем следующий запрос:
[мать-и-мачеха «мать-и-мачеха»].
В итоге получим:
Результаты 1 – 10 из примерно 27 для мать-и-мачеха – «мать-и-мачеха».
В выдаче появятся тексты такого содержания:
Санкт-Петербургская Федерация Настольного Футбола Матьимачеха. Королев Петр Трушков Кирилл. 2. Экспромт. Гриневич Василий… Матьимачеха – игроки получают по 60 рейтинговых очков; Экспромт – игроки… -09-03.html– 17k.
12. Количество слов в строке поиска.
Во многих источниках встречается информация, согласно которой поисковая строка Гугла вмещает 10 слов или что Гугл проводит поиск лишь по 10 словам. Проведенный нами эксперимент эти данные не подтвердил. Так, введем запрос из 23 слов:
[крупа мука яйца масло соль перец лук макароны молоко хлеб сметана сахар помидоры рубленое мясо фарш говядина майонез салат огурцы гамбургеры булочки сыр]
Результат:
Результаты 1–3 из примерно 5 для крупа мука яйца масло соль перец лук макароны молоко хлеб сметана сахар помидоры рубленое мясо фарш говядина майонез салат огурцы гамбургеры булочки сыр.
Ресторан. Ru | Кулинария | Кулинарные рецепты | Вторые блюда | С…
(салат, помидоры, огурцы, гамбургеры, булочки, сыр, майонез)… (макароны, лук, перец, помидоры, мука, масло, рубленое мясо, мясной бульон, сыр)…
В КЭШе подчеркнуты все 23 слова, и в тексте они также присутствуют. Если изменить запрос, используя логическое «ИЛИ» вместо логического «И», то результат прогнозируемо меняется, но все слова в выдаче по-прежнему выделены Гуглом.
[крупа OR мука OR яйца OR масло OR соль OR перец OR лук OR макароны OR молоко OR хлеб OR сметана OR сахар OR помидоры OR рубленое OR мясо OR фарш OR говядина OR майонез OR салат OR огурцы OR гамбургеры OR булочки OR сыр]
Результат:
Результаты 1 – 10 из примерно 3 430 000 для крупа OR мука OR яйца OR масло OR соль OR перец OR лук OR макароны OR молоко OR хлеб OR сметана OR сахар OR помидоры OR рубленое OR мясо OR фарш OR говядина OR майонез OR салат OR огурцы OR гамбургеры OR булочки OR сыр.
13. Стемминг (а также wildcard).
Стемминг – возможность усечения слова до его корня. После усечения слова до его корня производится поиск релевантных вариантов слов, производных от этого корня. Другими словами, стемминг позволяет искать все однокоренные слова.
Техника поиска по маске (wildcard) предствавляет собой написание базового слова (или части слова), после которых идет символ маски – «звездочка» (*), заменяющая собой любое возможное продолжение слова. Таким образом, если поисковая машина поддерживает поиск по маске, то ищутся все слова, которые одинаково начинаются. Эта техника особенно удобна, когда вам неизвестно точное написание конкретного слова, либо когда вы хотите включить все возможные варианты слова в свой поиск. Например, когда по запросу
[тарт*]
получают как «тарталетку», так и «тартар».
Так вот, Гугл эти технологии не поддерживает (как, впрочем, и Яндекс). Зато он поддерживает вариант, когда вместо целого слова вводится звездочка.
Например, по запросу:
[красная * площадь]
будет выдано:
«Красная и Манежная площади»,
с подчеркиванием всех этих слов, в том числе буквы «и». В какой-то степени это похоже на поиск с расстоянием между словами, применяемый в Яндексе. По запросу:
[красная * площадь – «красная площадь»] —
будут получены результаты:
«Красная (Семеновская) площадь»,
где слово «Семеновская» не считается релевантным и не подчеркивается Гуглом.
14. Дополнительные операторы.
14.1. Оператор cache:
Поисковая машина хранит версию текста, которая проиндексирована поисковым пауком, в специальном хранилище в формате, называемом кэшем. Кэшированную версию страницы можно извлечь, если оригинальная страница недоступна (например, не работает сервер, на котором она хранится). Кэширо-ванная страница показывается в том виде, в котором она хранится в базе данных поисковой машины, и при показе пользователю сопровождается надписью наверху страницы о том, что это страница из кэша. Там же содержится информация о времени создания кэшированной версии. На странице из кэша ключевые слова запроса подсвечены, причем каждое слово для удобства пользователя подсвечено своим цветом. Например:
«Это сохраненная в кэше G o o g l e копия страницы -09–03.html, записанная 4 янв 2006 06:07:09 GMT.».
Можно создать запрос, который сразу будет выдавать кэшированную версию страницы с определенным адресом: Так, запрос:
[cache:]
будет сразу выдавать версию страницы из кэша, а не проверять ее нынешнее состояние.
Внимание: пробела между оператором cashe: и URL’ом запрашиваемой страницы быть не должно.
Если вы хотите, чтобы ключевые слова на кэшированной версии страницы были подчеркнуты, их надо через пробел указать после оператора cashe: и адреса страницы.
Например:
[cache: библиотека].
14.2. Оператор info:
Оператор info: позволяет увидеть информацию, которая известна Гуглу об этой странице.
Например, запрос:
[info:]
дает следующий результат:
BSTM – Бизнес-школа технологий менеджмента | Екатеринбург: Новости phpsm, phpsitemanager… Президентская программа. О программе – Стратегический менеджмент – Менеджмент качества – Маркетинг на предприятии…/ Google может показать следующую информацию об этом адресе:
Показать сохраненную в Google версию
Найти страницы, похожие на
Найти страницы, ссылающиеся на
Найти страницы на сайте
Найти страницы, упоминающие ссылку «»
Внимание: пробела между оператором info: и URL’ом запрашиваемой страницы быть не должно.
14.3. Оператор site:
Этот оператор ограничивает поиск конкретным доменом. То есть, если сделать запрос:
[маркетинг разведка site:-tc.ru], —
то результаты будут получены со страниц, содержащих слова «маркетинг» и «разведка» именно в домене «acfor-tc.ru», а не в других частях Интернета. Если сделать запрос:
[scip site: ru], —
то будут получены документы, содержащие слово «scip» и расположенные в доменной зоне «.ru».
Внимание: пробела между оператором site: и URL’ом запрашиваемой страницы быть не должно.
14.4. Оператор link:
Этот оператор позволяет увидеть все страницы, которые ссылаются на страницу, по которой сделан запрос. Например, по запросу:
[link:] —
будут получены известные Гуглу ссылки на статью о поиске через Яндекс, написанную liveuser.
Внимание: пробела между оператором link: и URL’ом запрашиваемой страницы быть не должно.
14.5. Оператор allintitle:
Если запрос начать с оператора allintitle:, что переводится как «все – в заголовке», то Гугл выдаст тексты, в которых все слова запроса содержатся в заголовках (внутри тега Title в HTML).
Например, запрос:
[allintitle: википедия яндекс] —
даст результаты, где слова «википедия» и «яндекс» содержатся внутри тега Title на просмотренных поисковой машиной страницах. На момент написания статьи результат был таким:
Результаты 1–3 из примерно 7 для allintitle: википедия яндекс.
14.6. Оператор intitle:
Показывает страницы, в заголовке которых содержится слово, расположенное непосредственно после опретора intitle:,; все остальные слова запроса могут находиться в любом месте текста. Если поставить оператор intitle: перед каждым словом запроса, это будет эквивалентно использованию оператора allintitle:
[intitle: википедия яндекс].
На момент написания статьи результат был таким:
Результаты 1 – 10 из примерно 888 для intitle: википедия яндекс.
Внимание: пробела между оператором intitle: и последующим словом быть не должно.
14.7. Оператор allinurl:
Если запрос начинается с оператора allinurl:, то поиск ограничивается теми документами, в которых все слова запроса содержатся исключительно в адресе страницы, то есть в URL.
Так, на момент написания статьи для запроса:
[allinurl: narod razvedka] —
результат был таким:
Результаты 1 – 10 из примерно 14 для allinurl: narod razvedka.
Внимание: оператор allinurl: работает лишь со словами, а никак не со служебными фрагментами URL. Такие специальные символы, как слэш или точка, не окажут положительного влияния на результат. Напротив, влияние будет отрицательным, поскольку они могут быть восприняты Гуглом как попытка ввести в запрос точную фразу.
Например, запрос:
[allinurl: narod.razvedka],
равно как и
[allinurl: narod/razvedka] —
результата не дал вообще.
14.8. Оператор inurl:
Слово, написанное слитно с оператором inurl:, будет найдено лишь в адресе страницы Интернета, а остальные слова – в любом месте такой страницы.
Например, для того, чтобы найти слово «разведка „на сайтах, содержащих в адресе сочетание букв «tc“, можно сделать такой запрос:
[inurl: tc razvedka].
Результат на момент написания статьи:
Результаты 1–1 из 1 для inurl: tc razvedka.
Был представлен следующим текстом:
«Otryady-5
Razvedka okazalas' neskol'ko utomitel'noi (obratno shli V lavirovku). Poetomu k pirsu my podoshli sovershenno izmuchennye: no ne stol'ko samoi razvedkoi…. www-lat.rusf.ru/tc/tc08/08otr5.htm».
Если оператор inurl: поставить перед каждым словом запроса, это будет эквивалентно использованию оператора allinurl:.
Внимание: пробела между оператором inurl: и последующим словом быть не должно. Внимание: оператор inurl: работает только со словами и не работает со служебными фрагментами URL. Такие специальные символы, как слэш или точка, не окажут положительного влияния на результат. Влияние будет отрицательным, так как они могут быть восприняты Гуглом как попытка ввести в запрос точную фразу.
Например, запрос
[inurl: tc/razvedka],
равно как и
[inurl: tc.razvedka] —
результата не дал вообще. Результат мог бы быть, если бы в адресе какой-то страницы содержалась точная фраза «tc/razvedka» или «tc.razvedka».
В этом можно убедиться, введя запрос:
[inurl: kubok].
Результаты 1 – 10 из примерно 28 400 для inurl: kubok.
И этот результат начинается с текста:
«Кубок Яндекса. Как искать эффективно
– Вопросы и ответы
– Предложение организаторам соревнований
– Форум
– Кубок в LiveJournal kubok…kubok.yandex.ru/»
По запросу:
[inurl: kubok/45852]
Результаты 1–2 из примерно 44 для inurl: kubok/45852.
И этот результат начинается с текста:
«kubok: Хозяйке на заметку. Хозяйке на заметку. Материал рассчитан на подготовленного читателя, знающего, что такое стоп-слова и операнды, чем ~~ отличается от && и зачем их…www. livejournal.com/community/kubok/45852.html».
14.9. Оператор related:
Этот оператор описывает страницы, которые «похожи» на какую-то конкретную страницу. Так, запрос
[related: it2b.ru]
дает результат:
Результаты: 1 – 10 из приблизительно 29 подобных it2b.ru.
Мы не считаем, что все страницы действительно подобны странице сайта it2b. ru, с точки зрения человека, а не робота. Хотя некоторые из них действительно посвящены схожей тематике.
На самом деле первым в выдаче стоит сайт it2b.ru, который специализируется на вопросах использования технологий разведки для бизнеса. А вот вторым – сайт компании «SW-Trans», предлагающей услуги по перевозке грузов.
Можем предположить, что основанием для сравнения двух сайтов послужило упоминание на ресурсе грузовой компании услуг по охране маршрутов, их сопровождению машинами со спецсигналами, о предусмотренных в таких случаях пропусках и о «решении всех возможных дополнительных проблем, возникающих при транспортировке». Наряду с транспортной компанией, Гугл включил в «подобные» страницы и такие источники, как журнал «Sales/Business (Продажи)», в котором встречается немало публикаций о предпринимательских рисках и о конкурентной разведке, а также компанию «Информзащита», работающую в области обеспечения информационной безопасности.
Внимание: пробела между оператором related: и последующим словом быть не должно.
14.10. Оператор define:
Этот оператор выполняет роль, своего рода, толкового словаря, позволяющего быстро получить определение того слова, которое введено после оператора.
Например:
[define: разведка].
Результат:
Определения разведка в интернете:
совокупность мер для сбора данных о действительном или возможном противнике.
Интересная особенность оператора define: состоит в его способности искать толкования конкретных выражений. В качестве фразы он понимает все слова, написанные после оператора, в том числе и без кавычек, просто через пробел. Например:
[define: большой взрыв].
Результат:
Определения большой взрыв в интернете:
Большой Взрыв – взрывной процесс в котором, по данным современной науки, наша Вселенная родилась из так называемой космологической сингулярности.
ru.wikipedia.org/wiki/Большой_Взрыв.
Правда, иногда этот оператор может и повеселить, представив материал, в котором мало кто разберется. Например, по запросу
[define: ложка] —
результат будет следующим:
Определения ложка в интернете:
*блесна, основанная на подражании раненой рыбке.
fisherman.com.ua/files/fishsay.php.
А по запросу:
[define: осел] —
результат такой:
Похожие фразы: буриданов осел
Определения осел в интернете:
*строгий, собранный в кучу, материал
astro.rin.ru/htmls/nostradamus/astro1826-5.html.
ВНИМАНИЕ: наличие или отсутствие пробела между оператором define: и последующим словом на результате не сказывается.
14.11. Поиск синонимов
В хэлпе Гугла сказано, что если вы хотите найти тексты, содержащие не только ваши ключевые слова, но и их синонимы, то можно воспользоваться оператором «~».
Нам не удалось найти подтверждения этому заявлению.
Так, мы сравнили два запроса и не нашли разницы:
[~опережающий ~разведка]
Результаты 1 – 10 из примерно 33 100 для ~опережающий ~разведка.
[опережающий разведка]
Результаты 1 – 10 из примерно 33 100 для опережающий разведка.
14.12. Поиск числовых значений
Для тех, кому приходится работать с цифрами, Гугл дал возможность искать диапазоны между числами. Для того чтобы найти все страницы, содержащие числа в неком диапазоне «от – до», надо между этими крайними значениями поставить две точки.
Например, по запросу
[численность населения 1913..1917]
будут выданы страницы:
Народная энциклопедия городов и регионов России. Города. Санкт… Подчиненные поселки городского типа, численность населения на 1.01.2000… Вскоре после начала Первой мировой войны актом от 18 (31) августа 1914 г… rfdata.al.ru/auto/city/18/667.HTM —
с выделенным числом «1914», а также:
Известия Уральского государственного университета № 9(1998…
За 192 года своего существования с 1723 по 1915 гг. численность населения города увеличилась в 28 раз, достигнув 112 тыс. чел. Следует отметить, что город… proceedings.usu.ru/…/0009(03_05-1998)&xsln=showArticle.xslt&id=a14&doc=../content.jsp
с выделенным числом «1915». Подобный пример приведен в хэлпе Гугла на примере цены DVD:
[DVD player $50..$100].
14.13. Кнопка «Мне повезет» (в английском варианте – «I'm Feeling Lucky»)
Кнопка «Мне повезет» расположена на главной странице Гугла. На наш взгляд, это замечательная идея. По этой кнопке система выдает наиболее релевантный, с ее точки зрения, результат. Обычно это помогает при быстром поиске какой-то фактической информации, когда не требуется подробного изучения вопроса. После нажатия кнопки «Мне повезет» вы попадаете непосредственно на сайт, который Гугл предлагает в качестве искомого. Например, запрос по указанной кнопке:
[активные формы] —
открывает непосредственно сайт одноименной консалтинговой компании
/.
Поиск в Рамблере
Операторы Рамблера в данном разделе рассматриваются в сравнении с операторами Яндекса и Гугла. И, соответственно, те из них, которые имеют аналоги в двух других поисковых системах, здесь будут описаны не слишком подробно. Детальную характеристику мы сочли необходимым дать отличиям Рамблера от Яндекса и Гугла.
Рамблер, на наш взгляд, – третья по значимости поисковая машина для работы с русскоязычными текстами. Причем, это третье место находится на очень значительном расстоянии от первых двух. Мы нечасто обращаемся к Рамблеру, поскольку, в зависимости от задачи, обычно начинаем поиск с Яндекса, после чего переходим в Гугл, или наоборот – начинаем с Гугла, а затем уточняем результат в Яндексе. В большинстве случаев этого бывает достаточно при работе с каким-то фактическим материалом, главным критерием которой выступает не полнота ответа, а его правильность.
Вместе с тем, и специалисты конкурентной разведки, и представители других специальностей, которым часто приходится заниматься профессиональным поиском в Интернете, сходятся во мнении, что лишь использование нескольких поисковых машин может дать результат, претендующий на полноту ответа на вопрос. Одна поисковая система не способна справиться с подобной задачей. Связано такое положение вещей с тем, что, во-первых, поисковые роботы физически не успевают угнаться за стремительно растущим Интернетом, а во-вторых, с тем, что у разных поисковых машин – разные алгоритмы обработки собранной информации, а значит, и разные результаты этой обработки.
Как следствие, нет и не может быть полного совпадения результатов поиска, особенно когда речь идет о редком запросе.
Например, поиск во всех трех системах точной фразы (фрагмента песни) «дым, дым в твоих глазах» дал на момент написания статьи такие результаты:
Запрос:
[ «дым, дым в твоих глазах»]
Результат:
Яндекс: Результат поиска: страниц – 0
Гугл: Не найдено ни одного документа, соответствующего запросу «дым, дым в твоих глазах».
Рамблер: Вы искали: «дым, дым в твоих глазах», найдено сайтов: 1, документов: 1
Результат этого поиска можно увидеть здесь:
http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Dym_Dym_v_Glazakh.html
Это не значит, что Рамблер лучше всех. Знать заранее, в какой поисковой системе и что именно удастся найти, невозможно. В этом смысле показателен пример с поиском фразы – фрагмента редкой песни: «аэропорт аэропорт ночное зарево огней».
Запрос:
[ «аэропорт аэропорт ночное зарево огней»]
Результат:
Яндекс: Результат поиска: страниц – 133, сайтов – не менее 4.
http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Aeroport_Yandex.html Гугл: Результаты 1–6 из примерно 32 для «аэропорт аэропорт ночное зарево огней».
http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Aeroport_Google.html
Рамблер: Не найдено ни одного документа, полностью соответствующего запросу «„аэропорт аэропорт ночное зарево огней“». http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Aeroport_Rambler.html
Итак, перейдем к рассмотрению работы с Рамблером. Основу этой работы составляет раздел «Помощь», расположенный по адресу: . ru/doc/help.shtml – и форма расширенного поиска, находящаяся по адресу: -bin/advanced.cgi?set=www.
1. Какие ресурсы Рамблер индексирует.
По утверждению создателей системы, Рамблер индексирует сайты, размещенные в следующих доменах первого уровня:
Российская Федерация:.ru,su
Украина:.ua
Белоруссия:.by
Казахстан:.kz
Киргизия:.kg
Узбекистан:.uz
Грузия:.ge
Сайты, находящиеся в других доменах, поисковик игнорирует.
Для тех, кто хочет, чтобы их сайт, расположенный в другой доменной зоне, был проиндексирован Рамблером, эта поисковая машина оставляет небольшую надежду на успех.
Если Ваш сайт находится вне названных доменов (например, в зонах. com,org,net), но существенная часть сайта содержит русскоязычные материалы или, по Вашему мнению, он может представлять интерес для русскоязычной аудитории Рамблера, Вы можете отослать письмо на адрес [email protected] с просьбой включить Ваш сайт в число сканируемых, либо заполнить форму обратной связи. Наши сотрудники рассмотрят эту просьбу и примут решение о целесообразности такого включения.
Кроме того, Рамблер утверждает, что «умеет извлекать гиперссылки из объектов Macromedia Flash», но не индексирует непосредственно сами тексты flash-объектов. Для таких технически продвинутых сайтов специалисты поисковой системы советуют создавать HTML-копию.
2. Поддержка морфологии слов.
По умолчанию, Рамблер поддерживает морфологию слов. Отключение поддержки морфологии предусмотрено, но требует использования специального оператора – слово должно быть взято в кавычки.
Наш эксперимент подтвердил, что система морфологию слов действительно поддерживает.
3. Скобки.
Рамблер позволяет использовать скобки для группировки слов и применения ко всем словам, расположенным в скобках, одного оператора, который пишется перед скобкой. В этом описываемая в данном разделе система ничем не отличается от Яндекса, поэтому подробнее применение скобок мы рассматривать не станем.
4. Транслитерация.
Люди довольно часто делают ошибки при вводе текста и вместо русских букв печатают их английских «близнецов». Например, букву «с». Рамблер говорит, что старается исправлять такие огрехи, однако не гарантирует результата.
Эксперимент показал, что система действительно справляется с опечатками транслитерации, если количество таких ошибок в слове невелико. Убедитесь сами.
Запрос (все буквы русские):
[ «глОКлАя кУздРА»]
Результат: Вы искали: «глОКлАя кУздРА», найдено сайтов: 5, документов: 37.
Запрос (заглавные буквы – латинские):
[ «глOKлAя кYздPA»]
Результат: Не найдено ни одного документа, полностью соответствующего запросу ««глOKлAя кYздPA»».
Запрос (заглавные буквы – латинские):
«глOклая куздPа»
Результат: Вы искали: ««глOклая куздPа»», найдено сайтов: 5, документов: 37.
Чтобы не загружать читателя лишними примерами, скажем лишь, что при трех опечатках правильный поиск еще проводился, но после появления четвертой неправильно написанной буквы результат поиска стал нулевым. Рамблер в комментариях к результату поиска в этом случае просто порекомендовал пользователям быть внимательнее при вводе текста.
5. Регистр букв.
Как правило, Рамблер не учитывает регистр букв, причем он распространяет это правило не только на слова запроса, но и на операторы.
Действительно, запросы «глоклая куздра» и «ГлоКЛаЯ КУздРа» дали одинаковые результаты.
Запрос:
[ «глоклая куздра»]
Результат: Вы искали: «„глоклая куздра“«, найдено сайтов: 8, документов: 45
Запрос:
[ «ГлоКЛаЯ КУздРа»]
Результат: Вы искали: «„ГлоКЛаЯ КУздРа“«, найдено сайтов: 8, документов: 45
Однако Рамблер сообщает, что он делает исключение из этого правила: если в запросе, как минимум, два слова, идущих подряд, написаны с заглавной буквы, система, как утверждают ее создатели, старается искать эти слова также с заглавной буквы. То есть, Рамблер пытается помочь тем, кто ищет имена собственные или географические названия.
Проведенный нами эксперимент этого не подтвердил.
Запросы:
[слава зайчиков] и [Слава Зайчиков]
выдали в Рамблере одинаковое количество страниц в выдаче.
Вы искали: слава зайчиков, найдено сайтов: 813, документов: 2621
Вы искали: Слава Зайчиков, найдено сайтов: 815, документов: 2621.
Это похоже на результаты Гугла, который не различает заглавные и прописные буквы:
Результаты 1 – 10 из примерно 138 000 для слава зайчиков
Результаты 1 – 10 из примерно 138 000 для Слава Зайчиков.
Тогда как в Яндексе, который различает заглавные и прописные буквы, результат был иным:
Запрос: [слава зайчиков]
Результат поиска: страниц – 403, сайтов – не менее 173.
Запрос: [Слава Зайчиков]
Результат поиска: страниц – 64, сайтов – не менее 33.
Совершенно идентичные предыдущим результаты были получены и на запросах из трех слов:
[одна баба сказала] и [Одна Баба Сказала]
Результат: Вы искали: одна баба сказала, найдено сайтов: 42056, документов: 619112
Результат: Вы искали: Одна Баба Сказала, найдено сайтов: 42054, документов: 619112.
6. Стоп-слова и оператор «кавычки».
Подобно Яндексу, Рамблер при обработке запроса может проигнорировать стоп-слова. Авторы системы утверждают, что для принудительного включения указанных элементов (или каких-либо других, подобных им) в выдачу, нужное слово следует заключить в кавычки.
Эксперимент расставил акценты иначе. Стоп-слова, независимо от того, закавычены они или нет, одинаково попадают в выдачу.
А вот остальным словам (не входящим в список стоп-слов), которые необходимо в обязательном порядке включить в выдачу, кавычки действительно обеспечивают обязательное включение в результат. Это эквивалентно оператору «плюс» в Яндексе и Гугле.
Вы искали: «с» пингвином, найдено сайтов: 15468, документов: 166651
Вы искали: с пингвином, найдено сайтов: 15468, документов: 166651.
Вы искали: «the» apple please, найдено сайтов: 2700, документов: 16047
Вы искали: the apple please, найдено сайтов: 2700, документов: 16047.
Пример работы кавычек в иных случаях, а не только со стоп-словами, приведен в следующем разделе – Логическое «И».
Кроме того, как мы уже говорили, кавычки могут выступать аналогично оператору «восклицательный знак» в Яндексе. Слово, указанное в запросе в кавычках, будет присутствовать в результатах поиска лишь в той форме, в которой вы его зададите.
7. Логическое «И».
Как и в Яндексе с Гуглом, роль логического «И» в Рамблере выполняет пробел. В принципе, можно ввести вместо пробела слово AND, но на практике, по вполне понятным причинам, так обычно не делается.
Подобно Яндексу, Рамблер достаточно вольно обращается со словами, которые соединены пробелом – он может легко выдать не только те документы, где присутствуют ВСЕ слова запроса, но и те, где на одно-два слова меньше.
В этом можно убедиться, сравнив два запроса:
[кошки собаки верблюды зебры носороги]
Вы искали: кошки собаки верблюды зебры носороги, найдено сайтов: 42, документов: 296
http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Rambler_bez_Nosorogov.html
и
[ «кошки» «собаки» «верблюды» «зебры» «носороги»]
Вы искали: «кошки» «собаки» «верблюды»…, найдено сайтов: 9, документов: 53
http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Rambler_s_Nosorogami.html.
Во втором случае все без исключения элементы запроса принудительно включены в выдачу – за счет кавычек, поэтому документов в выдаче значительно меньше.
8. Логическое «ИЛИ».
Написание этого оператора приспособлено как для любителей Яндекса, так и для тех, кто предпочитает работать с Гуглом.
Как и в Яндексе, в Рамблере логическое «ИЛИ» может быть представлено вертикальной чертой |.
Для тех, кто привык к логическому «ИЛИ» Гугла, данная система предоставляет возможность пользоваться также оператором OR.
Приоритета нет ни у одного из этих двух указанных вариантов.
Наример:
Вы искали:
дуоденогастрэктомия OR циклопентанпергидрофенантрен,
найдено сайтов: 266, документов: 813.
Вы искали:
дуоденогастрэктомия | циклопентанпергидрофенантрен,
найдено сайтов: 266, документов: 813
9. Логическое «НЕ».
Логическое «НЕ» в Рамблере похоже на таковое в Гугле и распространяется на весь документ. Сузить запрос, подобно Яндексу, до предложения, эта система не позволяет. Записывается логическое «НЕ» как NOT.
Запрос: [журавль]
Вы искали: журавль, найдено сайтов: 43085, документов: 554542
Запрос: [журавль NOT колодец]
Вы искали: журавль NOT колодец, найдено сайтов: 41447, документов: 528644
Запрос: [журавль NOT (колодец | птица)]
Вы искали: журавль NOT (колодец | птица), найдено сайтов: 33059, документов: 390789
Запрос: [журавль NOT (колодец | птица | «журавль»)]
Вы искали: журавль NOT (колодец | птица | «журавль»), найдено сайтов: 23824, документов: 225549
Запрос: [журавль NOT (колодец | птица | «журавль» | «журавлей»)]
Вы искали: журавль NOT (колодец | птица | «журавль» | «журавлей»), найдено сайтов: 21197, документов: 192387
10. Стемминг (а также wildcard).
Рамблер НЕ поддерживает ни стемминг, ни вилдкард.
11. Поиск с заданным расстоянием.
Рамблер не очень качественно поддерживает поиск с расстоянием, несмотря на то, что его «Помощь» утверждает обратное.
Рамблер говорит о том, что когда он ищет слова «в документе», то он реально ищет их на расстоянии не более 40 слов друг от друга. Это, конечно, не поиск с расстоянием, а скорее ограничение расстояния, но, по крайней мере, это прямо заявленное ограничение.
Однако при этом Рамблер утверждает, что уменьшить расстояние в 40 слов можно. Запрос, при котором слова должны находиться рядом, в «Помощи» выглядит так:
[2, красная армия]
Интересно, что при проверке этого утверждения мы обнаружили, что поисковик, похоже, – рекордсмен по числу сайтов, которые можно реально открыть в результатах запроса. Так, в случае с запросом про «красную армию» Рамблер показал более двух с половиной тысяч сайтов и был готов демонстрировать их и дальше, если бы мы не прекратили свой эксперимент.
Результат можно увидеть по адресу:
http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Three_Thousands_Sites.html.
Еще нам показался необычным (и неудобным) способ перехода к следующей группе сайтов в результатах выдачи. Так, если в Яндексе можно уйти, например, на 20-ю страницу выдачи, после чего внизу страницы с результатами последней доступной для просмотра в группе страниц станет 30-я, то в Рамблере для того, чтобы эта 30-я страница стала видна, требуется сначала выбрать переход к следующей группе сайтов вверху страницы, под строкой с запросом, и только после этого можно выбрать последнюю страницу следующей группы сайтов и перейти на нее. Подобная организация перехода в два приема совершенно непонятна. Однако вернемся к непосредственным результатам запроса
[2, красная армия], —
который, согласно хэлпу Рамблера, должен рассматривать цифру «2» как служебную информацию о расстоянии между словами, и выдавать результаты, где слова «красная» и «армия» находятся рядом.
Наше внимание привлекло то, что цифра «2», которая в поиске должна была играть роль элемента оператора запросов, в выдаче обозначалась как слово, релевантное искомому.
Чтобы не пролистывать результаты по «красной армии» до 47-тысячного сайта, мы попробовали испытать поиск с расстоянием, как он описан в разделе «Помощь», на другом запросе и не полчили положительного результата. Для того чтобы провести такую работу, мы взяли за основу фразу из песни: «Майскими короткими ночами, отгремев, закончились бои».
Запрос: [2, «майскими» «ночами» +отгремев]
Вы искали: 2, «майскими» «ночами» +отгремев, найдено сайтов: 48, документов: 293.
В выдачу попали документы, не содержащие слова запроса непосредственно рядом друг с другом, более того, цифра «2» опять оказалась рассмотрена в качестве части введенного в поисковую строку выражения:
Фотографии, рекомендованные автором Roman Mezenin:: Галерея:: Клуб Foto.ru
… Портрет Комм. 6 / Рек. 2 Майскими короткими ночами / отгремев, закончились бои
05.06.2005 – 26 Kb – … – Восстановить текст – Найти похожие – Рубрика: Фото
Морской интернет-клуб
Майскими короткими ночами, Отгремев, закончились бои. Где же вы теперь, друзья – однополчане, Боевые спутники мои? Страницы: 1 2 3 4 5 6 7
18.10.2005 – 10 Kb – – Восстановить текст – Найти похожие.
Остальные операторы Рамблера вынесены в «Форму расширенного поиска», расположенную по адресу: -bin/advanced.cgi?set=www.
11.1. Поиск в заголовках страниц (<title>).
Этот оператор, существующий в Яндексе и Гугле как самостоятельный, в Рамблере тоже есть, но в «Помощи» системы он не указан и найти его нам удалось лишь в «Форме расширенного поиска».
Ссылка на форму расширенного поиска находится непосредственно справа от поисковой строки Рамблера.
11.2. Поиск ссылающихся страниц (link).
Этот оператор также встретился нам только в «Форме расширенного поиска».
Возможность использования его на практике проверена. Работает.
12. Язык документа.
Принудительное назначение конкретного языка документа возможно в «Форме расширенного поиска». При этом Рамблер предлагает на выбор один из трех языков: русский, украинский или английский.
По умолчанию в поле выбора языка отмечен вариант «любой».
13. Формат документа.
Выбор форматов, как и языков, по современным меркам не впечатляет. Предлагаются HTML, Word (.doc) и Adobe Acrobat (.pdf).
14. Дата документа.
Рамблер, подобно Яндексу, предлагает интересную возможность выбора даты в «Форме расширенного поиска», но если Яндекс, помимо конкретного диапазона с датами, позволяет выбрать, скажем, «последние 2 недели» или «последний год», то в Рамблере можно провести выборку лишь в конкретном временном диапазоне.
15. Поиск на определенном сайте.
Представлен строкой в «Форме расширенного поиска» с названием: «Искать документы только на следующих сайтах:».
Таким образом, на наш взгляд, Рамблер представляет определенный интерес для поиска страниц, когда требуется полнота выборки, но чаще эта поисковая система выполняет роль «запасного игрока» – на тот случай, если запросы, введенные в Яндекс и Гугл, не дадут желаемых результатов.
Сам Рамблер, похоже, с этим смирился и не стремится каким-либо образом менять ситуацию, о чем косвенно свидетельствует довольно бедный набор возможностей настройки запроса.
Однако порой система может быть весьма полезна, что вновь и вновь подтверждается практикой.
Визуальный поисковик Quintura Search
Наряду с рассмотренными выше поисковыми машинами, существует довольно необычный продукт – визуальный поисковик. Примером такой системы служит бесплатная программа Quintura Search. Вы можете выбрать поисковую машину, на которой будет основываться дальнейший поиск (на момент написания книги в дистрибутив по умолчанию входили Яндекс, Google и Рамблер, но на сайте программы можно было добавить плагины, позволяющие пользоваться практически любым известным поисковиком). Затем вы получаете результаты в виде слов, расположенных вокруг ключевого понятия. Справа от этого круга расположены непосредственно результаты поисковых запросов по этим словам. При наведении курсора на какое-то одно из них, результат в правом окне меняется – он содержит те ключевые слова, на которые наведен курсор.
Так, например, если ввести слово «электровоз», то в правом окне появятся сайты, которые Яндекс выдает в ответ на этот запрос. Вокруг него размещены слова, которые встречаются рядом с ним в системе – такие, как «грузовой», «постоянный», «контактный», «купить» и другие. Это видно на рис. 3.
При наведении курсора на любое из этих слов справа появляются дополнительные слова, и в левой части окна программы запроса набор их также меняется (рис. 4).
Вот как характеризуют программу Quintura Search специалисты, которые ее создали.
Quintura Search ищет так, как ищут люди. Теперь поиск в интернете – это уже не просто поиск слов запроса, это визуализированный поиск с учетом контекста запроса, а также группировка результатов, визуализация и управление контекстом.
Quintura Search предлагает для уточнения смысла запроса использовать термины (подсказки), которые по смыслу связаны со словами запроса
Невидимый Интернет
Феномен невидимого Интернета и принципы работы с ним детально описаны в лучшей, на наш взгляд, книге по этому вопросу Криса Шермана и Гэри Прайса «Невидимый Интернет».
Видимый Интернет – это та часть ресурсов, содержимое которой может быть обнаружено с помощью поисковых машин. К Невидимому Интернету относятся ресурсы, которые существуют в Глобальной Сети, и к которым можно получить доступ, если знать, где эти ресурсы находятся. Однако с помощью поисковых машин найти содержимое ресурсов Невидимого Интернета нельзя.
По мнению разных авторов, к видимому Интернету относится порядка 20–30 % содержимого Сети. Самые смелые источники указывают другую цифру – не более 50 %. Таким образом, можно утверждать, что невидимый Интернет – это основная часть ресурсов, доступных онлайн.
Причины существования невидимого Интернета
Невидимый Интернет существует в силу целого ряда причин, как технического, так и организационного характера.
Некоторые ресурсы могут быть индексированы поисковыми машинами с технической точки зрения, главное – обнаружить содержимое страницы. Некоторые виды контента не индексируются информационными системами потому, что «пауки» сознательно настроены так, чтобы игнорировать те или иные адреса.
К каким-то ресурсам доступ ограничили сами владельцы страниц.
А некоторые страницы имеют такой формат, который пока еще не поддерживается поисковыми машинами.
Вот что говорят о невидимом Интернете и причинах его существования Крис Шерман и Гэри Прайс.
Парадокс невидимого Интернета в том, что легко понять, почему он существует, но трудно точно его определить в конкретных, специфических терминах.
Невидимый Интернет трудно точно определить и классифицировать по нескольким причинам.
1. Большинство страниц невидимого Интернета могут быть проиндексированы технически, но не индексируются, потому что поисковые системы решили их не индексировать. Это очень важный момент для невидимого Интернета – что поисковики просто решили исключить из индексации страницы определенного содержания. Мы не говорим о страницах со «взрослым» содержанием или спамерских сайтах, вовсе наоборот. Большинство «невидимых» сайтов имеют высококачественный контент. Просто эти ресурсы не могут быть найдены с помощью поисковых машин общего назначения, т. к. они были заблокированы.
Есть много причин, почему так происходит. Если поисковик изменит свою политику по отношению к страницам подобного рода, то эти страницы станут частью видимого Интернета.
2. Довольно легко классифицировать сайты как часть видимого или невидимого Интернета, если посмотреть на то, каким образом они работают. Некоторые сайты используют технологию баз данных, что действительно сложно сделать поисковой машине. Это действительно невидимый Интернет. Другие сайты, однако, используют сочетание файлов, которые содержат текст и которые содержат мультимедиа, а поэтому часть из них может быть проиндексирована, а часть – нет. Такие сайты нельзя отнести четко к видимой или к невидимой части Интернета.
Некоторые сайты могут быть проиндексированы поисковыми машинами, но это не делается потому, что поисковые машины считают это непрактичным – например, по причине стоимости или потому, что данные настолько короткоживущие, что индексировать их просто бессмысленно – например, прогноз погоды, точное время прибытия конкретного самолета, совершившего посадку в аэропорту и т. п.
Мы рассмотрим каждую из основных причин существования невидимого Интернета более подробно.
Ограничения возможностей поисковых машин
1. Физические ограничения скорости. Информационные системы имеют физические ограничения по скорости поиска новых страниц. Скажем так, скорость, с которой сегодня паук пытается найти новые страницы, оказывается ниже, чем скорость появления новых страниц. Ежесекундно идет негласное соревнование:
в Интернете появляются новые страницы, а поисковые машины наращивают свою мощь. Кроме добавления новых страниц, в Интернете происходят еще и исчезновение старых, а также внесение изменений в содержимое существующих, что также оттягивает на себя часть ресурсов поисковых машин. В этой постоянной гонке Интернет выигрывает у поисковых машин с большим перевесом.
2. Поиск информации – мероприятие довольно дорогостоящее. Содержание сер веров, обеспечение подключений пользователей, рассылка пауков по Интернету, индексация, исключение сдвоенной информации – все это требует немалых затрат.
Понимая, что проиндексировать все документы в Сети не реально, а расходы надо приводить в соответствие с доходами, владельцы поисковых машин вводят собственные ограничения в работе своих систем. Например, лимитируют глубину проникновения паука на сайте, общее количество страниц в индексе, пропускают старые ресурсы, на которые никто никогда не ходит, либо регламентируют частоту их повторных посещений пауком, в результате чего часть страниц устаревает.
В любом случае, когда принимается решение о вводе ограничений на работу поисковой машины, это автоматически означает, что существуют страницы, которые могли бы быть проиндексированы, чего, однако, сделано не было.
Такое положение вещей имеет необычный побочный эффект: большие сайты могут порой проигрывать небольшим по полноте охвата информационными системами.
3. Принцип попадания страниц в индекс при помощи пауков.
Паук попадает только на те страницы, на которые есть ссылки с других страниц, либо по которым делались запросы в поисковые системы с целью уточнения рейтинга страницы в поисковой системе, либо которые внесены в очередь на индексирование вручную – путем заполнения формы «Добавить страницу» («Add URL»). Соответственно, если на страницу никто не ссылался, и никто о ней не сообщал поисковой системе вручную, то такая страница не будет проиндексирована.
Кроме того, если даже паук регулярно посещает страницу, то он делает это с определенной периодичностью. Если в промежутке между двумя посещениями ресурс изменится, то это изменение некоторое время будет неизвестно поисковой системе и ее пользователям.
Таким образом, существуют две задержки по времени в индексировании страниц: когда сайт создан, но еще неизвестен поисковику, и когда паук проиндексировал страницу, но не посетил ее повторно.
4. Необычные слова на странице, интересующей пользователя.
Страница, которая нужна пользователю, может содержать слова, отличные от тех, которые он, вероятнее всего, введет в поисковую строку. В результате, человек, не обладающий большим опытом поиска информации в Интернете, не сможет найти нужную страницу с помощью поисковой машины.
5. Предпочтение поисковой машиной быстроты поиска, а не его глубины.
Выбор между «максимально быстро» и «максимально полно» существует в любой отрасли, связанной с получением и обработкой информации. Поисковые системы обычно сориентированы их владельцами на наиболее быстрое получение результатов, пусть даже в ущерб полноте. Поэтому некоторые страницы, индексирование которых трудоемко, остаются за пределами базы данных, попадающей на сервер поисковой машины.
Хотя бывают исключения из этого правила. Существуют специализированные поисковики, которые добывают информацию, копая вглубь и напрочь отметая критерий скорости ее нахождения. Но они при этом «ходят» лишь на тематические сайты. Примером такой специализированной системы может служить, по информации Гэри Прайса Law Crawler (/) или Politicalinformation.com ().
6. Ориентация поисковых машин на поиск текстов в разных вариантах.
Поисковые машины изначально сориентированы на поиск текстов. На раннем этапе развития Интернета – представленных в формате HTML, после чего стали добавляться и другие их разновидности – Word (.doc), Adobe Acrobat (.pdf), Flash. Однако и эти форматы все равно содержат тексты. Индексировать изображения или, например, звуковые файлы (не названия звуковых файлов, а именно сам звук), поисковые машины пока не научились.
Типы контента в невидимом Интернете
Разные типы контента по разным причинам могут стать частью невидимого Интернета.
1. Быстрое устаревание или изменение информации.
Некоторые виды информации устаревают или меняются столь стремительно, что пауки просто не в состоянии ее проиндексировать своевременно. При этом часто владельцы поисковых систем вообще не пускают спайдеров на такие страницы, дабы не тратить ресурсы на бесполезное занятие.
Примером такого контента может служить сайт о погоде в реальном масштабе времени.
2. Ресурсы состоят преимущественно из документов в таких форматах, которые не поддерживаются поисковыми машинами.
Как, скажем, страница, содержание которой ограничивается одним лишь изображением.
3. Содержимое страницы генерируется по запросу и формируется пошагово.
Примером в данном случае может служить ресурс, на котором осуществляется расчет цены автомобиля, в зависимости от комплектации и материала отделки салона. Для получения такой страницы пользователь пошагово заполняет формы на сайте, и конечный результат каждый раз формируется заново. Содержимое такой страницы не может быть проиндексировано по той простой причине, что без запроса страницы не существует, а заполнять формы паук не умеет.
4. Содержимое баз данных.
Результат из базы данных также появляется лишь после ввода определенного запроса в форму обращения к ней. Паук, как и в предыдущем случае, не может ни заполнить форму запроса, ни проиндексировать содержимое самой базы.
5. Страница не вводилась в форму добавления сайта, не вводилась ни в какие формы проверки рейтинга на поисковых системах и при этом на нее не ведут никакие ссылки.
Паук никоим образом не может узнать о существовании подобной страницы, а потому никогда ее не посетит.
Эти страницы, кстати, могут представлять большой интерес для конкурентной разведки, поскольку на практике известны случаи, когда на них содержались эксклюзивные предложения для некоторых клиентов. Информация такого рода ориентирована на целевые группы и выкладывается на сайте, клиентам же присылаются ссылки на нужные страницы. Последние представляют бесценную находку для компаний, работающих на рынках с высокой конкуренцией, поскольку содержат ответ на вопрос о том, по каким ценам соперник реально продает свою продукцию.
Мы сталкивались с ситуацией, когда компания смогла вычислить алгоритм составления адресов таких страниц конкурентом, после чего была долгое время в курсе всех его специальных предложений – до момента смены системного администратора конкурента.
Примеры поведения поисковой машины при посещении страницы в Интернете
Придя на страницу, паук первым делом определяет, есть ли на сайте что-либо, что его владелец запрещает индексировать.
Подобный запрет может быть реализован двумя способами. Первый заключается в том, что на сайте создается специальный файл robots.txt либо используется особый тег – так называемый, метатег <noindex>. В этот файл или под метатег «прячут» содержимое страницы, которое, по мнению владельца контента, не должно индексироваться поисковыми машинами.
Единственное отличие между ними состоит в том, что <noindex> работает на той странице, на которой он расположен, тогда как robots.txt может быть использован с целью предотвращения индексации любых отдельных страниц, групп файлов или даже всего веб-сайта.
По своей сути, никаких технических препятствий для индексирования содержимого ресурса этот способ не создает. Однако большинство поисковых машин с уважением относится к подобному способу защиты контента, который, как правило, не попадает в информационные системы. Наиболее близким аналогом столь действенного ограничения доступа в реальном мире можно считать таблички «м» и «ж» на дверях общественных уборных.
На наш взгляд, метод ограничения индексирования с помощью файла robots. txt или метатега <noindex> потому получил столь большое распространение, что он препятствует работе пауков, но не мешает людям просматривать содержимое страниц без каких-либо ограничений.
Второй способ охраны контента значительно надежнее первого и заключается в том, что страница защищается паролем. Паук технически неспособен вводить пароль. Однако и человек, прежде всего, должен этот пароль знать, а кроме того, ему необходимо потратить время и приложить усилия для того, чтобы его ввести. При такой защите ресурса работает уже не этический, а технический способ ограничения индексирования.
После того, как паук попал на страницу, которая не защищена паролем и не внесена в список запрещенных, события развиваются по-разному, в зависимости от того, что на этой странице находится. Рассмотрим возможные их варианты, а также попытаемся понять, к видимому или к невидимому Интернету эти варианты относятся (по Крису Шерману и Гэри Прайсу).
Вариант 1. Паук обнаруживает страницу, написанную в HTML и содержащую графические элементы.
В таком случае паук может проиндексировать лишь название графического файла, и тогда такой документ будет найден при поиске картинок по ключевому слову, совпадающему с тем, которое есть в названии. Если имя файла не имеет ничего общего с его наполнением, он не сможет быть найден поисковой машиной, даже если будет содержать фотографию с изображением ключевого слова.
Вариант 2. Паук внутри сайта столкнулся со страницей, которая написана на HTML, но содержит поля, требующие заполнения пользователем – например, ввода логина и пароля.
В этом случае есть техническая возможность индексирования содержимого, но только того, к которому имеется доступ. Спрятанная под пароль часть страницы не может быть просмотрена и, как следствие, не может быть проиндексирована спайдером.
Здесь наиболее часто встречаются два варианта. Первый: допустим, на сайте лежат готовые к просмотру страницы, на которые существуют ссылки в Интернете (например, фраза: «Я недавно интересную статью прочитал, она находится здесь:» – и далее следует прямой адрес статьи). В этом случае страница с формой, требующей заполнения, создана лишь для того, чтобы пользователь мог выбрать нужный ресурс из имеющихся. Текст на странице с формой будет виден пауку и проиндексируется, а сами страницы, на которые ведет форма, индексируются «в обход» процедуры ее заполнения, в другое время и, возможно, другим пауком, за счет ссылок на внутренние страницы сайта из других источников. В таком случае и страница с формой, и внутренние страницы будут относиться к видимому Интернету.
Во втором варианте форма собирает информацию, на основании которой впоследствии создается необходимая пользователю страница. То есть, никакой внутренней страницы просто не существует до тех пор, пока форма не будет заполнена. Паук этого сделать не может. Данные, которые находятся внутри такого сайта, не могут быть получены никаким иным путем, кроме как посредством заполнения формы, а потому всегда относятся к невидимому Интернету.
Вариант 3. Паук приходит на сайт, содержащий динамические данные, меняющиеся в реальном масштабе времени.
К таким сайтам относится биржевая информация или, скажем, сведения о прибытии авиарейсов (рис. 2). Эти ресурсы обычно причисляют к невидимому Интернету, но не потому, что их технически нельзя проиндексировать, а потому, что их индексация не имеет практического смысла.
Рис. 2. Пример мониторинга движения рейсов на сайте
Вариант 4. Паук попадает на страницу, которая содержит текст в формате, не поддерживаемом данной поисковой машиной.
Например, Рамблер, как мы уже говорили, не поддерживает документы Power Point (.ppt). Ряд поисковых машин не индексируют документы в Postscript-файлах (это формат, в котором могут сохраняться для передачи в типографию файлы, созданные в программе Microsoft Publisher). До недавнего времени к таким форматам относился и PDF, однако сначала Гугл, а за ним и остальные поисковые машины стали индексировать подобные документы. Первоначально ограничение в работе с PDF-файлами было обусловлено тем, что на каждый новый формат приходилось расходовать дополнительные средства, распространенность же PDF-файлов вначале была невелика. Однако, по мере того, как правительственные организации многих стран стали выкладывать в Интернет документы именно в этом формате, поисковые машины начали с ним работать.
Вариант 5. Паук находит базу данных, запрос в которую выполняется через веб-интерфейс.
Причины, по которым такая база не может быть проиндексирована спайдером, следующие:
– страницы генерируются динамически, в ответ на запрос;
– протокол базы данных может не стыковаться с протоколом поисковой машины;
– доступ к базе требует введения логина и пароля (особенно, если дело касается платных ресурсов).
Четыре типа невидимости в Интернете
Традиционно выделяют четыре типа невидимости содержимого Всемирной Паутины, сформулирванные Крисом Шерманом и Гэри Прайсом.
1. Невидимость, обусловленная настройками пауков и их естественными особенностями (так называемый, «серый Интернет»). «Серый Интернет» имеет несколько возможных вариантов.
Ограничение глубины проникновения паука на сайт, настроенное владельцами поисковой машины.
Изменения страниц, происходящие уже после посещения страницы пауком.
Ограничение максимального количества показанных в выдаче страниц.
Если, например, Яндекс в выдаче представил пять тысяч страниц, то посмотреть более одной тысячи не удастся – он их просто не покажет. Во всяком случае, так обстояло дело на момент написания книги. Исправить ситуацию можно за счет использования операторов запросов. В результате, количество страниц в выдаче уменьшится, с одновременным увеличением релевантности.
1.4.Страницы, не прописанные в форме «Добавить страницу» и не имеющие ссылок с других адресов.
В мае 2000 г. IBM провела исследования, показавшие, что количество таких страниц, неизвестных поисковым системам, достигает 20 % от общего числа адресов, которые могли бы быть проиндексированы с технической точки зрения.[5]
2. Страницы, намеренно исключенные вебмастером из индексации.
К ним как раз и относятся ресурсы, защищенные паролем или включенные в файл robots.txt либо убранные под тег <noindex>.
3. Страницы, которые требуют регистрации.
В Интернете есть ресурсы, доступные бесплатно любому человеку, который для входа на страницу должен нажать кнопку «Я согласен»: это свидетельствует о его согласии с условиями посещения сайта. Иногда вместо такого выражения согласия требуется заполнить какие-то регистрационные формы. Паук не умеет выполнять подобные действия, и потому не попадает на сайт.
4. Действительно невидимый Интернет.
Страница содержит данные в формате, недоступном поисковым машинам.
Страницы намеренно не обслуживаются поисковыми машинами по тем или иным причинам.
Информация хранится в базе данных и доступ к ней возможен лишь при условии заполнения определенной формы.
Особенности построения адресов некоторых страниц Интернета
Советуем разобраться в данном вопросе, поскольку это позволит лучше ориентироваться в Интернете, а также эффективно обходить проблемы, которые нередко возникают при попытке поставить некоторые страницы на мониторинг, с целью автоматического обнаружения изменений их содержания.
Нередко ресурс может включать одновременно и элементы видимого, и невидимого Интернета.
Иногда веб-мастера принимают меры к тому, чтобы заведомо исключить попадание своего сайта в разряд невидимых, с точки зрения некоторых поисковых машин, сохранив при этом ресурс удобным в использовании и внешне привлекательным для пользователей. Для этого в ряде случаев сайты, написанные, например, на Flash, имеют HTML-копии. Такие копии называют «зеркалами» страницы, они позволяют увидеть ее содержимое с помощью тех информационных систем, которые имеют какие-то затруднения в работе с форматом основного варианта сайта.
Прямой и непрямой URL. Динамические страницы.Еще недавно в специальной литературе, изданной за рубежом, говорилось о том, что страницы, имеющие непрямой URL, как правило, относятся к невидимому Интернету.
Сегодня ресурсы с непрямым адресом могут нормально индексироваться поисковыми машинами. Однако попытки специалистов конкурентной разведки поставить их на мониторинг могут натолкнуться на неожиданную проблему, которая, тем не менее, может быть преодолена.
Если адрес страницы состоит только из букв, цифр и косых черточек, то это прямой url страницы, которая относится, как правило, к видимому Интернету.
Примеры прямого URL: /; .
Сложнее обстоит дело со страницами, где в адресе встречается вопросительный знак, после которого следует множество непонятных неподготовленному человеку символов. Обычно все, что расположено левее вопросительного знака, приведет вас на страницу с формой, требующей заполнения или просто на одну из первых страниц сайта, а вот правее вопросительного знака часто записана информация, описывающая запрос.
В качестве примера приведем адрес страницы, которая показывает результаты по запросу «маркетинг» в Яндексе: =%EC%E0%F0%EA%E5%F2%E8%ED%E3&stype=www.
К этому адресу мы обратились для того, чтобы с его помощью разобраться в способах решения типичной проблемы. Поэтому чуть позже мы к нему вернемся.
Непосредственно в этой правой части адреса страницы может содержаться описание критериев запроса – и тогда вы попадете на страницу еще раз, введя этот адрес в адресную строку браузера. А может запрос там и не содержаться, и тогда вам не удастся повторить переход на нужную страницу, введя адрес такой страницы в адресную строку браузера. В этом втором случае попытка перейти по адресу страницы приводит к загрузке незаполненного шаблона.
Рассмотрим два примера, когда запросы одинаковы, но сайты устроены по-разному, что приводит к разным результатам.
Итак, для наглядности поищем людей, которые разместили свои резюме в регионе «Екатеринбург» на сайтах Superjob.ru и e1.ru, причем анкеты их должны содержать слово «повар». При этом, заполняя формы запроса, мы намеренно не будем указывать никаких ограничений по полу, возрасту, образованию и прочим параметрам, дабы это не привело к возникновению дополнительных переменных величин поиска.
Вот адрес страницы, выдаваемой в ответ на запрос, на сайте Superjob.ru:
http://e-burg.superjob.ru/resume/search_resume.html?submit=1&period=60&town=33&paymentfrom=&paymentto=&type=0&old1=&old2=&pol=0&maritalstatus=0&children=0&education=0&language=1&lang_level=0&stazhyear=0&keywords=%EF%EE%E2%E0%F0&kwc=or&rating=0&tree_keyword=&saveparam=1.(ТЕКСТ В ОДНУ СТРОКУ.СТРОКУ РАЗБИТЬ ПО ШИРИНЕ ПОЛОСЫ)
В приведенной выше строке адреса описаны город (он имеет номер 33 по классификатору сайта и отражен в символах «town=33», а также слово «повар», на кодировке которого мы пока не будем останавливаться подробно). Если скопировать этот адрес в поисковую строку браузера, то можно вновь получить страницу с информацией о людях с требуемыми параметрами, как если бы мы ввели ее с клавиатуры заново.
Вид страницы по этому запросу приведен на рис. 3.
Рис. 3. Результат запроса на сайт Superjob.ru в поисках повара в Екатеринбурге.
Вот ответ на такой же запрос с сайта e1.ru при тех же критериях поиска был получен результат, отображенный на рис. 4.
Рис. 4. Результат запроса на сайт e1.ru в поисках повара в Екатеринбурге.
Адрес страницы, показанной на рис. 4, выглядит следующим образом: http:// .
Не нужно быть в высшей степени сведущим относительно всех премудростей Интернета, чтобы заметить: адрес этот выглядит гораздо короче предыдущего. Кроме того, в нем отсутствует описание запроса. Попытка перейти повторно на нужную страницу, просто введя в поисковую строку браузера вышеуказанные координаты, как раз и приводит к незаполненной форме.
Связано такое положение вещей с тем, что в принципе существует два типа запросов – так называемые GET и POST.
При запросе типа GET параметры поиска указаны в адресной строке, поэтому переход по такому адресу приводит на нужную страницу (этот запрос выглядит как достаточно длинная строка с множеством символов, в том числе знаком «%» или с большим количеством англоязычных слов).
Метод POST не подразумевает передачу параметров поиска через адресную строку. Данные о запросе передаются отдельно, по служебным каналам и не могут быть просмотрены обычным пользователем.
Тем не менее, часто и в такой ситуации можно найти решение. Если на странице, которая изображена на рис. 8, перейти по ссылке на вторую страницу результатов запроса (кликнув мышкой по цифре «2» в перечне страниц), то адрес этой второй страницы будет содержать параметры поиска: =%EF%EE%E2%E0%F0+%EE%F4%E8%F6%E8%E0%ED%F2&search_by=1&show_for=7&order_by=2&search=yes&page=1.
Видно, что адрес стал длинным, и в нем появилось множество символов, которых не было вначале. Интересно, что если после этого кликнуть по ссылке первой страницы и именно таким путем вернуться на первую страницу, то у нее также появится адрес, содержащий описание самого запроса и позволяющий при вводе его в адресную строку браузера попадать непосредственно на эту первую страницу: =%EF%EE%E2%E0%F0+%EE%F4%E8%F6%E8%E0%ED%F2&search_by=1&show_for=7&order_by=2&search=yes&page=0.
Мы приводим эти, на первый взгляд, абстрактные для гуманитариев закорючки не из любви к теории. Практическое значение подобного явления становится понятно, когда возникает необходимость поставить на мониторинг страницы сайта, имеющего подобные алгоритмы работы. Ведь этот «длинный» адрес первой страницы, полученный путем перехода на вторую страницу и возврата с нее обратно на первую, можно поставить на мониторинг.
Казалось бы, проблема решена. Но и тут не исключены сложности. Хорошо, когда можно перейти с первой страницы на вторую, а затем вернуться. Однако по некоторым запросам страница бывает всего одна, поэтому перейти с нее просто некуда. Выход и в таком случае есть. Правда, он несколько сложнее тех решений, о которых речь шла выше. Предлагаем рассмотреть данный вопрос более подробно, поскольку соответствующей литературой, как нам кажется, он пока еще специально не освещался. А кроме того, научиться ставить подобные сложные страницы на мониторинг отнюдь не помешает – это очень экономит время. Предлагаемое решение разработано нами совместно с участниками форума на сайте e1.ru в Екатеринбурге и со слушателями нашего курса «Маркетинг рисков и возможностей: конкурентная разведка». Итак, постараемся максимально доступно изложить весь алгоритм действий, чтобы он был понятен как можно более широкому кругу пользователей.
Для того чтобы решить проблему постановки на автоматический мониторинг страниц, которые выдаются в ответ на запрос в единственном экземпляре, следует обратиться к базе данных таким образом, чтобы можно было заведомо рассчитывать на результат, состоящий из более чем одного ресурса. Применительно к сайтам вакансий и резюме это должны быть массовые специальности. Зададим поиск по признаку (по ключевому слову) «Менеджер» на странице поиска резюме на сайте e1.ru (рис. 5).
Рис 5. Введен запрос по слову «Менеджер» в форме поиска резюме не сайте e1.tif.
Получив результат – первую страницу, мы точно так же, как в предыдущем случае, перейдем на вторую, кликнув по ссылке с номером страницы «2». Ее адрес (URL) выглядит так: =%EC%E5%ED%E5%E4%E6%E5%F0&search_by=1&show_for=7&order_by=2&search=yes&page=1.
Затем вновь вернемся на первую страницу, точно так же кликнув по ссылке страницы «1». После этого, как мы говорили ранее, в браузер будет загружена первая страница, полученная возвратом со второй. Ее URL выглядит следующим образом (это реальный адрес): =%EC%E5%ED%E5%E4%E6%E5%F0&search_by=1&show_for=7&order_by=2&search=yes&page=0.
Сравните адреса первой и второй страниц. Видно, что они почти идентичны, за исключением последнего знака: вторая страница в конце адреса содержит цифру «1», а первая – цифру «0». Кстати, заметим, что третья страница будет оканчиваться на «2» – это подтверждено экспериментально.
Теперь обратите, пожалуйста, внимание на сам набор символов: «%EC%E5%ED%E5%E4%E6%E5%F0».
Он начинается после знака «=» и заканчивается перед знаком «&». Этот перечень и представляет собой слово «Менеджер», написанное в определенной кодировке. В данном случае нам неважно, как она называется, гораздо существеннее то, что это стандартная кодировка, которая применяется во всех системах. Если же кому-то из читателей это все-таки интересно, то сообщаем, что именуется она не иначе как UrlEncode, а то, что стоит после знака процента, – код символа в UTF-8.
Научившись разбираться во всех приведенных нюансах, вы сможете автоматизировать процесс создания набора символов для подобных сложных страниц. Причем изучать кодировки для этого совершенно не требуется.
Проведем простейший эксперимент: наберем в поисковой строке Яндекса слово «Manager», а в отдельном запросе – слово «Менеджер» и сравним URL’ы страниц, которые будут получены в ответ.
Итак, адрес страницы по англоязычному запросу «Manager» выглядит следующим образом:
.
А вот так выглядит URL ресурса по русскоязычному запросу «Менеджер»:
=%EC%E5%ED%E5%E4%E6%E5%F0&stype=www.
Очевидно, что кодированные тексты в запросе резюме на сайте e1 и на Яндексе по слову «менеджер» идентичны и имеют вид
«%EC%E5%ED%E5%E4%E6%E5%F0».
Мы уже располагаем примером синтаксиса строки страницы номер один с сайта e1 по запросу «менеджер»:
=%EC%E5%ED%E5%E4%E6%E5%F0&search_by=1&show_for=7&order_by=2&search=yes&page=0.
Можно произвольно подставлять любое нужное слово, предварительно получая его закодированное написание в Яндексе, и таким образом принудительно генерировать на сайте e1 и ему подобных ресурсах нужные страницы с нужным форматом адреса, который впоследствии технически можно ставить на автоматический мониторинг.
Проверим это утверждение на примере запроса по ключевому слову «Автоленд».
Написание слова «Автоленд» в URL’е, полученное с помощью запроса в Яндексе, выглядит так:
«%C0%E2%F2%EE%EB%E5%ED%E4».
Если механически подставить это значение в строку запроса по поиску вакансий на сайте e1 для первой страницы выдачи, то адрес будет выглядеть следующим образом:
=%C0%E2%F2%EE%EB%E5%ED%E4&search_by=1&show_for=7&order_by=2&search=yes&page=0.
Подставив эти координаты в адресную строку браузера, мы получили всего одну страницу, на которой содержалось резюме конкретного специалиста. В тексте этого документа была информация о том, что человек действительно работал когда-то в компании «Автоленд».
Однако помимо всего описанного выше, долгое время существовала еще проблема индексации динамически генерируемых страниц, которая относила их к невидимому Интернету.
Динамические страницы – это ресурсы, создаваемые небольшой программой – скриптом – в момент запроса браузера к серверу. Такая страница часто имеет вид:
aaaa?b=x&c=y
где aaaa – название скрипта, а после «?» идут параметры, включенные в запрос. Обычно динамические страницы определяются пауком на том основании, что они содержат символы
«?», «&» и «=«в URL.
Большинство поисковых систем до недавнего времени старались обходить такие страницы стороной, т. к. паук вполне мог на них «зависнуть» навсегда, в силу технических причин – потому что он непрерывно пытался посетить несуществующие страницы, адреса которых практически до бесконечности может генерировать скрипт.
Динамические страницы очень удобны для производства сайтов, и игнорировать их было бы недальновидно. Поэтому в последнее время крупнейшие поисковые системы стали одна за другой объявлять о том, что они начинают индексировать такие ресурсы, так что сайтов, которые относились прежде к невидимому Интернету в силу того, что содержали динамические страницы, стало меньше.
Преимущества невидимого Интернета
Поисковые системы удобны, поскольку позволяют проводить поиск по ключевым словам. Однако все популярные поисковики такого плана – вроде Яндекса, Гугла и Рамблера, – рассчитаны на широкую, а не целевую аудиторию.
В то время как невидимый Интернет изобилует источниками, посвященными определенной теме: они подобраны и проверены специалистами вручную и потому в большинстве случаев содержат наиболее полную и подробную информацию по конкретному вопросу.
Так, на сайте проекта «Рифпарк», расположенном по адресу /, вы можете ознакомиться с материалами по аквариумистике, многие из которых взяты из видимого Интернета и собраны вместе на данном ресурсе, оценены специалистами на предмет компетентного подхода к проблеме и представлены в виде тематических каталогов. При этом часть материалов из каталога сайта «Рифпарк» на момент написания книги была не проиндексирована поисковыми машинами, несмотря на то, что главная страница ресурса проиндексирована была.
Например, фраза: «Водоросли обычно придают аквариуму неэстетичный вид (хотя в природе они встречаются повсеместно) или служат индикатором плохого качества воды», – взятая с этого сайта, при поиске по ней информации в Яндексе не вывела нас на ссылку, которая указывала бы на ресурс проекта «Рифпарк». Были найдены другие сайты с таким же текстом. Это видно на рис. 6.
Рис. 6. Яндекс не видит сайта «Рифпарк» при запросе фразы с этого сайта.
Как указывают эксперты по поиску в Интернете, поисковые машины общего назначения постоянно выбирают между тем, какой ответ предоставить: самый простой, самый полный, самый интересный… (перечень критериев можно продолжить – вплоть до «наилучшего»). Как мы уже говорили, эти системы вынуждены ограничивать себя в процессе удовлетворения запроса пользователя, так как их работа имеет определенную себестоимость. Поисковик – коммерческое предприятие, ничего уж тут не поделаешь.
С другой стороны, правительства, учебные заведения и другие организации, не преследующие целей получения прибыли, очень активно используют ресурсы невидимого Интернета. Такие сайты не стараются угадать интересы каждого, «заточены» под потребности представителей определенной отрасли и очень часто дают полный ответ на вопрос, на котором, собственно, и специализируются. Ответ этот, как правило, позволяет провести исчерпывающий поиск в конкретной предметной области и оперативно обновлять результаты.
Таким образом, нередко невидимый Интернет имеет преимущества перед видимым:
– фокусируется на узкоспециальном контенте, что позволяет ему обеспечивать более полные результаты;
– часто имеет соответствующий своей теме поисковый интерфейс, отчего запросы могут настраиваться более точно, нежели в поисковой машине общего назначения, а значит, и ответы получаются более релевантными;
– экономит время, а кроме того – может содержать информацию, которая нигде более недоступна.
Это происходит, в частности, оттого, что в каталог невидимого Интернета его энтузиасты нередко включают информацию, взятую из базы данных, которая не индексируется поисковыми машинами, либо помещают фотографию документа, сделанную такими пользователями лично. Кроме того, если на каком-то форуме появляются интересные сведения, то они в ряде случаев просто стираются модератором или самим автором. Но до того как информацию успеют убрать, она зафиксируется одним из энтузиастов и будет храниться затем на его тематическом сайте.
Когда использовать невидимый Интернет
Итак, мы можем констатировать, что при поиске узкоспециальной информации после просмотра того, что будет предложено поисковиками, следует непременно обратиться к специализированным ресурсам. Особенно когда задача заключается не в одном лишь нахождении ответа на вопрос вроде: «В каком году был открыт Кутаисский автомобильный завод?» (это, кстати, реальный вопрос с Форума Яндекса[6]), – а подразумевает сбор максимально полной информации по той или иной проблеме. Как уже было сказано, часть сведений на таких сайтах может относиться к видимому Интернету, а часть – к невидимому.
Есть смысл попытаться не ограничиваться поисковыми машинами, а отправиться на тематические сайты и поискать там информацию, которая может относиться к Невидимому Интернету, в следующих ситуациях.
1. Когда вы хорошо ориентируетесь в предмете.
Специалисты в своем деле обычно знают один или более ресурсов, которые располагают необходимой им информацией. Часть таких адресов относится к невидимому Интернету.
Компетентность человека в изучаемом предмете обеспечивает еще одно преимущество: настоящий профессионал быстро приходит к пониманию того, какие ключевые слова дают наилучший результат при поиске нужных сведений и в других базах данных.
2. Когда вы хорошо знакомы со специфическим поисковым инструментом.
Некоторые ресурсы невидимого Интернета охватывают различные области знаний, но имеют при этом столь развитый и тонко настроенный поисковый инструмент, что, умея им пользоваться, можно достичь результатов лучших, нежели те, которые будут представлены поисковыми машинами общего назначения. Возможность точного составления запроса позволяет лучше искать иголку в стоге сена. Это справедливо и для ряда ресурсов видимого Интернета. Чтобы убедиться в этом, достаточно сравнить ответ на запрос с множеством параметров, который можно ввести, например, при поиске нужного резюме на сайте, посвященном поиску работы, и ответы на такой же запрос к поисковой машине, например, к Яндексу.
3. Когда вам требуется исчерпывающий результат, который заведомо проверен людьми, ориентирующимися в изучаемой области.
Поисковые машины неспособны сравниться по этим параметрам с ресурсами невидимого Интернета. Глубина индексирования, несвоевременность, фильтрация результатов приводят к тому, что появляется много «шума». Проблему усугубляет отсутствие у большинства поисковых систем инструментов тонкой настройки запроса. Именно этот критерий – один из основных, на наш взгляд, по которому Гугл, имеющий одно логическое «И», проигрывает Яндексу, располагающему аж тремя логическими «И».
4. Когда стоит задача получить лишь своевременный контент.
Страницы невидимого Интернета и тематические ресурсы в ряде случаев обновляются чаще, чем страницы и директории, индексируемые поисковыми машинами. Это связано с тем, что добровольцы-энтузиасты с большим рвением отслеживают изменения на тематических сайтах, в отличие от беспристрастных и ничем не интересующихся пауков поисковых машин.
Плюсы и минусы директорий как способа поиска информации в Интернете
Независимо от того, к видимому или к невидимому Интернету относятся директории, у них есть ряд общих положительных и отрицательных свойств.
1. Директории всегда относительно невелики по размеру – в сравнении с общим количеством информации, доступной через поисковые машины.
Поскольку директории отбираются вручную, они, по определению, содержат информации меньше, чем любая поисковая машина. Однако такое ограничение имеет как плюсы, так и минусы.
К преимуществам директорий относится их прямая нацеленность на заданную проблему. Редактор, который принимает решение о включении каких-то данных в тематическую директорию, должен оценить соответствие этой информации теме, и поэтому для каталога отбираются лишь высококачественные ссылки. Кроме того, к каждой статье в директории прилагается аннотация, из которой сразу становится понятно, имеет ли смысл пользователю идти по конкретной ссылке в поисках определенной информации.
К минусам, связанным с небольшими размерами директорий и ограниченной численностью персонала, который их обслуживает, относится неспособность редактора понять нюансы той или иной узкой проблемы и, как результат, исключение некоторых пограничных вопросов из перечня тем. Надо сказать, что некоторые каталоги пошли по пути организации онлайновой энциклопедии – Википедии, когда сами пользователи решают, что соответствует, а что не соответствует их теме. Такие базы данных получают преимущество перед традиционными, которые контролируются лимитированным штатом редакторов. Что интересно, первоначально существовали опасения, что подобные возможности правок приведут к появлению тотальной анархии. Как и в ситуации с Википедией, практика показала, что все эти домыслы оказались беспочвенными.
2. Редакторская политика бывает очень субъективной.
Хотя редакторские стандарты и критерии отбора информации заявлены уже на входе в каждую директорию, другие факторы также могут влиять на качество ее содержимого. Так, у редактора могут быть «любимые» и «нелюбимые» темы. В открытых каталогах может быть собрано много информации, но такой специалист имеет возможность, например, убрать данные о конкуренте. Хорошая директория старается сохранить объективность и предоставить разные точки зрения, однако далеко не всегда это удается сделать на практике.
3. Несвоевременность.
Мы уже говорили, что на специализированных сайтах, благодаря работе энтузиастов, достаточно оперативно отслеживаются изменения по тематическим вопросам. Однако это происходит не всегда. К сожалению, нередко адреса и содержимое страниц могут меняться со временем, но далеко не всегда это находит оперативное отражение в содержании директории. Теоретически за этим должен следить редактор, однако на практике все подчас складывается иначе, хотя бы в силу банальной нехватки времени. В связи с этим многие из них просят сообщать о так называемых «битых и удаленных ссылках», но те адреса, которые посещаются мало, могут быть пропущены и не отслежены с помощью этого фильтра.
Кроме того, нередко картину в каталогах портит тактика неких «дорвеев». Она нацелена на то, чтобы заманить на свой сайт пользователя, который бродит по Интернету в поисках определенного контента, а затем перебросить его на другой сайт, ради принудительного посещения которого первый сайт, собственно, и создавался, а после чего «раскручивался». Недобросовестный администратор такого сайта может дождаться, когда его сайт, соответствующий теме каталога, окажется включен в тематический каталог, а затем ставит так называемый редирект (перенаправление) на сайт, например, порнографического содержания. Именно из-за этой технологии люди, которые ищут, например, программное обеспечение для мобильных телефонов, часто при переходе по ссылке оказываются на сайте электронного казино или на ресурсее, предлагающем интимные услуги.
4. Перекос информации в одну сторону.
Директории могут не отражать реального баланса информации, содержащейся в Интернете, поскольку информация отфильтровывается заведомо предвзято. Для директорий, имеющих узкую направленность, это не является недостатком, скорее наоборот. А вот для директорий общего назначения это критично. Ситуацию усугубляет то обстоятельство, что некоторые «раскрученные» ресурсы берут плату за включение новых сайтов в свои каталоги, что может приводить к исчезновению действительно нужного контента и замене его на бесполезный, но проплаченный в рекламных целях.
С другой стороны, как недостаток, так и избыток информации могут создавать проблемы, так как перенасыщение Сети материалами заметно усложняет процедуру поиска нужного ресурса. Примером перегруженных директорий, содержащих тысячи документов, может служить категория «Производство и поставки «в Яндексе, которая на момент написания книги включала 8748 ссылок. Отчасти указанная проблема решается за счет хорошего структурирования материала, однако это не избавляет пользователя от необходимости затрачивать на поиск немалые усилия.
Основные категории невидимого Интернета
Крис Шерман и Гэри Прайс еще в 2004 г. выделили основные категории онлайновой информации, которая чаще всех остальных сведений относится к невидимому Интернету – в той или иной степени.
Мы бы рекомендовали материалы, подобные приведенным ниже, искать не только и не столько через информационные системы, сколько через специализированные сайты. При этом сами такие узконаправленные ресурсы (их главные страницы, а не содержимое) можно успешно отыскать при помощи тех же информационных систем.
Мы попытались проанализировать, насколько изменилась ситуация по сравнению с той, что была описана Шерманом и Прайсом, а также проверить, как обстоят дела с подобными типами ресурсов в русскоязычной части Интернета.
1. Информация о компаниях, обязательная для раскрытия.
Во многих странах компании, акции которых публично продаются, обязаны предоставлять определенную информацию о себе на правительственные сайты или сайты общественных организаций. Такие ресурсы нередко позволяют организовать информирование по электронной почте об изменениях информации о какой-либо компании. В России к таким сайтам относится сайт проекта СКРИН: /.
2. Номера телефонов.
К невидимому Интернету часто относят так называемые «Белые страницы» или «White Pages» (справочники, содержащие информацию о телефонах отдельных людей), например справочник, расположенный по адресу: . ru/phone/.
3. Составление карт для водителей.
Конкретная карта, составляется по запросу.
Примеры:
&lang=RU.
4. Патенты.
Поиск по базам данных патентов в России предоставляется, в частности, на сайте Роспатента: /.
5. Книги, которые больше не печатаются.
Книги, которые больше не печатаются, но представляют интерес для читателей, есть всегда. И это не обязательно антиквариат. Нередко люди ищут такую литературу просто из желания сэкономить, особенно если речь идет об иностранной печатной продукции. Для удовлетворения такого спроса созданы специализированные сайты.
Напрмер, американский ресурс или российский http:// /.
6. Библиотечные каталоги.
Каталоги библиотек России: каталоги Российской государственной библиотеки;
– каталоги Российской национальной библиотеки (Санкт-Петербург);
– каталоги ГПНТБ РФ (включая Российский Сводный Каталог по научно-технической литературе);
– каталоги Государственной центральной научной медицинской библиотеки;
– каталоги Центральной научной сельскохозяйственной библиотеки;
– каталог библиотеки МГУ.
Каталоги зарубежных библиотек:
– Библиотека Конгресса США;
– Британская библиотека.
Списки Интернет-каталогов библиотек мира:
– каталоги национальных библиотек мира (Российская национальная библиотека);
– LibDex – The Library Index; Lib-Web-Cats. A directory of libraries throughout the world.
7. Толковые словари или словари иностранных слов известных авторов, размещенные на крупных поисковых ресурсах в качестве дополнительной услуги для пользователей.
Действительно, попытки найти значение слова «каталог» в словаре В. Даля через Яндекс «Словари» увенчались успехом. Был получен текст из сдоваря Даля:
«КАТАЛОГ м. роспись, ведомость или перепись, особенно книгам.
Католожный, к каталогу относящ.»
Попытка найти это же определение с использованием части текста (с помощью оператора «двойные кавычки») также дала положительный результат, но на других сайтах, не имеющих отношения к Яндексу (рис. 7).
Рис. 7. Слово «Каталог» найдено на других сайтах при поиске через Яндекс.
Попытка принудительно искать эту же часть текста именно на сайте Яндекса, с помощью оператора rhost, не дала результата.
8. История биржевых котировок.
Многие люди считают, что биржевые данные – это недолговечная информация, которая быстро теряет свою ценность. Однако для аналитиков, составляющих тренды, эти сведения необходимы. В качестве примера приведем описанный Шерманом и Прайсом сайт BigCharts, представленный на рис. 8 и расположенный по адресу: /.
Рис. 8. История биржевых котировок на сайте BigCharts.
Другим примером служит архив котировок Forex на ресурсе компании UMIS, находящемся по адресу: .
9. Исторические документы и рисунки.
Многие исторические документы присутствуют в Интернете лишь как изображения, отсканированные с оригинала. Но рисунки плохо распознаются поисковыми машинами. Как, например, Манифест об основании Русского исторического Общества 23 мая 1866 г. в Санкт-Петербурге с сайта .
10. Директории отдельных компаний.
Примером может служить сайт РАО ЕЭС -ees.ru/ru/ где есть ссылка на страницу «Сайты дочерних и зависимых обществ».
11. Экономическая информация.
Правительства и государственные учреждения содержат целую армию статистиков, которые проводят мониторинг экономической ситуации. Этому вопросу посвящен сайт Росстата, на котором собраны данные по темам: /.
12. Предложения вакансий и резюме о работе.
Для поиска сотрудника или работы поисковые системы не особенно подходят: результаты, которые они при этом демонстрируют, не самые впечатляющие – как по релевантности, так и с точки зрения трудоемкости. В подобных случаях, к примеру, не лишне было бы обратиться к одной из многочисленных баз данных, которая находится на специальном ресурсе, посвященном поиску работы. Это могут быть /, / или любой другой, подобный им региональнымй ресурс. Такие сайты обычно можно найти на сайтах городов или областей.
Например, поиску работы или вакансий посвящен сайт Самары . ru/job/index.php.
13. Инструменты по переводу.
Онлайновые переводчики обеспечивают ценный сервис, когда переводят текст целых веб-страниц с языка, который вам незнаком. Такой переводчик, после ввода в специальное поле URL страницы, идет по указанному адресу, переводит весь текст на желаемый язык и показывает в браузере как динамически сгенерированный документ. Такой сервис предоставляется многими онлайновыми переводчиками, примером может служить переводчик «Babel Fish Translation» от поисковой машины AltaVista /.
14. Данные о погоде.
Существует множество сайтов, специализирующихся на информации о погоде, одна из таких служб интегрирована в Яндекс и расположена по адресу: /.
15. Галереи искусств.
Рис. 9. Просмотр картин на сайте Эрмитажа.
Многие галереи, начиная с крупнейших и заканчивая крошечными, все чаще и полнее оцифровывают свое собрание произведений и делают его доступным онлайн. Лучший способ увидеть экспонаты такого рода – это посетить ресурсы наподобие представительства Эрмитажа в Интернете (рис. 9), которое поддерживается при участии компании IBM: /.
Интересный и перспективный, на наш взгляд, эксперимент проводит на сайте Эрмитажа IBM. Там представлена система поиска изображений по цветовым фрагментам, расположенным в определенном месте полотна: . museum.ru/fcgi-bin/db2www/qbicSearch.mac/qbic?selLang=Russian.
Детальное описание этого инструмента приведено на сайте, и мы не будем на нем останавливаться, отметим лишь, что пользование этим поисковым инструментом IBM требует от человека изрядных художественных навыков.
Чего вообще обычно не бывает в Интернете
Интернет появился относительно недавно. Однако, несмотря на стремительное его развитие, далеко не все документы, созданные людьми, успели обрести оцифрованное обличие и попасть в Сеть. Каждый день эта ситуация улучшается, хотя, на наш взгляд, до решения проблемы еще далеко.
Основные виды информации, которую в Интернете нельзя найти в принципе, представлены ниже, в соответствии с классификацией Шермана и Прайса.
1. Некоторые базы данных и информационные сервисы, которые доступны на платной основе и не выкладываются владельцами в Интернет.
Ограничение доступа к этой категории сведений наиболее понятно. Закономерно, что базу данных Регистрационной палаты в Сети не найдешь. Она находится либо в самой Регистрационной палате, где и должна храниться, либо в том или ином виде продается на «черном рынке», чего, в принципе, быть не должно.
2. Многие государственные и общественные документы.
Концепция цифрового правительства провозглашена, однако оно до сих пор не появилось. Многие документы, которые возникли задолго до изобретения Интернета, никто и не думал переводить в цифровой формат и, соответственно, публиковать в Интернете. Наиболее сложной остается ситуация с региональными приказами некоторых ведомств. Так, приказ Роспотребнадзора Свердловской области по одному из важнейших для любого бизнеса вопросов был на момент написания книги недоступен в Сети в принципе, а раздел сайта Роспотребнадзора, в котором он, по идее, должен был храниться в открытом доступе, находился «в стадии разработки».
3. Аналитическая информация, которая продается за деньги.
Многие отчеты о маркетинговых исследованиях или полные тексты тренингов, проводимых известными специалистами, не попадают в Интернет потому, что авторы продают их непосредственно своим клиентам и сознательно препятствуют появлению этих материалов онлайн.
4. Полные тексты многих журналов и газет.
Не все материалы переведены «в цифру». Часть материалов остается непереведенной из-за того, что просто до них не дошли руки. Другая часть, особенно за рубежом – потому, что не всегда удается урегулировать авторские права по старым материалам. Есть еще техническая проблема – некоторые материалы на бумажных носителях требуют усилий и материальных затрат по восстановлению текста, поскольку документы физически изношены и трудночитаемы. Кроме того, некоторые архивы просто не сохранились, в силу ряда причин – как, например, часть архива «Комсомольской правды», уничтоженная во время пожара.
5. Печатный материал не попадал в Интернет потому, что никто из людей, владеющих методами его перевода в цифровой формат и последующего размещения в Сети, пока что этими текстами не заинтересовался.
Как говорится, руки не дошли. Ни у кого. И потребности не возникло оцифровывать тот или иной документ. Как следствие, найти его можно лишь в библиотеке, с помощью библиотечных каталогов.
Оценка достоверности и качества онлайновой информации
Интернет доступен любому человеку, независимо от того, разбирается ли он в предмете, по поводу которого высказывается или нет. Помимо откровенно заблуждающихся людей среди пользователей Сети встречаются и такие, кто намеренно распространяет ложную или искаженную информацию.
Еще одна проблема: в Интернете не всегда можно установить дату публикации материала, из-за чего сведения могут оказаться устаревшими и сыграть, скорее, дезинформирующую роль.
Поскольку эти проблемы характерны в той или иной степени как для видимого, так и для невидимого Интернета, требуется критично подходить к найденной в Интернете информации во всех случаях без исключения.
Для того, чтобы не оказаться введенным в заблуждение следует всякий раз обращать внимание на ряд принципиальных моментов.
1. Кому принадлежит ресурс, на котором расположена информация.
Кто и с какой целью помещает материалы на сайт? Если это корпоративный сайт, то он обычно дает довольно правдивую информацию об адресах и телефонах, а также о номенклатуре выпускаемой продукции, но преимущества компании и ее продукции склонен преувеличивать, а недостатки – замалчивать или преуменьшать.
Если сайт поддерживается государственной структурой или учебным заведением и вопросы, которым он посвящен, не могут причинить вреда или, напротив, принести прямой выгоды этим организациям, то степень достоверности предоставляемой ими информации обычно достаточно высока.
Если же ресурс принадлежит отдельному человеку, то важно постараться узнать, кто этот человек.
Например, разную степень доверия имеет информация о некоторых аспектах работы Яндекса, которая может быть опубликована на личном блоге Ильи Сегаловича, директора по технологиям и разработке Яндекса, расположенном по адресу: / и информация на блоге никому неизвестного пользователя, у которого слово «Яндекс» стоит рядом со словом «Ацтой» и расположено сразу после фразы «Чота, Я 2 атчета пра эту тусу прачитал, а кабута тусы была 2е» (стилистика и орфография сохранены подлинные).
К сожалению, довольно часто нет явных признаков, позволяющих сделать вывод о компетентности и беспристрастности автора личной странички, поэтому специалисты рекомендуют присматриваться к некоторым, существенным в данном случае характеристикам.
Кто автор странички по профессии, сколько ему лет, где он живет?
Какова его биография?
Из чего следует, что этот человек разбирается в вопросах, о которых говорит?
Есть ли у него достижения в той области, которой он касается?
Есть ли контактная информация, которая позволяет связаться с автором?
Подтверждается ли информация на этом ресурсе материалами других источников?
Надо сказать, что эти критерии следует рассматривать в комплексе. Возможно, стоит попытаться связаться с автором встроенными средствами того ресурса, на котором вы видите его информацию (например, написать в комментариях к блогу).
Каждый из перечисленных моментов по отдельности нельзя назвать определяющим, поскольку, например, Денис (liveuser), написавший и поддерживающий в актуальном состоянии лучшую, на наш взгляд, статью о языке поисковых запросов Яндекса, отказывается размещать на собственном блоге даже адрес своей электронной почты, не говоря уже о номере телефона.
Однако уверенно можно сказать, что если авторитетность автора проверить не удается, то источник нельзя считать достоверным, даже если кажется, что он внушает доверие.
2. Кто ссылается на этот источник?
Ссылки извне на изучаемый ресурс могут многое о нем рассказать. Кого заинтересовало содержимое сайта, который привлек и ваше внимание? Почему они им интересуются? Правда, ссылки при всей их важности – не единственный критерий. Многие авторы просто не успели стать известными либо работают в столь узкой области, что обширной аудитории она изначально не предполагает. Поэтому мы бы сказали, что большое количество ссылок на ресурс с тематических сайтов обычно говорит о его полезности, но отсутствие таковых вовсе не свидетельствует о плохом качестве ресурса.
3. Беспристрастен ли подход к обсуждаемым на сайте вопросам?
Эта проблема может быть и неочевидна. Когда вопрос рассматривается лишь с одной стороны, тенденциозность выявить довольно легко. Однако чаще всего пристрастность замаскирована под якобы объективное рассмотрение различных точек зрения, при этом в защиту одной из них выбираются исключительно слабые аргументы, а в защиту другой – только сильные. Есть разнообразные технологии камуфлирования необъективности, мы не будем их здесь обсуждать, а отправим читателя к соответствующей литературе, отметив лишь необходимость оценки информации под эти углом зрения.
Специалисты выделяют в отдельную группу и такой вид пристрастной подачи информации, как спонсирование источника какой-то группой, имеющей свои собственные интересы и продвигающей ее под видом «новостей» или «аналитики».
Немаловажно помнить и о том, что Интернет играет не последнюю роль в противостоянии конкретных предприятий и даже целых отаслей промышленности. Специалисты по информационным войнам отмечают, что крайне удобно запустить какие-то сведения в Интернет, а затем, со ссылкой на них, подготовить серию статей для печатных СМИ, радио или телевидения.
Вот что по этому поводу говорил Глеб Павловский.[7]
Интернет – идеальный инструмент для запуска в массовое сознание необходимых сюжетов. Кроме того, традиционные средства массовой информации несут ответственность за распространяемые ими сведения. Слухи же, передающиеся через Интернет, анонимны. Зато газеты и телевидение получают возможность ссылаться на Интернет. То есть происходит самое настоящее отмывание так называемой черной информации.
4. Исследуйте URL веб-страницы.
Посмотрите, соответствует ли адрес страницы ее контенту? Часто доменное имя ресурса согласуется с названием компании, как, например, адрес страницы Яндекса, который выглядит следующим образом: yandex.ru. Проверьте, на каком хостинге расположен сайт – платном или бесплатном.
Кстати, в отношении хостинга в конкурентной разведке нет догматического подхода. Если вы обнаруживаете некоммерческий проект, он вполне может быть бесплатным. Например, на Народе: narod.ru.
К такому роду источников относится и ресурс автора этой книги, расположенный по адресу: http://ci-razvedka.narod.ru/.
Часто на бесплатном хостинге находятся личные странички или блоги людей, которые интересуют конкурентную разведку. Обычно такой интерес возникает не потому, что эти люди широко известны, а потому, что они работают в компании, являющейся объектом изучения конкурентной разведки.
Однако для компаний считается в некотором роде неприличным держать корпоративные сайты на бесплатных ресурсах, поскольку стоимость платного хостинга относительно невысока, и при этом существуют дополнительные плюсы, предлагаемые при платном размещении сайтов. К таким плюсам относятся, в частности, более высокая лояльность поисковых машин к платным сайтам, более высокая скорость доступа к ресурсу, возможность более гибко управлять файлами и свободно создавать динамические страницы.
Во всяком случае, специалист конкурентной разведки, увидев, что корпоративный сайт (именно корпоративный, а не личная страница или некоммерческий проект) размещен на бесплатном хостинге, значительно понижает в своем восприятии доверие к финансовому состоянию компании.
5. Посмотрите, куда ведут ссылки, размещенные на страницах сайта.
Гиперссылки могут вести либо на внешние ресурсы, либо в глубь того сайта, на котором расположены. Если есть внешние гиперссылки, посмотрите, куда именно они ведут. Насколько соответствуют теме сайта ресурсы, на которые ведут гиперссылки? Насколько эти ресурсы авторитетны?
Для того, чтобы быстрее искать гиперссылки, в том числе спрятанные, лучше всего вызвать нажатием правой кнопки мыши исходный код страницы, затем нажать одновременно клавиши CTRL и F, и в открывшемся окне поиска на странице искать текст «href», который показывает начало каждой гиперссылки.
6. Посмотрите, занимается ли владелец сайта обновлением информации.
Нередко встречаются сайты, на которых информацию никто не обновляет. Это может быть видно, например, по дате последних новостей, опубликованных на сайте. Если самые свежие новости компании размещены год назад, то обычно нет смысла ждать новинок и в других разделах сайта.
7. Воспользуйтесь советом Шермана и Прайса.
А совет такой:
Примените те же самые «фильтры» при оценке информации, которые вы применяете при чтении информации в офф-лайне. Спросите себя: «Как бы я отреагировал, если бы прочитал об этом в газете или в письме, пришедшем по почте?». Тот факт, что информация содержится в Интернете, еще не служит доказательством ее правдивости – равно как и наоборот.
Тем не менее, часто люди подсознательно считают, что прочитанное в Интернете печатное слово правдиво.
Онлайновые службы, предоставляемые поисковыми системами
Поисковые системы давно вышли за пределы просто поисковых инструментов и стали «воротами» в Интернет, позволяющими узнавать всевозможные новости: погоду, курсы валют и тому подобное, – а также решать множество других проблем.
Рассмотрим подробнее онлайновые службы, предоставляемые Яндексом. Для того, чтобы открылся полный их перечень, достаточно перейти по гиперссылке «Все службы», расположенной справа под поисковой строкой. Ниже мы также приведем ссылки на адрема служб Яндекса, которык наиболее востребованы в конкурентной разведке.
1. Поиск.
Собственно, это и есть то главное, что делает Яндекс поисковой машиной. Здесь обеспечивается доступ к строке запроса, который предваряет процесс поиска в Интернете. Переход из списка «Все службы» по ссылке «Поиск» приводит на привычную всем главную страницу сайта:/.
2. Каталог.
Он расположен по адресу: /. Здесь сайты, отобранные вручную редакторами каталога, сгруппированы в тематические директории.
3. Новости (/).
Речь идет о новостях, представленных электронными СМИ, которые в Яндексе сгруппированы по темам. На первую страницу вынесены главные новости. Кроме того, информацию, отображаемую оперативно, по мере появления свежих данных оносительно тех или иных событий, происходящих в общетве, можно посмотреть в соответствующих разделах – таких, как политика, экономика, наука и пр. При этом справа на странице приведены фамилии людей, которые упоминаются в новостях. На основании этих упоминаний составляется так называемый пресс-портрет, на который можно перейти по ссылке. Правда, специалисты довольно скептически относятся к таким «портретам», поскольку действительно новую и полезную информацию они содержат не очень часто.
Поставщиками новостей для Яндекса в электронном виде выступают такие агентства, как РИА «Новости», REGNUM, Труд, Newsinfo, Полит. ру, Росбалт, АМИ-ТАСС, Радио «Маяк», Газета. Gzt.Ru, Грани. ру, Lenta.ru, Утро. ru, Московские новости, Интерфакс, Известия, Грани. ру, НТВ, Сегодня. ру, ИТАР-ТАСС, NEWSru.com, Взгляд, Kommersant.ru и многие другие. Список всех источников сайта, как центральных, так и региональных, отображенных на рис. 38, можно увидеть по адресу: , и там же найти ссылку для перехода непосредственно на эти ресурсы.
4. Поиск по блогам и форумам (/).
Во-первых, данная служба обеспечивает поиск в блогах и форумах, занесенных в список Яндекса, по ключевым словам. А помимо этого указанный раздел позволяет увидеть, какие темы наиболее популярны в текущий момент.
Кроме того, при желании, непосредственно на этой странице можно внести в персональную ленту нужные блоги и получить возможность в одном и том же месте читать изменения на любом из них. Если блог или форум не внесены в список Яндекса, их можно туда добавить непосредственно на странице «Поиск по блогам и форумам».
5. Маркет (/).
Служба позволяет найти нужный товар и его продавцов в интересующем вас регионе, сделать выбор с учетом всех факторов и совершить покупку. Товары для удобства поиска сгруппированы в каталоге.
6. Словари (/).
Этот раздел располагает разнообразными словарями.
– Энциклопедии (БСЭ).
– «Брокгауз и Ефрон».
– Словари русского языка (Толковый словарь живого великорусского языка Владимира Даля;
– Словарь русских синонимов и сходных по смыслу выражений. Автор – Н. Абрамов; Краткий словарь синонимов).
– Энциклопедии и словари по гуманитарным наукам (Литературная энциклопедия в 11 томах, 1929–1939;
– Энциклопедический словарь «История Отечества с древнейших времен до наших дней»;
– Энциклопедический словарь «Политические деятели России 1917»).
– Энциклопедии и словари по Государству и праву (Словарь основных уголовно-процессуальных понятий и терминов;
– Словарь основных уголовно-правовых понятий и терминов;
– Энциклопедический словарь «Конституция Российской Федерации»).
– Словари по Экономике и финансам (Экономические и финансовые словари от Глоссарий. ру;
– Словарь «Бухгалтерский учет, налоги, хозяйственное право»).
– Справочники (Регистр лекарственных средств России);
– Интернетско-русский разговорник;
– Энциклопедия «Москва»; Энциклопедия «Япония от А до Я»;
– Глоссарий. ру: словари по общественным наукам;
– Глоссарий. ру: словари по естественным наукам;
– Словарь «Война и мир в терминах и определениях» под ред. Д. Рогозина).
Кроме того, данный ресурс позволяет сделать прямой и обратный перевод слов на английском, немецком, французском, итальянском и испанском языках.
7. Картинки.
/
Служба осуществляет поиск файлов с изображениями по названиям конкретных документов. Нередко она помогает найти фотографии людей или товаров, интересующих службу конкурентной разведки, а также логотипы компаний. Напомним, что поиск проводится по названию файла или по подписи к нему в гиперссылке, поэтому это название лучше писать как в русском, так и в английском варианте, плюс в транслите.
Пример поиска в «Картинках» Яндекса по названию одного из крупнейших в России фармацевтических дистрибьюторов – «ЦВ Протек» – показан на рис. 10.
Рис. 10. Результат по запросу «ЦВ Протек» в Картинках Яндекса.
8. Карты.
В этом разделе можно найти карты некоторых городов и стран, в том числе и отдельные адреса ряда населенных пунктов. На момент написания книги данная служба располагала относительно небольшим, набором соответствующих источников, но, на наш взгляд, с учетом тенденций развития Яндекса и его конкурентов, ситуация неизменно изменится к лучшему.
9. Адреса.
/
Эта служба, организованная Яндексом совместно с YellowPages.ru, позволяет искать информацию обоими традиционными для Интернета способами: как посредством поисковой строки, так и с использованием тематического каталога. Поиск производится в определенном регионе, который можно выбрать вручную и который по умолчанию соответствует ip-адресу, с которого пришел посетитель.
10. Афиша.
Представляет репертуар театров, киноафишу, рассказывает о том, где и какие проходят выставки и прочие культурные мероприятия. Предусмотрен выбор региона и дата мероприятия.
11. Погода.
/
Предоставляется прогноз погоды практически в любой точке мира.
12. Телепрограмма.
Служба позволяет ознакомиться с сеткой вещания на центральных, региональных, а также на спутниковых каналах.
13. Почта.
Речь идет об электронной почте от Яндекса. Позволяет пользоваться виртуальным ящиком – как через веб-интерфейс, так и с помощью почтовых клиентов.
14. Спамооборона.
/
Это система защиты от спама, предложенная Яндексом. Она позволяет использовать антиспамовый фильтр для входящей корреспонденции. Предлагается не только персональная, но и корпоративная версия подобного фильтра.
15. Народ.
/
Яндекс предлагает бесплатный хостинг: любой желающий может создать, разместить и поддерживать собственный сайт, либо используя шаблоны (конструкторы) ресурса, либо вывешивая в Сети самостоятельно приготовленные страницы.
К достоинствам таких сайтов относится их бесплатность, а также неограниченное дисковое пространство. Недостатков также хватает – от довольно медленной загрузки страниц до низких позиций в рейтингах, которые им отводят практически все поисковые машины, за исключением Яндекса. Хотя, справедливости ради, следует отметить, что при грамотной раскрутке и правильно выбранной нише такой сайт может неплохо выполнять функции представительства отдельного человека в Интернете (недаром он носит называние «личная страничка»).
Кроме того, на Народе располагается форум, где обсуждаются вопросы создания и поддержки бесплатных сайтов.
16. Деньги.
/
«Яндекс Деньги» – это платежная система, которая по своим функциям близка к интернет-банку. После того, как открывается так называемый «электронный кошелек» (по сути – счет клиента), пользователь переводит на него денежные средства. Сделать это можно, активировав предоплаченную карту, либо осуществив электронный перевод средств из банка, либо с помощью почтового перевода.
После того, как деньги будут зачислены на счет, ими можно расплачиваться за товары или услуги. В случае закрытия электронного кошелька, остаток средств с него переводится в банк, где его можно снять наличными.
17. Закладки.
/
Этот сервис позволяет хранить свои закладки на веб-страницы непосредственно в Интернете. Таким образом, закладки становятся доступны пользователю в любом месте, где бы тот ни находился. Более того, Яндекс проверяет, не удалена ли страница и нет ли на ней изменений, и сообщает, если такие явления имеют место.
К недостаткам данной службы можно отнести более низкий уровень конфиденциальности, чем при пользовании закладками на собственном компьютере, поскольку ситуация с конфиденциальностью находится под контролем специалистов Яндекса, но не самого пользователя.
Закладка создается очень просто: после нажатия на ссылку «добавить закладку» открывается новое окно, в котором требуется указать адрес страницы, включаемой в закладки, и ее название (для удобства пользователя). Более наглядно данный процесс представлен на рис. 11.
Рис. 11. Закладки Яндекса. Добавление новой закладки.
18. Подписки.
/
Они обеспечивают подписку на так называемые «Новости Яндекса» по поисковому запросу (рис. 12). От настоящих новостей в их общепринятом понимании данная информация отличается тем, что она черпается из тех ресурсов, которые были недавно проиндексированы Яндексом. Реальный срок публикации таких документов в Интернете может быть достаточно давним, однако для Яндекса они считаются новинками, отчего и попадают в соответствующий его раздел.
От «Яндекс Ленты» эта услуга отличается тем, что новости приходят по электронной почте в виде гиперссылки на документ и небольшого его фрагмента, тогда как «Ленту» пользователь должен загружать самостоятельно.
Рис. 12. Подписка на Новости Яндекса по запросу.
19. Лента.
/
«Яндекс Лента» позволяет отслеживать изменения на новостных ресурсах и блогах, которые отображаются на одной странице. Для того чтобы воспользоваться данной услугой, достаточно внести адрес нужного ресурса в специальную форму подписки. Это удобный инструмент для конкурентной разведки, поскольку облегчает процесс мониторинга изменений на сайтах, входящих в сферу ее интересов.
20. Директ.
Представляет собой инструмент подписки на контекстную рекламу. Используя ее рекламодатель платит деньги не повременно, а за реальных посетителей, перешедших по ссылке на его сайт с поисковой машины. Выражаясь языком пользователей Интернета, рекламодатель оплачивает определенную небольшую сумму за каждый «клик» по гиперссылке, размещенной в «Директе».
21. Кубок.
Соревнования по профессиональному поиску в Интернете. Некоторые из постоянных участников Кубка Яндекса привносят значительный вклад в развитие этой поисковой системы – как, например Денис (liveuser), написавший работу по поиску через Яндекс.
22. Города.
Приведем цитату с сайта Яндекса об этой службе.
Для каждого города Яндекс попробовал вычислить свой интернет-индекс – численный показатель, в котором учитывается доля пользователей Яндекса в городе (при этом население города берется из данных последней переписи), количество и авторитетность городских сайтов, популярность города в поисковых запросах.
Данный индекс представлен в виде списка.
С этого ресурса можно перейти и к поиску в конкретных регионах, адрес соответствующей страницы.
23. WiFi.
Служба содержит список точек доступа в Интернет с помощью WiFi. На этой же странице есть и переход на ресурсы, которые продают оборудование, приспособленное для работы по данной технологии.
24. Тариф.
Список провайдеров в различных городах, которые обеспечивают безлимитный Интернет по цене не более 30 долл. США в месяц. Таким образом, Яндекс стимулирует популяризирует использование Сети в стране.
Развлечения.
25. Открытки.
Подборка цифровых открыток впечатляет. Здесь можно найти картинку на любой случай. Особенно полезна эта, казалось бы, чисто развлекательная функция Яндекса, когда надо создать у людей (например, у клиентов) хорошее настроение оригинальными и запоминающимися действиями. Более того, на «Яндекс Открытках» есть «напоминалка», которая не даст забыть о необходимости поздравить конкретных людей с памятной датой.
26. Игрушки.
А вот эта функция вряд ли может пригодиться в конкурентной разведке. Думаем, не надо объяснять почему.
27. Сфера.
Это многопользовательская онлайновая игра, опять же не представляющая особого интереса для конкурентной разведки.
28. Гостиная.
Форумы, где можно пообщаться со специально приглашенными для общения интересными людьми.
29. Рефераты.
/
Этот странный, на первый взгляд, сервис, может быть иногда полезен в конкурентной разведке. Смысл его состоит в том, что здесь генерируются псевдоосмысленные и псевдонаучные тексты.
Применение для целей конкурентной разведки, которое нам удалось видеть, заключалось в «уводе» общения на одном из форумов, принадлежавшем компании, которой мы помогали, в сторону от первоначальной темы. В упомянутом нами случае недоброжелатели организации затронули неприятный для обсуждения вопрос. Персонаж форума, использовавший фрагменты текстов из «рефератов» Яндекса в качестве «комментариев», выглядел настолько нелепо, что о теме все благополучно забыли, переключившись на обсуждение «глупости» этого человека. В результате, беседа была прервана модератором как явно несоответствующая формату дискуссионной площадки.
Вот фрагмент «реферата», который Яндекс сгенерировал по теме «Почему постоянно самонаблюдение?» (тему выбирает Яндекс в пределах заданной проблемы).
Фрустрация интегрирует ассоцианизм, это обозначено Ли Россом как фундаментальная ошибка атрибуции, которая прослеживается во многих экспериментах. Социализация откровенна. Как отмечает Жан Пиаже, чувство недоступно аннигилирует сублимированный интеллект, как и предсказывает теория о бесполезном знании. Коллективное бессознательное, согласно традиционным представлениям, случайно. Важность этой функции подчеркивается тем фактом, что лидерство дает аутотренинг, здесь описывается централизующий процесс или создание нового центра личности.
Нет ничего удивительного в том, что, столкнувшись с подобными «шедеврами», адаптированными к теме дискуссии, участники обсуждения быстро забывают о заявленных в начале разговора проблемах.
30. Специальные виды поиска.
Семейный (он исключает ресурсы, содержащие нецензурные выражения и порнографию).
Для слабовидящих (содержит ссылки на программы для людей с ослабленным зрением и выставляет крупный размер шрифта).
Дзен (это шутка Яндекса, при которой запрос генерируется автоматически на основании статистики запросов пользователей за определенный период).
Аскетичный (Ya.ru) (страница не содержит вообще ничего, кроме поисковой строки и входа в почту Яндекса).
Расширенный (форма расширенного поиска, о которой мы подробно поговорим чуть позже).
31. Вебмастеру. Служба, реализующая пожелания пользователей относительно нюансов работы с сайтом.
– Добавить сайт. Позволяет вручную записать новый сайт в очередь на индексацию. Данная функция – единственная возможность сообщить поисковой машине о своем сайте, если на этот сайт нет ни одной внешней ссылки.
Удалить страницу. Удаляет страницы из индекса, но только в том случае, если они больше не существуют в Сети. «Живые» страницы не могут быть уничтожены. Предвосхищая идеи, которые могут прийти в голову некоторым читателям в отношении сайтов их конкурентов, сообщаем: чужие страницы, соответственно, также удалить не получится.
Поиск на вашем сайте. Позволяет разместить на своем ресурсе поисковую строку Яндекса, которая сможет адресовать запросы как данному сайту, так и Интернету в целом.
Партнерские программы. Включают в себя предложения о сотрудничестве для СМИ, интернет-магазинов, кафе, региональных компаний и разработчиком вебсайтов.
– Статистика поисковых запросов по различным словам и словосочетаниям.
Рисунок 13 иллюстрирует статистику по запросу «конкурентная разведка».
Рис. 13. Статистика по запросу «Конкурентная разведка».
32. Инструменты.
Поиск кнопкой. Добавляет кнопку со ссылкой на нужный сайт в панель браузера Internet Explorer. В браузере Mozilla Firefox эта опция имеет штатный характер и предусмотрена в самом браузере в виде «панели закладок».
Русская клавиатура. Создает экранную клавиатуру. Эта опция может пригодиться в том случае, если работа осуществляется с нерусифицированного компьютера – например, за рубежом. Причем использование ее не ограничивается рамками Яндекса, поскольку созданный с помощью такой клавиатуры текст можно скопировать и вставить в любую другую программу, решив тем самым проблему отсутствия русскоязычной шрифтовой раскладки для любого приложения.
Надо сказать, что многие поисковики стараются предоставить пользователю дополнительный сервис. Поскольку они перенимают друг у друга лучшее, их услуги часто бывают похожи, хотя каждая система имеет свою изюминку. Мы не будем подробно останавливаться на службах остальных поисковых сайтов, так как считаем, что читатель в состоянии разобраться в данном вопросе самостоятельно. Скажем лишь, что, например, услугам Гугла посвящен целый сайт, созданный энтузиастом данного сайта Николаем Петровым и расположенный по адресу: -google.ru/.
Внешний вид главной страницы ресурса, с которой можно перейти на соответствующие страницы Гугла, приведен на рис. 14.
Рис. 14. Главная страница сайта Мир Google.
А тем читателям, которые интересуются появлением новых сервисов (или изменениями старых) в Яндексе, мы рекомендуем включить в свою Ленту Блог Яндекса: /.
Здесь регулярно появляется официальная информация, посвященная вопросам работы этого сайта, что позволит вам своевременно узнавать обо всех новинках.
Формы расширенного поиска в поисковых системах
Создатели поисковых машин понимают, что не все их пользователи хотят изучать язык поисковой машины. Тем более, что при всей принципиальной схожести синтаксис запросов конкретных поисковых машин специфичен, а к некоторым машинам обращаются и вовсе нечасто. Иными словами, все указывает на то, что особого смысла в глубоком изучении этого языка для каждого поисковика нет.
Между тем, машин таких действительно немало.
Рис. 15. Поисковые строки поисковых систем, собранные на одной странице на сайте «Центра новых технологий» ОАО «ЮТК»
Интересен ресурс, рекомендованный специалистом конкурентной разведки Рогачевой Еленой Юрьевной (она участвует в форуме проекта it2b под псевдонимом). На сайте филиала ОАО «Южная телекоммуникационная компания» «Центр новых технологий» по адресу на одной странице собраны поисковые строки сразу десяти машин, а также пяти систем поиска по FTP-серверам, как показано на рис. 15. При нажатии на этом ресурсе кнопки «Искать» ваш запрос будет адресован конкретному, выбранному вами поисковику, причем синтаксис запроса будет сохранен. С этого же ресурса можно попасть и на страницу расширенного поиска каждой из представленных в списке машин, если нажать кнопку «Детальный поиск».
Условия расширенного поиска предоставляют возможность детализировать запрос. После заполнения предусмотренной для этого формы поисковая система автоматически расставляет операторы запроса и выдает соответствующий результат. Такая простота в обращении позволяет достигать эффективности при минимуме затрачиваемых усилий.
Однако существует и оборотная сторона использования такой формы поиска, а именно – невозможность тонкой настройки запроса. Как показывает практика, запрос, адресованный информационной системе человеком, знакомым со всеми нюансами ее работы, значительно более точен, нежели алгоритм, записанный в форме расширенного поиска.
Именно поэтому мы предлагаем использовать ее лишь на тех машинах, к которым вы обращаетесь нечасто, и только в том случае, когда вас устраивает получение неисчерпывающего результата.
Внешний вид формы расширенного поиска Яндекса приведен на рис. 16.
Рис. 16. Форма расширенного поиска Яндекса.
На рисунке видно, что пользователь имеет возможность задать расположение слов запроса на странице – в заголовке страницы, в тексте или в ссылке на страницу. Кроме того, можно задать расположение слов друг относительно друга – согласно оператору «Логическое И» в Яндексе. Можно также запретить образование словоформ.
Помимо того, вы можете произвести поиск в определенном регионе или на отдельно взятом сайте. Ну и, наконец, затребовать выдачу документов указанного вами формата или на выбранном вами языке.
При этом авторы Яндекса почему-то не стали вводить строку для исключения слов из запроса, а ограничились текстом под поисковой строкой, который рекомендует ставить знак «минус» перед словами, которые вы хотели бы исключить.
На наш взгляд, это не самое удачное решение, поскольку оно может быть не вполне понятно неподготовленному человеку. В этом смысле, нам представляется более удобным механизм, действующий в большинстве информационных систем: строка для исключения слов из запроса представлена в виде полноправного инструмента, доступного в форме расширенного поиска наравне с остальными элементами.
Сложные запросы в форме расширенного поиска создать нельзя.
Хорошо видно, что, например, решение такой относительно сложной задачи, как:
[!налог & +недвижимость ~~ +подоходный] —
просто не предусмотрено структурой формы расширенного поиска Яндекса, поскольку разные слова в приведенном запросе имеют разные атрибуты.
Рис. 17. Форма расширенного поиска Гугла.
Подобная ситуация в той или иной степени характерна и для остальных поисковых систем. Пожалуй, только форма расширенного поиска Гугла страдает этим в меньшей степени, что достигается за счет сочетания двух направленных навстречу друг другу факторов: с одной стороны, сам по себе язык запросов Гугла проще (в смысле, несколько примитивнее), чем в Яндексе, а с другой стороны, форма расширенного поиска этой программы предоставляет больше возможностей в отличие от таковой в Яндексе. В частности, как иллюстрирует рис. 17, она позволяет сделать такой запрос, в котором логические «И» сочетаются с логическими «ИЛИ».
Метапоисковые машины Интернета с примерами поиска различных типов информации
Каждый из увлеченных пользователей Сети в душе мечтает о существовании одной-единственной информационной системы, которая сочетала бы в себе достоинства всех поисковиков одновременно.
Казалось бы, достаточно автоматизировать процесс размещения запроса в каждую из поисковых машин, как исследователю останется лишь собирать богатый урожай. И действительно, нашлись люди, которые так и поступили. Однако полученный результат хорошим не назовешь, с точки зрения специалиста конкурентной разведки.
Поскольку, как известно, большинство поисковых машин по умолчанию воспринимают знак пробела как логическое «И», то для слов, введенных в поисковую строку каждой машины, автоматический «вброс» запроса работает неплохо. То есть, само по себе размещение содержимого поисковой строки в разные поисковые машины технических трудностей не представляет. Только дело в том, что ввод слов через пробел крайне редко позволяет специалисту конкурентной разведки получить нужный результат. А вот автоматизировать составление поискового запроса для каждой поисковой машины на одном шаблоне, чтобы потом этот запрос автоматически переконвертировался с учетом синтаксиса языка запросов конкретной машины и забрасывался туда, пока что никто в широко доступных продуктах не стал. Да и сама по себе такая возможность переконвертации вызывает на сегодня сомнения, поскольку просто не существует, например, в Гугле поиска «в пределах одного предложения».
В результате, целый класс подобных инструментов, названный метапоисковыми машинами, практически не применяется для нужд конкурентной разведки.
Метапоисковая машина не имеет собственных пауков и собственной базы данных. Она в неизменном виде размещает запрос в тех поисковых машинах, которые отметил пользователь, а затем дожидается ответа от них и выдает результат со всех машин на одной странице. Для удобства пользователя эти результаты содержат пометку о том, с какой поисковой машины был получен тот или иной ответ. В результате вместо всех плюсов каждой поисковой машины, которые достаточно индивидуальны, пользователь может ощутить общие для них всех минусы, поскольку неточный поиск «сырой» информации с большим содержанием «информационного шума» непригоден для целей конкурентной разведки. Нам нравится высказывание специалиста журнала «Игромания» Алексея Бутрина о принципе работы метапоисковых машин и их недостатках, по сравнению с настоящими поисковыми машинами:
Гораздо эффективнее влезть на яблоню и сорвать именно то яблоко, которое вам нужно, а не трясти бедное дерево (скорее всего, вас просто завалит яблоками по самые уши).[8]
Примеры метапоисковых машин Интернета
Примерами метапоисковых машин, работающих в Интернете, могут служить Nigma (/), xRambler (/) и Metabot (http://www. metabot.ru/).
Они имеют схожие интерфейсы и представляют собой поисковую строку, под которой можно отметить те поисковые системы, в которые будет отправляться запрос. Результаты запроса включают также, в отличие от таковых при работе с обычными поисковиками, информацию о том, из какой конкретно машины они получены.
Программы для работы с информацией
1. Метапоисковые машины, устанавливаемые на собственном компьютере.
Яркий представитель программ такого рода – Коперник Мета (Copernic Meta). Это бесплатное программное обеспечение, которое можно скачать по адресу: .
Для доступа к метапоисковой машине Copernic Meta пользователь устанавливает на своем компьютере плагин к Интернет Эксплореру, после чего в браузере появляется дополнительная панель.
Создатели Copernic Meta говорят о том, что их машина имеет следующие преимущества:
– позволяет провести метапоиск в Интернете с целью сравнения цен в сетевых магазинах, охватив при этом большое количество таких торговых площадок;
– производит поиск картинок, аудиофайлов, новостей, предметов, продающихся на аукционах;
– предоставляет пользователю возможность добавлять свои любимые поисковые машины и информационные ресурсы;
– обеспечивает доступ к поиску из любого приложения простым нажатием клавиш «Windows Key + S»;
– облегчает поиск ключевых слов на найденных страницах;
– достаточно щелкнуть по любому слову на странице, удерживая клавишу Alt, чтобы начать поиск этого слова;
– имеет панель с ярлыками для запроса в определенную поисковую машину.
Авторы программных продуктов Коперник не ограничились созданием метапоисковой машиной. За дополнительную плату (около 50 долл. США) они предлагают такие продукты, как Copernic Tracker, а также Copernic Summarizer.
Copernic Tracker способен отслеживать появление новых слов или графических элементов на веб-страницах. Кроме того, он имеет ряд дополнительных возможностей:
– может отправлять оповещение об изменении на странице на электронный почтовый ящик либо на мобильный телефон;
– подчеркивает изменения на странице, облегчая тем самым их обнаружение пользователем;
– может проводить контроль изменений автоматически, по заданному расписанию – каждый день, каждую неделю или даже каждую минуту;
– способен проверять наличие определенных ключевых слов на странице;
– сохраняет в архиве разные версии проверенных страниц;
– обеспечивает возможность проверки страницы непосредственно в тот момент, когда пользователь ее просматривает.
Copernic Summarizer, который оценивается уже в 60 долл. США, способен анализировать текст любой длины, написанный на одном из четырех языков, и затем выдавать краткое содержание материала в том размере, который ему задали. При этом программа работает с документами, представленными в таких форматах, как документы Word, веб-страницы, PDF-файлы, сообщения электронной почты и даже текст в буфере обмена.
Запуск программы Copernic Summarizer может быть произведен нажатием одной кнопки в таких приложениях, как браузер Интернет Эксплорер, а также программах Adobe Acrobat, Acrobat Reader, Outlook Express, Eudora, Microsoft Word, and Outlook.
Документ, полученный в результате работы программы, можно распечатать на принтере либо сохранить в одном из нескольких допустимых форматов: как простой текст, документ Microsoft Word, файл HTML или XML formats. Кроме того, этот материал может быть немедленно преобразован в сообщение электронной почты и отправлен по любому адресу, выбранному пользователем.
И наконец, производитель продуктов Коперник предлагает программу Copernic Agent Professional, которая объединяет все вышеописанные продукты под одной оболочкой. При этом стоимость ее относительно невелика для изобретения такого уровня и составляет около 80 долл. США.
К сожалению, на этом несомненные плюсы программ Коперник заканчиваются. Минус у них, собственно, один. Но достаточно большой: Коперник не работает с русскоязычными поисковыми системами, русский язык в принципе не входит в число четырех языков, с которыми работает система.
У автора этой книги есть опыт приобретения программы Copernic Agent. Так вот, на этапе ее эксплуатации выяснилось, что в данном случае невозможен не только анализ русскоязычных текстов, но и добавление русскоязычных поисковых машин в базу Copernic Meta, хотя легкость включения информационных систем в базу данных отдельно заявлена среди преимуществ продукта.
Служба технической поддержки сообщила, что, к их большому сожалению, русский язык не поддерживается Коперником и в ближайшее время в этом направлении создатели программы работать не планируют.
Однако, справедливости ради, отметим, что объявленный ими принцип: «Мы гарантируем возврат денег в течение 30 дней после покупки, если вам не понравится наш продукт» – действительно соблюдается. После того, как мы высказали по электронной почте просьбу компенсировать нам стоимость программы, в связи с указанными выше обстоятельствами, деньги действительно были зачислены на тот счет, с которого ранее производилась оплата.
Однако для тех, кто работает с Интернетом на основных европейских языках, программные продукты Коперник могут действительно помочь сэкономить время при параллельном повышении качества работы. На наш взгляд, Copernic Agent – одно из самых доступных по цене решений для малого и среднего бизнеса, когда стоит задача мониторинга Сети и предварительного анализа полученных документов.
2. Поиск информации на собственном компьютере.
Сегодня у большинства пользователей на персональном компьютере хранится достаточно много информации, и ее количество стремительно растет. Это могут быть статьи, письма, договоры, какие-то другие документы различных форматов. Если владелец компьютера регулярно собирает какие-то сведения, то их объемы могут составлять сотни гигабайт, что обычно и происходит у профессионала конкурентной разведки. В такой ситуации достаточно скоро возникает вопрос, как найти нужные тексты, в том числе те, о которых пользователь уже забыл. Лучшее решение этой задачи предлагается компанией Apple, производящей компьютеры на базе операционной системы MacOS. Наш опыт показал, что заявленная ею возможность мгновенного поиска файлов по фрагменту слова, содержащегося в тексте, действительно работает. Это было достигнуто благодаря тому, что принципиальная организация MacOS обеспечивает индексацию содержимого файлов еще на этапе записи документа на жесткий диск. Однако большинство наших читателей пользуется операционной системой Windows, поэтому мы подробнее остановимся на предлагаемых для нее решениях.
Встроенные в Windows XP средства поиска, которые вызываются нажатием виртуальных кнопок «Пуск» > «Найти» > «Файлы и папки», имеют один существенный недостаток. Дело в том, что этот алгоритм каждый раз открывает и просматривает все без исключения файлы, хранящиеся на компьютере в области, заданной для поиска. Такой способ работы с информацией обеспечивает высокую точность результатов, но, к сожалению, требует много времени, и чем больше становится количество файлов на персональном компьютере, тем больше времени расходуется впустую, в ожидании того, когда нужный файл будет найден. Именно поэтому на рынке появились программы, которые, подобно поисковым машинам Интернета, индексируют информацию на персональном компьютере и делают ее доступной пользователю практически мгновенно. Причем эти программы как правило предоставляются бесплатно.
Наиболее известные из них – Яндекс Десктоп (Yandex Desktop . yandex.ru/), Гугл Десктоп (Google Desktop . html) и Коперник Десктоп (Copernic Desktop Search / products/desktop-search/index.html). Первые две поддерживаются поисковыми системами Яндекс и Гугл, а третья – авторами метапоисковой машины и других продуктов под маркой «Коперник».
Каждый из названных продуктов работает в фоновом режиме и по умолчанию проводит индексацию в то время, когда пользователь не прикасается к компьютерной мыши и не работает на клавиатуре.
Для того, чтобы читателю было проще сделать свой выбор между этими тремя программами, мы поделимся результатами проведенных нами в свое время экспериментов. Мы исследовали, насколько безопасны поисковые программы для персональных компьютеров, с точки зрения утечки информации с компьютера без ведома пользователя.
Персональные поисковики Гугл и Яндекс выпущены и поддерживаются одноименными поисковыми машинами Интернета. На наш взгляд, основная причина появления этих программ для настольного компьютера именно в бесплатном варианте – это привлечение людей к своим информационным системам как к основным средствам работы в Сети. Недаром в оба продукта встроена функция «Искать в Интернете», приводящая к машине по обработке запросов, которая создала настольный поисковик. Такое привлечение пользователей материально выгодно для информационных систем в силу ряда причин:
– это позволяет эффективно продавать контекстную рекламу, так как количество посетителей поисковой машины возрастает;
– дает дополнительный трафик поисковикам;
– позволяет собирать статистику по ключевым словам, используемым пользователями;
– помогает отслеживать перемещения людей от одной машины к другой и тем самым узнавать об их предпочтениях.
Недаром при установке нового пакета программ Гугла, в котором персональный поисковик для настольного компьютера представляет собой лишь один из его компонентов, по умолчанию ставится «галочка» в графе о подтверждении согласия пользователя на сбор «неличной информации» с его компьютера.
Вот текст этого дисклеймера, который появляется при установке Google Desktop.
При использовании расширенных функций Вы можете передавать информацию о просмотренных сайтах и неличную информацию об использовании в Google. Например, для персонализации новостей, отображаемых на боковой панели, Google Desktop отправляет в Google информацию о посещаемых Вами страницах новостей. Мы используем неличные данные об использовании, включая сообщения о сбоях, в целях усовершенствования Google Desktop. Учтите, что эти данные на самом деле не содержат сведений, позволяющих нам узнать, кто Вы такой. Мы используем их только для расширения возможностей Google Desktop по предоставлению Вам наиболее релевантной информации.
Существует два варианта установки поисковика Гугла отдельно от пакета (о «галочке» в этом случае можно забыть) – с расширенными функциями и без таковых. Если выбрать вариант, когда расширенные функции включены, то программа начнет соединяться с Интернетом сразу по множеству каналов, перебирая закладки на сайты, сделанные в браузере компьютера. В результате откроется боковая панель, с которой можно будут осуществлять быстрые переходы к ресурсам, которыми вы интересуетесь. Соединение при этом будет установлено с адресом kh.google.com и mt.google.com.
Коперник, как известно, выпущен компанией, которая не имеет собственной поисковой машины, а владеет метапоисковиком, распределяющим запросы между поисковыми системами других владельцев, и затем анализирующим полученные результаты. Вероятно, поэтому столь выраженного интереса к сбору статистики, который характерен для поисковых машин, у владельцев и авторов Коперника нет.
Проводя исследование передачи данных в Интернет настольными поисковыми системами, мы обратились за помощью к человеку, который профессионально занимается вопросами конфиденциальности сведений, представленных в Сети. В работе были использованы специальные программы для подробного анализа интернет-активности приложений – SmSniff и Ethereal.
Владимир Казеннов, так зовут нашего эксперта, не только помог нам советами, но и непосредственно проделал основную часть экспериментальной работы. Если читателям потребуется связаться с ним для прояснения непонятных моментов, это можно сделать по электронной почте [email protected].
Проведенное нами исследование подтвердило, что Коперник Десктоп и Яндекс Десктоп достаточно безвредны. Так, Коперник Десктоп вообще ничего не передавал в Интернет, а Яндекс Десктоп передавал лишь информацию о запросе, сделанном пользователем (да и то, как вначале предположил Владимир Казен-нов, а впоследствии подтвердили сотрудники Яндекса, это не преднамеренный поступок, а некритичная ошибка в написании программы).
Однако с Гугл Десктоп ситуация оказалась более угрожающей, с точки зрения конфиденциальности информации на персональном компьютере. Мы выявили, что он передает на свой сервер некие неустановленные данные по зашифрованному каналу (именно потому, что они зашифрованы, их и не удалось установить). Кроме того, нами было доказано, что Гугл предоставляет своим хозяевам обширную статистическую информацию о параметрах машины, которая использует данную программу, и о работе системы поиска.
Вместе с тем, исследование большей части полученных данных показало, что основная сетевая активность Гугла Десктоп осуществляется в незашифрованном виде и в большинстве своем неопасна с точки зрения угрозы конфиденциальным сведениям.
А кроме того, было установлено, что часть программного кода, применяемого Гуглом – в частности, java-скрипт, – может при определенных условиях быть вредоносной, так как использует технологию скрытого сбора информации и не требует получения разрешения от пользователя на ее отправку поисковику. Во всяком случае, такие java-скрипты обычно запрещаются в защищенных системах.
Так обстояло дело на момент написания книги. Мы не в состоянии спрогнозировать, каким будет поведение поисковых машин этих производителей завтра.
Полное описание эксперимента с детализацией полученных на каждом этапе данных читатель может найти по адресу: . html.
Таким образом, если во главе угла – конфиденциальность информации на персональном компьютере, можно было бы рекомендовать в первую очередь Коперник Десктоп и, пожалуй, Яндекс Десктоп. Гугл, передающий в Интернет неустановленные зашифрованные данные с персонального компьютера, на наш взгляд, не может считаться полностью безопасным.
Однако есть еще один параметр, по которому мы также проводили эксперимент, сравнивая два поисковик-лидера. Речь идет о том, что лучше – Яндекс Десктоп или Коперник Десктоп, с точки зрения языка запросов, который используется в этих программах. Интерфейс Коперника англоязычный, Яндекса – русскоязычный.
Для того, чтобы разобраться в этом вопросе, на жесткий диск персонального компьютера были записаны четыре файла, созданных в Word и содержавших короткие, достаточно бессмысленные тексты, включающие в себя нестандартные, редко встречающиеся слова, а также понятия, намеренно написанные с орфографическими ошибками. Это позволило работать без «информационного мусора», который мог быть создан другими документами, хранящимися на том же компьютере. Полное описание эксперимента можно увидеть по адресу: .
В результате, нами были сделаны приведенные ниже выводы.
На наш взгляд, программа Copernic Desktop Search обеспечивает больше возможностей для точного поиска на персональном компьютере, нежели Яндекс Десктоп.
Коперник Десктоп больше подходит для человека, который знает, что такое Булева алгебра и которого не смущает англоязычный интерфейс.
Яндекс, на наш взгляд, за счет упрощения языка запросов настольной поисковой программы, утратил свое главное преимущество – способность составить точный поисковый запрос.
Если же пользователь не испытывает необходимости в составлении точного запроса, то Яндекс Десктоп – лучшее решение, нежели продукт Коперника, поскольку он прощает большее количество ошибок и неточностей.
Особенности фактического языка запросов обеих испытанных программ. Яндекс Десктоп:
– воспринимает слова в любой их форме, и возможности отменить процесс образования производных от исходного слова нет. Причем, не работают ни стандартный для поисковой машины Яндекс оператор «!», находящийся перед словом, ни заключение запроса в двойные кавычки;
– не проводит различий между заглавной и прописной буквами в тексте;
– ищет по целому слову, изменяя его, по фрагменту слова поиск не выполняется;
– не поддерживает функцию принудительного включения слова в результат поиска. Если из двух слов, соединенных логическим «И» в пределах текста есть только одно, этот документ все равно попадет в выдачу, даже если перед обоими словами стоит знак «плюс»;
– оператор логическое «И» внутри одного предложения («&») при этом действует;
– оператор расстояния между словами не действует;
– логическое «НЕ» существует, но всегда относится ко всему тексту (что соответствует двойной тильде «~~»);
– точная фраза (оператор «кавычки») действует;
– логическое «ИЛИ» также действует.
Коперник Десктоп:
– выдает результат в зависимости от того, с заглавной или прописной буквы написано слово. Эта зависимость исчезает, если перед словом поставить логическое «ИЛИ» (оператор OR – заглавными буквами);
– ищет информацию по фрагменту слова;
– словоформы не поддерживает. Если нужно любое производное от искомого понятия, надо написать его не до конца, чтобы все варианты окончаний могли быть добавлены к этому фрагменту;
– если в запросе два слова связаны логтческим «И», представляет в выдаче только те тексты, в которых обязательно есть оба слова (напоминаем, что лучше писать слово без окончания, если нет уверенности в том, в какой форме оно присутствует в тексте);
– логическое «НЕ» представляет знаком «минус», действие которого распространяется на любой фрагмент текста.
Мониторинг изменений на сайтах в Интернете
Ни специалисту конкурентной разведки, ни сотруднику отдела маркетинга или сбыта недостаточно просто знать, на какой страничке Интернета содержится нужная информация. Надо иметь возможность своевременно и точно отслеживать изменения на этой страничке. Каждый может себе представить, насколько сложна, а чаще всего и вовсе неосуществима эта задача. Вряд ли даже самый внимательный и скрупулезный человек в состоянии быстро и точно оценить изменения в тексте – скажем, в прайс-листе, – занимающем пять страниц.
Для решения подобной проблемы несколькими компаниями разработано специальное программное обеспечение – так называемые «сторожевые роботы»: ознакомившись со страницей, они сохраняют ее образ в своей базе данных, а при повторном посещении сравнивают актуальное состояние ресурса с этим образом. Программа отмечает изменившиеся места, которые становятся похожи на выделенные маркером фрагменты текста на бумажном носителе. Более того, удаленние кусков материала также фиксируется многими программами данной категории – как правило, внизу страницы, дабы не мешать восприятию человеком информации. «Сторожевые роботы» могут запускаться пользователем вручную, а могут и работать автоматически, по расписанию.
Предлагаем рассмотреть эти программы более подробно.
Сторожевой робот WebSite-Watcher
Программа выпущена в Германии, ее официальный сайт – . Стоимость продукта составляет около 40 долл. США за индивидуальную лицензию. Кроме того, пользователю дается 30-дневная полнофункциональная версия, дабы он успел удостовериться в необходимости ему этого продукта. Заплатить за WebSite-Watcher требуется лишь один раз, после чего все обновления становятся доступны бесплатно и на неограниченный срок.
Интерфейс программы поддерживает русский и украинский языки, однако раздел «Помощь» до выхода в свет версии 4.06 был написан на английском. После появления версии 4.06 на сайте программы по адресу . com/wswtrans.htm стал доступен exe-файл (wswhelp_russian.exe), который присоединяет к WebSite-Watcher справочную информацию на русском языке. Работа с русским языком не вызывает у программы никаких проблем. Продукт довольно часто обновляется. Так, на момент написания книги была доступна версия 4.10.
WebSite-Watcher работает как клиент на компьютере пользователя. Это значит, что все закладки и конфигурации хранятся локально на жестком диске компьютера и сервер хозяина не участвует в процессе поиска. Производитель утверждает, что выход в Интернет требуется продукту лишь для посещения страниц, проверяемых пользователем.
Что же может проверять программа?
Любые web-страницы с текстовым содержанием, независимо от расширения файла. То есть статичные страницы (с расширением файла. htm или. html) и динамичные страницы (с расширением. asp,php и так далее). WebSite-Watcher также выделит цветом все изменения в тексте.
RSS/Atom feeds. Страницы RSS/Atom преобразовываются в читаемый html-формат и могут обрабатываться как обычные web-страницы.
Страницы, защищенные паролем. Для таких страниц вы можете записать макрокоманду, после автоматического выполнения которой ресурс будет проверен на обновление.
Форумы. Они обрабатываются как обычные страницы с небольшой оптимизацией, например, специальной технологией подсветки изменений.
Страницы с Javascript. Для таких страниц WebSite-Watcher поддерживает отдельную и более сложную технологию преобразования динамически сгенерированного содержания ресурса в статичное содержание.
Изображения. Если Вы отслеживаете изображение, WebSite-Watcher способен обнаружить его обновление. Изменения в изображении не подсвечиваются.
Двоичные (бинарные) файлы. WebSite-Watcher может обнаруживать обновление двоичных файлов (например, файлы zip или exe) сравнением даты документа, его размера и/или части его содержания (двоичные файлы не будут полностью загружаться при проверке на обновление).
Файлы PDF и Flash. Они обрабатываются как двоичные файлы. WebSite-Watcher не подсвечивает изменения в их содержании.
FTP-файлы и каталоги. WebSite-Watcher поддерживает отслеживание таких документов и каталогов. FTP-файлы могут проверяться по их дате/размеру или содержанию.
Интранет. Все страницы в сети Интранет могут быть проверены подобно обычным web-страницам.
Локально хранящиеся файлы. WebSite-Watcher может отслеживать любой файл на вашем жестком диске.
По крайней мере, такие данные приводит сам производитель.
После того, как WebSite-Watcher установлен и запущен на компьютере, в правом верхнем углу всех наиболее распространенных браузеров (в частности, Internet Explorer, Mozilla Firefox, Opera) появляется значок программы, представляющий собой стилизованный глаз.
Добавление закладки в перечень закладок может производиться двумя способами.
1. Непосредственно из браузера.
Таким образом можно добавить к закладкам ту страницу, которая в настоящий момент загружена в браузере. При щелчке любой кнопкой мыши по значку WebSite-Watcher в правом верхнем углу браузера появляется всплывающее меню, первый пункт которого «Добавить в закладки». После того, как выбирается этот пункт, появляется следующее окно, в котором URL страницы уже автоматически внесен в соответствующее поле. Вам остается лишь ввести ее имя вручную (причем оно не имеет никакого значения для компьютера и служит только для того, чтобы можно было определить, для чего та или иная закладка нужна, потому и назначается пользователем произвольно). Версия 4.10 позволяет обойтись даже без ручного ввода названия страницы, поскольку программа может автоматически брать это название на самом ресурсе.
Внимание: после того, как URL страницы и имя закладки внесены в это окно, требуется нажать клавишу «ПРОВЕРИТЬ!», а НЕ кнопку «ОК». В этом случае WebSite-Watcher отправится на страницу и сохранит в своем архиве ее образ, с которым и будет при следующем посещении ресурса проводить сравнение. В главном окне программы WebSite-Watcher после этого напротив имени закладки появится надпись «ОК, инициализировано».
Если же пользователь выберет кнопку «ОК» вместо кнопки «Проверить!», то программа сохранит закладку в меню, однако посещать страницу не будет и, соответственно, не будет и сохранять в архиве ее копию.
2. Из главного меню программы WebSite-Watcher.
Для этого надо открыть окно добавления новой закладки, щелкнув либо по второй слева кнопке на верхней панели программы (она называется «Мастер» и выглядет как жезл с икрящимся наконечником), либо по третьей слева кнопке в той же панели (она называется «Новая закладка» и выглядит как лист бумаги с размещенным на нем знаком «плюс»). Нажатие кнопки «Мастер» предпочтительно, когда проверяемая страница защищена паролем, поскольку там предусмотрен макрос, позволяющий вводить этот пароль автоматически. В остальных случаях лучше воспользоваться командой «Добавить закладку».
Программа WebSite-Watcher позволяет проверять изменения на странице как вручную, так и автоматически.
Организуются новые папки и подпапки для систематизации закладок также очень легко, а перемещаются в новые места простым перетаскиванием их их мышью.
Кроме того, в программе предусмотрены фильтры, которые позволяют исключать из проверки определенные строки (например, постоянно меняющиеся время или дату в углу страницы либо афоризм, который некоторые оптимизаторы сайтов любят постоянно менять на своем ресурсе). Использование фильтров помогает исключать неинформативные сообщения о наличии изменений на странице.
Архивирование страницы непосредственно в программе WebSite-Watcher не предусмотрено, однако производитель вместе с программой WebSite-Watcher поставляет бесплатную программу Local WebSite Archive, которая как раз и создает архивную копию странички Интернета. При этом Local WebSite Archive может запускаться из того же меню, встроенного в браузер, что и WebSite-Watcher.
Подробное описание этих и других возможностей WebSite-Watcher приведено в разделе «Помощь» этой программы, поэтому детально останавливаться на них мы не будем.
И напоследок нам хотелось бы отметить, что существует форум (/), где обсуждаются проблемы программы WebSite-Watcher и способы их преодоления. Форум, к сожалению, англоязычный, но он приносит реальную пользу, когда не понятно, как поступить в том или ином случае, либо когда требуется отыскать нужную функцию, не вынесенную в главное меню программы. Хотим поблагодарить его участников, советы которых неоднократно помогали нам в работе.
Программа Copernic Tracker
Эта программа может быть скачана из Интернета по адресу: .
К сожалению, Copernic Tracker, как и другие продукты компании, пока что плохо работает с русскими шрифтами, поэтому интересен, главным образом, для тех, кто проводит мониторинг европейских и американских сайтов. Тем, кто интересуется русскоязычными страницами, лучше сразу перейти к описанию следующей программы.
Однако мы не сочли возможным обойти его вниманием, поскольку продукты Коперник – наиболее доступное программное обеспечение, позволяющее автоматизировать работу с сайтами, которые написаны на языках, основанных на латинском алфавите.
Производители Copernic Tracker отмечают следующие его возможности:
– мониторинг сайтов с целью поиска изменений в тексте и отслеживания новых изображений;
– предоставление уведомлений об изменениях на интересующих пользователя сайтах не только на рабочий стол компьютера, но и по электронной почте, а также по мобильному телефону;
– выделение цветом изменений на странице;
– осуществление автоматической проверки страниц по расписанию – ежедневно, еженедельно и даже ежеминутно;
– просмотр конкретных ключевых слов на странице;
– архивирование разных версий просмотренных страниц;
– просмотр одним щелчком мыши изменений страницы, которая загружена в данный момент в браузер.
На наш взгляд, практический интерес представляет способность отправлять оповещение об изменениях на страницах в Интернете на адрес электронной почты или мобильный телефон. Эта функция может быть полезна всем пользователям. А вот разрекламированные возможности программы отслеживать новые рисунки мы в ходе тестирования обнаружить так и не смогли. Нами, в частности, был поставлен на мониторинг сайт новостей от BBC. Картинки на ресурсе менялись регулярно, располагаясь при этом в одних и тех же местах, и Copernic Tracker, исправно сообщающий об изменениях в тексте, никоим образом на манипуляции с изображениями не реагировал. А жаль, поскольку способность отслеживать изменения баннеров, например, очень востребована рекламными компаниями.
В остальном программа очень похожа на вышеописанную.
На момент написания книги пользователям был доступен только англоязычный интерфейс, в отличие от русскоязычного WebSite-Watcher. Функция запуска Copernic Tracker непосредственно из браузера работает не из любого распространенного браузера, как это было возможно в случае с программой WebSite-Watcher, а лишь из Internet Explorer.
Стоимость Copernic Tracker – примерно 50 долл. США. На сайте производителя возможно скачать демонстрационную 30-дневную версию, и еще 30 дней даются покупателю на принятие окончательного решения о целесообразности приобретения, поскольку на Copernic Tracker распространяется обычная для программного обеспечения Copernic практика гарантии возврата денег в течение указанного срока, если пользователя по каким-то причинам продукт не устроит.
Программа Check & Get
Это отечественный продукт. Преимущество такой программы заключается не только в корректной поддержке русского языка, но и в возможности ее приобретения за российские рубли (что выступает решающим аргументом для крупных предприятий, в особенности – государственных, где использование иностранной валюты для оплаты товаров или услуг затруднительно), а также в доступности создателя продукта, если у вас появляются к нему вопросы. Причем техническая поддержка при этом также русскоязычная, в отличие от программ-конкурентов.
Мы подтверждаем, что Дмитрий Скорняков ([email protected]) – человек, который создал и поддерживает программу Check & Get, действительно всегда готов помочь разобраться с проблемой, если таковая возникает. Так, автор этой книги сталкивался с ситуацией, когда ни одна из приведенных здесь программ не могла отслеживать изменения на сайте одного из российских университетов. Попытавшись понять причины этой проблемы, в бессилии расписались как создатели и администраторы проблемного сайта, так и служба технической поддержки WebSite-Watcher. И только Дмитрий Скорняков внимательно изучил тот проблемный сайт, разобрался в причинах возникшей ситуации и дал рекомендации, которые позволили устранить проблему. На наш взгляд, это немаловажное обстоятельство, говорящее в пользу программы Check & Get.
Скачать ее можно по адресу: .
Вот что говорит о возможностях продукта его создатель.[9]
При обнаружении на веб-странице новой информации, Check&Get автоматически сохраняет «снимок» этой страницы в локальную базу данных и информирует Вас указанным Вами способом. Check&Get может послать вам сообщение электронной почты с содержанием измененной веб-страницы, при этом, изменения на странице будут «подсвечены» для их легкой идентификации. Также, программа может вывести сообщение на экран или проиграть звуковой файл, информируя Вас об изменениях.
Check&Get автоматически извлекает названия и описания веб-страниц при создании Закладки, проверяет вашу коллекцию на наличие «мертвых» ссылок, находит дублирующиеся ссылки в вашей коллекции закладок. Check&Get работает с Internet Explorer, Netscape, Mozilla, Opera, позволяя вам импортировать, экспортировать, и синхронизовать закладки. Благодаря этому, вы всегда имеете в выбранном браузере актуальную и организованную коллекцию ссылок.
Список ссылок также может быть импортирован и добавлен к вашим Закладкам из буфера обмена Windows, окна браузера, HTML файла или офисного документа. В дополнение ко всему, Check&Get позволяет конвертировать вашу коллекцию Закладок в файл HTML с легкой и удобной навигацией. Это дает вам возможность опубликовать свои Закладки на веб-сайте или создать в Интернет свой мини-портал буквально за пару минут.
Приведем перечень функций программы, также взятый на ее официальном сайте (рис. 18).[10]
Интуитивный и простой в использовании интерфейс на русском языке с поддержкой функций Drag & Drop.
Поддержка «визуальных схем».
Возможность проверки веб-страниц в ручном или автоматическом режиме на наличие изменений.
Поддержка протокола SSL.
Одновременная проверка веб-страниц.
Расширенные функции поиска закладок и веб-страниц по общим полям (имя, описание, ключевые слова). Также возможен поиск по сохраненному содержанию веб-страниц.
Встроенный браузер с поддержкой онлайнового и автономного (offline) режима.
Подсветка изменений на веб-страницах, что позволяет легко идентифицировать новое содержание.
Выбор пользователем режима оповещения об изменениях веб-страниц: по электронной почте (включая содержание страницы с подсвеченными изменениями), оповещением на экране пользователя, проигрыванием звукового файла.
Автоматическое сохранение «снимков» веб-страниц с возможностью их просмотра в автономном режиме. Позволяет изучить изменение ресурса за указанный промежуток времени.
Возможность открытия закладок в любом внешнем браузере (автоматически определяемые браузеры: Internet Explorer, Netscape, Mozilla, Opera, MyIE2, Avant Browser, etc.).
Импорт закладок из Internet Explorer, Opera, Netscape, Mozilla.
Экспорт закладок в Internet Explorer, Opera, Netscape, Mozilla.
Синхронизация закладок с Internet Explorer, Opera, Netscape, Mozilla.
Захват ссылок из буфера обмена Windows.
Расширенные возможности импорта ссылок из буфера обмена, окна браузера, текстовых или HTML-файлов, офисных документов или любых других материалов, даже если они имеют неизвестный формат.
«Мастер очистки Дублирующихся Ссылок», который позволяет обнаружить и вычистить дубликаты в коллекции закладок.
Обнаружение «мертвых ссылок».
Поддержка постоянного (локальная сеть/выделенная линия) или сеансового (коммутируемый модем) соединений с Интернет; функции авто-дозвона, авто-отсоединения от Интернет.
Автоматическая загрузка программы при старте Windows, работа в системном лотке.
Использование в коммерческих целях или внутри компании.
Рис. 18. Check&Get главное окно и оповещение об изменении на странице.
На наш взгляд, способность программы импортировать все закладки или их часть в HTML-файл – интересная находка автора. В ряде случаев эта функция открывает очень полезные возможности. Такой файл может быть использован на сайте как страница с работающими гиперссылками. Причем если его обработать в любом редакторе HTML-файлов, например, в Frontpage или в Dreamweaver, то можно снабдить первоначальный документ необходимыми текстовыми пояснениями или иллюстрациями.
Кроме того, Check&Get позволяет одним кликом мыши извлечь все гиперссылки, которые есть на странице.
Полезна и функция удаления «мертвых» и дублирующихся ссылок.
А вот возможность по автоматическому занесению в закладки страницы, с которой пользователь пытается копировать текст, заложенную в программу по умолчанию, на наш взгляд, нельзя однозначно отнести к достоинствам продукта. По крайней мере, начинающим пользователям эта функция скорее досаждает, нежели облегчает их работу: на практике эта теоретически полезная способность программы проявляется в возникновении всплывающего окна всякий раз, когда вы всего лишь копируете фрагмент текста со страницы в буфер обмена (даже если вы вообще не планируете ничего ставить на мониторинг, а собираетесь, к примеру, просто скопировать часть документа, чтобы сохранить его в текстовом файле). Это всплывающее окно предлагает внести в закладки адрес страницы, и его каждый раз приходится закрывать вручную. В принципе, Check&Get предусмотрена возможность зайти в меню и отключить эту опцию, однако для начинающего пользователя обычно и столь, казалось бы, примитивная операция представляет немалую сложность.
Существует 30-дневная ознакомительная версия программы.
Стоимость персональной лицензии продукта при расчете наличными составляет около 600 рублей. Иностранные покупатели платят цену примерно вдвое большую, сопоставимую со стоимостью зарубежных программ-конкурентов.
Онлайновый сервис Infominder
Можно считать неизменной тенденцию к развитию онлайновых сервисов, которые если не полностью вытесняют, то, по крайней мере, дублируют программное обеспечение, устанавливаемое непосредственно на компьютере. А потому появление таких интернет-услуг, которые обеспечивали бы контроль содержимого страниц, было вполне логичным. Arthur Weiss.[11] рекомендует пользоваться ресурсом Infominder, который расположен по адресу:
30-дневная бесплатная версия сервиса позволяет проводить мониторинг изменений на веб-ресурсе один раз в день, ограничивая при этом количество просматриваемых страниц десятью. Платный сервис обеспечит проверку изменений до четырех раз в день. Стоимость услуги зависит от количества поставленных на мониторинг страниц. На момент написания книги годовой платеж за 20 страниц составлял 9 долл. США, за 100 страниц – около 25 долл., за 250 страниц – около 50 долл., за 500 страниц – порядка 99 долл. и за 1000 страниц – 179 долл.
Независимо от того, какой версией пользуется клиент, он может получать уведомления об изменившихся страницах двумя способами: лично посетив свою страницу на сайте Infominder и введя при этом логин и пароль, либо запросив отправку соотвествующих сообщений по электронной почте. Последнее требует заполнения расширенной (Advanced) формы при добавлении новой закладки, приведенной на рис. 19.
Онлайновый сервис ChangeNotes
Сервис расположен по адресу .
В принципе, существует возможность бесплатной постановки на мониторинг изменений на сайтах общим числом до 100 контролируемых страниц, а при том, что учет ведется по адресу электронной почты подписчика, мы бы сказали, что, скорее, кратно ста страницам. Оповещение пользователя производится один раз в день.
Однако, как показывает практика, нередко поставщики бесплатных услуг не несут никакой ответственности в случае сбоев в работе. Кроме того, они не отвечают и за качество предоставленного сервиса. Хотим оговориться: к ChangeNotes (рис. 20) это опасение, вполне возможно, и не имеет никакого отношения. Потому мы и обращаемся к описанию этого сервиса, и в то же время считаем своим долгом напомнить читателю о возможных подводных камнях, когда дело касается установки бесплатных программ. Так что делайте выводы.
Рис. 19. Расширенное меню добавления страницы в Infominder.
Рис. 20. Онлайновый сервис ChangeNotes
Архив сайтов Internet Archive Wayback Machine
Электронный адрес – .
Каждый, кто собирал информацию по интересующей его проблеме за достаточно длительный период, знает, как порой бывает важно найти сведения, опубликованные на сайте несколько лет назад. Иногда это просто необходимо: в частности, в случае обнаружения новых тенденций в развитии объекта, которое требует ретроспективной оценки времени их появления. Либо возникновения новой темы для изучения событий на рынке и, как следствие, сравнения реакции на них с тем, как вели себя в подобной ситуации участники рынка в прошлом. Конечно, специалист конкурентной разведки всегда старается архивировать интересующую его информацию. Однако в реальной жизни бывает так, что проблема просто не входила в сферу его интересов до определенного момента либо на предприятии эта служба появилась позже тех событий, которые и стали предметом ее пристального внимания.
В таком случае на помощь нередко может прийти сервис, который нам также рекомендовал Arthur Weiss. Этот Internet Archive Wayback Machine, его изображение представлено на рис. 21. Сервис позиционируется как «Библиотека Интернета». Пауки, принадлежащие Internet Archive Wayback Machine, посещают веб-сайты и сохраняют архивную копию на сервере «библиотеки». Как написано на странице этого ресурса, интересующего нас сайта может и не оказаться в архиве. Например, в случае если паук не может его прочитать, поскольку тот защищен одним из способов, описанных нами в соответствующем разделе данной книги.
Сервис Internet Archive Wayback Machine некоммерческий. Он работает с 1996 г. и, как утверждают его владельцы, существует на пожертвования меценатов и благодаря технической поддержке крупных интернет-компаний, таких как Alexa. Ежемесячно архив увеличивается в объеме на 20 терабайт. Ценным нам видится то обстоятельство, что Internet Archive Wayback Machine отслеживает копии даже тех сайтов, которых больше не существует в Сети.
Для того, чтобы увидеть сохраненную версию нужного сайта, достаточно ввести в окно, расположенное в верхней части главной страницы, адрес ресурса и нажать клавишу «Take me Back». После этого пользователю будет предложен архив по запрошенному ресурсу. В пределах этого архива можно ознакомиться с копией сайта за искомую дату. На рис. 22 показан список копий ресурса «Росбизнесконсалтинг».
Рис. 21. Главная страница Internet Archive Wayback Machine.
Рис. 22. Архив по сайту РБК
Архив, расположенный на сервере в Сан-Франциско, поражает своими возможностями. Вот как выглядела страница этого известнейшего интернет-ресурса 10 декабря 1997 г. (рис. 23).
Рис. 23. Страница ресурса РБК от 10 декабря 1997 г.
Надо сказать, что, помимо функций обеспечения нужд непосредственно конкурентной разведки, наши источники рассказывали о случаях, когда этот ресурс помогал компаниям в сборе доказательств по фактам информационной войны против них. Как правило, в таких ситуациях, когда нападающая сторона «затирала» сведения на сайте, Internet Archive Wayback Machine позволял доказать факт распространения порочащих организацию данных.
Один из источников автора сообщил о факте, когда наличие копии сайта в архиве Internet Archive Wayback Machine позволило доказать в споре с контролирующими органами, что сайт, существование которого вызывало сомнения у контролеров, действительно существовал в тот период, когда компания получила деньги за его разработку и «раскрутку».
Мониторинг появления новых сообщений на сайте
Программы, которые устанавливаются на персональном компьютере и позволяют видеть все, что происходит с ресурсом, – не единственный инструмент мониторинга его модификаций. Преимущество таких программ – в том, что они фиксируют изменения, которые касаются даже одного-единственного слова.
К недостаткам «сторожевых роботов» мы бы отнесли то обстоятельство, что работают они лишь на том компьютере, на котором непосредственно установлены. Технически возможно перенести базу данных с машины на машину, однако программу придется вновь инсталлировать на тот компьютер, с которого планируется осуществлять контроль изменений в Интернете. Кроме того, «сторожевые роботы» небесплатны.
В связи с этим, представляют практический интерес два бесплатных сервиса, доступных любому пользователю с любой машины, которая подключена к сети. Речь идет об агрегаторах новостей и о новостях по запросу пользователя.
Новости по запросу пользователя.
В Яндексе, Гугле и некоторых других информационных системах этот сервис работает достаточно давно.
Рассмотрим его более подробно на примере Яндекса (рис. 24). Для того, чтобы им воспользоваться, необходимо ввести запрос в строку поиска. Введем следующее: «курс доллара резко возрос», – а затем дождемся загрузки результатов.
Если после появления результатов кликнуть по гиперссылке «Новости» под поисковой строкой, то откроется страница, на которой справа содержится гиперссылка с текстом:
«Подписка на новости по запросу „курс доллара резко …“.
Рис. 24. Подписка на Новости Яндекса по запросу.
Переход по этой гиперссылке приведет пользователя еще на одну страницу, на которой ему будет предложено авторизоваться. Как обычно принято на Яндексе, для авторизации используются те же логин и пароль, которые пользователь задействует для доступа к своему почтовому ящику на Яндексе. После авторизации в почтовый ящик подписчика будут приходить все новости, обнаруженные Яндексом по этому запросу. Пользователь может добавлять подписки на новости по другим запросам, а может удалять те из них, которые перестали быть ему нужны.
По мере появления новой информации в Яндексе по конкретному запросу, в почтовый ящик подписчика будут приходить ссылки и сниппеты (фрагменты текста), при переходе по которым пользователь получит возможность ознакомиться с содержимым страницы в подлиннике.
Правда, хотим напомнить, что новостями Яндекс считает те ресурсы, которые были проиндексированы им недавно. Истинный возраст информации на этих страницах может быть сколь угодно большим, но поисковиком они будут восприниматься как новые на том основании, что он о них узнал с опозданием.
Такой сервис существует и в Гугле, он называется GoogleAlert (что можно перевести как «Часовой от Гугла» или «Сторож от Гугла») и расположен по адресу /.
После того, как пользователь авторизуется, а также укажет адрес своей электронной почты, ему будет предложено ввести в поисковую строку фразу, по которой он намерен получать новости.
Когда в Гугле появится свежая информация по запросу, поставленному на мониторинг, адресат получит виртуальное письмо, содержащее ссылки на страницы, отвечающие заданным критериям.
В целом, хочется отметить, что сервисы Гугла развиваются настолько стремительно, что мы уверены: к моменту публикации этой книги появятся новые программы, часть из которых еще находится в состоянии бета-тестирования, а часть пока только претендует на звание перспективных планов компании.
Напомним о существовании универсального способа быть постоянно в курсе всех новинок Гугла. Дело в том, что вокруг этой поисковой (и просто сервисной) системы уже сложилось сообщество энтузиастов, которые любят ресурс и постоянно отслеживают, а также тестируют его новинки. Читателю достаточно выбрать нужные группы пользователей и поставить их на мониторинг любым удобным способом, либо просто периодически читать их переписку на форумах. Чтобы попасть на страничку с Группами Гугла, вам нужно перейти по ссылке «Группы» на первой странице.
А можно воспользоваться другим вариантом – уже упомянутым ранее сайтом «Мир Google», расположенным по адресу: -google.ru.
Этот полностью русскоязычный ресурс поддерживается энтузиастами во главе с Николаем Петровым из Пскова. Там всегда можно увидеть описание и комментарии к новым сервисам Гугла, в том числе и к тем, которые находятся в тестовой эксплуатации, и получить приглашение для пользования ими.
Исследование сайта конкурента с точки зрения получения коммерческой информации – на примере конкретных сайтов
Сайт конкурирующей компании может быть источником очень ценной информации, если уметь правильно его исследовать. Один из самых мощных ресурсов для изучения любого сайта – Fagan Finder's URLinfo (. com/urlinfo/).
Вот что писала по этому поводу Группа Компаний Radius в разделе «Новости индустрии IT» еще в 2004 г.[12]
Интересный сайт Fagan Finder's URLinfo способен предоставить для определенной вебстраницы практически исчерпывающую информацию, поскольку обращается к 107 различным системам идентификации, анализа, перевода и т. д.». Arthur Weiss также рекомендует пользоваться этим инструментом.
Адрес проверяемого сайта вводится в строку в верхней части страницы, затем выбирается нужный сервис на вкладке, после чего открывается доступ к статистике, как показано на рис. 25 (только не надо нажимать для этого кнопку «View Page», потому что она открывает не статистику, а непосредственно страницу сайта).
Рис. 25. Главная страница ресурса Fagan Finder's URLinfo.
Изучение любой компании с помощью интернет-ресурсов специалисты рекомендуют начинать непосредственно с ее корпоративного сайта. В этом исследование предприятия в Сети диаметрально противоположно тактике выведывания, которая применяется при получении информации от людей, которые непосредственно ею располагают.
В данном разделе мы будем приводить примеры реально существующих компаний.
Изучение корпоративного сайта будет проведено на примере ресурса екатеринбургского предприятия «Автоленд» – одного из лидеров среди официальных дилеров автомобилей известных марок, а при отсутствии какой-либо информации на сайте этой организации обратимся к ресурсам других компаний. Сайт «Автоленда» и других предприятий, использованных нами при написании книги, позволят увидеть, какого рода сведения о компании находятся в открытом доступе и могут быть получены при исследовании подобных источников.
Если же нам доведется коснуться вопросов, которые могут быть неоднозначно восприняты с точки зрения имиджа предприятия либо вскрыть реально существующие бреши в системе его информационной безопасности, мы будем вносить изменения во внешний вид сайта компании или личных страничек ее сотрудников, с тем, чтобы сделать невозможной их идентификацию. Изменения затронут и текстовую информацию, включая имена людей, адреса, номера телефонов. Ну и, разумеется, будут убраны логотипы и другие визуальные элементы, позволяющие установить принадлежность сайта тому или иному реально существующему предприятию.
Поэтому в разделе, приведенном ниже, наряду с «Автолендом» будут приводиться и другие ресурсы – просто потому, что сайт исследуемой компании не всегда содержит необходимые примеры.
На что обращать внимание при анализе сайта, помимо текстовой информации и изображений
Прежде, чем перейти непосредственно к изучению содержимого сайта – текстам и иллюстрациям, рекомендуем обратить внимание на ряд особенностей, которые помогают лучше воспринимать контент ресурса.
1. Какого уровня доменное имя компании.
Как уже отмечалось, на это следует обратить внимание в первую очередь. Если домен второго уровня – например, «rbc.ru», то он платный. Напомним, что к домену первого уровня относится «.ru», поэтому мы его не рассматриваем. Если это домен третьего уровня – например, «ci-razvedka.narod.ru», то он, как правило, бесплатный. Для компании это чаще всего минус. У «Автоленда» – домен второго уровня «autoland.ru». Соответственно, он платный.
2. Нет ли орфографических ошибок в написании доменного имени.
Нередко компании, занимающиеся предоставлением тех или иных услуг, намеренно регистрируют доменные имена, сходные по написанию с популярными ресурсами. Расчет делается на то, что при опечатке в имени известного сайта пользователь окажется на их ресурсе и воспользуется его сервисами.
Некоторые начинающие исследователи попадают в такую ловушку. Если вместо сайта нужной организации загружается порносайт, то ошибка очевидна. Однако если ресурс имеет более нейтральное содержание, то специалист может и не заподозрить ничего плохого.
И наоборот – если окажется, что компания сознательно пользуется именем, которое, возможно, имитирует чужие параметры, следует задуматься о причинах такого положения вещей. Не исключено, что это лишь ловкий маркетинговый ход. Однако дело тут может быть и в другом. В принципе, каждый конкретный случай подразумевает свои выводы, которые пользователь должен сделать самостоятельно, с учетом всей имеющейся в его распоряжении информации.
Примеры сайтов, имена которых отличаются от широко известных на одну-единственную букву, приведены на рис. 26.
Рис. 26. Сайт googl.ru (отличается на одну букву от google.ru)
Проблема создания сайтов с доменными именами, использующими сходство в написании с популярными ресурсами, порой приводит к неожиданным и довольно дорогостоящим проблемам, от которых не застрахованы даже самые уважаемые компании. Вот, например, сообщение об инциденте, связанном с использованием ошибочно написанных доменных имен уважаемой поисковой системой в рекламе.[13]
Рекламодатели подали против Yahoo коллективный иск
06 мая 2006 года, 19:50 Текст: Наталья Дембинская
Рекламодатели Yahoo подали против интернет-гиганта коллективный иск с обвинением в размещении рекламы на сайтах, кишащих шпионскими программами и на сайтах с «опечатками» в доменных именах. В частности, реклама размещалась на сайтах компаний Intermix Media и Direct Revenue, которые в апреле были признаны судом распространителями шпионского ПО и нежелательных баннеров.
Меж тем как за «премиум» размещение рекламы было заплачено Yahoo и ее дочерней компании Overture Services. В иске говорится, что Yahoo обещала обеспечить рекламе высокий таргетинг и разместить ее на таких крупных сайтах, как Microsoft.com и CNN.com, сообщает Infoworld. Представители Yahoo поданный иск пока не прокомментировали. Адвокаты истцов пока не определили размер нанесенного ущерба, предположительно эта сумма может составить сотни миллионов долларов.
Проверка сайта с помощью сервисов Fagan Finder
()
Раздел «Подробности о трафике» (General > Alexa > Traffic Details)
Рис. 27. Подробности трафика на сайте компании Автоленд, г. Екатеринбург.
Статистика основывается на результатах обработки запросов пользователей, на компьютерах которых установлен тулбар Alexa. Это достаточно репрезентативная выборка, хотя и не вполне объективная для русскоязычного Интернета, поскольку относительно небольшой процент пользователей рунета вообще слышал о существовании Alexa, еще меньшее число людей установили себе этот тулбар. В частности, статистика показывает, какие страницы сайта наиболее часто посещаются (это отражено в разделе «Where do people go on autoland.ru?», внешний вид которого приведен на рис. 27).
В этом же разделе можно провести сравнение посещаемости ресурса с каким-либо другим сайтом и получить результаты в виде графика.
Кому принадлежит доменное имя (вкладки General > Global Whois)
В принципе, эту информацию можно получить на многих сайтах, которые занимаются регистрацией доменных имен. Или, как вариант, на ресурсах, обращающихся к так называемой службе WHOIS. Например, по адресу: /.
Однако, если загружен Fagan Finder и проверка сайта уже идет, логично провести ее с помощью этого сервиса.
autoland.ru Whois Form
domain: AUTOLAND.RU
type: CORPORATE
nserver: pio.convex.ru.
nserver: ubik.convex.ru.
nserver: valis.convex.ru.
state: REGISTERED, DELEGATED
org: J/S Co «Auto land»
phone: +7 343 3727000
fax-no: +7 343 3727064
e-mail: [email protected]
e-mail: [email protected]
e-mail: [email protected]
registrar: RUCENTER-REG-RIPN
created: 1998.01.12
paid-till: 2007.02.01
source: TC-RIPN
Last updated on 2006.08.07 11:04:29 MSK/MSD
Registration information:
Просмотр ссылок на сайт
Для Yahoo! требуется пройти по вкладкам Links > Yahoo! (рис. 28). Для остальных ресурсов – по соответствующим ссылкам на эти ресурсы, приведенным после ссылки Links.
Внимание: Fagan Finder не поддерживает ссылки с изначально русскоязычных поисковых систем, например с Яндекса или Рамблера, поэтому ссылки на сайт с этих ресурсов требуется искать вручную, вводя запрос непосредственно из русскоязычных информационных систем. А вот ссылки с русскоязычных страниц, проиндексированных Гуглом или MSN, показаны хорошо.
Ссылки на сайты отечественных компаний, найденные с помощью оператора Link в русскоязычных поисковых системах, нередко позволяют найти личные странички бывших и настоящих сотрудников компаний, а также частные объявления специалистов, которые порой позволяют выйти на контакт с этими людьми с целью получения от них информации о предприятии.
Рис. 28. Ссылки на сайт «Автоленда» в Yahoo! полученные через панель управления на ресурсе Fagan Finder.
Рис. 29. Архив сайтов компании «Автоленд», полученный через панель управления на ресурсе Fagan Finder.
Просмотр архива сайтов (Cache > Internet Archive)
Ресурс этот мы уже рассматривали, а потому нет смысла повторяться. Отметим лишь, что архив сайтов входит в пакет инструментов, доступных через Fagan Finder, что отображено на рис. 29.
Запрос страницы сайта, сохраненной в кэше различных поисковых систем
Рис. 30. Запрос страницы сайта компании «Автоленд» из кэша Google, полученный через панель управления на ресурсе Fagan Finder.
Поиск по блогам
Этот сервис, интегрированный в Fagan Finder, ориентирован на западные блоги. Поэтому применительно к екатеринбургскому «Автоленду» он результатов не дал, чего и следовало ожидать.
Перевод веб-страниц с иностранного языка (вкладка Translate)
Поскольку сайт компании «Автоленд», расположенной в Екатеринбурге, российский, нет никакого смысла переводить его на русский язык. Поэтому для тестирования функции перевода в Fagan Finder мы обратились к приведенному на рис. 31 тайваньскому ресурсу Mazda на китайском языке (. com.tw). Надо сказать, что Fagan Finder нам не показался удачным решением для подобного рода операций. Использование панели сервиса для перевода выглядит следующим образом.
Рис. 31. Тайваньский сайт Mazda на китайском языке.
Ресурс располагает несколькими онлайновыми интерпретаторами, и для продвинутого пользователя это, пожалуй, неплохо. Есть даже возможность автоматического определения языка, на случай, если кому-то не известно наверняка, на каком языке написан просматриваемый им документ (правда, работает этот инструмент не всегда корректно, точнее – не всегда работает). Но для того, чтобы добраться в Fagan Finder до нужного электронного переводчика, требуется проделать немало дополнительных действий, переходя по англоязычным ссылкам со страницы на страницу. С другой стороны, сервис предоставляет возможность пользоваться и такими переводчиками, которые, в отличие, скажем, от известного онлайнового ресурса Systransoft (), переводят непосредственно на русский материалы с самых разных языков (например, с китайского). Правда, качество продукта подобных манипуляций традиционно далеко от совершенства (рис. 32).
Раз уж речь зашла об онлайновых переводчиках, отвлечемся ненадолго от инструментов, предлагаемых Fafgan Finder, и отметим, что лично нам более всех остальных по своей функциональности нравится онлайновый переводчик Systransoft, о котором мы уже упоминали и который рекомендуют многие специалисты конкурентной разведки, состоящие в SCIP. Он позволяет переводить как отдельные слова и фрагменты текста, так и целые веб-страницы. А помимо этого дает возможность ставить эти страницы на мониторинг, что бывает важно для специалиста конкурентной разведки. Например, постановка на мониторинг слова «выставка» на арабском языке при помощи онлайнового переводчика может состоять из таких этапов:
Рис. 32. Перевод тайваньского сайта Mazda на русский язык, полученный через панель управления на ресурсе Fagan Finder.
– в переводчике Systransoft или любом другом слово «выставка» переводится на английский язык – «exhibition»;
– в переводчике Systransoft слово «exhibition» переводится на арабский язык – «»;
– в Гугле слово «» вводится в поисковую строку и результат ставится на мониторинг – например, с помощью сервиса Google Alert.
Процесс поиска указанного понятия в Сети проиллюстрирован на рис. 33.
Внешний вид одной из страниц приведенного выше списка результатов, которая принадлежит выставочному центру в Кувейте (/), отображен на рис. 34.
Еще раз напоминаем, что онлайновые переводчики в принципе не дают ком-петеных результатов – хотя бы потому, что не имеют возможности учитывать полисемию (многозначность) и идиомы. Например, в карманном словаре «The Oxford Russian Minidictionary», изданном в США в 1995 г., слово «Run», которое онлайновые переводчики обычно интерпретируют как «бежать», имеет девять значений. Особенно серьезной эта проблема становится при кросс-переводе через третий язык.
Хорошо иллюстрирует подобную ситуацию пример, приведенный нам специалистом по конкурентной разведке Евгением Гришиным. Он перевел с помощью онлайнового интерпретатора Systransoft известную поговорку с русского языка на английский, а затем обратно и получил такие результаты.
Рис. 33. Результат поиска в Гугле слова «выставка» на арабском языке.
Рис. 34. Страница в результатах поиска по слову «выставка» на арабском языке.
Первоначальный вариант:
баба с возу – кобыле легче
Англоязычный вариант, по версии Systransoft:
ram to cart to mare more easily
Окончательный русскоязычный вариант, по версии Systransoft:
штоссель к тележке к конематке легко
Тем не менее, для того, чтобы понять смысл содержимого страницы, не прибегая к помощи «живого» специалиста, возможностей онлайновых переводчиков обычно оказывается достаточно.
Просмотр изменений на странице (вкладки Track > Watch ThatPage)
Fagan Finder предлагает услуги четырех практически равноценных систем мониторинга изменений на странице сайта. Эти системы позволяют получать по электронной почте один раз в день или реже информацию об изменениях. Субъективно, по нашему мнению, эти онлайновые сервисы менее удобны и оперативны, нежели программы, устанавливаемые на персональном компьютере (рис. 35).
Рис. 35. Постановка страницы на мониторинг через панель управления на ресурсе Fagan Finder.
При появлении изменений на странице, служба Watch ThatPage информирует о них по электронной почте.
На наш взгляд, программа WebSite-Watcher информативнее, чем онлайновые службы, однако последние выигрывают за счет того, что позволяют увидеть изменения из любой точки мира и с любого компьютера.
Переход в блоги, онлайновые хранилища закладок и архивы страниц (вкладки Post > Livejournal)
Через панель управления на ресурсе Fagan Finder можно перейти непосредственно в персональный блог. При этом ссылка на изучаемый сайт появится автоматически как новое сообщение в блоге, которое тут же можно дополнить.
Так же осуществляется переход на интернет-сервисы, которые способны сохранять закладки пользователей и даже архивные копии страниц. Примером такого сервиса служит Furl (аббревиатура от FileURL). Данный ресурс во многом похож на блог, но не дает публичного доступа к своему содержимому, это ваше личное хранилище статей, страниц и закладок. При этом Furl хранит как закладку на страницу, так и изображение самой страницы на заданную дату. Пользователь может вести собственный архив страниц (рис. 36).
Рис. 36. Занесение страницы в Furl через панель управления на ресурсе Fagan Finder
Инструменты оптимизации сайта (переход через вкладку Develop)
Прямого отношения к задачам конкурентной разведки, на наш взгляд, эти сервисы не имеют, но для комплексной оценки «продвинутости» сайта могут пригодиться. Специалисты по оптимизации наверняка найдут здесь немало полезных инструментов, позволяющих понять организацию ресурса с технической точки зрения.
Просмотр служебной информации о сайте с помощью ресурса NETCRAFT[14]
Этот ресурс позволяет определить, какие серверы используются в обслуживании сайта, кому они принадлежат, какие имеют ip-адреса и какие на них установлены операционные системы. Причем, для целей конкурентной разведки может быть полезным то, что здесь отображается вся история изменений как аппаратной и программной части серверов компании, так и провайдеров, которые обеспечивают хостинг. Это помогает, в частности, оценить техническую «подкованность» организации и косвенно – через обновление техники – ее финансовое благополучие. На рис. 37 приведена информация об истории развития серверов компании «Автоленд» – со времени их возникновения до наших дней.
Рис. 37. Информация об истории изменения аппаратной, программной части серверов, обслуживающих сайт по адресу /, и о провайдере, полученная на ресурсе NETCRAFT
Просмотр содержимого файла robots.txt
Для просмотра содержимого этого файла мы рекомендуем воспользоваться скриптом, созданным Сергеем Матвеенко – специалистом по IT из Санкт-Петербурга.
Скрипт доступен по адресу: /.
Вот что пишет о нем сам автор.
Кнопка на панель ссылок браузера для просмотра текста файла robots.txt
Вы можете добавить на панель ссылок вашего браузера кнопку «Посмотреть robots.txt». Чтобы установить кнопку, просто перетащите эту ссылку на панель ссылок вашего браузера: Посмотреть robots.txt.
Теперь, если Вы захотите увидеть файл robots.txt сайта, который в данный момент открыт в браузере, просто щелкните по кнопке «Посмотреть robots.txt» в панели ссылок. Откроется страница, содержащая текст файла.
Кнопка работает во всех браузерах при включенном JavaScript.
При просмотре сайта компании «Автоленд» выяснилось, что файл robots.txt на ресурсе отсутствует. Таким образом, данный способ ограничения индексации поисковыми роботами в указанном случае не применяется. Для получения доказательств того, что скрипт все-таки работает, мы обратились к другому сайту, а именно – форуму на екатеринбургском портале e1 по адресу: / forum/.
Результат проверки содержимого файла robots.txt на сайте форума приведен ниже.
User-Agent: *
Disallow: /mye1
Disallow: /ad.php
Disallow: /cgi/go
Disallow: /talk/forum/go.php
Disallow: /fun/photo/get_code.php
Disallow: /auto/sale/print/
Disallow: /talk/forum/forum_news.php
В ряде случаев специалиста конкурентной разведки может ждать удача – когда переход по гиперссылке, указанной в окне с результатами проверки содержимого файла robots.txt, открывает доступ в те зоны сайта, которые в принципе предназначены лишь для служебного пользования, но при этом не запрещены к посещению людьми (то есть ограничения на посещение введены исключительно для поисковых пауков). Соответственно, на наш взгляд, ничего противозаконного или неэтичного в попытке представителя конкурентной разведки взглянуть на страницы ресурса, к которым ведут гиперссылки в файле robots.txt, нет.
Визуальный осмотр офиса изучаемого предприятия на спутниковой фотографии с использованием Google Map
Этот метод хорош при работе с иностранными партнерами из развитых стран, поскольку в Гугле сделана привязка карт к каталогам с названиями компаний. Отечественные предприятия пока что не очень широко представлены в этом списке, а русский язык сервисом Google Map вообще на момент написания книги не поддерживался. Да и правила пользования подобными сервисами не всегда полностью соответствуют требованиям, предъявляемым к максимально разрешенной в России точности карт. На момент написания книги не были завершены дебаты о том, что ограничения на точность карт в России, возможно, устарели и требуют внесения изменений. Мы рекомендуем изучить законодательство на текущий момент, прежде чем пользоваться ресурсами Google Map по отношению к объектам на территории нашей страны, во избежание конфликтов с Законом.
Рис. 38. Офис компании IBM в Нью-Йорке, показанный с помощью ресурса Google Map.
За рубежом законодательные проблемы точности карт уже решены. При поиске иностранных компаний достаточно ввести название предприятия в поисковую строку Гугла и выбрать масштаб изображения, а также вариант его демонстрации – «карта» (map), как это представлено на рис. 38, «спутниковое изображение» (satellite) или «и то, и другое» (hybrid). При этом пользователю будет показана и контактная информация интересующей его организации.
Грамматические ошибки в тексте, размещенном на сайте
После того, как завершено знакомство с сайтом с технической точки зрения, советуем приступить к исследованию его конента – текстовой и графической информации.
Во время такого изучения могут быть обнаружены орфографические или пунктуационные ошибки. В случае их выявления, для того, чтобы сделать правильные выводы из такой находки, надо постараться понять, почему эти огрехи присутствуют на сайте.
Вот наиболее частые причины появления орфографических и грамматических ошибок в сетевых документах.
Случайные опечатки грамотного человека при вводе информации, при отсутствии контроля качества готового материала.
Безграмотность человека, составлявшего текст.
Принадлежность владельцев или целевой аудитории сайта к субкультуре, которая использует намеренно искаженный язык.
Сетевые традиции написания некоторых слов.
Намеренные ошибки, введенные в текст, призванные помочь сайту обнаруживаться по ключевым словам, которые пользователи часто вводят в поисковую строку с нарушением правил грамматики.
Безусловно, наличие ошибок или опечаток нередко может подорвать доверие к ресурсу, даже если его контент безупречен по содержанию. На рис. 39 и 40 приведены примеры двух размещенных в Интернете текстов, которые содержат такие огрехи. Причины их появления нам не известны, предоставим читателю самостоятельно оценить степень доверия к материалу, изложенному таким образом.
Обычно понять причины появления ошибок или опечаток можно интуитивно. Однако иногда установить, чем обусловлено их возникновение, бывает непросто. Для того, чтобы отличить безграмотность от случайных огрехов, как правило, достаточно «пробежать» несколько текстов, размещенных на сайте. Если какое-то слово на ресурсе пишется в основном правильно и лишь изредка – с ошибкой, то это, вероятно, связано с невнимательностью при вводе, то есть это опечатка. Если же слово везде или по преимуществу написано неправильно, то причина этого – в безграмотности, и в данном случае речь идет уже о грамматической ошибке.
Рис. 39. Реклама «Представительство в Орбитражном суде».
Рис. 40. Сообщение на одном из интернет-форумов.
Примером субкультуры, имеющей свой собственный язык, могут служить так называемые «Падонки» (они именуют себя именно таким образом, через «а»). Представители этой субкультуры используют язык, в котором слова намеренно пишутся так, как звучат, или подвергаются другим искажениям. Например, слово «еж» пишется как «йош», «животное» – «жывотное». Сленг «Падонков» (или, как они себя еще называют, «Падонкафф») вышел далеко за пределы их сообщества, несколько адаптировался к нормам литературного языка, и его элементы нередко встречаются в самых разных текстах, с которыми может столкнуться специалист конкурентной разведки, потому мы и уделили ему внимание в нашей книге. В частности, искаженное написание слов может быть востребованным при постановке некоторых ресурсов на мониторинг по поисковому запросу. Подробное описание сленга «Падонков» можно найти в Википедии (рис. 41).[15]
Рис. 41. Статья «Жаргон Падонков» в Википедии.
Сетевые традиции возникли в связи с тем, что некоторые часто употребляемые слова достаточно длинно пишутся, и при большом объеме переписки по электронной почте или по ICQ это создает неудобства. Поэтому появились достаточно распространенные слова-штампы, позволяющие сократить написание. Примером могут служить такие трансформации слов, как «информация» – «инфа», «человек» – «чел», «компьютер» – «комп», «что-нибудь» – «чтонить». Конечно, на корпоратичном сайте в разделе «Новости компании» такой сленг вряд ли уместен, но на многих форумах даже очень компетентные и грамотные люди могут применять его достаточно активно.
Намеренное написание слов с ошибками практикуется потому, что, согласно статистике, 10 % запросов именно в таком виде вводится в поисковую строку. Иногда ошибочное написание слов при поиске – это также следствие безграмотности либо опечатки (на сей раз – пользователя), а иногда оно связано с тем, что люди просто не в курсе правильного их написания. В частности, это касается имен собственных (так, название компании «Автоленд» можно встретить в Сети и в такой его представлении, как «Автолэнд»).
Вебадминистраторы вынуждены включать написанные с ошибками слова в текст на сайтах: это дает возможность найти его даже безграмотному или невнимательному потенциальному клиенту. Проблема настолько масштабна, что существуют специальные инструменты, позволяющие автоматизировать создание ключевых слов с опечатками. Одним из таких инструментов, приведенным на рис. 42, под названием Typo Generator можно воспользоваться по адресу: http:// tools.seobook.com/spelling/keywords-typos.cgi.
Рис. 42. Typo Generator – ресурс для создания слов с опечатками
Изучение контента сайта
Рис. 43. Главная страница сайта компании «Автоленд».
Начать изучение контента лучше с «парадного входа» – с главной страницы ресурса (рис. 43).
Значительно облегчает навигацию на ресурсе раздел «Карта сайта», который встречается на большинстве серьезных корпоративных ресурсов.
Информация о продукте предприятия
На корпоративном сайте в большинстве случаев подробно и с максимально выигрышной для предприятия стороны говорится о том, какие товары или услуги оно предоставляет.
Так, сайт екатеринбургского «Автоленда» состоит из ряда соответствующих разделов.
– Лэнд-Ровер.
– Вольво.
– Ягуар.
– Мазда.
– Форд.
– Мицубиши.
– Хендэ.
– Комиссионные автомобили.
А в разделе «Интернет-магазин» дополнительно указаны отдельные группы товаров:
– аудиосистемы;
– масла;
– тюнинг;
– шины;
– автономные подогревы;
– инструмент;
– люки Webasto;
– противоугонные устройства.
Причем каждая из указанных групп детализируется по мере продвижения в глубь сайта. В частности, мы узнаем о том, что «Автоленд» продает масла производства ESSO и Mobil.
– ESSO, в свою очередь, подразделяется на такие группы:
– ESSO масло для автоматической трансмиссии;
– ESSO масло для механической трансмиссии;
– ESSO прочие масла и смазки;
– ESSO моторное минеральное;
– ESSO моторное полусинтетическое;
– ESSO моторное синтетическое.
Любой раздел может состоять из подразделов, а те нередко дробятся дальше. Например, «ESSO масло для автоматической трансмиссии» на сайте «Автоленда» включает два наименования – «Esso ATF LT-масло автомат. трансмис. п/синт., 71141 (1 л) Финляндия, по цене 195 руб.» и «Esso ATF D-масло автомат. трансмис. минер., 21611 (1 л) Финляндия, по цене 131 руб.».
Безусловно, анализировать весь немалый ассортимент аксессуаров и запчастей, которые предлагает покупателям «Автоленд», сейчас нет, однако из нашего примера видно, что при скрупулезной работе с сайтом можно получить достаточно полное представление о продукции и определить круг поставщиков, с которыми работает компания.
В разделе «Услуги», который представлен отдельно по каждой марке продаваемых предприятием автомобилей, обозначен круг работ, осуществляемых им в рамках автосервиса, страхования и кредитования.
На странице «О компании», кроме того, можно найти подборку, составленную специалистами «Автоленда» и посвященную тем услугам, которые компания считает своим конкурентным преимуществом.
Услуги, предлагаемые автосалонами и сервисными центрами «Автоленд»:
– продажа автомобилей: модельный ряд в наличии и под заказ;
– обмен автомобиля на новый с доплатой (Trade-in);
– продажа автомобилей в кредит, лизинг;
– регистрация в ГАИ;
– льготное страхование.
Сервис:
– гарантийное обслуживание;
– все виды ремонта с использованием современного технологического оборудования;
– кузовной ремонт любой сложности;
– проведение инструментального контроля технического состояния на компьютерных диагностических линиях;
– компьютерные стенды восстановления геометрии кузова;
– большой склад запчастей;
– гарантия на ремонт и запчасти;
– покрасочные работы.
PR-материалы
Для специалиста конкурентной разведки интересны любые материалы, которые укладываются в расширенное и вместе с тем упрощенное понимание PR как действий, направленных на формирование положительного имиджа компании в глазах представителей общества – будь то потенциальные клиенты, представители власти или, например, руководители кредитных учреждений. Чаще всего подобные документы представлены на корпоративных сайтах в виде новостей, интервью, статей.
В качестве примера PR-материала можно рассмотреть информацию «Новый Hyundai Santa Fe – в Новосибирске!», анонсированную на сайте компании «Автоленд» в разделе «Новости». При переходе по ссылке на этот документ появляются текст и фотографии, которые не просто информируют местное население о выпуске определенной модели автомобиля (что и составляет, по сути, саму новость), а привлекают внимание к тому, что компания сработала очень оперативно и изобретение, совсем недавно показанное в автосалоне Детройта, уже продается в Сибири, благодаря расторопности дилера. Причем все это – своего рода дополнение ко вполне логичному, на первый взгляд, в данном контексте описанию особенностей машины наряду с указанием ее цены. Специалист конкурентной разведки сделает следующий вывод из этой статьи: «Автоленд» состоит в хороших отношениях с журналистами из шестнадцати новосибирских изданий, поскольку в материале сказано, что именно такое количество представителей СМИ присутствовало на презентации и тесте Hyundai Santa Fe. При необходимости можно связаться с PR-менеджером компании и уточнить, члены каких именно редакций посетили мероприятие и, соответственно, в каких изданиях «Автоленд», с высокой степенью вероятности, располагает возможностями влияния.
Указатели по персоналу, номера телефонов и адреса электронной почты
Корпоративный сайт подчас позволяет не только найти номера телефонов, адреса электронной почты и фамилии некоторых сотрудников, но и составить представление об организационной структуре компании.
Стоит отметить, что это правило в отношении сайта «Автоленда», взятого нами в качестве примера, практически не работает, поскольку ресурс публикует по одному номеру телефона, одному номеру факса и одному адресу электронной почты для каждого филиала, без указания контактных лиц.
Надо сказать, что в ряде случаев анализ виртуального почтового адреса бывает полезен. При этом мы рекомендуем оценивать два обстоятельства:
– каково доменное имя в адресах электронной почты;
– как выглядят имена, которые написаны перед знаком «@» («собака»).
В случае с екатеринбургским «Автолендом» доменные имена сайта компании и электронной почты совпадают, и это наиболее частая ситуация. В обоих случаях адрес выглядит как «autoland.ru». А, например, у Уральского филиала оператора мобильной связи «Мегафон» они отличаются: доменное имя ресурса – «megafonural.ru», а виртуального ящика – «UralskyGSM.com».
Далее мы подробнее расскажем о том, каким образом доменные имена и имена пользователей могут помочь в работе специалиста конкурентной разведки.
Номера телефонов также должны быть записаны, например, в файл Word, потому что они, как и адреса электронной почты, понадобятся для дальнейшего поиска дополнительной информации о компании.
Миссия компании
Не каждая компания имеет официально провозглашенную или хотя бы осознанную миссию. Однако если таковая у предприятия все же существует, это нередко позволяет спрогнозировать стратегию дальнейшей его деятельности. Изменение миссии, как правило, служит сигналом к тому, что в компании происходит (а, скорее всего, уже произошло) серьезное переосмысление путей развития.
Спланированная миссия организации некоторыми исследователями относится к внутрифирменному PR, наряду с корпоративными стандартами и мероприятиями. Довольно часто она воспринимается самими компаниями как внешний атрибут и просто модная деталь, однако есть и такие предприятия, которые всерьез считают миссию управленческим ресурсом и действительно ей следуют. Фирмы, миссию которых имеет смысл принимать всерьез, можно отличить по существенному признаку: путь развития таких компаний никогда не отклонялся от конкретно сформулированных ее положений. При этом миссия не должна сводиться к короткому девизу из серии «Мы сделаем счастливыми всех клиентов после того, как они помогут нам достичь состояния счастья», – а должна содержать описание конкретных идей, реализация которых позволит им достичь продекларированных целей.
На Западе крупные организации чаще, чем в нашей стране, могут заявить о наличии у них миссии. Если она и впрямь воспринимается компанией как руководство к действию, специалисту конкурентной разведки, безусловно, следует принимать ее во внимание.
Примером компании, миссия которой существует не только на бумаге и которая, на наш взгляд, помогает оценить направление развития предприятия, служит «МАКСМИР» (рис. 44).
Рис. 44. Миссия компании МАКСМИР
Ищет ли компания инвесторов и если да, то под какие проекты
Как правило, в разделе «Информация для инвесторов» российские предприятия публикуют информацию, подлежащую обязательному раскрытию по закону. Однако на их сайтах встречаются и обращения к инвесторам.
На момент написания книги среди отечественных компаний, приглашающих инвесторов под конкретные проекты, преобладали энергетические фирмы и банки, за которыми следовали строительные организации и представительства иностранных предприятий в России. Примеры двух таких компаний приведены ниже.
ИМПЭКСБАНК ()
Информация для инвесторов
В настоящее время ИМПЭКСБАНК осуществляет следующие проекты в области привлечения долгового финансирования:
Облигационный заем ЗАО «ИНКОМ-Финанс»
Облигационный заем ООО «Агропромышленная компания „Аркада“
Вексельная программа Холдинга «МАРТА»
Реализованные проекты ИМПЭКСБАНКА:
Облигационный заем АПК «ОГО»
Облигационный заем ЗАО «Трансмашхолдинг»
Вексельная программа Корпорации «ИНКОМ-Недвижимость»
Каждая из приведенных выше строк на сайте ИМПЭКСБАНКа является гиперссылкой и открывается в новом окне
Компания Киндерлэнд ():
Информация для инвесторов
Киндерлэнд в Чехии и России работает с частными инвесторами, финансовыми организациями и банками, привлекая внешнее финансирование для реализации своих бизнес-проектов. Мы заинтересованы в долгосрочном сотрудничестве, среднесрочном и долгосрочном кредитовании. Ваши предложения вы можете направлять непосредственно Главе российского представительства г-ну Васильеву А. Н. по адресу vasa@kinderland. ru. Особый интерес представляют револьверные возобновляемые кредитные линии с базовым сроком погашения не менее 3-х лет. После обсуждения и формализации предложения оно проходит обязательное согласование с финансовым департаментом головной организации, и в случае его утверждения центральным офисом в Чехии принимается к реализации в России. Просим вас все возникающие вопросы задавать по электронной почте.
Некоторые организации, помимо требуемой по закону отчетности, выкладывают в свободном доступе в разделе для инвесторов и другие документы – такие, как Устав, свидетельства о регистрации, лицензии и пр. Ниже приведен далеко не полный перечень правоустанавливающих документов, размещенных на корпоративном сайте одним из крупнейших в стране фармацевтических дистрибьюторов – ЗАО «Катрен» ().
Правоустанавливающие документы
ЗАО НПК «Катрен» (г. Новосибирск) – осуществляет оптовую торговлю лекарственными средствами и предметами медицинского назначения на территории Российской Федерации.
Учредительные документы
Устав (683 Kb)
Изменение к Уставу от 28.12.2005 (312 Kb)
Изменение к Уставу от 04.04.2006 (64 Кb)
Измение к Уставу от 26.06.2006 (111 Kb)
Какова маркетинговая стратегия предприятия
Прежде всего, специалист конкурентной разведки пытается получить ответ на два вопроса:
– на какие целевые группы ориентируется предприятие;
– какова стратегия ценообразования, применяемая в компании.
Ответы на эти вопросы позволяют лучше позиционировать собственную организацию на рынке, по возможности, избегая лобового столкновения с сильным конкурентом либо наоборот – навязывая слабому конкуренту лобовое столкновение.
В ряде случаев, понимание принципов маркетингового мышления компании позволяет спрогнозировать ее поступки, например, в преддверии праздника. В такой ситуации специалист конкурентной разведки, обоснованно предполагая, что PR-менеджеры изучаемого предприятия прибегнут к неким маркетинговым приемам в связи с приближением определенной даты, заранее может приступить к выяснению его будущих шагов, пользуясь своими источниками информации.
Очень кратко напомним основные возможные варианты подходов к ценообразованию:
– в пределах одной товарной номенклатуры устанавливаются разные цены, в зависимости от себестоимости и восприятия каждого конкретного продукта потребителем;
– цены на основной и дополняющие его продукты устанавливаются в одном масштабе по отношению к другим товарам, которые могут заменить данный продукт, но относятся к иной ценовой категории;
– цена на основной продукт устанавливается низкая, однако на товары, которые необходимы для пользования этим продуктом, – высокая;
– цена на основной продукт высокая, а на товары, которые необходимы для пользования им, – низкая;
– цена устанавливается «в пакете», когда продавец объединяет несколько продуктов, назначая суммарную стоимость ниже той, по которой товары приобретаются по отдельности.
Базовые цены, установленные с учетом вышеописанных принципов, обычно адаптируют к конкретной сделке, с учетом различий между клиентами и различий в условиях продажи.
Наиболее часто используются следующие стратегии адаптации цен:
– ценовые скидки (за количество товара, накопительная, сезонная, к празднику и пр.);
– дискриминационное ценообразование (скажем, разные цены для тех или иных групп покупателей, разного времени суток либо в разные дни недели);
– ценообразование по психологическому принципу (с учетом того, что некоторые продукты, независимо от их себестоимости, безопасности и надежности, воспринимаются покупателями как более качественные);
– стимулирующее ценообразование (кратковременное снижение стоимости, например, при необходимости избавиться от залежавшихся товарных остатков либо во время проведения промо-акций);
– ценообразование по географическому принципу (продажа одного и того же продукта на разных территориях по разной цене).
На практике возможны также сочетания перечисленных стратегий.
Помимо ценообразования, к маркетинговым шагам относятся и различные дополнительные услуги, оказываемые клиентам.
Например, рассматриваемый нами официальный дилер автомобилей «Автоленд» предоставляет возможность пройти тест-драйв на понравившейся машине, оформить кредит на ее приобретение на льготных условиях, установить дополнительное оборудование.
Кроме того, на сайте компании существуют интернет-магазин, онлайновая консультация по вопросам, связанным с определенными моделями автомобилей, форум.
Проводятся различные конкурсы: литературный, фотоконкурс «Люди и автомобили» и другие. Даже такие детали могут натолкнуть специалиста конкурентной разведки на новые идеи для развития собственной компании. Особенно – если проводить бенчмаркинг и анализировать не только собственных бизнес-противников, но и организции, которые занимаются похожей деятельностью в других регионах.
И в дополнение к сказанному, можно отметить такие дополнительные средства привлечения и удержания внимания потенциальных клиентов, как наличие раздела с билетами к экзамену в ГИБДД, таблицу штрафов и ссылки на тематические автомобильные ресурсы.
Тексты, приведенные в каждом разделе, должны тщательно прочитываться и анализируются под углом зрения специалиста конкурентной разведки.
Приведем материал раздела для корпоративных клиентов, размещенный на сайте компании «Автоленд».
Корпоративные программы
Корпоративным клиентам.
Если перед Вашей компанией стоит вопрос формирования или обслуживания корпоративного автопарка, то мы готовы помочь Вам в решении этого важного вопроса. Корпоративные клиенты всегда были в центре внимания компании Автоленд.
Нашей компанией был разработан комплекс предложений, позволяющих полностью решить все проблемы с выбором, покупкой и обслуживанием автомобилей.
Холдинг Автоленд, являясь абсолютным лидером по продажам автомашин иностранного производства в Уральском регионе, официально представляет автомобили марки Volvo, Mazda, Land Rover, Ford, Jaguar, Mitsubishi. Кроме того, у Автоленда есть мультибрендовые салоны в Уфе и Новосибирске.
В августе 2005 года в рамках Холдинга Автоленд создан отдел по работе с корпоративными клиентами.
Нашей основной задачей является на высоком профессиональном уровне оказать Вам помощь в выборе оптимального транспортного средства в соответствии с Вашими потребностями.
Располагая широкими возможностями оказания сервисных услуг, поставки запчастей и проведения ремонтных работ, мы гарантируем, что Ваши автомобили будут постоянно находиться в исправном состоянии и безотказно служить Вам.
Основные преимущества работы с нами:
– индивидуальное решение для каждой компании;
– персональный менеджер;
– гибкая система скидок на автомобили, приобретаемые для автопарка компании;
– разнообразные cхемы оплаты: лизинг, кредит и пр.;
– уникальная система мультимарочного приобретения автомобилей;
– скидки на сервисное обслуживание, а также оплата сервисных услуг по факту либо с отсрочкой;
– замена автопарка по системе TRADE-IN;
– выездной «Тест-драйв» в любое удобное для Вас время;
– бесплатный выезд автоэвакуатора (JAGUAR, LAND ROVER, VOLVO);
– подменные автомобили на период ремонта (JAGUAR, LAND ROVER, VOLVO).
Если Вы заинтересовались информацией отдела корпоративных продаж компании Автоленд и хотели бы стать нашими клиентами, Вы можете заполнить анкету и отправить ее нам посредством электронной почты, а также заполненную анкету Вы можете прислать нам по факсу: +7 (343) 37 27 064 или на электронные адреса менеджеров направлений.
Также для всех корпоративных клиентов есть уникальная возможность заказать «выездной» тест-драйв интересующего автомобиля в удобное время и в удобном месте. Для этого не обязательно приезжать в автосалон, вы можете заказать прямо сейчас:
Контактные координаты отдела корпоративных продаж.
620137, Екатеринбург, ул. Блюхера, 50 Тел.: +7 (343) 37 27 000 доб. 237, 238. Факс.: +7 (343) 37 27 064 Сотрудники отдела корпоративных продаж…
Этот текст позволяет извлечь из него следующую информацию:
– «Автоленд» отдает приоритет в работе корпоративным клиентам;
– компания считает себя лидером по объемам продаж автомобилей в регионе и очень дорожит этим положением;
– филиалы в Уфе и Новосибирске, по-видимому, не столь приоритетны для «Автоленда», как екатеринбургское отделение, поскольку упомянуты в тексте вскользь (со словами «кроме того…»);
– для корпоративных клиентов предусмотрена отсрочка платежа, в том числе и за сервисное обслуживание.
При внимательном рассмотрении выяснилось, что приведенная внизу страницы фраза «Сотрудники отдела корпоративных продаж» фактически представляет собой гиперссылку, которая ведет к фамилиям и номерам мобильных телефонов менеджеров компании. При беглом просмотре сайта эта гиперссылка обнаружена не была и казалась обычной строкой в тексте.
Номер телефонов, адреса электронной почты и имена сотрудников не были нами замечены, когда мы искали контактную информацию, и обнаружились лишь в момент исследования вопросов маркетинговой политики компании. Интересно, что гиперссылка «Сотрудники отдела корпоративных продаж», как мы уже отмечали, внешне выглядела как обычный текст, поскольку не была выделена цветом, а подчеркивание под ней зрительно сливалось с нижним краем листа.
Обнаружить ее мы смогли только после того, как навели курсор на эту надпись и увидели, что она изменила форму, на традиционную для гиперссылок.
Помимо фактической информации, которую сами по себе несут координаты сотрудников компании, они отражают и общие принципы, которыми руководствуются на предприятии при назначении адреса электронной почты тому или иному работнику. В случае с «Автолендом» (рис. 45) понимание принципов построения имен в адресе виртуального ящика не дает каких-либо серьезных преимуществ специалисту конкурентной разведки, но бывают и совершенно другие ситуации.
Рис. 45. Контактная информация менеджеров по корпоративным продажам компании «Автоленд».
В связи с этим, надо отметить, что независимо от того, какой раздел сайта исследуется в каждый конкретный момент времени, информация собирается по всем необходимым вопросам, ведь, в отличие от любого учебника, где все материалы четко сгруппированы по тематическому принципу, в жизни нередко возникает элементарная путаница и ценные сведения могут быть отнесены не к той категории, к которой, по логике, они имеют непосредственное отношение.
Как мы уже сказали, при упоминании новосибирского и уфимского филиалов «Автоленда» на странице, посвященной корпоративным клиентам, возникает мысль о второстепенности этих отделений для компании, в то время как екатеринбургское пользуется явным преимуществом. Эти филиалы даже визуально занимают на сайте значительно менее видные места, нежели последний.
Для проверки этого предположения мы перешли по гиперссылкам с первой страницы сайта на все остальные.
Выяснилось, что на странице, посвященной новосибирскому филиалу «Автоленда», нет адреса сайта, однако есть координаты электронной почты: autoland@ autoland.nsk.su. Попытка прямо перейти по адресу autoland.nsk.su результатов не дала – ресурс оказался недоступен. Бросается в глаза, что компании в этом адресе принадлежит домен третьего уровня, что чаще всего характерно для бесплатных сайтов. Мы решили проверить, что же представляет собой доменное имя «Автоленда» в Новосибирске autoland.nsk.su на самом деле.
Простой запрос в Яндекс по доменному имени в электронной почты «nsk.su» (рис. 46) показал, что создание почтового ящика с окончанием «nsk.su» и доменным именем третьего уровня, совпадающим с именем компании – это распространенная в Новосибирске форма организации почтовых ящиков на виртуальном почтовом сервере, не характерная исключительно для компании Автоленд. Заводить собственное оплаченное доменное имя для новосибирского филиала Автоленд не счел нужным.
Рис. 46. Большое количество почтовых ящиков с окончанием «nsk.su» по запросу в Яндексе.
Доменное имя в адресе электронной почты филиала «Автоленда» в Уфе [email protected] вообще не содержит названия компании и принадлежит крупному уфимскому интернет-провайдеру. Это выяснилось также при запросе в Яндекс и видно на рис. 47.
Рис. 47. Информация об использовании имени ufanet.ru в адресах электронной почты
Годовой отчет компании
Некоторые компании, в частности, открытые акционерные общества, по закону обязаны публиковать свои отчеты в свободном доступе. Это делается для того, чтобы существующие акционеры, равно как и потенциальные инвесторы могли быть более полно проинформированы о положении дел в организации, в которую они вложили или намерены вложить средства.
На момент написания книги Гугл выдал 1 210 000 результатов по запросу «годовой отчет ОАО москва», введенному в поисковую строку без кавычек.
В числе этих результатов, был и годовой отчет компании «СИБНЕФТЬ» за 2003 г. в формате PDF. Содержание документа приведено ниже.
Содержание
1. Сведения о Компании:
– сведения о создании Компании, место нахождения, почтовый адрес;
– сведения об уставном капитале, структура акционерного капитала;
– информация об аудиторе информация о регистраторе Компании.
2. Положение Компании в отрасли:
– нефтедобыча, нефтепереработка, экспорт нефти, добыча газа.
3. Приоритетные направления деятельности Компании.
4. Отчет совета директоров о результатах развития Компании по приоритетным направлениям ее деятельности:
– основные технико-экономические показатели деятельности Компании;
– рынок акций Компании в 2003 г.;
– дивиденды.
5. Основные факторы риска, связанные с деятельностью Компании.
6. Корпоративная деятельность Компании:
– работа органов управления;
– состав исполнительных органов и сведения об их деятельности.
7. Соблюдение Компанией кодекса корпоративного поведения.
8. Перспективы развития Компании.
Западные компании также обязаны публиковать подобные годовые отчеты в открытом доступе.
Перечень регионов (а иногда и стран), в которых работает компания
На наш взгляд, нет необходимости конкретизировать и иллюстрировать дополнительными примерами этот пункт.
История развития фирмы
Нередко исследователи совершают ошибку, не желая знакомиться с материалами о развитии компании на корпоративном сайте. Читать официальную версию истории предприятия надо обязательно.
В ряде случаев ее изучение позволяет составить представление о корпоративной культуре и о принятых в компании способах решения проблем. Правда, следует оговориться, что любая информация на сайте, которая характеризует организацию с положительной стороны (а другой там обычно и не бывает), должна обязательно перепроверяться по другим источникам. Происходит это по вполне понятной причине: ни одна компания не станет писать о себе негатив, скорее приукрасит действительность. Ничего плохого в подобной подаче себя в максимально выгодном свете нет, просто этот факт специалисту конкурентной разведки не стоит выпускать из поля зрения.
Основная же причина, по которой надо обязательно читать историю предприятия, заключается в том, что история – это на самом деле наука не о прошлом, а о будущем, поскольку люди в схожих ситуациях поступают, как правило, примерно одинаково.
История фирмы обычно содержит рассказ о наиболее значимых вехах на пути развития компании, об изменении ее названий, о смене руководителей, а подчас и собственников. Как правило, читая этот раздел, можно получить дополнительное представление о ее финансовых возможностях, а иногда – о периодах, когда она вступала в тесные отношения с чиновниками различного уровня либо наоборот – такие отношения прерывала.
Нередко история компании содержит факты, которые показывают, кто может располагать дополнительной информацией о ее деятельности. Кроме того, в этом же разделе могут встречаться факты о нынешнем состоянии предприятия, а также о его планах.
В качестве примера приведем текст истории екатеринбургской компании «Автоленд», взятый на ее официальном сайте.
Екатеринбург
Холдинг Автоленд ведет свою историю с 27 июня 1991 года. В этот день был заключен дилерский контракт с Форд Мотор Компани. В это время на небольших арендованных выставочных и ремонтных площадях открылся первый в городе автосалон, в котором продавались автомобили иностранного производства. Тогда он назывался Центр «Екатеринбург Форд». Именно с Ford начиналась в Екатеринбурге дилерская торговля иномарками.
Два года спустя «Екатеринбург Форд», соответствуя всем дилерским стандартам, уже занимал площадь 2000 кв. метров и включал в себя просторный автосалон, сервисную зону и офисные помещения. В этом же году «Екатеринбург Форд» заключил важные контракты с компаниями – Piooneer, GoodYear и Mobil Oil.
С момента основания Центра «Екатеринбург Форд» 33 % руководящего состава компании были представлены иностранными гражданами. Постепенно происходили изменения «в верхах», и уже к 1996 году весь руководящий состав компании был представлен российскими менеджерами.
В 1998 году к компании присоединилось предприятие Сити-Моторс, официальный дилер Mitsubishi Motors. А к 2000 году холдинг, названный Автоленд, уже получил статус дилера Mazda Motor Europe и Land Rover. Летом 2003 года в Автоленде был продан первый автомобиль марки Jaguar – Jaguar S-Type. С этого момента Холдинг стал единственным на Урале официальным дилером этой престижной марки. В ноябре 2003 года Автоленд становится официальным дилером Volvo Car Corporation и торжественно открывает новый автосалон Volvo.
В 2005 году компания Сити-Моторс была переименована в Автоленд Север, следом за этим событием на этой площадке открылся второй дилерский центр Ford. Автоленд сегодня – это большие современные автосалоны, построенные по международным стандартам, сервисные центры технического обслуживания и ремонта автомобилей, склады запасных частей, автомаркеты и автомагазины, а также подразделение оптовой торговли. Персонал компании соответствует высокому уровню профессиональной подготовки специалистов по продаже и послепродажному обслуживанию. Компания Автоленд активно участвует в культурной и социальной жизни Урала: мы несем шефство над школой-интернатом № 9 поселка Лосиный, поддерживаем дизайнера одежды Наталию Соломеину, принимаем участие в организации светских мероприятий, проводим благотворительные акции.
На сегодняшний день Холдинг Автоленд реализует автомобили шести ведущих мировых производителей с двух торговых площадок в Екатеринбурге (общая площадь центра
Автоленд Север – 4600 кв.м., площадь автоцентра по ул. Блюхера, 50–11 800 кв.м.).
Кроме того, у Автоленда есть дочерние компании в Новосибирске и Уфе.
В будущем ожидается расширение предприятия, которое будет обеспечиваться не только большим количеством предлагаемых на автомобильном рынке марок и брендов, но и предоставлением новых услуг для своих клиентов.
Из приведенного текста видно, как быстро и какие именно марки автомобилей добавлялись к товарной линейке, как компания расширялась территориально. Так, что к массовым маркам автомобилей (Форд) потепенно добавлялись модели премиум-класса, принадлежащие Форду, – такие, как Ягуар, Вольво и Ленд Ровер. Кроме того, принадлежащая Форду Мазда, которая относится к массовому бренду, тоже появилась в товарном ряду Автоленда в рамках существующего предприятия. А вот появление марок, которые Форду не принадлежат, происходило за счет присоединения уже имеющегося дилера. Можно сделать вывод и о том, что слова государства о социальной ответственности бизнеса были услышаны компанией – это нашло отражение в информации о шефстве и благотворительных акциях.
Картина становится более полной, если ознакомиться с историей развития «Автоленда» в Новосибирске и Уфе, представленной в том же разделе. При этом отчетливо прослеживаются общие тенденции корпоративной культуры и косвенно подтверждаются выводы о второстепенной роли этих филиалов в жизни компании, по сравнению с екатеринбургским филиалом, сделанные при изучении ее маркетинговых подходов. Вместе с тем, из приведенных ниже текстов о работе филиалов видно, что корпоративная культура и подходы к работе с потребителями, равно как и к взаимодействию с государством, едины во всей компании, независимо от города, в котором компания работает.
Новосибирск
Компания Автоленд занимается продажами автомобилей на рынке Новосибирска с 1999 года. Как и в Екатеринбурге, история компании Автоленд в Новосибирске начиналась с автомобилей Ford. Весной 2003 года Автоленд-Новосибирск становится официальным дилером еще 2-х известных марок: в феврале начинаются продажи Volvo, а в марте открывается автосалон Land Rover.
Май 2004 года – компанией Автоленд продан первый в Новосибирске автомобиль Mazda. 2005 год – Автоленд Новосибирск получает дилерство Jaguar.
Автосалон и центр технического Автоленд-Новосибирск обслуживания находится на пересечении улиц Б. Хмельницкого и Объединения.
Площади центра составляют более 8600 кв.м. Компания имеет в своем распоряжении современное импортное диагностическое оборудование, покрасочную камеру; склад запасных частей постоянно поддерживается в диапазоне от 500 тыс. до 1 млн. Все работы по обслуживанию ведутся специалистами прошедшими аттестацию. С учетом развития технического прогресса, совершенствования техники и устройства автомашин, специалисты компании проходят курсы повышения квалификации в учебных центрах изготовителей автомобилей.
Кроме продаж автомобилей и сервисного обслуживания Автоленд ведет активную благотворительную деятельность: при поддержке компании построена Элитная школа искусств, где имеют возможность получать дополнительное образование дети центрального района; также компания взяла шефство над Детским Домом (по ул. Столетова); оказывает реальную помощь детской хоккейной команде Калининского района.
Уфа
Компания Автоленд – Уфа появилась на региональном рынке автоуслуг в 1998 году с присвоения статуса официального дилера ZAO Ford Motor Company. В 2000 году компании был присвоен статус дилера Mitsubishi Motors; в 2004 году Автоленд – Уфа – официальный дилер Mazda. В настоящее время компания располагает двумя площадками: на улице Новосибирской общей площадью более 3400 кв.м. и на улице Бакалинской 66Б, площадью 800 кв.м. Дилерские центры оформлены в соответствии со всеми стандартами производителя, с использованием фирменных предметов корпоративной идентификации.
Демонстрационные залы компании занимают площадь более 1000 кв.м. Cтанция технического обслуживания автомобилей – также более 1000 кв.м.
В ноябре 2004 года компания Автоленд – Уфа открыла свой субдилерский центр в г. Стерлитамаке по продаже автомобилей Ford.
Предприятие является постоянным участником городских и республиканских профессиональных конкурсов, автомобильных выставок, в которых неоднократно становилось победителем и лауреатом. В 2004 году – «Лучший специализированный автосервис», «Фирменный сервис по техническому обслуживанию и ремонту автомобилей», дипломы автомобильных выставок «За лучшее комплексное представление предприятия», «За лучшую экспозицию» и др. В 2005 году – Автоленд – Уфа награжден дипломом 2 степени в конкурсе «Лучший автосалон 2005».
Компания Автоленд – Уфа выступает постоянным спонсором соревнований по тайскому боксу, а также картинной галереи ЮНЕСКО. Оказывает поддержку: Социально – профилактическому центру № 5 Советского района г. Уфы; детскому дому № 6; Республиканскому социальному приюту для детей и подростков. За годы работы компанией накоплен богатейший опыт, позволяющей прочно удерживать планку надежного партнера, лидера в автобизнесе. Новые технологии, современное оборудование, первоклассные специалисты, качественный сервис – вот фундамент, на котором базируется успех нашего предприятия.
Кстати, прочтение текстов о компании нередко дает возможность увидеть и еще одну особенность: разделы сайта обновляются с разной скоростью либо написаны не совсем корректно.
Так, в «Истории компании» Автоленд говорится о шести марках автомобилей, которые реализует Автоленд, тогда как на первой странице показаны автомобили семи производителей. Вместе с тем, раздел «Новости» обновляется регулярно. Лишь при попытке скачать прайс-лист на автомобили Hyundai, оказывается, что они доступны только в Новосибирске, что затем подтверждается при пристальном просмотре раздела «О компании», поскольку в разделе «О компании» написано, из каких предприятий состоит Автоленд и дилерами каких марок является каждое из этих предприятий:
Екатеринбург:
«Автоленд» – официальный дилер Ford, Mazda, Land Rover, Volvo, Jaguar «Автоленд Север» – официальный дилер Mitsubishi Motors, Ford.
Новосибирск:
«Автоленд» – официальный дилер Ford, Mazda, Land Rover, Volvo, Jaguar, Mitsubishi Motors, Hyundai.
Уфа:
«Автоленд» – официальный дилер Ford, Mazda, Mitsubishi Motors.
Отдельно хотим отметить, что иногда специалисту конкурентной разведки удается «зацепиться» за огрехи в обновлении информации на чужом сайте и найти с их помощью уязвимое место противника. Так, в нашей практике был случай, когда недружественная компания-конкурент развязала информационную войну против дружественных нам структур, распространяя при этом заведомо ложную информацию. Изучение интернет-ресурса этого противника показало, что организация-неприятель не убрала со своего корпоративного сайта (а может быть, и специально разместила в целях очковтирательства) лицензию, действие которой прекратилось более пяти лет назад. На сайте были даны реквизиты этой лицензии и размещено ее изображение. Причем, масштаб этого изображения был таким, что различить надписи на документе не представлялось возможным, тогда как те лицензии, которые продолжали действовать (по другим направлениям работы предприятия), можно было рассмотреть во всех подробностях. Такая разница в подходе к демонстрации материалов в пределах сайта одной и той же фирмы настолько нас заинтересовала, что мы предприняли дополнительные шаги по проверке этой лицензии, обратившись в организацию, которая ее выдала. Проверка подтвердила, что срок действия документа, вызвавшего наши подозрения, давно истек, о чем мы получили официальное удостоверение.
Тот факт, что просроченная лицензия была доступна для всеобщего обозрения в разделе «Наши лицензии» непосредственно под текстом, утверждавшим, что компания-противник имеет все необходимые для работы лицензии и сертификаты, был положен нами в основу доказательной базы о недобросовестном поведении компании на рынке и о, возможно, сознательном введении потенциальных клиентов в заблуждение. В результате предпринятой информационной контратаки была достигнута цель, которая стояла перед контратакующими силами, в число которых входили и мы. Наша сторона официально обратилась к этим структурам с просьбой разобраться в причинах подобного способа формирования имиджа неприятельской компании в глазах ее потребителей, дать этим действиям правовую оценку и наказать виновных. В связи с началом нами ответных действий, противник, который до контратаки с нашей стороны откровенно упивался безнаказанным причинением вреда своему конкуренту, стал нести реальные потери, после чего прекратил информационную войну, а заодно убрал со своего сайта документы, ставшие недействительными из-за истечения срока их действия.
Корпоративные журналы и газеты
Многие компании, круг клиентов которых достаточно четко обозначен, выпускают корпоративные газеты или журналы. Такие издания интересны для специалиста конкурентной разведки тем, что они могут содержать перечни клиентов и содержать информацию об особенностях взаимоотношений с ними, описывать новые проекты организации, публиковать фотографии рабочих мест и оборудования, применяемого в исследуемой компании, рассказывать о ключевых фигурах фирмы и их позиции по каким-либо вопросам. Практика показывает, что даже крупные и серьезные предприятия периодически пропускают в такую печать информацию деликатного свойства. А сведения неконфиденциального плана, отвечающие, тем не менее, на вопросы, важные для правильного принятия решений руководителями конкурента, содержится там по определению. Правда, и дезинформацию через такие источники проводить тоже весьма удобно, а потому данные из корпоративных изданий следует подвергать обязательной перепроверке.
Однако такого рода материалы выпускаются далеко не всеми компаниями. А те, которые все же публикуют информацию о деятельности фирмы в подобных издниях, не всегда пишут об этом на своем сайте. И все же при исследовании интернет-ресурса есть смысл попытаться найти сведения о корпоративном журнале.
Так, например, на сайте фармацевтического дистрибьютора ЦВ «Протек» из Москвы есть не только прямое указание на наличие корпоративной газеты «Вести от ПРОТЕКа», но и существует возможность с ней ознакомиться. Правда (возвращаясь к вопросу о своевременности обновления информации), в апреле 2006 г. в разделе «Свежий номер» была размещено издание за май 2005 г. (http:// /).
А фармацевтический дистрибьютор из Екатеринбурга «АС-Бюро», также выпускающий корпоративную газету, не пишет об этом на своем сайте. Тем не менее, найти информацию о ней можно по простейшему запросу в поисковую систему общего назначения, например, в Гугл.
Получить физически доступ к изданию – как ЦВ «Протек», так и «АС-Бюро» – можно и у клиентов указанных организаций.
Ниже приведены некоторые заголовки корпоративной газеты компании «АС-Бюро» «ВсегдА С Вами» № 1(63) от января 2006 г. (оригинальное написание букв «А» и «С» в названии сохранено).
«Подведем итоги года» (статья содержит информацию о работе компании в Пермской области, в Омске, на Дальнем Востоке, а также о программном обеспечении, которым организация пытается «привязать» к себе клиентов, о приоритетах в развитии ассортимента, о создании учебного центра для потребителейв, о вводе системы сбалансированных показателей в компании, о сдаче в эксплуатацию здания собственного фармацевтического завода в г. Березовском и о том, что первые десять препаратов, которые будут выпускаться на этом заводе, находятся на регистрации в Минздраве).
«На взаимном уважении» (рассказ о конкретном клиенте компании – сети аптек из городов-спутников Екатеринбурга).
«Без права на отказ» (материал об одном из ключевых сотрудников организации, который снабжает удаленные от крупных городов аптеки строительными материалами, отправляемыми вместе с товаром).
В выходных данных, кроме того, сообщается о том, что предприятие – учредитель газеты, издает же ее компания «Press-Club», адрес и контакты которого указываются.
Специалисту конкурентной разведки подобные источники могут дать немало предварительной информации, которая может быть полезной при правильной ее интерпретации руководителем структуры, работающей на фармацевтическом рынке: способствовать организации работы таким образом, чтобы избежать конфронтации с конкурентном, а также навязать противнику схватку на выгодных для себя и невыгодных для него условиях.
Практика показывает, что даже заводские многотиражки, которые в принципе не предназначены для выноса за пределы территории, как правило, оказываются доступны посторонним, так что уж говорить о корпоративных изданиях, которые прямо созданы для распространения за пределами предприятия.
Как организована обратная связь с клиентами
Эта часть сайта может показать, в каких областях компания чувствует себя наиболее уверенно, как концептуально организована ее работа с клиентами и на чем основаны те или иные аспекты их взаимодействия.
Помимо традиционных разделов вроде «Оставьте свой отзыв», все большую популярность приобретают онлайновые консультации, которые берутся на вооружение компаниями, работающими в самых разных отраслях.
Например, на сайте «Автоленда» существует онлайновая консультация. Есть на сайте и форма обращения в отдел контроля качества компании, который помогает клиентам, недовольным качеством обслуживания, решать возникающие проблемы.
Достаточно показательны форумы, размещенные на сайтах организаций. По одному лишь перечню их заголовков можно увидеть, какие проблемы волнуют посетителей в настоящее время, а какие были актуальны в прошлом и насколько хорошо решаются вопросы, которые участники ставят перед компанией. Правда, репрезентативной информацию на форумах можно считать только тогда, когда на них достаточно много посетителей, причем сведения должны регулярно обновляться.
Для оценки популярности форума рекомендуем первым делом обращать внимание на общее количество сообщений в темах, а также совокупное число просмотров этих сообщений и даты их публикации.
Так, например, на сайте компании «Автоленд» прослеживается, что посетители предпочитают онлайновую консультацию, потому что свежие объявления на форуме появляются редко, соответственно, и обсуждаются они неактивно. Это неудивительно, поскольку онлайновая консультация на сайте «Автоленда», на которой и вопросы, и ответы публикуются открыто, прямо конкурирует с форумом, имея при этом психологическое преимущество в глазах потребителей как более официальная форма общения.
А вот, скажем, форум абонентов компании «МТС» в Екатеринбурге, напротив, достаточно хорошо отражает настроения и проблемы клиентов этого сотового оператора (онлайновые запросы в «МТС», в принципе, тоже существуют, однако представляют собой электронную переписку, которая недоступна ни для кого, кроме самого абонента, задавшего вопрос, и специалиста компании, который на этот вопрос отвечает).
Для сравнения: по состоянию на 30.04.2006, максимальное количество сообщений в одном разделе на форуме «Автоленда» – 143, а на форуме екатеринбургского филиала «МТС» – 6051. При этом максимальное количество просмотров одной темы на форуме «Автоленда» – 1147, а на форуме рассматриваемого отделения «МТС» – 22 937.
Раз зашла речь о форумах, отдельно надо сказать несколько слов о внешних форумах, которые популярны на порталах крупных городов и на которых часто присутствуют клиенты предприятий из региональных населенных пунктов.
Исследования, проведенные в последнее время на различных форумах российских городских порталов, показали, что оценки, даваемые компаниям на таких форумах, специалисту конкурентной разведки следует воспринимать с осторожностью. Уточним, что речь идет именно об оценках конкретных компаний, а не о товарах, которые также могут обсуждаться на форумах.
Выяснилось, что тон на общегородских форумах часто задает очень небольшая группа лиц – порой не более четырех-пяти человек, которая из личной неприязни или по каким-то иным причинам может выдавать исключительно негативную или только позитивную информацию о той или иной компании. Выступая слаженной командой, такая группа способна эффективно подавлять инакомыслие на форуме. В результате может формироваться мнение о деятельности конкретных предприятий, имеющее мало общего с реальной действительностью. При этом темы, «раскачиваемые» такой командой, могут достигать по объему 10–15 страниц и содержать несколько сотен сообщений. Если сообщения в таких темах проанализировать с точки зрения смысловой и эмоциональной нагрузки, то примерно 70–90 % представляют собой бессмысленный «флуд» – просоте общение посетителей между собой, не имеющее отношения к обсуждаемой теме («общение ради общения»). При этом подобные изречения нередко сопровождаются большим количеством «смайликов». Остальные высказывания зависят от настроя «ведущей команды», а не от реального положения дел.
Основной способ искажения действительности на подобных общегородских форумах – это замалчивание фактов, которые не подтверждают точку зрения «ведущей команды» при одновременном педалировании фактов, совпадающих с «генеральной линией» актива форума. В сочетании с подавлением тех, кто осмеливается высказаться против, пусть даже приводя правдивые аргументы, такая тактика приносит свои плоды. Откровенные инсинуации встречаются на форумах относительно нечасто, хотя нам встречались и такие примеры.
Если форум все же заинтересовал специалиста конкурентной разведки как источник информации и необходимо разобраться в том, насколько приведенные на форуме факты соответствуют реалиям, мы рекомендуем с помощью встроенного в каждый форум поиска смотреть историю высказываний тех людей, мнение которых специалист намерен положить в основу своих выводов. Такое исследование позволяет сделать довольно точный вывод о том, насколько компетентен и объективен тот или иной человек в конкретном вопросе.
Кроме форумов и онлайновых консультаций, информацию о качестве работы с клиентами обычно можно почерпнуть из таких разделов, как «Гостевая книга» или «Книга жалоб и предложений».
Высказывания руководителей и лучших клиентов
Нередко подобная информация содержится на сайте компании. Во-первых, она помогает отметить тех клиентов, с которыми у организации сложились особенно хорошие отношения, а, во-вторых, высказывания руководителей на многих предприятих не рискуют подвергать цензуре, в то время как их заявления порой могут содержать сведения, которые любому другому сотруднику вряд ли разрешили бы обнародовать.
Например, на сайте ЦВ «Протек» есть отчет об участии компании в мероприятии, на котором один из ее руководителей озвучил свое видение перспектив развития не только отрасли в целом, но и своей фирмы.
Фармацевтический бизнес в России: реформы и рынок
В московском отеле «Мариотт» 14–15 февраля прошла Международная конференция «Фармацевтический бизнес в России: реформы и рынок». Центральными темами форума стали итоги реализации программы ДЛО, безопасность и качество лекарств, отношения государства и бизнеса и стратегии развития отечественных фармкомпаний… Отдельной темой конференции стала практика развития бизнеса. Секцию под таким названием открыл доклад президента ОАО «Акрихин» Александра Лазуто. Все российские компании-производители (коих в стране от 300 до 900) он разделил на две группы: предприятия, ориентированные на капитализацию, и фирмы, нацеленные на текущую доходность. Он высказал созвучную заявлению Дмитрия Рейхарта мысль о том, что компании, ориентированные на повышение своей рыночной стоимости, интересны государству.
Тему продолжил генеральный директор ЦВ «ПРОТЕК» Виталий Смердов. По его словам, следующий шаг при современном росте объемов фармрынка – его концентрация. Причем этот процесс должен охватить все сегменты отрасли: производство, дистрибуцию и розничную торговлю. «Скорее всего, в ближайшем будущем доля брендированных аптечных сетей составит 10 % рынка, – отметил докладчик. – Несмотря на сравнительно большое количество фирм-производителей, три крупнейшие занимают 30 % рынка производства лекарств, а первая тройка дистрибьюторов уже превышает 50 % сегмента фармдистрибуции». Виталий Смердов подчеркнул, что сейчас рынок стоит на пороге нового периода – эпохи национальных холдингов. Сегодня компания «ПРОТЕК» стремится создать интегрированную структуру, объединяющую три основных звена фармацевтической цепочки (производство, дистрибуцию, розничную торговлю). Докладчик отметил, что положение лидера отрасли следует определять не по отдельным показателям (величина продаж, импорта и т. п.), а комплексно, как это происходит на Западе. Таким комплексным показателем, несомненно, является стоимость компании на рынке. В этом плане холдинги оказываются в выигрышном положении, так как их «цена» намного выше суммарной стоимости входящих в их состав компаний. Именно поэтому ориентация на капитализацию, увеличение своей рыночной стоимости, формирование цивилизованного и социально ответственного рынка – ключевые цели «ПРОТЕКа».
А на сайте «Автоленда» существует специальный раздел «VIP-клиенты», который начинается с их поименного перечня: «Нам очень приятно, что такие известные компании, как HILTI, Уралотель, аэропорт „Кольцово“, МТС, Wrigley, Nestle, Philip Morris являются нашими VIP-клиентами», а далее содержит информацию о каждом из них и о том, как именно протекает сотрудничество организации с указанными предприятиями. Например:
Уралотель известен а Екатеринбурге своим гостеприимством и уютным размещением. А трансферы из аэропорта осуществляются на комфортабельных микроавтобусах Ford Transit. Адрес гостиницы: г. Екатеринбург, ул. Хомякова, 23. тел: (343) 37-11-333.
Награды и победы в конкурсах
Компании обычно с удовольствием сообщают о своих победах в различных конкурсах. Для специалиста конкурентной разведки такая информация может быть полезна при определении сильных сторон изучаемой организации, а также при поиске новых источников сведений о ней – ведь, в большинстве случаев, члены конкурсных комиссий узнают немало интересного как о достижениях лауреата, представляющего предприятие, так и о его планах. Поэтому, если после награждения под удачным предлогом поговорить с людьми, входившими в состав указанной комиссии, то во многих случаях можно получить интересные данные об изучаемой компании.
Вот, к примеру, текст с информацией о победе в конкурсе, размещенный на сайте «Автоленда».
22-Декабрь-2005 Автомаркет компании Автоленд награжден дипломом
Уходящий год одарил нашу компанию очередной наградой. 14 декабря в екатеринбургском «Доме кино» состоялось подведение итогов Екатеринбургского конкурса «Лучший магазин „Автозапчасти-2005“, на котором автомаркет компании Автоленд был награжден дипломом за III место в номинации „Лучший магазин по торговле автозапчастями для иномарок“.
В этом году в финальной части конкурса, которая прошла в декабре, участие приняло 29 магазинов автозапчастей. Организатором мероприятия выступила администрация Екатеринбурга и некоммерческое партнерство автосервисов и магазинов запчастей «Перспектива Роста». Подведение итогов и награждение победителей производилось по 4 номинациям. Так в номинации «Лучший магазин по торговле автозапчастями для иномарок» магазин «Автомаркет» компании «Автоленд» занял третье место. Кроме того, автомаркет компании «Автоленд Север» получил благодарственное письмо за участие в конкурсе.
Ссылки на статьи о компании
Достаточно часто встречается практика приводить на корпоративном сайте ссылки на статьи о компании, которые были опубликованы в тех или иных изданиях. В этих материалах могут упоминаться конкретные сотрудники организации, ее партнеры либо содержаться информация, способная прояснить некоторые действия и планы изучаемого предприятия. Такие разделы чаще всего называются «О нас пишут», «СМИ о нас» или иным подобным образом.
Перечень адресов филиалов или заводов
Поскольку корпоративный сайт обычно создается для того, чтобы облегчить потенциальному клиенту взаимодействие с компанией, то, как правило, никто не скрывает адресов ее филиалов. Правда, на основании нашего опыта можем дать совет применительно к исследованию этого раздела ресурса. Он касается все той же необходимости перепроверки полученной информации. Бывает, что организация уже закрыла отделение, однако сведения о нем с сайта не убрала и они продолжают «висеть» на корпоративном ресурсе. Но даже такая информация может быть полезной для специалиста конкурентной разведки, поскольку многие бывшие сотрудники филиала наверняка продолжают жить в том же населенном пункте, затаив при этом обиду на бывших работодателей (что случается нередко). Проверить наличие отделения в каждый конкретный момент времени несложно – достаточно просто позвонить по указанному на сайте телефону, а в особо ответственных случаях – отправить сотрудника по адресу филиала. А вот в случае, если ресурс сообщает о том, что отделение существует, но его адрес и телефон не указаны, то, как показывает практика, этого филиала может и не быть вообще, а информация о нем – явное приукрашивание действительности или, как минимум, поспешное оповещение общественности о нереализованных пока еще планах. Выявление этого может быть использовано по-разному, в зависимости от воли руководителя компании, которая обнаружила подобное несоответствие. Можно просто отказаться от сделки с недобросовестным партнером, а можно и положить данный факт в основу преследования в суде или в прессе организации, которая повышает собственную оценку в глазах покупателей или партнеров за счет лжи. Справедливости ради отметим, что случаи умышленного искажения информации о филиалах встречаются нечасто, но, тем не менее, нам с такими предприятиями пересекаться доводилось.
Чаще всего информация об отделениях или других территориально удаленных подразделениях компании, выложенная на корпоративном сайте, оказывается правдивой. Вот, например, каким образом данные о филиалах представлены на сайте предприятия «Автоленд», размещенные в разделе «Контакты» и сопровождаемые иллюстрациями, демонстрирующими схему проезда к подразделению компании.
Компания «Автоленд-Екатеринбург» – официальный дилер Ford, Mazda, Land Rover, Volvo,
Jaguar
620137, г. Екатеринбург,
ул. Блюхера, 50
тел: (343) 37-27-000
факс: (343) 37-27-064
[email protected]
Компания «Автоленд-Север» – официальный дилер Mitsubishi Motors и Ford в Екатеринбурге
620017, г. Екатеринбург
ул. Космонавтов, 6
салон Ford: тел. (343) 37-00-133
салон Mitsubishi Motors: тел: (343) 37-00-132
[email protected]
Компания «Автоленд-Новосибирск» – официальный дилер Ford, Mazda, Land Rover, Volvo, Hyundai
и Mitsubishi Motors.
630027, г. Новосибирск,
ул. Б.Хмельницкого, 101
тел: (383) 27-22-000
факс: (383) 27-26-400
Компания «Уфа-Автоленд» – официальный дилер Ford, Mazda, Mitsubishi MotorsАдрес автосалона
Ford:
450022, г. Уфа,
ул. Бакалинская, 66/б
тел/факс (3472) 527-527
autoland@[email protected]
Адрес автосалона Ford, Mazda и Mitsubishi Motors:
450022, г. Уфа,
ул. Новосибирская 2/2
тел/факс (3472) 777–500 (Mitsubishi)
тел. (3472) 777–000 (Ford, Mazda)
[email protected]
Исследования и разработки
Компании довольно часто информируют общественность о новых разработках, справедливо относя их к тем достижениям, которыми можно гордиться. Однако довольно часто размещением подобной информации занимаются люди, которые не задумываются о вопросах безопасности и защиты сведений не то чтобы от представителей конкурентной разведки, но и от банальных промышленных шпионов. Нам приходилось сталкиваться с крупными предприятиями, на которых «не имеющий тормозов» специалист по PR, допущенный на все совещания и регулярно получавший премии за количество публикаций, выкладывал на корпоративный сайт все данные о перспективных изобретениях.
К счастью для отечественных предприятий, в большинстве случаев контроль за распространением информации о таких разработках все же существует и угрозы безопасности компании с этой стороны возникают относительно редко. Однако и обычные сведения о новых разработках предприятия могут оказаться весьма полезными для целей конкурентной разведки.
Например, на главной странице томской компании «Эрмис» приведена ссылка на страницу «Новые разработки» (), на которой подробно рассказывается о бесконтактных измерителях длины проволоки, канатов, кабелей, труб «Дельта-4» и «Дельта-4.1».
Аффилированные компании и аффилированные лица
В ряде случаев информация об аффилированных лицах и компаниях может быть прямо или косвенно проверена на корпоративном сайте. В случае с организациями, которые по закону обязаны раскрывать подобные сведения, выполнить такую проверку проще всего.
На рис. 48 приведен пример того, как выглядит список аффилированных лиц в одной из генерирующих компаний (при переходе по гиперссылке пользователь получает доступ к файлу в формате Word).
Рис. 48. Список аффилированных лиц ОАО «ЮГК ТГК-8».
Размещение списка аффилированных лиц на сайте в виде текстового файла встречается очень часто.
Наш опыт показывает, что когда будет предложено выбрать, сохранить ли файл со списком аффилированных лиц на жестком диске или открыть в браузере, то лучше выбрать сохранение файла. Это позволит в любой момент обратиться к документу, что может потребоваться в случае появления необходимости уточнить какие-то вопросы. А кроме того, в ряде случаев нам удавалось обнаружить дополнительные данные, исследуя этот сохраненный на компьютере файл. Если навести на него курсор и нажать правую кнопку мыши, то можно получить доступ к свойствам документа, которые обычно устанавливаются текстовым процессором автоматически и могут содержать фамилию человека, на компьютере которого файл создавался. Конечно, к безупречным такой источник информации отнести нельзя, однако лично нам беседа с создателем файла нередко помогала выяснить достаточно весомые, а порой и ключевые обстоятельства (рис. 49).
Рис. 49. Свойства файла с фамилией автора (имена и названия вымышленные, но принцип соответствует фактам, имевшим место в реальности)
Зарегистрированные товарные знаки и торговые марки, а также патенты
Не все компании публикуют подобную информацию на своих сайтах. Некоторые ограничиваются тем, что ставят значок «ТМ» или «R» справа от своего названия. Иностранные организации предоставляют подробные сведения о принадлежащих им торговых марках и патентах чаще, нежели российские. Хотя, даже на отечественном ресурсе такой крупной компании, как «Кока-Кола», нам не удалось при беглом просмотре карты сайта и раздела, посвященного бренду «Кока-Кола», найти такую информацию.
Данные о патентах преимущественно публикуются высокотехнологичными предприятиями. Так, тайваньским электронным гигантом – компанией «Foxconn» – соответствующая информация размещена на странице, посвященной инновациям.[16]
А данную ниже информацию размещать не будем. Лучше оставить так, как было. Это не художественная книга, здесь нужно максимально натуралистичное вомспроизведение действительности.
Эти данные сведены в таблицу (табл. 1), которую мы приводим ниже: она показывает, как с 1995 г. росло количество патентов, принадлежащих организации в разных странах, а также какие страны были более приоритетными для нее в разные годы.
Таблица 1
Динамика интеллектуального индекса компании «Foxconn» в период с 1995 по 2000 г.
Цены
Однозначного ответа на вопрос о том, доверять или не доверять разделу «Цены», размещенному на сайте компании, не существует.
На самом деле, соответствие подобной информации цен, представленной на интернет-ресурсе, реальному положению вещей напрямую зависит от того, в каком сегменте рынка работает организация. Известно, что ряд крупных компаний с большим ассортиментом имеет такую систему скидок, дифференцированную в зависимости от категории клиента и его географического положения, что принимать в качестве ориентира обнародованные на сайте цены бессмысленно. Недаром, участники некоторых рынков – например, рынка оптовых продаж лекарственных средств – считают, что единственная информация, неизвестная им о конкуренте, – это действительная стоимость, установленная на товары для разных категорий потребителей, с разбивкой по регионам. Ситуация усугубляется тем, что эти цены непрерывно меняются, отчего однократное их выяснение ничего не дает.
Вместе с тем, случается и такое, что заявленная на сайте цена соответствует реальной. Это относится, прежде всего, к интернет-магазинам, автосалонам и пунктам продаж мобильных телефонов. Но и в этом случае советуем проверить полученную информацию – например, позвонив продавцу или посетив его лично, если это возможно. По крайней мере, необходимо периодически проводить выборочный анализ.
Информация о стоимости продукции может быть по-разному представлена на корпоративном ресурсе. Прайс-лист или иллюстрированный каталог здесь может и отсутствовать. А цена конкретного товара формируется, лишь вследствие пошагового выбира того или иного варианта комплектации изделия. Однако некоторые сайты все же предоставляют пользователю возможность скачать прайс-лист (как правило, в формате документов Word, Excel или PDF).
А иногда товар подбирается в заданном ценовом диапазоне. Как, например, на ранее рассмотренном сайте «Автоленда», где как раз можно сформировать пошагово нужную комплектацию автомобиля и затем узнать его цену.
Специалисту конкурентной разведки необходимо просмотреть все варианты цен, приведенные на сайте, после чего проверить их актуальность, и лишь затем делать выводы как о самих ценах, так и о достоверности информации.
Вакансии
Раздел «Вакансии» на корпоративном сайте позволяет сделать косвенные выводы о кадровой ситуации в компании (особенно, если этот раздел постоянно подвергается мониторингу в динамике). Кроме того, появление объявления о некоторых вакансиях – хорошая возможность сходить на мнимое (а таковым оно и будет для псевдосоискателя) собеседование, дабы ознакомиться с предприятием конкурента изнутри и, может быть, по характеру задаваемых вопросов понять, над чем он в настоящее время работает, на какие направления и почему приглашает специалистов. Надо сказать, что за рубежом такой поступок специалиста конкурентной разведки, скорее всего, признали бы неэтичным либо вовсе незаконным. В России же на момент написания книги это считалось вполне приемлемым – как с позиции закона, так и с точки зрения этики. Однако ситуация в нашей стране может измениться, поэтому, прежде чем идти на такой шаг, рекомендуем читателю справляться о текущем положении вещей в данной сфере.
Кроме того, ситуации, когда на собеседование приходит такой «засланный казачок», могут закончиться весьма комично. Так, в одну солидную екатеринбургскую фирму, продающую строительные материалы, потребовался грузчик. Был объявлен конкурс, подано объявление о вакансии. Дело было зимой. На собеседование явился солидный мужчина в дубленке, который не показал трудовой книжки, путано представил свою трудовую биографию и почти с порога стал интересоваться тем, как часто, откуда и какой именно груз доставляется на склад. Сотрудник службы по персоналу рассказывал потом, что сразу с появлением «соискателя» у него «щелкнул в голове сигнал опасности», но уже после нескольких минут разговора он с трудом сдерживался от смеха и ждал, когда (цитируем) «этот клоун выдохнется и уйдет».
Внешние ссылки на сайт из Интернета
Мощный инструмент изучения компаний с применением ресурсов Интернета – это просмотр ссылок на сайт с помощью оператора Link. Синтаксис этого оператора варьируется в зависимости от того, с какой информационной системой вы работаете. Тем не менее, он присутствует во всех крупных поисковиках.
Важность указанного оператора для конкурентной разведки и специалистов PR очевидна: ведь те, кому не интересно содержимое сайта, не станут ссылаться на него подобным образом. И наоборот: упоминание человеком каких-то страниц интернет-ресурса свидетельствует о том, что они его, в силу ряда причин, интересуют. Причем интерес этот не всегда носит дружеский характер. Он может быть продиктован и недовольством. А как минимум, желанием обменяться ссылками.
Оператор Link обычно позволяет прояснить важные вопросы относительно:
– дружественных структур;
– аффилированных компаний, которые не афишируются публично;
– личных страничек сотрудников;
– наличия позитивной или негативной информации на форумах и в дискуссионных группах;
– новых источников информации в лице деловых партнеров изучаемой компании;
– раскрутки в поисковых машинах собственного сайта или сайта, порочащего конкурента.
Если внешних ссылок чересчур много, Link хорошо сочетать с ключевыми словами (в частности, такими, как «резюме», «работа», «„зарплата“ и другими, в зависимости от того, какая цель стоит перед исследователем).
Проиллюстрируем сказанное на конкретных примерах.
Ссылки на сайт компании «Автоленд». Оператор Link в Гугле на момент написания книги выявил 81 ссылающуюся страницу. Некоторые из них – внутренние (так, в рамках корпоративного сайта со страницы автозапчастей к автомобилю «Ford Focus» существует гиперссылка на страницу с информацией о модельном ряде всех автомобилей).
Другие же указывают на организации, которые состоят с «Автолендом» в деловых отношениях, и поэтому потенциально могут служить источниками информации о рассматриваемой компании либо выступить в роли агентов влияния на это предприятие. Среди таких организаций, ссылающихся на сайт «Автоленда», встречаются:
– ресурсы, на которых размещается справочная информация о компании;
– банки, кредитующие клиентов «Автоленда» при покупке автомобилей;
– рекламное агентство, сотрудничающее с компанией;
– каталог поисковой машины Апорт.
Ниже приведен перечень конкретной информации, выданной по этим организациям Гуглом в ответ на запрос с помощью оператора Link.
Визуальная механика Архив новостей
состояние проекта · карта сайта. english. АРХИВ НОВОСТЕЙ. Открытие портала Автоленд 09 ноября 2004. С удовольствием представляем вам нашу последнюю работу… . php?arhiv=1&id=100104 – 20k – Размещение рекламы – Auto-Dealer.ru Екатеринбург
Размещение рекламы…
АВТОстоп. АВТОстоп март 2006 29 апреля 2006 АВТОСТОП МАРТ 2006. Период широкой популярности серебристых цветов и оттенков у… -dealer. ru/advert.php – 62k -
Автокредитование
Предлагаем воспользоваться в Новосибирске услугой автокредитования физических лиц – потребительским кредитом на покупку нового автомобиля в Новосибирске. sobin.nsk.ru/services/ autocredit.php – 49k –
НОВОСИБИРСК: – Предприятия – Интернет – Карта – Телефоны…
Выберите район, Любой, Бердск, Дзержинский, Железнодорожный, Заельцовский, Калининский, Кировский, Ленинский, Октябрьский, Первомайский, Советский… www.h-ck.ru/ url/12/81/427/ – 24k
Автоленд – продажа и ремонт автомобилей Ford, Mazda, Volvo, Jaguar…
Автоленд – продажа и ремонт автомобилей Ford, Mazda, Volvo, Jaguar, Land Rover и Mitsubishi catalog.aport.ru/rus/hitrate.aspx?urlid=1516649 – 22k —
Карта сайта – Auto-Dealer.ru Екатеринбург
Карта сайта… АВТОМОБИЛИ. Фото автомобилей Как выбрать автомобиль Тест драйвы автомобилей Мысли на обочине Покупка автомобиля… -dealer.ru/map.php – 42k -
Автокредитование
Физическим лицам. Народный кредит Автокредитование Ипотечный жилищный кредит Потребительское кредитование Вклады Ставки по вкладам физических лиц… nsk.impexbank.ru/persons/ avto.html – 84k -
Форум / World Gym – фитнес центр Екатеринбург
Сейчас на форуме 96 пользователей(я). На форуме находятся зарегистрированные пользователи: Александр [flame], Ирина Рахимова [020981], svetlana [kul],… – 24k
Остановимся подробнее на одном интересном моменте. При попытке найти на каком-то конкретном сайте гиперссылку на изучаемый ресурс (в случае с «Автолендом» – на сайте фитнес-центра) специалист конкурентной разведки может столкнуться со стандартным затруднением. Дело в том, что на рассматриваемом ресурсе фитнес-центра гиперссылка на сайт компании «Автоленд» находится в небольшом рекламном баннере. Причем, баннер этот расположен в нижнем правом углу страницы и не особенно бросается в глаза.
Поэтому для облегчения поиска нужной информации о гиперссылке рекомендуем использовать универсальный прием, действие которого продемонстрируем на примере сайта «autoland.ru».
На странице, полученной по запросу с помощью оператора Link, вызовите с помощью щелчка правой кнопкой мыши «Просмотр исходного кода страницы», затем нажмите CTRL+F и в открывшемся окне поиска введите слово «autoland». И вы сразу увидите, где именно на странице расположена нужная вам гиперссылка. Это повысит точность работы и сэкономит немало времени.
Поиск гиперссылок на сайт «autoland.ru» с помощью оператора Link в Яндексе расширил список ссылающихся страниц, по сравнению с тем, что был найден в Гугле (всего Яндекс показал на момент написания книги 46 ресурсов).
При этом были обнаружены:
– партнеры «Автоленда», не упоминавшиеся ранее;
– отзывы клиентов об обслуживании в компании (в основном, в дискуссионных группах и на форумах). Кстати, хорошо видно, что Яндекс, по сравнению с Гуглом, ценит форумы выше. На наш взгляд, для специалиста конкурентной разведки это несомненный плюс;
– резюме сотрудника «Автоленда» (программиста), активно искавшего работу в 2004 г. И вновь надо отметить, что, как нередко случается, ресурсы, на которых размещаются подобные анкеты, Гуглом найдены не были.
Ниже приведены тексты документов, которые были отражены в Яндексе, но проигнорированы Гуглом:
Уральский Мазда-клуб
/ Автоленд Екатеринбург
mazda.utk.ru/links.shtml?1072355051 (8 КБ)
Тематические ресурсы – услуги
Автоленд Холдинг – официальный дилер автомобилей Ford, Mazda, Volvo, Land Rover, Jaguar,
Mitsubishi Motors, Hyundai
(16 КБ)
композитная защита для сердца вашего автомобиля – наши партнеры
Автоленд, Екатеринбург
(7 КБ) · 24.04.2006
Форум Челябинских Автомобилистов – > Mazda Rx 8. Где Можно Обслуживать?
(42 КБ)
Особо хотелось бы остановиться на резюме, размещенном в Интернете от имени сотрудника «Автоленда», поскольку подобные инциденты периодически происходят в компаниях и именно на этой почве чаще всего происходит передача в Службу Безопасности предприятия информации, полученной специалистом конкурентной разведки.
Вот как выглядели реальные результаты Яндекса применительно к странице с резюме, содержавшей гиперссылку на сайт «Автоленда» (видно, что в общей сложности были обнаружены три таких ресурса):
Каталог Userline – Программисты
Оглоблин Константин
(29 КБ)
TopList.H1.ru: Они ищут работу
Оглоблин Константин
Рейтинг:
toplist.h1.ru/index.php/c140019s1p9 (22 КБ) 05.03.2004
Работа и заработок: Они ищут работу: Page 4
Работа и заработок: Они ищут работу: Page 4
Оглоблин Константин
logs.wallst.ru/1801/1809/more4.html (20 КБ)
При переходе по одной из гиперссылок, появлялась следующая информация, приведенная на рис. 50.
Рис. 50. Личное объявление от имени сотрудника компании о поиске им работы, обнаруженное с помощью оператора Link в Яндексе.
Интересно, что свое резюме этот сотрудник (или тот, кто выступал от его имени) разместил непосредственно на корпоративном сайте «Автоленда», после чего и дал на него гиперссылку с различных досок объявлений. Мы можем предположить, что человек в данном случае воспользовался своим служебным положением – доступом к содержимому сайта – в личных целях, поскольку достаточно сложно себе представить, чтобы тот, кто не имеет соотвествующих прав, никем незамеченным пробрался на интернет-ресурс компании и создал там каталог с резюме. Если наши предположения верны, то данный факт лишний раз доказывает, насколько полезно бывает проводить мониторинг информации касательно собственного предприятия – как минимум, для своевременной идентификации специалистов, находящихся в поиске новой работы. На наш взгляд, действия, подобные тем, что предпринял программист при размещении своей анкеты (если он, конечно, сам это сделал), также могут косвенно свидетельствовать об уровне квалификации и определенном психологическом типе соискателя вакансий, а это, в свою очередь, позволяет более основательно продумать подход к такому человеку с целью получения от него необходимых сведений, если речь идет о сотруднике конкурента.
Однако оставим выяснение вопроса об авторстве рассмотренного резюме тем, кого это напрямую затрагивает. Предлагаем обсудить другую проблему: насколько опасна подобная ситуация для компании, с точки зрения попадания в сети, расставленные специалистами конкурентной разведки, конфиденциальных данных о предприятии.
Поскольку нам периодически становится известно о случаях, когда сотрудники размещают свои анкеты на сайте работодателя или заводят собственные страницы на его сервере, мы хотели бы подробнее остановиться на том, какие угрозы, помимо неприятных эмоций, могут нести компании подобные инциденты. Для этого попытаемся обобщить наиболее характерные психологические характеристики членов персонала организации, которые идут на такие формы использования ее ресурсов. Вероятно, люди, совершающие подобные поступки и демонстрирующие, в целом, отдельные навыки владения такими понятиями, как «ключевые слова», тем не менее, считают, что обнаружить их действия никто не сможет. Как показывает приведенный пример, убежденность ряда пользователей в том, что Интернет большой и затеряться в нем проще простого, не имеет под собой основания.
С учетом оценки психологического типа человека и при грамотном планировании подхода, для специалиста конкурентной разведки подобные кадры противника в ряде случаев могут действительно оказаться находкой. Особенно если такой специалист окажется не обременен этическими предрассудками. В частности, подобных соискателей могут пригласить на собеседование, поскольку они готовы к общению на темы своей нынешней работы. При этом, с высокой степенью вероятности, «ключ» к ним может лежать на поверхности: их нетрудно расположить к себе и дополнительно поощрить к подробному рассказу, выражая вслух восхищение «нестандартным» и «креативным» подходом к вопросу поиска работы. Высока вероятность того, что вдохновленные высокой оценкой своего поступка (по нашему мнению, совершенно неэтичного и заслуживающего самого жесткого порицания), такие люди могут расслабиться и рассказать еще немало подробностей о своих «подвигах» на рабочем месте.
Поскольку ссылки на сайт «Автоленда» не привели нас на личные страницы бывших и нынешних сотрудников компании, приведем пример другой организации (рис. 51) и покажем, как может выглядеть подобный ресурс (в данном случае она называется «Любимые ссылки» и содержит три раздела: «О моей работе», «Немного эротики» и «Все о Siemens»).
Рис. 51. Личная страничка сотрудника компании со ссылкой на сайт компании, обнаруженная с помощью оператора Linkв Яндексе.
Данная страница – подлинная и принадлежит сотруднику реально существующей организации, название которой мы решили не указывать по этическим соображениям.
Составление запросов, связанных с названием компании, в поисковые машины
Запросы в поисковые машины, которые формулируются с использованием названия компании, позволяют не только получить дополнительную информацию о конкретной организации, но и поставить эту информацию на мониторинг.
В ряде случаев удается найти принадлежащие сотрудникам личные страницы и дневники, которые включают в себя название компании или ее продукции, но не содержат гиперссылок на копоративный сайт, а потому не обнаруживаются с помощью оператора Link.
Как показывает практика, встречается несколько основных источников и способов поиска подобной информации, которые мы разберем более подробно.
Поиск с использованием фрагментов адреса электронной почты или доменного имени компании.
Отдельно надо сказать о важности исследования с помощью доменных имен компании, прежде всего – тех, которые используются в адресах электронной почты.
Обратимся к описанному нами в предыдущей книге «Конкурентная разведка: маркетинг рисков и возможностей»[17] случаю, когда использование доменного имени в поисковом запросе привело к получению стратегически важных сведений о конкуренте.
Исследование проводилось в отношении компании «ЛКПС» (название компании, доменное имя и адреса электронной почты вымышленные, но принципы их написания сохранены). Специалисты по конкурентной разведке зашли на корпоративный сайт www. lkps.ru и убедились, что адреса электронной почты сформированы на основе названия домена. Был проведен поиск по доменному имени как фрагменту адреса электронной почты – «lkps.ru».
Одна из найденных таким образом страниц представляла собой книгу отзывов на первой странице сайта уважаемой обучающей организации. В этой книге было зафиксировано сообщение, связанное с адресом электронной почты [email protected] и содержавшее указание на то, что автор отзыва – это заместитель финансового директора компании, в отношении которой производился сбор информации.
После этого был проведен поиск по псевдониму «polina_rad». В результате на одном из форумов, посвященном банковской деятельности, обнаружилась участница с таким псевдонимом и адресом электронной почты [email protected], дававшая подробные объяснения из практики своего предприятия по поводу различных схем работы с банками и лизинговыми организациями. О том, что это женщина, свидетельствовали тексты ее сообщений, содержавшие фразы «я подумала…», «я пришла…» и т. п. На момент обнаружения в форуме было шесть ее сообщений, отвечавших на вопросы посетителей форума и рассказывавших о плюсах и минусах конкретной финансовой схемы. Любой желающий мог задать практически любой вопрос и получить четкий ответ. С высокой степенью вероятности можно предположить, что при ответах данный специалист и дальше будет использовать опыт работы компании «ЛКПС». Во всяком случае, в предыдущих ответах на вопросы она прямо ссылалась на опыт своего предприятия, используя в предложениях фразы «наша фирма <это делает так-то>…» или «по моему опыту…». Все это оказалось весьма кстати для конкурента предприятия «ЛКПС», выступившего в качестве заказчика исследования. Заказчик пояснил, что полтора года пытался узнать о том, как конкретно его конкурент осуществляет подобную работу. Работа по схеме, любезно рассказанной на форуме госпожой под псевдонимом polina_ rad, с одной стороны открывала доступ к серьезным финансовым ресурсам, а с другой требовала проведения некоторых мероприятий, без которых она ставила под угрозу финансовую стабильность предприятия.
Информация, обнаруженная специалистами по конкурентной разведке, сама по себе еще не давала возможности начать работу с новыми партнерами по новой схеме, но, во-первых, она восполняла пробелы в опыте проведения финансовых операций, а во-вторых, открывала возможность следить за дальнейшими «откровениями» топ-менеджера конкурентов.
Специалисты по конкурентной разведке удостоверились, что финансового директора конкурента звали Полина Радова.
Первоначально эта информация была дана заказчиком, который поставил задачу провести исследование. Достаточно давно работая на рынке, он знал имена ключевых менеджеров своих конкурентов. Однако, во избежание риска, поскольку Полина Радова относительно недавно перешла на новое место работы и теперь делится опытом работы на другом предприятии, специалисты по конкурентной разведке позвонили в фирму «ЛКПС». По телефону в последнем справочнике с перечнем оптовых цен и списком поставщиков был совершен звонок с мобильного телефона, принадлежавшего частному лицу, никак не связанному с компанией заказчика. Таким образом связались с отделом сбыта, который дал телефон секретаря генерального директора. Специалисты перезвонили секретарю и объяснили, что хотят обратиться к финансовому директору с письмом и поэтому уточняют, как точно ее зовут и как правильно называется ее должность. В результате информация о том, что финансовый директор «ЛКПС» и Полина Радова – по-прежнему одно и то же лицо, получила подтверждение «из первых рук».
Комментируя этот пример, хотим высказать свое мнение о способах избежания проблем, подобных тем, которые создала своей компании госпожа Радова.
Первоначально мы предлагали использовать в адресах элетронной почты нейтральные имена. Например, вместо [email protected] давать адрес [email protected]. Однако, как верно заметила Виктория Прохорова, такой подход неприемлем для западных компаний, в которых практически всегда имя в адресе электронной почты представляет собой настоящие имя и фамилию. Согласно такому неписаному правилу корпоративной этики, госпожа Радова должна была создать адрес polina_radо[email protected]. А вот псевдоним для участия в форумах и для адреса электронной почты, публикуемого в открытом доступе и расположенного на бесплатных почтовых серверах, может быть обезличенным. Такой подход позволит соответствовать общепринятым нормам и при этом посещать форумы, не создавая проблем себе и своей компании.
Надо отметить, что даже простой запрос по правой части адреса виртуальной почты организации дает, как правило, очень неплохие результаты. А если его провести с обязательным включением в поиск таких слов, как «отзыв», «куплю», «продам», «меняю», «познакомлюсь», «люблю», «ищу», «предлагаю», «изготовлю», «окажу», «предоставлю», «сдам», «сниму», «гарантирую», «выполню», то можно получить подборку информации о жизни сотрудников компании вне стен родной фирмы: эти сведения поодерживаются электронной перепиской, хранящейся на корпоратвном ресурсе (рис. 52). Ну а затем можно провести поиск по отдельным никам – то есть, по левой части адресов сетевой почты. При этом ни к каким конфиденциальным сведениям специалист конкурентной разведки не обращается, поскольку он пользуется лишь теми данными, которые опубликованы в общем доступе.
Вот, например, как может выглядеть запрос по адресу электронной почты уральского филиала компании Мегафон, если убрать тот «информационный мусор», который попадает в выдачу и становится виден при первом размещении запроса:
[+«uralskygsm.com» && +(знакомства | общение | отзыв | куплю | продам | меняю | познакомлюсь | люблю | ищу | предлагаю | изготовлю) ~~ (personal | Мегафон | vopros)].
Подобная информация может пригодиться представителю конкурентной разведки, однако кому она действительно помогает в работе, так это тем, кто занимается промышленным шпионажем. Ведь специалист, который ищет подходы к предприятию, имеет возможность знакомиться с человеком, который готов к общению, а тема для разговора и повод начать этот разговор уже заданы будущим собеседником. Поэтому, на наш взгляд, служба безопасности компании должна включить мониторинг такой информацию в сферу своих интересов и, возможно, прибегнуть для этого к помощи представителей конкурентной разведки.
Рис. 52. Личные объявления сотрудников компании, с указанием адреса служебной электронной почты.
Подобная ситуация характерна для большинства крупных российских организаций.
Блоги и личные сайты сотрудников и просто информированных лиц.
Все чаще люди ведут в блогах свои дневники, делятся переживаниями, рассказывают о планах на будущее и о работе. Эти ресурсы порой становятся источниками крайне ценной для специалиста конкурентной разведки информации. Причем, во многих случаях сведения в таких дневниках доступны всем без исключения пользователям Сети. Чтобы масштабы явления были более понятны читателю, приведем выдержки из материалов, которые были опубликованы в открытой печати.
2004 г. Американская стюардесса Эллен Симонетти сражается сейчас за свое рабочее место с руководством авиакомпании Delta Airlines, которое отстранило ее от работы за высказывания, содержащиеся в ее виртуальном дневнике.
Эллен вела так называемый «блог» или интернет-дневник, в котором выступала под псевдонимом Королева небес. Однако в какой-то момент честолюбие пересилило, и девушка опубликовала в нем свои фотографии в форме стюардессы, передает BBC.[18]
Президент Буш и американские политики получают больше данных из открытых источников, таких как интернет-блоги и иностранные газеты, чем это было в прошлом, сообщают высокопоставленные сотрудники разведки.
Новый Центр открытых источников (Open Source Center – OSC) в штаб-квартире ЦРУ недавно активизировал сбор и анализ данных на основе блогов по всему миру и начал разрабатывать новые методы для проверки достоверности их контента, сказал директор OSC Дуглас Наквин.
«Сейчас культура блогов в интернете стремительно развивается, и мы получаем богатый улов из блогов, которые многое сообщают нам о социальных перспективах различных обществ. Из них мы узнаем все – от общих настроений до эксклюзивной информации, которую нельзя получить из других источников», – сказал Наквин в интервью Washington Times.[19]
В России начинают увольнять сотрудников компаний или организаций, которые чересчур откровенничают в виртуальном мире о своей работе и обсуждают начальство. Относительная прозрачность Интернета позволяет работодателям легко обнаруживать «болтунов». Спецслужбы и милиция также внимательно следят за частными сообщениями в Сети, однако мечтают получить еще больший контроль над пользователями Всемирной Паутины. Личные интернет-дневники – популярная нынче среди россиян забава. Почти 160 тыс. наших сограждан ведут подобные страницы, на которых день за днем записывают свои впечатления. При этом большинство подобных ресурсов отрыты для посторонних наблюдателей. А ведь есть еще тематические интернет-форумы, чаты и гостевые книги, на которых также обсуждаются самые разные темы – от последнего матча «Челси» и художественных особенностей голливудских боевиков до отношений подчиненных с начальниками и студентов с преподавателями. 19-летняя Валентина Кныш училась на втором курсе факультета искусства Санкт-Петербургского государственного университета профсоюзов. Ее специальность непосредственно связана с высокими технологиями – она режиссер мультимедиа-проектов. Все свои переживания, радости, новые идеи и мысли она записывала в личный интернет-дневник. Первый месяц эту страницу читал один человек. Но яркая личность всегда привлекает людей. И через полгода ресурс регулярно посещали уже семьдесят человек.
О своей реакции на ход занятий и уровень преподавательского состава вуза студентка Кныш подробно писала в дневнике не стесняясь в выражениях… Между тем в России все чаще происходят корпоративные скандалы, связанные с «неправильным» использованием Интернета сотрудниками различных компаний и организаций. Так, недавно мировым судом в Нижнем Новгороде был оштрафован электромонтер одного из предприятий, входящих в компанию «Вимм-Билль-Данн Продукты питания». На своем сайте он разместил взятую из локальной сети фирмы информацию о размерах зарплаты всех сотрудников предприятия. В прокуратуре, куда обратилось руководство фирмы, электромонтер объяснил свои действия любопытством.
Однако даже невинная болтовня с сетевыми приятелями может обернуться крупными неприятностями для посетителя Интернета. «Я работал в одном из крупных сетевых СМИ, – рассказал „НИ“ журналист Сергей Суранов. – Нам задерживали зарплату, и сотрудник нашего издания проболтался об этом в Интернете. Его тут же вычислила служба безопасности, и парень был мгновенно уволен.
В большинстве крупных российских компаний в функции службы безопасности давно входит слежка за сообщениями в Интернете. Все это происходит в рамках борьбы с «инсайдом» – утечкой внутренней информации. Однако «под колпаком» оказываются и те, кто, например, обсуждает своего шефа или политику фирмы. Впрочем, иногда наказать сотрудника не получается – это происходит, когда информация становится достоянием гласности. Так было в случае с недавним скандалом с участием начальника Московского метрополитена Дмитрия Гаева на борту самолета «Аэрофлота», летевшего из Москвы в Токио. О дебоше журналисты узнали из сообщений на форуме бортпроводников авиакомпании».[20]
Мы не считаем, что увольнение сотрудников – это лучшее решение проблем, связанных с тем, что системы безопасности отстают от развития информационных технологий. Во многих случаях достаточно просто объяснить работнику, что его страница легкодоступна всем желающим, и он сам ее прикроет либо уберет из нее идентифицирующие его личность и место его работы признаки. В более сложных ситуациях службы безопасности предприятий могут провести через эти ресурсы и дезинформационную кампанию.
Однако как специалистов конкурентной разведки нас подобные источники интересуют, хотя надо вновь оговориться: предоставляемые ими сведения должны в обязательном порядке перепроверяться.
В блогах предусмотрена такая функция, как создание списков друзей. Это явление настолько развито, что прижился термин «зафрендить», что и означает причислить чей-то блог к такому списку. Все сообщения, появляющиеся на одном из таких блогов, немедленно становятся известны по электронной почте или через ленту всем остальным «друзьям». Нам в нашей практике удавалось обнаруживать сложившиеся сообщества, со своей неформальной, но реально функционирующей иерархической структурой. Участие в таких объединениях позволяет не только быть в курсе многих планов их участников, но и порой оказывать влияние на сообщество в целом. Это долговременная работа, однако перед специалистами конкурентной разведки или PR она может открывать серьезные перспективы.
Некоторые блоги сегодня стали практически отдельными СМИ, однако и те из них, которые не столь заметны, могут играть важнейшую роль, например, в распространении слухов.
Проиллюстрируем это на основании текста, взятого из нашего общения на «Форуме разведчиков» сайта it2b-forum.ru. Нами было проведено исследование путей трансформации и распространения сведений в Интернете на примере рядовой шутки. Автор книги, который постоянно и открыто присутствует на данном форуме, выступал под ником CI-KP.
На наш взгляд, этот пример настолько хорошо показывает возможности распространения искаженной и неискаженной информации, что заслуживает быть приведенным здесь полностью (в текст беседы нами внесены минимальные изменения, адаптирующие материал к неэлектронной версии изложения).
Sprinter Apr 25 2006, 11:43
Говорят, на последней компьютерной выставке COMDEX Билл Гейтс заявил, что если бы General Motors развивался так, как Microsoft, мы бы уже все давно ездили на машинах стоимостью $ 25 и расходом топлива 0.005 л/100 км.
Через день представитель GM заявил в ответ, что если бы GM повторял тенденции Microsoft, то:
1. Абсолютно без причины, среднестатистическая машина попадала бы в аварию 2 раза в день.
2. Каждый раз, когда изменялась бы разметка на дороге, приходилось бы покупать новый автомобиль.
3. Иногда машина бы просто останавливалась посреди шоссе. Чтобы поехать дальше, надо было бы оттолкать машину к обочине, закрыть все ОКНА, заглушить двигатель, открыть все ОКНА и только потом ехать.
4. Выполняя сложный маневр, машина может заглохнуть и больше не завестись. Тогда придется переинсталлировать двигатель.
5. Макинтош сделал бы автомобиль, который бы использовал энергию солнца, был бы в пять раз быстрее авто от Microsoft, вдвое легче в управлении – но мог бы ездить только по 5 % дорог.
6. Датчики температуры двигателя, зарядки батареи, давления масла заменили бы на один – единственный: «Эта Машина выпонила недопустимую операцию и сейчас заглохнет».
7. Перед тем как сработают подушки безопасности, появится надпись: Are you sure?
8. Иногда автомобиль закроет дверь на замок и вы не сможете попасть внутрь. Тогда нужно одновременно нажать ручку двери, вставить ключ и нажать на радиоантенну – система разблокируется.
9. Каждый раз при покупке нового авто придется учиться ездить заново – управление каждой новой машины будет в корне отличаться от старого.
10. Чтобы заглушить мотор, нужно нажать кнопку START.
CI-KP
Небольшое компьютерное расследование на тему «Пути распространения интересных слухов в Интернете, или откуда ноги растут»:) Привожу так, как шел реально по этой цепочке.
1. Смотрим Яндекс на предмет присутствия искомой шутки.
Результат – по запросу в Яндекс: «Иногда автомобиль закроет дверь на замок и вы не сможете попасть…».
2. Сортируем полученные результаты не по релевантности, а по дате, пытаясь найти
самое старое сообщение.
Результат – сообщение:
alexserp.nm.ru/Vista/poleznosti/krutit.htm (93 КБ) · 24.06.2003
Эта ссылка на сегодня не соответствует по содержанию тому, что мы ищем, но среди соседних ссылок найден документ 2004 г., на самом деле это перепечатанный документ
2003 г., расположенный по адресу:
.
Итак, шутка датирована не позднее, чем 2003 г. По крайней мере, на русском языке.
3. Ищем информацию о том, когда была «последняя выставка COMDEX».
Находим информацию (по адресу /) – как минимум, не вчера, а году так примерно в 2003-м или 2002-ом. Дальше не вникал, так как главное – что не так уж и недавно.
4. Пытаемся найти первоисточник. Предполагаем, что события на той выставке, применительно к нашим фигурантам – Гейтсу и GM – вряд ли были на русском языке, а значит, где-то должен быть английский текст. И значит, английский текст старее русского. Для этого идем в поисковик, который больше любит английский язык, чем русский. Выбираем Google. Поиск проводим максимально широко. Для этого берем уже не точную фразу, а два-три ключевых слова (два главных и одно – просто любое из текста, чтобы мусора поменьше было). Запрос: Гейтс GM развивался.
5. В числе первых – документ, который содержит текст и на русском, и на английском языках по адресу
Вот этот текст:
«про Б.Гейтса и GM
Гoворят, на компьютерной выставке COMDEX Билл Гейтс заявил, что если бы General Motors развивался так, как Microsoft, мы бы уже все давно ездили на машинах стоимостью $ 25 и расходом топлива 0.005 л/100 км.
Через день представитель GM заявил в ответ, что если бы GM повторял тенденции Microsoft, то:
1. Абсолютно без причины, среднестатистическая машина попадала бы в аварию 2 раза в день.
2. Каждый раз, когда изменялась бы разметка на дороге, приходилось бы покупать новый автомобиль.
3. Иногда машина бы просто останавливалась посреди шоссе. Чтобы поехать дальше, надо было бы оттолкать машину к обочине, закрыть все ОКНА, заглушить двигатель, открыть все ОКНА и только потом ехать.
4. Выполняя сложный маневр, машина может заглохнуть и больше не завестись. Тогда придется переинсталлировать двигатель.
5. Макинтош сделал бы автомобиль, который бы использовал энергию солнца, был бы в пять раз быстрее авто от Microsoft, вдвое легче в управлении – но мог бы ездить только по 5 % дорог.
6. Датчики температуры двигателя, зарядки батареи, давления масла заменили бы на один – единственный: «Эта Машина осуществила нелегальную операцию и сейчас заглохнет».
7. Перед тем, как сработают подушки безопасности, появится надпись: Are you sure?
8. Иногда автомобиль закроет дверь на замок и вы не сможете попасть внутрь. Тогда нужно одновременно нажать ручку двери, вставить ключ и нажать на радиоантенну – система разблокируется.
9. Каждый раз при покупке нового авто придется учиться ездить заново – управление каждой новой машины будет в корне отличаться от старого.
10. Чтобы заглушить мотор, нужно нажать кнопку START.
Говорят, Гейтс обиделся…
Когда Майкрософт выпустит что-нибудь, что не будет тормозить?
Когда начнет выпускать автомобили:)))
At a recent computer expo (COMDEX), Bill Gates reportedly compared the computer industry with the auto industry and stated: «If GM had kept up with technology like the computer industry has, we would all be driving twenty-five dollar cars that got 1000 miles to the gallon.» In response to Bill's comments, General Motors issued a press release stating (by Mr. Welch himself): If GM had developed technology like Microsoft, we would all be driving cars with the following characteristics:
1. For no reason whatsoever your car would crash twice a day.
2. Every time they repainted the lines on the road you would have to buy a new car.
3. Occasionally your car would die on the freeway for no reason, and you would just accept this, restart and drive on.
4. Occasionally, executing a maneuver such as a left turn, would cause your car to shut down and refuse to start, in which case you have to reinstall the engine.
5. Only one person at a time could use the car, unless you bought «Car95» or «CarNT.» But then you would have to buy more seats.
6. Macintosh would make a car that was powered by the sun, reliable, five times as fast, and twice as easy to drive, but would only run on five per cent of the roads.
7. The oil, water temperature and alternator lights would be replaced by a single «general car fault» warning light.
8. New seats would force everyone to have the same size butt.
9. The airbag system would say «Are you sure?» before going off.
10. Occasionally for no reason whatsoever, your car would lock you out and refuse to let you in until you simultaneously lifted the door handle, turned the key, and grabbed hold of the radio antenna.
11. Every time GM would introduce a new model car buyers would have to learn how to drive all over again because none of the controls would operate in the same manner as the old car.
12. You`d press the «Start» button to shut off the engine
Although you`d get 1000 miles per gallon, you`d still have to spend 20 minutes every other day draining your tank and re-filling it with updated gas 5.0x in order for your car to run properly.»
6. Снова бросаем в Гугл фразу из текста, на этот раз – более точную, но на английском (фактически повторяем первый шаг, но уже не на русском языке). Запрос в Гугл: «If GM had kept up with technology like the computer industry has»
7. Очень быстро получаем документ, который, похоже, отвечает на наш вопрос и представляет собой исследование по такому же поводу, но проведенное за несколько лет до нашего и содержащее эти же факты:
В этом документе под названием «Городские легенды», датированном 1999 годом сказано, что исследуемая шутка появилась не позднее 1997 года и тогда в ней говорилось, что производители компьютеров любят сравнивать себя с Большой Тройкой – производителями автомобилей из Детройта. Сравнение, якобы, проводилось в таком ключе: Если бы технологии автомобилестроения развивались так же, как технологии силиконовой Долины, то можно было бы купить машину, которая развивала бы скорость 10 000 миль в час, или машину, которая проезжала бы на одном галлоне топлива 1000 миль. А де-тройтцы на это отвечали: «А как быть с тем, что такая машина разбивалась бы дважды в день?». Впоследствии произошла замена героев шутки на знаковые фигуры современности: «компьютерная индустрия» была заменена на Билла Гейтса, а «детройтцы» на Дженерал Моторс. Конец исследования. Sprinter Apr 25 2006, 22:50 Но ведь что главное!!! Несмотря на возраст, до сих пор все очень актуально звучит.
Lang Apr 26 2006, 01:50
Но: а вот как выловить источник, запустивший старую шутку в нужное время…
Krendel
По этому поводу мысль. Если даже механически заменить часть слов синонимами, то «мочить» Гейтса со страниц многих JJ можно, и это будет видимостью общественного резонанса. «Люди говорят».:)
CI-KP Apr 26 2006, 09:34
В принципе, в Интернете фигурирует несколько подобных текстов. Они практически одинаковы, но в них могут различаться отдельные слова. Например, где-то написано «Are you sure?», а другой источник в этом же месте пишет: «Вы уверены?». Тем не менее, у меня сложилось впечатление, что путь каждого из этих текстов такой же, как у других. Распространение происходит следующим образом. Совершенно случайно, просматривая нетематическую ветку на тематическом форуме (вроде здешней «Поговорим»), кто-то находит интересный текст. И публикует его на своем блоге. Поскольку в блоге вмонтирована возможность автоматического оповещения о каждом новом сообщении всех друзей, эта информация становится доступной им немедленно. А у них – свои друзья. Это распространяется, как лесной пожар. Затем попадает в рассылки subscribe.ru как часто цитируемое сообщение (во время поиска я видел, что в 2003 году это сообщение было в рассылках. Судя по адресу внизу страницы, приведенной по ссылке , это похоже на 23 декабря 2003 г.). А вот, кстати, и первые возможные жертвы той рассылки, от того же 23.12.2003: #comments
Потом тема постепенно угасает. И так – до новой волны. Такой, например, как рассылка с адресом от 1.08.2005. Вот технология и результаты моего поиска по одному из вариантов текста.
1. Снова возвращаемся к запросу по цитате и разбивкой по датам. Теперь ищем самое новое сообщение по запросу: +Гейтс & +GM ~~ генетически.
Документ свежий – проиндексирован вчера. Правда, он то появляется, то исчезает – видимо, час-пик и кластеры в Яндексе не все отрабатывают. Тем не менее, на момент поиска именно ссылка на блог пользователя davels была первой, поэтому далее с ней и будет проведена работа.
2. Идем непосредственно на страницу и видим, что текст на ней размещен относительно недавно – 31 марта 2006 г.
Внизу этой страницы сказано, что источник – (это сайт, посвященный модемам).
3. Идем на этот источник и обнаруживаем, что «в лоб» проблема не решается (нет на первой странице сайта нужного текста).
Тогда используем оператор поиска внутри этого ресурса по все той же фразе: «Каждый раз, когда изменялась бы разметка на дороге, приходилось бы покупать новый автомобиль» && url=*.
И обнаруживаем ту самую нетематическую ветку на тематическом форуме. Находим, что сообщение, попавшее в печать в конце марта 2006 г., датировано было первоначально 25 Авг, 2005 г. Теперь оцениваем, сколько людей могли сразу увидеть это сообщение после того, как пользователь по имени davels опубликовал его в своем блоге. Для этого отправляемся на страницу, которая содержит информацию о пользователе и всегда есть на Живом Журнале (иногда она называется «User info» или «Профиль пользователя»). Видим:
Друзья:
Люди 175: 0ceanaria, 0ld, 2fst4u, 715, _boxa_, _loving, _lu_, _mushka_, _shaka_, _top_, aaz_2, ace_ humor, acekievua, acid_bunny, actros, alien_now, alik_new, amazi, amelka, antris, anusha, anzzola, argonauta, barbasyaka, barly, beauty_n_beast, benzina, big_star, blinohod, borman_ua, cd102, cfnfyf, crazymonstr, cvetkina, dana_do, davels, dead_cat_dance, ded11, depebo, dezugner, diggya, divine_ tal, dotoshnaya, dr_tibibo, driffire, ekrava, el_heria, elize, enotova, erba, esaulkov, evangelista7sam, falkius, fantomazzz, feel_the_image, fester_ua, g0b1in, garaga, glex, hhhhope, hierba, himena, hindugirl, ibn_sammak, ilishin, iriska, iska, jenshen_, jorjetta, kadjy, kamenev, kastaneda, katrenka_jr, katso, kievbear, kievcat, kiryan, koreffan, krokozyabra, kudryashki_, lara_alety, led_mist, lider_o,
lo_lita, maddcat, max_sv, maxkol, may_b_guilty, maya_melian, mc_xmapa, mercik, mexicanec, miomio, misslead, mitos, mixali4, mjawa, mt6561, murgatroid, mysine, natalia_s, nemoy, neveripe, nezadachya, ng_, ng_photo, nikmurder, nizka, nns_nsn, no_speech, none_smilodon, oll, pashyrey, pautina, pesnya_pesnya, plum_bum, qzzaargh, r0land, rastafari, rastamandita, realcomp, ritta, rrran, sanych, saund, scheglov, schwarze_katze, scorp_ca, sea13, sekildjavka, serduke, sevenova, shefango, sisop, sojuz, spir, stelaria, swarga, syncat, sysval, talmuth, tannen, tarantul7, the_petrovich, thpirt, trafkina, turkut, tutanhamon, umanager, vadim_panov, vadyunya, valerait, validolchik, valkyriya, vasyuchka, veres, vi_u, vincent_no_care, virg, vladius, voffka, wi1dcat, x_lina, xelaskac, xprimus, yanaka, yllw, yrashk, zevana, zireaelka, zmejuka, zmeuka, zo_zo, zomb, zorg_ua Сообщества 72: _ya_sterva_, ad_hardfake, adv_ua, alkogoliki, anekdot, antimult, bierstadt_kiev, brutal_business, dengi_v_kieve, devushki, dirty_anecdotes, e_ru, faine_misto, flash_mob_kiev, foto_zhaba, haliava_ua, hochu_zamuzh, holostyaki, in_kiev, jk18, kiev, kiev09, kiev_flame, kiev_friends, kiev_help, kiev_job, kiev_lj_meeting, kiev_neodin, kiev_realty, kiev_second, kiev_ shopping, kiev_sopli, kievsex, kk_award, kyiv_voice, lost_in_kiev, na_sharu_kiev, nakedparts_ru, otdam_za_minet, otdamsya_darom, otdamsya_kiev, otdamsyazaeblu, polit_adver, ponaehali_ oto, realgirls, relax_kiev, ru_bachelors, ru_bajan, ru_baldurs_gate, ru_bayan, ru_cyniki, ru_nakedparts, ru_piknik, ru_sexy, ru_show_boobs, ru_single, ru_virgins, santabarbara_ua, scooter_ua, sex_and_kiev, shashlik_kiev, t_grad, terno_in_kyiv, ua_bank, ua_friends, ua_ljpromo, ua_maidan, ua_market, ua_production, ua_sex, ukr_nationalism
Транслируемые ленты 1: ua_vacancy
Взаимные друзья 137: 0ceanaria, 0ld, 2fst4u, _loving, _lu_, _mushka_, _shaka_, _top_, aaz_2, acekievua, acid_bunny, actros, alien_now, amazi, amelka, anusha, anzzola, argonauta, barbasyaka, barly, benzina, big_star, blinohod, cd102, cvetkina, dana_do, davels, dead_cat_dance, ded11, depebo, dezugner, diggya, divine_tal, dotoshnaya, dr_tibibo, driffire, ekrava, elize, enotova, erba, esaulkov, fantomazzz, feel_the_image, fester_ua, g0b1in, garaga, glex, hhhhope, hierba, himena, ibn_sammak, ilishin, iriska, jenshen_, jorjetta, kadjy, kamenev, kastaneda, katrenka_ jr, katso, kievcat, koreffan, krokozyabra, kudryashki_, lara_alety, led_mist, lider_o, lo_lita, maddcat, max_sv, maxkol, may_b_guilty, mc_xmapa, mercik, miomio, misslead, mitos, mixali4, mjawa, mt6561, murgatroid, mysine, natalia_s, nemoy, neveripe, nezadachya, ng_, nikmurder, nizka, nns_nsn, none_smilodon, oll, pautina, plum_bum, r0land, rastafari, ritta, sanych, saund, scheglov, schwarze_katze, scorp_ca, sea13, serduke, sevenova, shefango, sisop, spir, stelaria, syncat, sysval, talmuth, tarantul7, the_petrovich, thpirt, trafkina, turkut, tutanhamon, vadyunya, valkyriya, vasyuchka, veres, vi_u, virg, vladius, voffka, xelaskac, xprimus, yanaka, yllw, yrashk, zevana, zireaelka, zmejuka, zmeuka, zo_zo, zorg_ua
Также в друзьях у: 51: 1_6_5, _0_l_0_, _elki_palki, _gand0n_, anahujaaninam, antonavt, ashvatthamany, braveua, d9d11, delphinchick, demonn, dmz_z, dr_azzi, ebalyavas, fiorine, hazy_amber, jur_jur, ka3ahoba_lt, kalbas_nick, kapmah, korg, koxuser, lena_olya, lost_one_d, myba, night_horseman, novy, pahanium, part, procyonlotor, prostofilosof, realavatar, rozabelka, rozha, shlema, shti, silkasoft, simple_voice, smith_zloy, sneg_anxieux, tai_aowen, tanga_cash, taryk, timoha, ukrfan, vvlad, xlxl, xyulo, yanek, zaichonochek, zzzulfiya
Состоит в: 69: ad_hardfake, adv_ua, alkogoliki, anekdot, antimult, bierstadt_kiev, brutal_business, dengi_v_kieve, devushki, dirty_anecdotes, e_ru, faine_misto, flash_mob_kiev, foto_zhaba, haliava_ ua, holostyaki, jk18, kiev, kiev09, kiev_friends, kiev_help, kiev_lj_meeting, kiev_neodin, kiev_photo, kiev_pidor, kiev_realty, kiev_second, kiev_shopping, kiev_sopli, kievsex, kk_award, kyiv_voice, lost_in_kiev, na_sharu_kiev, nakedparts_ru, otdam_za_minet, otdamsya_darom, otdamsya_kiev, otdamsyazaeblu, polit_adver, ponaehali_oto, relax_kiev, ru_bachelors, ru_bajan, ru_baldurs_gate, ru_ bayan, ru_cyniki, ru_piknik, ru_preved, ru_sexy, ru_show_boobs, ru_single, ru_virgins, santabarbara_ ua, scooter_ua, sex_and_kiev, shashlik_kiev, show_your_pussy, t_grad, ua_bank, ua_friends, ua_ ljpromo, ua_maidan, ua_market, ua_polityka, ua_production, ua_sex, ukr_nationalism
Непосредственно на его странице можно перейти по ссылке на каждого из этих друзей и убедиться, что распространение информации между ними может проходить по-настоящему лавинообразно.
Приходим к выводу, что штатовцы, пожалуй, не напрасно допускают возможность атаки со стороны блоггеров, которую придется отражать (статью об этом очень кстати нам показал на этом форуме Albert R. Apr 24 2006, 06:09).
На наш взгляд, из приведенного выше исследования и сопровождавшего его обсуждения видно, что неформальные и состоящие из географически удаленных друг от друга людей сообщества способны играть серьезную роль в распространении информации и в формировании мнения по тем или иным вопросам и что специалисты по работе с информацией отчетливо это понимают.
Запрос по названию компании в контексте продукции, которую она выпускает или продает, а также в контексте позитива в отношении к этой компании
Такие запросы позволяют быть в курсе появления эмоционально окрашенных сообщений положительного свойства о своей или посторонней компании.
Для этого создается запрос, содержащий название организации и такие слова, как «награда», «победа», «успех», «конкурс», «благодарность», «лучший» и т. п. Таким же образом составляются и запросы со словами, которые характеризуют продукцию компании.
Приведем пример соотвествующего поиска по адресу:
Рис. 53. Результаты по запросу о компании «Мегафон» в позитивном контексте.
[+мегафон && +(награда | победа | успех | конкурс | поблагодарил | благодарность | лучший)] результаты которого проиллюстрированы на рис. 53.
Если результатов слишком много, можно исключать те из них, которые уже были просмотрены. Так, например, если запрос модифицировать, убрав из него, в качестве эксперимента, слова «подключение», «ролик», «консультанты», «cамара», «москва»:
Запрос: [+мегафон && +(награда | победа | успех | конкурс | поблагодарил | благодарность | лучший) ~~ (подключение | ролик | консультанты | cамара | москва)]
то итоговая выборка изменится, что отображено на рис. 54.
Рис. 54. Результаты по запросу о компании «Мегафон» в позитивном контексте и без слов «подключение», «ролик», «консультанты», «cамара», «москва».
Кстати, при сравнении двух приведенных выше рисунков становится очевидным довольно распространенный «глюк» Яндекса: количество страниц, как и следовало ожидать, значительно уменьшилось, а вот количество сайтов возросло. Это, как мы уже говорили, связано с тем, что страницы данный поисковик считает точно, а вот сайты – приблизительно.
Запрос по названию компании в контексте «штраф», «суд», «скандал»
Подобные запросы прямо противоположны (разумеется, не по принципиальной своей структуре, а по целям и эмоциональной окраске) тем, которые были описаны в предыдущем разделе. Они позволяют поставить на мониторинг появление соответствующей негативной информации о своей организации или о компании-сопернике.
Обычно в начале работы специалистом конкурентной разведки просматриваются имеющиеся на момент составления запроса сообщения. Затем первые две страницы информационной системы, отсортированные по дате, а не по релевантности, ставятся на мониторинг поисковым роботом, а кроме того по ним производится подписка на «новости» поисковых машин – такие, как «Новости Яндекса» или «Google Alert». Это позволяет впоследствии не тратить время на просмотр всего массива информации, а отслеживать лишь свежие поступления.
Запрос по названию компании в контексте «зарплата», «плохой», «кидают»
Составляется поисковый запрос со словами, которые могут употребляться в отрицательных контекстах, и так же, как в предыдущем случае, ставится на мониторинг. Не следует забывать и о постановке на мониторинг названия организациии вместе с элементами ненормативной лексики. Лучше отследить подобные сообщения самостоятельно и своевременно принять меры, нежели позволить развиться кампании черного пиара, которая вполне может быть организована на основе стихийного (или спланированного и скоординированного) «возмущения клиентов».
Не следует забывать о том, что страницы, содержащие подобную лексику, могут быть перемещены в другие части ресурса или удалены уже после того, как их проиндексирует поисковая машина, но до вашего прихода на сайт. В этом случае надо посмотреть на страницу, сохраненную в кэше. Напомним, что переход на нее в Гугле осуществляется непосредственно со страницы, содержащей выборку по запросу, а в Яндексе – со страницы, на которую переходят, нажав гиперссылку «Найденные слова» под результатами поиска.
Просмотр счетчика посещений сайта
Неочевидный для многих, но иногда крайне полезный ресурс при изучении сайта компании – счетчик посещений этого сайта. Он позволяет отслеживать, сколько посетителей и откуда приходят на сайт, а также участвовать в рейтингах.
Счетчик представляет собой небольшой скрипт, который вписан в текст страницы сайта и передает на сервер своего владельца информацию о том, кто и когда загружал эту страницу. На сервере эта информация обрабатывается, хранится и предоставляется владельцу сайта с установленным по его запросу счетчиком. Обычно этот запрос выглядит как самостоятельное обращение клиента к сайту компании, предоставляющей счетчики.
Как правило, установка самого простого счетчика производится бесплатно. Однако информация, которую он предоставляет, касается лишь количества посетителей и не раскрывает подробностей относительно того, кто они, что делали на сайте, с какой страницы зашли на сайт и на какой странице его покинули.
Для установки счетчика надо просто прийти на сайт системы, которая занимается инсталляцией указанного инструмента, сообщить свою контактную информацию и адрес своего сайта, получить код счетчика с уникальным номером и простым копированием вставить несколько строчек этого кода на свою страницу. Когда каждый новый пользователь посещает ресурс, скрипт, как мы уже говорили, передает информацию об этом в компанию, которой принадлежит. Соответственно, данный инструмент должен быть скопирован в исходный код каждой страницы, иначе те из них, на которых он не установлен, выпадут из поля зрения.
Многие крупные компании пишут счетчики сами либо скрывают их, предпочитая не сообщать посетителям об их наличии (кстати, услуга размещения скрытого счетчика обычно платная, в противном случае удастся скрыть лишь статистику посещений, но не сам факт установки инструмента на странице). Так, у многих крупных компаний – вроде «Кока-Колы» или «Газпрома» – счетчиков не видно.
Однако, несмотря на то, что большинство коммерческих интернет-проектов, а также личных страниц снабжено такими счетчиками, нередко случается так, что компании, заплатившие за предоставление им расширенных статистических данных о популярности их поратала, не считают нужным или просто забывают эти данные скрыть. В результате, информация о посещаемости сайта становится общедоступной.
Для наглядности обратимся к рассмотрению данного вопроса на примере счетчика HotLog (/), распространенного в России. Для начала требуется найти этот скрипт на странице сайта. Сделать это несложно, как правило, достаточно просто «пробежать» страницу.
Внешне счетчик может выглядеть по-разному, в зависимости от того, какой его вариант выбрал владелец ресурса. Сама система HotLog предлагает самые разные варианты внешнего оформления счетчика.
Однако бывают ситуации, когда счетчик увидеть не удается. В этом случае мы рекомендуем открыть просмотр исходного HTML-кода страницы и с помощью поиска, используя клавиши CTRL+F, найти слово «HotLog».
Вот как выглядит счетчик при поиске его через исходный код страницы на сайте Альпклуба МГУ им. Р. В. Хохлова[21] (рис. 55).
Первое же «длинное» число в коде счетчика – это идентификационный номер (ID), по которому и ведется статистика. В случае, приведенном на рисунке, это число «64091», оно отображено в нижней левой его части. Если же счетчик виден на странице сайта, то при наведении на него курсора обычно в нижней части страницы высвечивается тот же номер (непосредственно перед ним стоит вопросительный знак). Сказанное хорошо иллюстрирует рис. 56.
Рис. 55. Счетчик HotLog в исходном коде страницы сайта.
Рис. 56. При наведении курсора на ярлык счетчика, виден идентификационный номер 64091 счетчика HotLog на сайте Альпклуба МГУ им. Р. В. Хохлова.
Узнав, таким образом, ID счетчика, можно отправляться на сайт HotLog. Ресурс предусматривает два вида входа – для владельцев ресурса и гостевой. Первый требует логина и пароля, которые невозможно узнать из открытых источников, а второй предполагает ввод ID, который открытые источники и предоставляют. Если владелец сайта запретит просмотр информации через гостевой вход, система об этом сообщит. А если такие ограничения не накладываются, то любой посетитель получает доступ к статистике посещаемости сайта. Это показано на серии приведенных ниже рисунков (рис. 57, 58).
И, пожалуй, самое важное в статистике, доступной через счетчики, это ip-адреса, с которых пользователи заходят на сайт. В случае, когда исследуется деятельность некоторых коммерческих компаний, эта информация может быть прямым ответом на вопрос: «Как найти клиентов конкурента?».
Наш опыт показывает, что информация о посещаемости сайта по тем или иным причинам находится в открытом доступе очень часто. Нередко это может быть довольно успешно использовано специалистом конкурентной разведки.
Управлять же правами доступа к таким сведениям очень просто – владельцу ресурса достаточно убрать или поставить сответствующую отметку в настройках на сайте компании, предоставляющей счетчики.
Рис. 57. Общее число посетителей и просмотренных страниц, по данным счетчика HotLog, на сайте Альпклуба МГУ им. Р. В. Хохлова.
Рис. 58. Характеристика посетителей сайта Альпклуба МГУ им. Р. В. Хохлова с точки зрения их географической принадлежности, по данным счетчика HotLog
На что обращать внимание при изучении сотрудников конкурента
Специалист конкурентной разведки должен держать в поле своего зрения ключевых сотрудников компаний и учреждений, способных оказать положительное или отрицательное влияние на деятельность определенного предприятия. Это делается для того, чтобы иметь возможность при необходимости предсказать поступки тех или иных людей, а также знать, к какому подходу прибегнуть дабы, в случае необходимости, получить у них нужную информацию или провести в отношении них активные мероприятия.
По мнению Лари Каханера (Larry Kahaner),[22] существует три ключевых элемента, которые определяют действия каждого руководителя в конкретной ситуации:
– прошлый опыт;
– темперамент;
– окружение.
Прошлый опыт значим потому, что каждый человек стремится к повторению того стиля поведения, который в прошлом приводил его к успеху. И наоборот, предпочитает избегать повторения прошлых ошибок, в особенности – недавних.
Как отмечал Каханер, в ряде случаев специалисты конкурентной разведки могут предсказать, что человек, добивавшийся успеха в одной компании, не сможет преуспеть в другой, поскольку организации – старая и новая – принципиально отличаются друг от друга. При этом Каханер приводил пример Джона Скалли (John Sculley), перешедшего из PepsiCO в Apple. Недолговечность пребывания Скалли на новом посту предвидело большинство специалистов уже в момент вступления того в новую должность. Их прогнозы основывались на оценке его личности по приведенной здесь методике конкурентной разведки.
Темперамент человека предопределяет выбор им наилучшего (на его взгляд) варианта из нескольких возможных. По мнению Каханера, агрессивная личность, хвастун, любитель риска или консерватор поступят каждый по-своему. Причем, известно, что темперамент редко меняется со временем, и это обстоятельство позволяет достаточно точно прогнозировать поведение человека в той или иной конкретной ситуации.
Если прочитать интервью, которые давал человек, и рассказы о нем других людей, то картина прояснится еще больше. Однако это справедливо лишь для достаточно схожих ситуаций. Резкое изменение статуса человека или его окружения может оказать значительное влияние на его поведение. Общеизвестно, что карьерный рост, в особенности, внезапный, может резко изменить человека, и специалист конкурентной разведки должен помнить об этом, делая свои прогнозы. Подобное наблюдается достаточно часто, особенно когда рядовой сотрудник вдруг, неожиданно для всех становится начальником.
Окружение человека. С каким кругом людей у изучаемого человека в его компании поддерживаются отношения? С какими барьерами он сталкивается в ходе работы и как обычно эти барьеры преодолевает?
Лари Каханер говорит, что специалиста по конкурентной разведке, помимо трех базовых факторов, должна интересовать следующая информация о руководителях изучаемой организации:
– карьерная история;
– политические пристрастия;
– семейный «тыл»;
– любимые занятия;
– щедрый или скупой;
– что любит, а что не любит;
– хобби;
– личные причуды.
Знание этих особенностей руководителей конкурента может оказаться очень полезным для того, чтобы предсказать, какое они примут решение в той или иной ситуации и куда поведут компанию. Особенно важно знание личностных особенностей руководителей в случае, если обстоятельства, в которых эти руководители оказались, отличаются от тех, в которых им доводилось оказываться прежде. Начальник – живой человек, а потому, даже принимая решение в новой для себя обстановке, он все равно будет поступать в соответствии с тем, каковы его личностные особенности. А значит, он предсказуем.
Правда, такой подход нужен не всегда, а только при работе с «основным противником». Связано это с тем, что сбор и осмысление информации о личности человека требует значительных затрат времени и сил. В отношении «топов» остальных конкурентов или стратегических партнеров достаточно базы данных с именами, должностями и телефонами. Однако при переходе какой-то компании в разряд «основного противника» список пристально изучаемых персон должен непременно пополниться руководителями этой организации.
Кроме того, при сборе информации по открытым источникам, Лари Каханер рекомендует сосредоточить усилия на следующих мероприятиях:
– установить связи компании с властями;
– установить аффилированных с компанией лиц;
– исследовать негативную информацию о компании;
– определить активы компании;
– установить названия, под которыми компания работала раньше;
– установить, кто на самом деле владеет компанией.
Как увидеть появление в Интернете новой информации о своем предприятии
Для того чтобы контролировать ситуацию с информацией о собственной компании в сети, следует составить поисковые запросы о ней точно так же, как мы предлагали делать это для изучения чужих организаций. После того, как подобная работа будет проделана, рекомендуем поставить эти запросы на мониторинг (для Яндекса).
Отсортировать результаты запроса по релевантности и поставить на мониторинг первые пять страниц (это позволит быть в курсе всей основной доступной пользователям поисковых систем информации).
Отсортировать результаты запроса по дате и поставить на мониторинг первые две страницы (это позволит видеть все новые сообщения).
Поставить на мониторинг первые пять страниц при сортировке результатов по релевантности для «простых» (непрофессионально сформулированных) запросов – как их составил бы неподготовленный человек.
При изменении оперативной обстановки составлять специальные запросы – такие, как, например, упоминание компании в одном документе с какой-то конкретной фамилией или определенным названием.
Кроме того, для Гугла следует поставить аналогичные запросы на мониторинг по релевантности, а также по дате с помощью Google Alert.
Надо отметить, что подобные меры неоднократно помогали нам выявлять начало информационной войны уже через несколько часов после того, как соответствующие сведения становились доступными через поисковые системы. Это позволяло оперативно отреагировать на угрозу, что примерно в половине случаев приводило к отказу от продолжения атаки со стороны недоброжелателей, а в остальных – своевременно начинать юридическое преследование правонарушителя.
Как обнаружить присутствие в Интернете информации о своих сотрудниках и о сотрудниках конкурента
Сотрудники компаний могут быть обнаружены в Интернете при поиске по трем разным направлениям.
1. По данным, связанным с названием компании:
– при мониторинге по названию организации;
– при мониторинге по доменному имени в адресах электронной почты;
– при мониторинге сайта компании по оператору Link;
– при мониторинге появления резюме специалистов на веб-сайтах, посвященных поиску работы.
2. По данным, найденным при исследовании материалов, связанных с названием компании:
– при поиске по номерам телефонов организации;
– при поиске по названиям поставщиков или клиентов компании;
– при поиске по названиям ее продукции или услуг.
3. По имени конкретных людей (когда прицельно ищут определенных специалистов).
Как использовать информацию из Интернета для поддержки маркетинговых исследований, повышения клиентоориентированности компании и контрпропаганды
Интернет как индикатор настроения клиентов, инструмент для сбора их мнений и средство влияния на мнение клиентов
Специалист конкурентной разведки может использовать профессиональный поиск в Интернете для того, чтобы выяснить реальное отношение клиентов.
В случае, когда речь идет о широко распространенных товарах или услугах (таких, как автомобили, фотоаппараты или сотовая связь), хорошую службу в этом вопросе могут сослужить форумы и дискуссионные группы, где люди обмениваются своими мнениями. Эти площадки можно считать достаточно объективным источником информации, если продукт действительно массовый и его обсуждение представлено широко. Дело в том, что в пределах небольшого форума всегда существует возможность применения технологии, именуемой некоторыми специалистами «киберфутболом». Суть ее заключается в том, что группа людей под разными именами (никами) выстраивает дискуссию нужным ей образом. Применение технологии киберфутбола позволяет, в принципе, до неузнаваемости изменить мнение о продукте.
Однако вряд ли у какой-то компании окажется достаточно ресурсов, да и просто желания отслеживать сотни форумов и устраивать управляемое искажение информации на каждом из них. Тем более, что многие сообщества форумчан представляют собой вполне сложившиеся группы, члены которой нередко знакомые друг с другом лично, и они просто не допустят подобного манипулирования на своей территории. Именно поэтому точки зрения, высказываемые при массовом обсуждении каких-то вопросов на форумах различными дискуссионными командами, достаточно объективны. Для получения объективной картины главное – чтобы форумы, принимаемые во внимание в качестве источников информации, не были связаны между собой ни географически, ни по составу участников.
Надо сказать, что технология киберфутбола, если ее применить своевременно, может быть серьезным орудием контрпропаганды и борьбы с черным пиаром. Нам приходится периодически выступать на стороне компаний, против которых разворачивается борьба на интернет-форумах. Практика показывает, что чаще всего для развертывания кампании черного пиара противник использует стихийно возникающее недовольство одного-двух человек и начинает дополнять их высказывания собственными заявлениями, которые порой значительно уводят разговор от первоначальной темы, но неизменно представляют жертву в роли монстра, пренебрегающего интересами клиентов. Группа «киберфутболистов», противопоставляя противнику по сути его же методику, способна дать отпор агрессорам.
Наши наблюдения за рядом форумов показали, что чаще всего успех приносит тактика «киберфутболистов», которая заключается в развернутой аргументации альтернативной точки зрения, а также в поиске нестыковок и нелогичности в текстах оппонентов и озвучивание этих нестыковок. Это можно удачно дополнить высмеиванием оппонентов и цитированием их собственных диаметрально противоположных высказываний в прошлом, найденных с помощью встроенного в форум поиска или с помощью поисковиков в Интернете. Неплохо срабатывает и тактика использования персонажа, который сначала якобы выступает на стороне противника (это приводит к тому, что противник высказывает все свои аргументы за короткое время и затем ему просто не остается возможности для маневра, и нечего говорить). Затем персонаж переходит на сторону «киберфутболистов» и нередко при этом перетягивает за собой часть сторонников напавшей соперника.
Сбор информации о том, что конкурент утаивает о своем продукте
Преимущества продукции конкурентов, как истинные, так и надуманные, обычно отражены в их рекламных буклетах. А вот знание недостатков их товаров или услуг порой помогает компании правильно выстроить собственную маркетинговую политику. Ведь в большинстве случаев значительно выгоднее избежать прямого столкновения с бизнес-противником, акцентируя внимание потребителей на своих уникальных плюсах, а не на общих с конкурирующим продуктом свойствах.
Знание слабых сторон товаров оппонента позволяет, не упоминая о них прямо, завоевать ту аудиторию, которая ими недовольна.
Поскольку изъяны можно найти у любого изделия и любой услуги, а производитель никогда не станет их афишировать, сосредоточившись на том, чтобы подчеркнуть достоинства, важно правильно недостатки конкурирующих продуктов идентифицировать. Вот как описано это в нашей книге «Конкурентная разведка: маркетинг рисков и возможностей», которая была опубликована в конце 2005 г.
Дискуссионные группы оказываются мощным инструментом конкурентной разведки, особенно когда стоит задача выяснить слабости того или иного продукта.
Вот, например, какую информацию можно получить, сравнив высказывания о недостатках двух конкурирующих моделей фотоаппаратов ведущих мировых производителей – Sony DSC F828 и Canon PowerShot Pro1. Не вызывает сомнений, что обе они хороши. Преимущества каждой из моделей подробно описаны в рекламных проспектах. Но и недостатки тоже есть. Чтобы о них узнать, надо выяснить мнение пользователей и независимых исследователей в Интернете о фотоаппаратах Sony DSC F828 и Canon PowerShot Pro1. В Яндекс были введены следующие поисковые строки:
+(«sony» +«828») +(мнение | форум | общение | отзыв | рекламация | рекомендация | недостаток | тест | обзор | сравнение | минусы)
и
+(«powershot» +«pro1») +(мнение | форум | общение | отзыв | рекламация | рекомендация | недостаток | тест | обзор | сравнение | минусы).
В результате мы получили следующую картину (табл. 2), причем во внимание принимались лишь повторяющиеся в разных источниках сведения.
Таблица 2
Недостатки двух популярных моделей фотоаппаратов.
Значение дискуссионных групп для конкурентной разведки становится еще более понятным, если к сказанному добавить, что архивы этих форумов хранятся десять лет и за этот период можно сделать выборку по всем высказываниям любого участника интернет-сооюбщества. Более того, люди обычно забывают, о чем они говорили и что делали несколько лет назад, поэтому о тех, кто постоянно участвует в форумах и пользуется постоянными никами либо любит указывать в регистрационных данных номер ICQ, со временем можно собрать немало информации – включая номера домашнего и мобильного телефонов, географию поездок, личные фотографии и многое другое.
В Сети на момент написания книги насчитывалось около 120 000 дискуссионных групп.
Помимо форумов интерес для специалиста конкурентной разведки представляют и публикации. Однако, учитывая, что многие материалы, в том числе и так называемые «независимые обзоры», ангажированы в той или иной степени, следует делать поправку на то, в какую сторону и в какой степени может быть искажена информация.
Автоматизированные системы анализа сообщений в Интернете, а также оценки негатива/позитива в публикациях
Поскольку крупным компаниям требуется анализировать большие массивы информации, и при этом они не только финансово способны, но и психологически готовы тратить на автоматизацию такого анализа деньги, на рынок выведены программы, способные обеспечить серьезным копорациям автоматизированный сбор, анализ и хранение документов, опубликованных в Интернете.
Часто для полноценного овладения этими инструментами требуется специальное обучение оператора, поэтому мы не будем подробно рассказывать о каждом из подобных ресурсов, а лишь дадим описание основных возможностей каждой из программ. Те из читателей, которые захотят ознакомиться с ними полнее, смогут сделать это самостоятельно, на основе приведенной здесь краткой информации.
Сразу хотим отметить, что, изучив вопрос, мы пришли к следующему выводу: рассматриваемое программное обеспечение при сегодняшнем уровне развития техники способно выполнить за человека рутинную работу по нахождению, сбору и сортировке информации, но никоим образом не может заменить аналитика.
Вся информация, приведенная ниже, взята нами на сайте -pro.ru.
Информационно-аналитическая система «Семантический архив»
Информационно-аналитическая система «Семантический архив» разработана компанией «Аналитические бизнес решения».
Она предназначена для автоматизации деятельности соответствующих служб коммерческих организаций и государственных структур различного профиля.
Система позволяет организовывать сбор текстовой информации из открытых источников (электронные СМИ, аналитические отчеты экспертов), осуществлять их обработку, эффективное хранение, проведение анализа и генерацию.
ИАС «Семантический архив» предоставляет аналитикам возможность создавать формальные досье на различные объекты мониторинга – персоны, компании, государственные структуры, а также хранить описания их взаимоотношений и событий, происходивших с ними. Часть таких описаний может иметь ссылки на текстовые материалы, в которых, собственно, и упоминалось о конкретных фактах.
«Галактика Zoom»
Галактика ZOOM решает следующие задачи:
– поиск сведений о требуемом объекте в текстовых информационных массивах;
– выделение наиболее значимых факторов, идентифицирующих объект, из большого объема полученных данных;
– экспресс-анализ больших предметных областей с выделением ключевых объектов, понятий, их связей и признаков;
– классификация информации по определенным темам с возможностью оперативного задания нужной темы и дальнейшей ее быстрой и гибкой коррекции;
– увеличение производительности коллективной аналитической обработки неструктурированных и слабоструктурированных текстовых материалов.
Информационно-мониторинговая система «Web-Observer»
Информационно-мониторинговая система предназначена для автоматического сбора, структурирования и первичной обработки информационных сообщений, публикуемых в интернет-источниках и приходящих на электронные адреса в качестве виртуальных почтовых рассылок.
Программный комплекс «Intellectum.BIS»
Основное предназначение продукта – обеспечение экспертов-маркетологов и аналитиков инструментарием обработки информации для выполнения бизнес-исследований в целях обеспечения информацией руководства для принятия управленческих решений.
Это средство анализа документов различного содержания (СМИ, новости с веб-ресурсов, базы данных на интересующие темы – внешне-экономическая деятельность, грузоперевозки, статистика и т. д.). Основное отличительное свойство данного программного продукта – возможность его использования не только в пределах организации, но и on-line сторонними лицами, подключенными к базе данных предприятия посредством Интернет, dial-up и других видов удаленного доступа.
В поисковую машину системы заложены возможности задания условий запроса с использованием логических выражений и осуществления операций поиска с использованием морфологического словаря и словаря синонимов.
RCO Fact Extractor
RCO Fact Extractor – это интеллектуальная программа для компьютерного анализа текста на русском языке, которая находит в нем описания фактов нужного типа, например, «встречи», «договоренности», «приобретение собственности», классифицирует и упорядочивает их. Основная сфера приложения программы – аналитические задачи из области компьютерной разведки, требующие высокоточного поиска информации, например, автоматический подбор материала к досье на целевой объект или мониторинг определенных сторон его активности, освещаемых в СМИ. «Fact Extractor» воплотил в себе наиболее продвинутые технологии искусственного интеллекта, разработанные в компании «Гарант-Парк-Интернет», которая известна своими решениями в области компьютерной лингвистики (). Помимо собственно программы с графическим интерфейсом для Windows, фирма выпускает динамическую библиотеку для разработчиков (SDK), на базе которой построен «Fact Extractor» и которая позволяет включать возможности анализа текста в собственные приложения.
Программа позволяет обрабатывать документы в популярных текстовых форматах из различных источников – файловой системы, базы данных, заданных web-сайтов.
ИАС «Астарта»
ИАС «Астарта» предназначена, прежде всего, для тех подразделений компаний, деятельность которых связана со стратегическим планированием, маркетингом, обработкой и анализом большого объема текстовых файлов. Это аналитические службы организаций и государственных структур, издательства и информационные агентства, правоохранительные органы и службы безопасности. В современном бизнесе «Астарта» применяется в качестве аналитической системы поддержки принятия решений и мониторинга данных.
Программный комплекс ИАС «Астарта» успешно решает следующие задачи:
– непрерывный информационный мониторинг внешней среды предприятия (анализируются, систематизируются и аккумулируются текущие и архивные данные по актуальным для компании проблемам касаемо рынков сырья и комплектующих, развития технологий и продуктов в отрасли, информации о конкурентах и потребителях, отраслевой законодательной информации и т. д., причем тематика и состав рубрик формируются самим пользователем);
– тематическая фильтрация информации (такие задачи возникают в случае необходимости построения подборок по заданному вопросу).
Информационно-программный комплекс «Тренд»
ИПК «Тренд» позволяет:
– производить исследования интересующих объектов и процессов;
– прогнозировать изменения в их состоянии на период до двух месяцев с вероятностью более 63 % на основе сравнения информационных образов объектов и процессов, получаемых из потоков любых текстовых сообщений (в том числе СМИ), с эталонными информационными образами (фильтрами) позиций исследования.
Программа GetNews
Мы вынесли эту программу в отдельный раздел потому, что, имея достаточно серьезные технические возможности, она, тем не менее, доступна по цене предприятию любого размера и даже физическим лицам. Стоимость программы – порядка 25 евро. По нашим данным, ее используют даже очень крупные компании. Сорокадневная триал-версия позволяет однозначно сделать вывод о востребованностии GetNews. Вот описание программы, взятое с ее сайта http:// :
К несомненным плюсам программы можно отнести тот факт, что она позволяет автоматически загрузить весьма внушительный перечень готовых и настроенных каналов.[23]
Более того, авторы GetNews заявляют, что готовы создать для заказчика канал по его запросу.
На наш взгляд, программа в ее нынешнем виде представляет большой интерес для специалистов конкурентной разведки на предприятии любого масштаба.
Как конкурентная разведка может закрыть «разрыв» между отделом продаж и отделом маркетинга
Навыки специалиста конкурентной разведки профессионально работать с Интернетом, как показал наш опыт, играют важную роль в этом вопросе.
Отдел продаж компании принципиально отличается от остальных внутренних клиентов конкурентной разведки тем, что по своей природе это тактическое подразделение, что накладывает отпечаток на взаимодействие с ним указанных органов.
Отдел продаж не интересуется стратегией по объективным причинам. Он находится на «передовой»: взаимодействует как с клиентами, так и с конкурентами – через сравнение продуктов компании, предлагаемых клиентам, с продуктами других фирм.
Более того, в отличие, скажем, от маркетологов, которые мыслят категориями стратегическими – например, категориями сегментации, «портрета типичного клиента» и т. п. – представители данного направления видят в каждом потребителе личность.
Для «продажников» клиент – это не компания, а люди, в ней работающие. И основное желание сотрудника рассматриваемого отдела – сделать так, чтобы общение с потребителем закончилось сделкой, причем как можно более дорогостоящей, да еще и в максимально короткие сроки.
В какой-то степени, это повсеместное взаимное недопонимание между маркетологами и «продажниками» можно сравнить с отношениями командиров полевого подразделения и штабных офицеров.
Поскольку «наш» отдел продаж и такие же отделы конкурентов борются за одно и то же, на той же территории и в одинаковых условиях, попытка «наших» сотрудников выполнить свою задачу наталкивается на ряд типичных проблем.
Рассмотрим более подробно, какие проблемы и как именно может решить служба конкурентной разведки с помощью Интернета в интересах отдела сбыта.
1. Постоянное выявление будущих клиентов, отслеживание цен, анализ трендов движения рынка, законодательной и конкурентной ситуации в отрасли.
Эта информация собирается с помощью программ мониторинга Сети посредством поисковых запросов, а также изучения IP-адресов при анализе открытой информации о посетителях сайта конкурентов или отраслевых ресурсов.
2. Оказание помощи отделу продаж в правильном позиционировании товара в рамках презентации его клиентам.
Мы достаточно подробно рассмотрели этот вопрос, когда говорили об использовании дискуссионных групп при изучении продукции массового спроса.
3. Консультирование отдела продаж на предмет того, где лучше разворачивать деятельность на первых порах, при принятии стратегического решения о начале экспансии на новую территорию.
В этом вопросе также может оказаться полезной информация, которая нередко содержится на интернет-площадках различных дискуссионных групп. В некоторых отраслях, в частности, связанных с оказанием услуг в сфере высоких технологий, использование мнения таких групп бывает очень эффективным.
Так, например, при вхождении некой федеральной сотовой компании в один из регионов России, она безошибочно выбрала именно те районы, в которых ее основной конкурент весьма слаб.
Нам не известно достоверно, каким был механизм принятия решений в том конкретном случае, но мы знаем, что служба конкурентной разведки в течение одного рабочего дня способна составить полный перечень районов города и отдельных населенных пунктов, готовых упасть в руки любому, кто предоставит им нормальную связь.
Суммируя вышесказанное, можно заключить, что служба конкурентной разведки при умелом использовании ее в тактических целях, может полноценно восполнить пробел в цепи «маркетинг-сбыт» и обеспечить синергетический эффект их работы. «Подружить» эти отделы вряд ли получится, однако помочь компании достичь лучших результатов, организовав необидное для обоих направлений взаимодействие друг с другом, указанная служба действительно может.
Платные ресурсы Интернета против бесплатных
Помимо бесплатных, в Интернете есть и такие ресурсы, доступ к которым предоставляется на платной основе. Число документов в бесплатной части Интернета непрерывно увеличивается, а, кроме того, увеличивается количество пользователей платных ресурсов, поэтому возможность найти нужный документ в бесплатном доступе становится все более реальной. Соответственно, стоимость доступа к платным ресурсам неуклонно снижается.
Какие же ресурсы лучше – платные или бесплатные? На сегодня преобладает точка зрения, что тратить деньги на первые целесообразно в тех случаях, когда после исследования бесплатной информации однозначого ответа на вопросы не получено. Либо когда в бесплатном доступе вообще нельзя найти нужный документ.
Ситуацию соотношения платных и бесплатных ресурсов очень образно объясняют на семинарах канадской тренинговой компании при Academia Competia. Представьте себе, что вы сравниваете рыбу, которая плавает в океане, и ту, которая находится на борту рыболовного судна, где она рассортирована по видам и размерам. Несомненно, в океане рыбы значительно больше. Но и выгоды от работы с той, что уже на борту, тоже очевидны.
Коммерческие базы данных помогают уточнить информацию, так как они дают возможность быстро найти статьи одновременно из разных источников. А кроме того, однозначно указывают, что это за источники. Это позволяет без лишних затрат времени провести сравнение данных, решив при этом одну из главных проблем Интернета – сложности в определении авторства материала и даты публикации.
Недостатки платных ресурсов – это необходимость расставаться с деньгами и относительно небольшой объем документов, включенных в базу данных конкретного ресурса. Так, например, информация о Ющуке Евгении Леонидовиче в январе 2006 г. в бесплатном Интернете была представлена примерно на 300 сайтах, а в платном – в частности, на ресурсе «Артефакт» – она содержала ссылки всего на три статьи, опубликованные в разное время в журнале «Sales Business/Продажи». Однако эти три статьи были приведены полностью и доступны любому желающему в любое время, тогда как самим журналом в бумажном варианте они распространялись лишь по подписке, а в электронном виде не распространялись вообще. Таким образом, «Артефакт» был единственным местом, позволявшим через Интернет получить доступ к полному тексту документов, но при этом больше никакой информации о Ющуке Евгении Леонидовиче не содержал.
Один из самых знаменитых платных ресурсов на Западе – это LEXIS®-NEXIS®.[24] Специалисты конкурентной разведки всего мира широко работают с этой системой, однако некоторые отмечают, что материалов в ней так много, что без навыков использования языка запросов, основанного на Булевой алгебре, найти что-либо в новостях LEXIS®-NEXIS® трудно: слишком много информационного «шума».
Помимо LEXIS®-NEXIS® практики конкурентной разведки обычно дают высокую оценку сервису Thompson Dialog.[25] В частоности, они отмечают, что тематические новости от Thompson Dialog в ряде случаев организованы лучше, чем в LEXIS®-NEXIS®.
Отечественные системы можно оценить, например, на сайтах (система «Артефакт») или (система «Кронос плюс»).
Кроме того, всякий раз, работая с онлайновыми источниками, необходимо помнить, что не все ресурсы Интернета равноценны по степени достоверности. Когда специалист конкурентной разведки начинает работать с информацией, представленной в Сети, ему, прежде всего, следует посмотреть, откуда эта информация взята. Если она размещена на сайте известного новостного ресурса или государственного органа – это одно. Если же ее источником служит «Личная страничка Пети Иванова» на narod.ru – это другое. Хотя обращение к личным страницам, как мы уже говорили, может быть и очень полезным: правда, в таком случае они должны принадлежать человеку, который интересен как источник достоверных и нужных сведений.
Ну, и не стоит забывать, что бесплатные ресурсы могут перестать быть бесплатными или вовсе убрать информацию с сайта. Первое можно увидеть на примере ресурса Public.ru, который долгое время баловал пользователей открытым доступом к документам в своей базе данных, после чего сделал его платным. Примерно та же ситуация порой складывается и с некоторыми журналами, которые пару недель позволяют читать информацию в бесплатном доступе, а затем переносят ее в архив, откуда ее можно получить уже только за деньги.
Второе прослеживается на примере страниц с новостями, которые нередко просто стирают и записывают на освободившееся место свежие материалы, при этом далеко не всегда сохраняя стертое в архиве.
Интересно, что бывает и обратный процесс – когда платные ресурсы становятся бесплатными. Так, некоторые журналы делают свободным доступ к своим номерам, спустя, скажем, два месяца после их выхода, а до этого с ним, разумеется, могут ознакомить лишь заплатившие за это пользователи.
Сравнение платных и бесплатных ресурсов, по Helen Burwell,[26] приведено в табл. 3.
Таблица 3 Сравнение платных и бесплатных ресурсов.
Артур Вайс[27] приводит такое сравнение платных и бесплатных ресурсов Интернета (табл. 4).
Таблица 4
Преимущества платных и бесплатных сетевых ресурсов.
Как искать в Интернете информацию о конкретных людях
В русскоязычном Интернете информация о людях может быть найдена либо с помощью поисковых систем, либо с помощью телефонных онлайн-справочников.
В информационные системы вводится запрос, который должен содержать фамилию и варианты написания имени и отчества. Дабы исключить возможное взаимное недопонимание с реальным человеком, на примере которого будет объясняться эта разновидность поиска, обратимся к запросу данных о Ющуке Евгении Леонидовиче.
Для того, чтобы составить такой запрос сначала требуется указать все варианты написания его имени. Варианты написания имени Ющука Евгения Леонидовича могут быть следующими:
Ющук Евгений Леонидович, Ющук Евгений, Ющук Е., Ющук Е. Л.
а также в иной последовательности:
Евгений Леонидович Ющук, Евгений Ющук, Е. Ющук, Е. Л. Ющук.
Некоторые специалисты иногда включают в запрос и такое написание имени, как:
Евгений Л. Ющук.
Поскольку слово «Ющук» всякий раз повторяется, а имя или инициалы расположены непосредственно рядом с фамилией, то для Яндекса подобный запрос, позволяющий поставить на мониторинг информацию об этом человеке, может выглядеть следующим образом:
[+ющук /1 +(евгений | «евгенй леонидович» | «е.л.» | «е»)]
Затем из результатов поиска исключается информационный «мусор».
Важно, что при этом следует выбирать слова, которые с небольшой вероятностью могут встречаться в документах, имеющих отношение к искомой личности. Особенно важно соблюдать это правило, когда слово исключается из всего документа, а не из предложения. Проблема в том, что при изучении человека, информации о котором у исследователя немного, бывает достаточно сложно априори знать, какие слова имеют к нему отношение с большей долей вероятности, а какие – с меньшей. А усугубляется все тем, что если какие-то слова не встречаются в документе с информацией об искомой персоне сегодня, то они могут появиться в нем завтра. И это важно при постановке запроса на мониторинг, поскольку может получиться так, что исследователь случайно исключит из результатов поиска по-настоящему важный материал.
Мы бы рекомендовали в такой неопределенной ситуации прием, который доказал на практике свою эффективность. При получении в выдаче документа, вызывающего сомнения, не надо в поиске слов для исключения ограничиваться сниппетами. Советуем открыть весь материал и поискать слова для исключения непосредственно в его тексте. Напомним, что сниппеты – это те несколько строк, которые приводятся в результатах запроса для того, чтобы помочь исследователю сориентироваться в содержимом документа. Неопытные пользователи забывают о возможности открыть материал и пытаются из сниппетов, которые находятся у них перед глазами, выудить такие слова – и совершают ошибку.
Так, например при поиске по указанному поисковому запросу по Ющуку Евгению Леонидовичу в сниппеты попадает такой текст:
«… Генерал-майор.? 6549. ЧЕРТОК. Абрам. Гершанович. Генерал-майор артиллерии.? 6550…».
На первый взгляд, логично удалить с помощью логического «НЕ» слово «генерал». Однако в принципе возможно появление документов, где Ющук Е. Л. упоминается вместе с этим словом. Например, в предыдущей нашей книге «Конкурентная разведка: маркетинг рисков и возможностей» указано, что ее научный консультант – генерал Службы Внешней разведки России в отставке Ющук Ростислав Васильевич. И хотя на момент написания книги в Интернете этой информации не было, нельзя отказываться от вероятности ее появление в принципе. Таким образом, если исключить из выдачи документы, содержащие слово «генерал», результаты будут неполными, потому что это слово все-таки достаточно распространено в обыденной речи.
Во избежание подобной ситуации, мы и рекомендуем не ограничиваться прочтением нескольких строк сниппетов, а открывать текст документа и искать в нем слова, которые при их удалении, вероятнее всего, не приведут к потере информации об исследуемом человеке. Универсального рецепта здесь не существует, решение зависит от того, какой конкретно вопрос исследуется.
Так, выяснилось, что в документе, который содержал сниппеты:
«.. Генерал-майор.? 6549. ЧЕРТОК. Абрам. Гершанович. Генерал-майор артиллерии.?
6550…», —
после его открытия оказался, в частности, такой текст:
ФЕДЮНИНСКИЙ Иван Иванович Генерал армии
ФЕДЮНЬКИН Иван Федорович Генерал-майор
ФЕДЮНЬКИН Иван Федорович Генерал-лейтенант
ФЕКЛЕНКО Николай Владимирович Генерал-майор танковых войск
ФЕКЛЕНКО Николай Владимирович Генерал-лейтенант танковых войск
ФЕЛЬДМАН Моисей Исаакович Генерал-майор технических войск
На наш взгляд, в данном случае правильнее было бы исключить документы, содержащие в любом месте текста слово «ФЕДЮНЬКИН» или «ФЕКЛЕНКО». Это относительно редкие фамилии, поэтому с высокой степенью вероятности можно предположить, что их удаление из результатов поиска не приведет к отрицательным последствиям. Однако если потребуется убедиться в том, что это действительно так, можно сделать проверочный запрос:
[+ющук && +фекленко]
В результате было найдено два сайта, имеющих отношение к человеку по имени И. И. Ющук. Подобная проверка лишний раз доказала, что слово для исключения из выдачи было выбрано верно, по крайней мере, на момент составления запроса. С этой точки зрения, кстати, подошло бы и слово «Гершанович», которое присутствовало в сниппетах, но часто бывает так, что в них не оказывается редко употребляемых слов и для иллюстрации решения проблемы мы дали здесь более развернутые рекомендации и примеры.
При поиске персон в иностранных сегментах Интернета лучше обращаться к так называемым «Белым страницам» (White Pages), которые по своей сути ближе всего к телефонному справочнику.
Самый простой способ найти, например, «Белые страницы» Лондона – это ввести в поисковую строку Гугла запрос:
[white pages london]
В результатах, полученных по этому запросу, содержатся страницы с формами, в которые требуется ввести такие параметры, как имя, фамилия, адрес или номер телефона человека. По любому из них можно получить результаты, содержащие все остальные параметры. То есть, появятся имена всех, кто живет по указанному адресу, или будет определен владелец телефона по его номеру.
Специалисты, проработавшие за рубежом в отечественной государственной разведке несколько десятилетий, отмечают, что система занесения информации о том, где кто фактически живет, на Западе работает очень эффективно. Например, даже в отсутствие института регистрации («прописки»), уже через неделю после вселения в арендованную квартиру человек начинает получать по почте рекламные объявления, адресованные лично ему. Таким образом, как показала практика, «Белые страницы» – достаточно ценный ресурс, данные которого поддерживаются в актуальном состоянии. Поэтому западные специалисты конкурентной разведки рекомендуют пользоваться именно этим источником для поиска контактной информации конкретных людей.
Как искать информацию о компаниях
Источниками информации о компании в Интернете могут выступать самые разные ресурсы. Многие из них были подробно исследованы в предыдущих разделах, поэтому здесь мы их лишь перечислим. Однако тех, о которых ранее не говорилось мы расмотрим более детально. Именно этим обстоятельством, а не фактической ценностью того или иного ресурса определяется разное количество информации по каждому пункту, приведенному ниже. А что касается фактической ценности источников, то заранее невозможно предугадать, какой из них окажется более полезным, а какой – менее.
1. Изучение сайта компании.
Поиск сайта компании, адрес которого неизвестен, мы рекомендуем начинать с ввода названия организации в строку запроса Гугла и анализа первой страницы результатов выдачи. Если это ни к чему не приводит, то продолжать поиски имеет смысл путем составления запросов в поисковые системы.
2. Составление поисковых запросов в поисковые машины.
В качестве ключевых слов используются название компании, а также любой фрагмент информации, который будет найден в процессе поиска. К таким фрагментам обычно относятся номера телефонов, имена людей, координаты электронной почты, физические адреса.
Рекомендуем принять за правило: обнаружение слов, которые могут быть использованы как ключевые, должно вести к созданию новых или модификации существующих запросов с использованием этих слов.
На каждом этапе поиска специалист конкурентной разведки может найти какую-то новую информацию, после чего начинает составлять запрос уже по этой находке. Таким образом, иногда, подобно тому, как с одной ниточки происходит разматывание всего клубка, осуществляются и поиск, и дальнейшая перепроверка информации.
3. Служба «адреса» в Яндексе.
Об этой службе мы уже говорили, поэтому не будем повторяться.
4. Запрос в компании, специализирующиеся на поставках информации о предприятиях.
Диапазон возможностей в таком случае достаточно широк. Можно обратиться в российские компании, которые предоставляют услуги по конкурентной разведке. Либо в такие структуры, которые обеспечивают клиентов комплексной информацией о любой организации, в какой бы стране она ни находилась. Наиболее интересная фирма второго типа, на наш взгляд, – Dun & Bradstreet (www. dnb.ru и ). Она работает с 1841 г. На сегодня компания располагает глобальной базой по юридическим лицам и представительствам практически во всех развитых странах. Вкупе с более чем 150-летней репутацией, это позволяет организации в течение от 3–8 дней до 15 дней (по оффшорам) подготовить справку по предприятию. При этом очень интересен сам принцип ее работы. Dun & Bradstreet выходит на контакт с изучаемой компанией и прямо просит предоставить о себе информацию. В случае отказа ей говорят, что непредъявление сведений – ее законное право, однако в таком случае в соответствующей графе будет сделана запись об этом отказе. Что для любого предприятия автоматически означает катастрофическое падение доверия со стороны инвесторов.
Некоторые практикующие специалисты конкурентной разведки, которые имеют опыт работы с российским представительством Dun & Bradstreet, рекомендуют перед заключением договора с этой компанией обратиться не только в указанное отделение, но и в европейские или американские офисы организации и сравнить предлагаемые ими условия. Нам неизвестны причины этого явления, но, по словам ряда специалистов, иногда предложения зарубежных филиалов бывают более интересными с точки зрения соотношения сервиса и цены, нежели то, чем пытается привлечь клиентов российский офис Dun & Bradstreet. Мы не можем опереться в этом вопросе на собственный опыт, поэтому предлагаем читателю самостоятельно проверить данную информацию, прежде чем заключать договор.
5. Обращение к специальным онлайновым службам.
Существуют онлайновые сервисы, которые позволяют получать информацию о предприятиях. Часть этой информации находится в свободной доступне, часть – предоставляется на платной основе.
Приведем примеры таких служб.
-info.ru (ВАЛААМ): сведения из ЕГРЮЛ и ЕГРИП; учредительская деятельность юридического лица; аффилированные лица.
(СПАРК): сведения из ЕГРЮЛ и ЕГРИП (сведения из ЕГРЮЛ доступны бесплатно); балансы; арбитраж; банкротства; новости компаний. disclosure.interfax.ru: эмитенты, аффилированные лица (бесплатно).
(СКРИН): сведения об участниках рынка ценных бумаг, подлежащие раскрытию (бесплатно).
: сведения об участниках рынка ценных бумаг, подлежащие раскрытию (бесплатно).
(это сайт Федеральной Налоговой службы России. С некоторых пор на нем стало возможным часть информации получать бесплатно).
Переход на многие из вышеуказанных бесплатных ресурсов для удобства специалистов предусмотрен на нашем сайте (http://ci-razvedka.narod.ru).
Мы предпочитаем использовать в работе систему СПАРК. Единственный ее недостаток, на наш взгляд, – довольно высокая цена (на момент написания книги она составляла 700 долл. США в месяц). Однако всегда есть возможность при небольших объемах требуемой информации приобрести ее не напрямую у СПАРКа, а у кого-то из подписчиков на достаточно выгодных цене. Для крупных же организаций стоимость системы никакой проблемы не представляет.
Прямой конкурент СПАРКа – СКРИН – также довольно популярен у специалистов конкурентной разведки. Однако цена этой системы, меньшая, по сравнению с упомянутой выше, не всегда может компенсировать отсутствие в СКРИНе решений арбитражных судов. СПАРК позволяет увидеть текст судебного решения полностью, а такая информация бывает крайне важной в работе указанной службы. Кроме того, специалисты отмечают некоторую неоперативность в обновлении базы данных СКРИНа, чего нельзя сказать о СПАРКе. Некоторые эксперты объясняют это тем, что последний имеет представительства в каждом регионе, поэтому процесс сбора информации и занесения ее в собственную базу в данном случае происходит несколько быстрее.
На сайте it2b-forum.ru проходило довольно подробное и всестороннее обсуждение плюсов и минусов СПАРКа и СКРИНа, участники которого пришли к следующему выводу: при относительно небольших объемах информации дешевле пользоваться связкой двух ресурсов – СКРИНа и петербургской системы «Кодекс»,[28] а при относительно больших объемах целесообразнее применять СПАРК.
Связан такой вывод был с тем, что система «Кодекс» на момент написания книги взимала разовые платежи и открывала доступ к текстам решений арбитражных судов, а именно отсутствие этой информации, как уже говорилось, делало СКРИН менее интересным ресурсом, нежели СПАРК, с точки зрения специалистов конкурентной разведки. Однако при большом объеме запросов эти разовые платежи превращаются в сумму, которая сводит экономию на нет.
6. Платные ресурсы.
О роли платных ресурсов в работе конкурентной разведки, об их плюсах и минусах мы достаточно подробно говорили ранее.
7. «Желтые страницы».
«Желтыми страницами» называют справочники компаний, сгруппированные по видам деятельности. В онлайновом доступе этот источник также присутствует. Для того, чтобы найти «желтые страницы» нужного города, достаточно сделать в поисковую машину запрос типа:
[ «желтые страницы» екатеринбург]
8. Интернет-порталы городов.
Многие крупные города имеют собственные интернет-порталы, с которых обычно можно попасть на сайты, содержащие информацию о местных компаниях. Иногда у города бывает два-три веб-ресурса. Чаще всего эти проекты поддерживаются в рекламных целях крупными сетевыми провайдерами.
Найти портал нужного города можно, в частности, по такому запросу:
[портал екатеринбург]
Информация об иностранных компаниях представлена на тех же ресурсах, которые мы описывали выше, рассматривая вопрос поиска информации о российских предприятиях. Пожалуй, единственная разница состоит в том, что сайты вроде СПАРКа или СКРИНа будут заменены их местными аналогами. Вот, к примеру, перечень некоторых национальных ресурсов, которые содержат доступную для каждого информацию о национальных компаниях:
(Великобритания);
(Италия);
(Нидерланды);
(Чехия);
(Франция);
(Финляндия).
Кроме того, информация об иностранных компаниях можно найти через распространенные за рубежом поисковые системы, такие как Google, Yahoo! AltaVista, MSN.
На нашем сайте (http://ci-razvedka.narod.ru) приведена ссылка на Европейские поисковые ресурсы (European Search Engines, Directories and Lists). За эту полезную ссылку мы отдельно хотим поблагодарить участника «Форума разведчиков» с ником speedy.
Учитывая, что на Западе Интернет пользуется большей популярностью, нежели в России, специалисты конкурентной разведки по предприятиям в странах Европы и в США имеют возможность обращаться в своей работе к ресурсам, не имеющим отечественных аналогов.
Например, Gary Price[29] говорит о специализированных ресурсах, которые с помощью собственных пауков индексируют только тематические разделы Интернета, но делают это значительно полнее, чем поисковые машины общего назначения.
Подобно целевым директориям, целенаправленные пауки ориентированы на поиск определенного вида информации и пытаются найти максимальное количество страниц не вообще, а в конкретной области, посещая ограниченное количество доменов.
Такие пауки посещают «свои» страницы чаще и тщательнее, чем обычные, которые просматривают ресурсы в поисках информации общего назначения. Пример специализированного паука – Law Crawler / или Politicalinformation.com
Как искать информацию о продуктах конкурента
В поиске подобной информации через Интернет основную роль играют следующие ресурсы:
– поисковые машины;
– каталоги;
– дискуссионные группы и форумы;
– тематические сайты любителей данной продукции (например, «Клуб любителей смартфонов Rover» или «Клуб Маздоводов Екатеринбурга»);
– сайты журналов, специализирующихся на данном продукте (например, сайты автомобильных журналов);
– отраслевые порталы.
Как найти нужный закон или постановление
Со временем ситуация с поиском подобной информации улучшится, поскольку отмечается тенденция к повышению доступности для граждан официальных документов на безвозмездной основе. Более того, суды стали активно поддерживать обеспечение такой доступности и обязывать отраслевые государственные учреждения обеспечивать бесплатный доступ через Интернет к соответствующим материалам.
Мы считаем, что покупать тексты документов, которые разработаны на деньги налогоплательщиков и размещены на сайтах государственных учреждений, также оплаченных налогоплательщиками, – все равно что дважды платить за один и тот же товар.
Однако пока что мы находимся в начале этого пути, и специалисту конкурентной разведки периодически требуется искать необходимые материалы в поисковых машинах общего назначения.
Обычно основную проблему представляют два обстоятельства:
– существует несколько разных документов с одинаковым номером;
– вместо самого текста документа в больших количествах появляются предложения магазинов купить этот текст.
В связи с этим, дадим несколько рекомендаций, которые позволят избавиться от информационного мусора и найти конкретный материал.
1. Если в поисковом запросе требуется написать название документа сокращенно, лучше это название заключить в кавычки.
Например,
не ФЗ, а «ФЗ»
2. Информацию с номером нормативного акта тоже лучше заключать в кавычки.
Например,
не 2.1.7.728-99, а «2.1.7.728-99»
3. Если известно какое-то специфическое слово, которое должно содержаться в названии или в тексте нормативного акта, то лучше его также указать в запросе.
Например, для документа
«Санитарные правила и нормы СанПиН 2.1.7.728-99 „Правила сбора, хранения и удаления отходов лечебно-профилактических учреждений“
мы рекомендуем включать в запрос слова «отходов», причем именно в той форме, в которой оно содержится в названии документа.
4. Часто неплохо включить в запрос указание на необходимость обязательного наличия в тексте слова «скачать». Но делать это надо только в том случае, если в выдаче слишком много документов, даже при правильно составленном запросе.
Иначе можно чересчур заузить результаты поиска.
5. Исключить из документа слова «цена», «купить» и «магазин».
Таким образом, для поиска бесплатного текста
СанПиН 2.1.7.728-99 «Правила сбора, хранения и удаления отходов лечебно-профилактических учреждений»
можно составить для Яндекса следующий запрос:
[+(«СанПиН» «2.1.7.728-99» &!отходов) ~~ (магазин | цена | купить)].
Как посетить сайт конкурента анонимно и зачем нужна такая анонимность
Конкурентная разведка, как мы уже говорили, требует соблюдения конфиденциальности во многих случаях работы с открытой информацией, в том числе при посещении сайта компании-противника.
Грамотный администратор сайта всегда способен увидеть, с каких ip-адресов приходили посетители, на какие страницы и в какой последовательности они переключались и какого рода информацией там интересовались.
Это может «обнаружить» службу конкурентной разведки и показать, какие вопросы для этой службы сегодня приоритетны, что, в свою очередь, способно значительно снизить эффективность работы данного органа. Мало того, системный администратор может создать ложные странички, которые «подсовываются» посетителям, пришедшим с определенного адреса. Этот прием, как мы уже говорили, широко применяется поисковыми спамерами, которые позволяют пауку просмотреть одну страницу, а пользователям – совершенно другую. Если в отношении специалиста конкурентной разведки будет применен подобный прием, тот будет считать, что знакомится с содержимым сайта соперника, тогда как на самом деле станет потребителем дезинформации.
Как назначаются ip-адреса?
Мы не будем чересчур углубляться в вопросы организации компьютерных сетей, расскажем лишь о принципе, по которому назначаются ip-адреса. Это поможет читателю, который ранее не интересовался данной проблемой, быстрее сориентироваться в последующем материале.
Итак, прежде всего надо понять, что в сети (в данном случае – в Интернете, хотя это справедливо для любой сети) не может быть двух компьютеров с одинаковым ip-адресом. Такая система обеспечивает возможность доставки данных именно на ту машину, для которой данные предназначены.
Компьютеры «знакомятся» друг с другом и передают информацию именно посредством ip-адресов. Людям было бы трудно запоминать эти бесконечные наборы цифр, поэтому для пользователей придумали доменные имена (вроде yandex.ru или ci-razvedka.narod.ru). Для перевода понятных человеку доменных имен в привычные для компьютеров ip-адреса в Интернете существуют так называемые DNS-серверы, работа которых, по сути, сводится к конвертации доменных имен в ip-адреса и наоборот по специальной таблице. Существует единый центр по выдаче адресов, который традиционно находится там, где и был создан Интернет, – в США. Соответственно, этот центр де-факто, вероятно, способен держать под контролем в той или иной степени всю информационную Паутину.
Когда появляется новый Интернет-провайдер, ему выделяется определенный диапазон ip-адресов, и он уже в пределах этого диапазона раздает адреса своим клиентам. Адрес у пользователя может быть постоянным, неизменно закрепленным только за ним (так называемый, фиксированный ip-адрес), что позволяет установить на этом адресе сервер и разместить, например, сайт. А может выдаваться в момент выхода человека в Интернет из наличия свободных в данный момент адресов. В таком случае он называется динамическим. Динамический адрес не позволяет установить на нем почтовый или веб-сервер, но и определить конкретное местонахождения пользователя такого адреса сложнее.
Тем не менее, город и провайдера по ip-адресу можно вычислить в любом случае, а физические координаты и название компании – в случае, если ip-адрес фиксированный.
Как «прикрыть» свой ip-адрес?
Обычно применяется несколько законных способов прикрытия ip-адреса.
Сразу хотим отметить, что мы рекомендуем проводить работу по поиску в Интернете с компьютера, который не подключен к корпоративной сети, так как большинство способов «прикрытия» ip-адреса потенциально могут создать брешь в защите корпоративной сети вашего предприятия. Куда занесет специалиста конкурентной разведки поиск информации, никто заранее предугадать не может. Ваш компьютер может быть атакован кем угодно и в любой момент, поэтому не надо ставить корпоративную сеть под угрозу потери данных или сбоев в работе. Все, что вы сочтете нужным представить в корпоративной сети, вы разместите там после окончания поиска и обязательной проверки размещаемой информации на наличие преступного или просто нежелательного программного обеспечения.
Вот основные способы «прикрытия» ip-адреса.
1. Воспользоваться обыкновенным модемом, работающим через телефонную линию.
В этом случае администратор посещаемого сайта будет видеть, что посетитель пришел из определенного города, не более того. Ip-адрес, который при этом зафиксирует у себя посещаемый сайт, будет истинным ip-адресом вашего компьютера, поэтому в случае атаки на этот адрес ваш компьютер может быть поражен.
К моменту выхода книги в коммерческую эксплуатацию были введены телефоны оператора сотовой связи СкайЛинк, работающие по технологии «Скай Турбо». Эти аппараты позволяли использовать динамические ip-адреса, при этом реально обеспечивая скорость передачи данных, сопоставимую со скоростью выделенной линии. По нашему опыту, это почти идеальное решение для конкурентной разведки, поскольку позволяет получить мобильный высокоскоростной Интернет в любом месте, не «привязанный» к конкретной компании и не создающий угрозы безопасности корпоративной сети.
2. Воспользоваться GPRS-соединением, без предоставления услуги фиксированного ip-адреса.
В этом случае администратор посещаемого вами сайта увидит, что вы пришли из сети определенного оператора связи определенной территории, с тем же ip-адресом, что и все остальные посетители, обслуживаемые этим оператором. Ip-адрес, который могут определить на посещаемом вами сайте, при этом будет иным, нежели на самом деле. Связано это с тем, что все пользователи GPRS имеют один ip-адрес, который транслируется сервером сотового оператора, посещаемому сайту. Атака на такой ip-адрес вашу машину поразить не сможет, так как будет направлена против сервера сотовой компании.
3. Воспользоваться бесплатным анонимным прокси-сервером.
Из-за того, что большинство хакерских атак проводилось через цепочку анонимных прокси-серверов, в Интернете против них ведется постоянная борьба.
Тем не менее, списки ip-адресов анонимных прокси-серверов находятся в свободном сетевом доступе. Ознакомиться с ними, в частности, можно на таких ресурсах, как:
/
Настройка браузера на анонимный прокси-сервер выполняется очень просто. Для этого в браузере прописывается ip-адрес прокси-сервера и указывается номер порта. И все – можно работать с новым ip-адресом, который, как и и номер порта, отображен в списке прокси-серверов. Номер порта может быть указан прямо либо в следующем формате: 217. 556. 81. 93: 35.
Это означает, что «217. 556. 81. 93» – ip-адрес, а «35» – номер порта, которые и надо прописать в браузере. Двоеточие просто отделяет визуально ip-адрес прокси-сервера от номера порта и во внимание приниматься не должно.
В браузере Мозилла Файрфокс для осуществления этой операции надо пройти по ссылкам Инструменты > Настройки > Основное > Параметры соединения > Настройка прокси вручную.
Мы не рекомендуем пользоваться подобным методом достижения анонимности, поскольку нет никаких гарантий того, что он окажется действенным.
Кроме того, обычно такое соединение с Интернетом нередко обеспечивает очень низкую скорость работы. И совершенно неизвестно, кто и с какой целью при этом собирает, например, вводимые вами через веб-интерфейс пароли и фиксирует ваш настоящий ip-адрес.
Помимо всего сказанного, иногда требуется затратить немало времени, чтобы найти такой прокси-сервер, который в принципе работает в данный момент.
Чтобы убедиться в том, что прокси-сервер обеспечил анонимность компьютера, достаточно подключиться к такому серверу, а затем проверить свой ip-адрес, например, на странице . Сервис, предоставляемый там, позволяет увидеть, какой адрес транслируется сайту при вашем посещении, а также проверить, кому этот адрес принадлежит – достаточно лишь щелкнуть по гиперссылке «Информация о сети и домене». На приведенном ниже рис. 59 видно, что администратор посещаемого нами ресурса видит наш ip-адрес (217.119.94.135), тип браузера (MSIE v 7.0), а также почтовый сервер, принадлежащий провайдеру Интернет-услуг в данном случае (mail.uraltel.net).
В результате просмотра сведений о конкретном ip-адресе: 217.119.94.135 – можно увидеть, что он принадлежит корпорации МТС в Екатеринбурге, являющейся провайдером связи в стандарте GSM, и обращение к посещенному нами сайту идет с сервера, расположенного в компании Etel Co. Это показано на рис. 60. Здесь же приведены контактные телефоны и адреса электронной почты компании Etel, а также указано контактное лицо, заявленное при регистрации домена – в данном случае это Evgeny Yarchuk.
Для удобства коллег мы разместили переход на вышеуказанную страницу проверки информации о компьютере пользователя прямо на главной странице нашего сайта http://ci-razvedka.narod.ru.
Во многих случаях эксплуатации так называемых анонимных прокси-серверов вы обнаружите, что определяется ваш подлинный ip-адрес. Поскольку посторонние прокси-серверы не взимают платы за их использование, вы должны понимать, что в случае неработоспособности заявленного сервиса претензии предъявлять будет некому.
Рис. 59. Страница проекта leader.ru, на которой показана информация, видимая администратору посещаемого сайта.
Рис. 60. Информация о принадлежности ip-адреса, полученная на странице проекта leader.ru.
4. Воспользоваться анонимайзером, который может требовать, а может и не требовать установки на компьютере программного обеспечения.
Подобный сервис за рубежом предоставляет сайт . Еще недавно этот сайт предоставлял возможность анонимного Интернет-серфинга, в том числе и бесплатно. Однако в настоящее время бесплатный доступ закрыт и возможно лишь скачать и установить на компьютер программу, которая обеспечивает подключение к прокси-серверу анонимайзера. Мы проверили работоспособность этого сервиса и можем констатировать, что это удобный инструмент. Удобство пользования этим анонимайзером – в том, что не надо вводить в настройки браузера никакой информации, а достаточно просто запустить программу на своем компьютере, после чего она самостоятельно установит соединение через анонимный прокси-сервер.
Стоимость услуг этого сервера – около 30 долл. в год. В пакет, помимо возможности анонимного посещения Интернета, входит программа по автоматической очистке на вашем компьютере сведений о ваших перемещениях в Сети. Удобно, что этот «шредер следов работы в Интернете» позволяет нужные параметры внести в список доверенных, и тогда они будут постоянно сохраняться, в то время как остальные будут автоматически удаляться при каждой очистке. Кстати, без этого пакета вы можете очистить данные вручную, если зайдете в браузере Mozilla Firefox в раздел «Инструменты – Настройки – Приватность – Очистить все»., но в этом случае придется перебирать очень большое количество строчек также в ручном режиме.
Помимо куков, «шредер» втоматически удаляет с компьютера пользователя временные страницы, список посещенных сайтов, список введенных при поиске слов, перечень недавно открытых документов. Мы убедились в том, что программа корректно работает с браузерами Internet Explorer и Mozilla Firefox.
Относительно недавно появился анонимайзер в российской части Интернета по адресу /. Вот что говорят о ресурсе его владельцы:
Anonymizer.Ru это далеко не первый, из существующих в Интернете сервисов, по обеспечению безопасности и личной неприкосновенности, хотя в Российском сегменте Сети подобных примеров нами и не замечено.
Нам никто не доверяет и о нас никто не знает, но мы абсолютно уверены в том, что эта ситуация изменится коренным образом ровно с того момента, как Вы воспользуетесь нашим сервисом и посоветуете всем своим знакомым и друзьям никогда им не пользоваться, или наоборот, не делать ни одного более-менее серьезного похода в Интернет без нашего сервиса.
Anonymizer.Ru позволяет своим пользователям исследовать просторы Сети оставаясь анонимным для окружающих, не задумываясь о проблемах безопасности и личной неприкосновенности.
Мы ставим перед собой задачу сделать наш сервис самым лучшим и наиболее популярным среди всех ему подобных не только на просторах России, но и во всем оставшемся мире, и поэтому с удовольствием примем любые ваши замечания и предложения.
Этот сервис позволяет просто ввести в строку на странице ресурса адрес нужного сайта и перейти на него. Однако из-зи того, что Куки при этом не поддерживаются, невозможно пройти регистрацию для входа на некоторые ресурсы. Поэтому российский анонимайзер можно считать удобным, но несколько ограниченным в своих возможностях инструментом.
5. Установить на рабочем месте отдельное соединение через ADSL-модем или выделенную линию, зарегистрированные на частное лицо.
В этом случае вы получите фиксированный ip-адрес, но этот адрес не будет связан с вашей компанией. Однако это будет ваш настоящий ip-адрес, одинаковый во всех случаях выхода в Интернет, и закрепленный за вашим физическим адресом, поэтому анонимность в данном случае ограничивается только отсутствием записи о вашей компании в журнале веб-администратора посещаемого вами сайта.
6. Воспользоваться программой-анонимайзером, которая устанавливается на локальном компьютере.
Существует несколько программ, обеспечивающих анонимность в Интернете. Они устанавливаются на персональном компьютере и при запуске автоматически обновляют список доступных прокси-серверов, после чего предлагают выбрать, через какой из них подключиться. При этом они сразу предоставляют информацию о том, к какой стране и компании имеет отношение каждый конкретный прокси-сервер, а также показывают степень его загруженности (то есть, позволяют оценить, насколько медленным будет соединение.).
К таким программам относится, в частности, Steganos Internet Anonym Pro.
При запуске она связывается с сервером производителя и обновляет список прокси-серверов, после чего позволяет подключиться к любому серверу из имеющегося списка. Поскольку производитель программы – компания Steganos – один из лидеров рынка программ по защите информации и к тому же берет на себя задачу поддержания списка прокси-серверов в актуальном состоянии, мы считаем оправданным приобретение Steganos Internet Anonym Pro.
К сожалению, компания, по всей видимости, решила развивать данное направление в сторону предоставления онлайнового сервиса Internet Anonym VPN, похожего на описанный выше ресурс с сайта . Однако, как показывает практика, продажа программ дилерами еще какое-то время продолжится, поэтому мы рекомендуем всем зинтересованным поторопиться с приобретением данного продукта либо подключиться к онлайновому сервису. Принимая решение, надо учесть, что если стоимость Steganos Internet Anonym Pro составляла около 50 долл. (единоразовый платеж), то онлайновый сервис на момент написания книги предлагался за 99 долл. в год (появилась также возможность подписки на один месяц). На рис. 61 видно, что фальшивый адрес 212.227.97.132, предоставленный сервисом Steganos Internet Anonym VPN, был зафиксирован встроенным в сайт http://ci-razvedka.narod.ru средством определения ip-адресов посетителей. Таким образом, анонимность посещения ресурса была соблюдена.
Рис. 61. Онлайновый сервис Steganos Internet Anonym VPN в работе
Как в точности сохранить информацию, найденную на сайтах в Интернете
Периодически специалист конкурентной разведки сталкивается с необходимостью сохранения информации, найденной в Интернете. Это требуется, как правило, в целом ряде случаев.
– Когда нет времени внимательно изучать собранный материал, но хотелось бы к нему вернуться позже.
Когда есть вероятность, что страница будет изменена (например, в случае размещения на ней компрометирующей информации, либо утечки данных, либо если речь идет о странице новостей компании). Тогда, чаще всего, необходимо не просто зафиксировать изображение, размещенное на ресурсе, но и заверить его нотариально. И в крупных городах уже появились нотариусы, которые могут справиться с такой задачей.
Когда вместе с данными требуется предоставить сырой материал – на случай, если понадобится объяснить, на каком основании были сделаны те или иные выводы.
Когда компания составляет архив сайтов – свой или посторонней организации – с целью мониторинга изменений на копоративном портале и хочет иметь возможность поднять этот архив за любой период.
Когда архивная копия делается «на будущее» без явной цели, но специалист конкурентной разведки считает, что нетекстовая информация с сайта может пригодиться ему в будущем.
Вот основные способы создания архивных копий внешнего вида страниц сайтов.
1. Сохранение страницы из браузера штатными средствами операционной системы.
Для этого достаточно в верхней панели браузера выбрать команды «Файл» > «Сохранить как» и задать имя файла. Как правило, страница сохраняется в виде файла и связанной с ним папки. В случае если, например, документ будет случайно переименован в неоткрытом состоянии, потеряется его связь с папкой. Нам известно также немало случаев, когда папка просто случайно стиралась, что также лишало возможности полноценно просматривать содержимое страницы.
2. Сохранение страницы с помощью текстового процессора Word.
Содержимое страницы сначала копируется в буфер (например, с помощью последовательности команд «Правка» > «Выделить все» > «Правка» > «Копировать»). Затем открывается программа Word, в нее скопированная страница вставляется из буфера с помощью команд «Правка» > «Вставить».
Такой метод при всей простоте исполнения не лишен недостатков. Во-первых, страница, снабженная гиперссылками, достаточно долго вставляется из буфера в документ Word. Во-вторых, результат довольно сильно оличается от оригинала, и в первую очередь страдает взаимное расположение текста, таблиц и изображений на странице, так как Word не вполне корректно отображает таблицы. На сленге специалистов это обычно называется «Слетели таблицы», поскольку самое сложное в создании страниц – это расположение таблиц, текста и изображений таким образом, чтобы их компоновка на странице совпадала с первоначальным замыслом.
3. Создание PDF-файла из веб-страницы.
Для того, чтобы сделать pdf-файл, требуется программа Adobe Acrobat Professional (не следует путать ее с бесплатной программой Acrobat Reader, предназначенной только для чтения pdf-файлов, а не для их создания и изменения). Сайт программы Adobe Acrobat Professional находится по адресу / acrobatpro/main.html.
Это достаточно удобный метод сохранения веб-страниц, который можно рекомендовать к практическому применению. Изображение при использовании Adobe Acrobat Professional получается корректным. Существенный минус данного решения – цена программы, достигающая нескольких сотен долларов. Кроме того, иногда случается так, что на некоторых страницах Интернета возникают проблемы с кодировкой и это делает конечный текст нечитаемым.
Избежать последней проблемы поможет следующее решение. Не следует пользоваться встроенной функцией и назначать адрес сохраняемой страницы непосредственно в меню программы Adobe Acrobat Professional, потому что именно в этом случае чаще всего и возникает проблема кодировок. Вместо этого, следует открыть страницу в браузере Internet Explorer и воспользоваться встроенным в него плагином Adobe Acrobat Professional. Тогда страница будет отображена корректно, разве что может смениться тип шрифта – например, вместо шрифта Arial, содержащегося на странице, в PDF-файле окажется Times New Roman. Официальное представительство компании Adobe пытается научить пользователей преодолевать проблему с отображением шрифтов: для этого надо попытаться изменить настройки программы, – однако сделать это максимально доступно ему пока не удалось. Даже элементарное объяснение способа занимает несколько минут, так что воплотить его в жизнь неподготовленному пользователю непросто. Именно поэтому мы применяем приведенный выше метод, а не тот, который пытаются популяризировать в официальном представительстве.
4. Сохранение всей картинки в Local WebSite Archive.
Сайт программы Local Website Archive находится по адресу . com/wsarc/.
Пожалуй, это оптимальный способ сохранения интернет-страниц на персональном компьютере. Программа Local Website Archive абсолютно бесплатна, проста в обращении и сохраняет страницу в том виде, в котором вы ее видите на экране своего компьютера. Поскольку программа выпускается тем же производителем, что и WebSite Watcher, она может запускаться прямо из браузера, с кнопки WebSite Watcher. За все время пользования программой мы лишь однажды были свидетелями того, что она столкнулась с проблемой кодировки. Как раз в том случае проблема была решена с помощью встроенного в браузер плагина Adobe Acrobat Professional.
5. Воспользоваться описанным ранее сервисом FURL, который позволяет создать в Интернете копию страницы.
Как мы уже показывали, сервис FURL, расположенный по адресу http://www. furl.net/view.jsp, позволяет бесплатно создать и сохранить копию веб-страницы непосредственно в Интернете, что делает ее доступной буквально из любой точки и с любого компьютера.
6. Перенос страницы чужого сайта на свой сайт.
Для того, чтобы сохранить страницу подобным образом, достаточно вывести на экран компьютера в браузере функцию «Просмотр исходного кода страницы», а затем скопировать код на страницу своего ресурса, расположенную в недоступной для просмотра пользователями Интернета части этого ресурса. Как мы уже говорили, просмотр исходного кода возможен обычно с помощью всплывающего меню при нажатии правой кнопки мыши на свободном месте окна браузера.
Однако такой метод при его использовании на бесплатных хостингах таит в себе потенциальную опасность. Дело в том, что сайты, размещенные на narod. ru, немедленно индексируются и могут быть уже на следующий день обнаружены встроенными средствами поиска, даже если они не появляются в информационных системах, в том числе и в Яндексе. Отсюда следуют две практические рекомендации:
– не забывать пользоваться встроенным в «narod» средством поиска при запросе чужой информации, в дополнение к инструментам поисковиков;
– не сохранять на свой сайт с бесплатным хостингом страницы, которые не должны быть доступны посторонним людям.
7. Сфотографировать экран или его элементы.
Для того, чтобы сфотографировать весь экран целиком, подойдет встроенная функция Print Screen. Но этот метод не позволяет сделать снимок фрагмента экрана.
Фрагмент любого размера можно получить с помощью программы HyperSnap-DX 5, расположенной по адресу /. Там же находится программа HyperCam, которая позволяет заснять все, что происходит на экране, в виде видеоролика.
Кроме того, существует большое количество сервисов, с помощью которых можно закачать сайт целиком, вместе со всеми взаимными ссылками страниц. Мы не рассматриваем здесь эти программы, поскольку нас интересует прицельное сохранение нужных источников информации, однако при необходимости читатель без труда найдет их в Интернете. Перед загрузкой себе этих программ обязательно почитайте отзывы пользоватеей, чтобы не столкнуться с типичными проблемами, поскольку некоторые из приложений по закачке сайтов делают это подчас некорректно, тогда как трафик все они расходуют исправно.
Фальшивые «зеркала»
Начнем этот раздел нестандартно. Посмотрите на приведеный ниже рис. 62.
Рис. 62. Фальшивая страница входа в службы на Яндексе
Имитация страницы Яндекса полная, включая знак копирайта, принадлежащий поисковику. Ни одного упоминания о том, что эта страница не имеет к Яндексу никакого отношения, на момент проведения исследования не было замечено. Все ссылки с «зеркала» ведут действительно на указанный портал. Пароли же, введенные на подобных ресурсах, становятся доступны владельцу сервера, на котором расположено «зеркало».
Вот адрес страницы, на которой размещена приведенная на рисунке форма:
.
Понятно, что данный сайт не имеет отношения к Яндексу. Однако, если не посмотреть на URL страницы и нажать ссылку «Войти», то появится форма для ввода логина и пароля (рис. 63).
И лишь тогда, когда введены пароль и логин, нажата кнопка «Войти», появляется предупреждение о том, что пользователь вводил конфиденциальные данные на постороннем Яндексу ресурсе. Это предупреждение выдает сам Яндекс, столкнувшись с тем, что пользователь приходит к нему с постороннего сайта.
Поскольку Яндекс не знает, известно ли посетителю, что тот заходит в его службы с постороннего ресурса, пользователю предлагается самостоятельно решить, доверяет он этому ресурсу или нет и, соответственно, либо продолжить работу с Яндексом, либо сменить пароль.
Легкость, с которой можно перемещать исходный код с одной страницы на другую, приводит к тому, что ничего не стоит создать точную копию настоящего сайта даже тем людям, которые к настоящему сайту не имеют никакого отношения. У нас нет оснований доверять или не доверять приведенному выше ресурсу, поэтому мы не делаем выводов о том, с какой целью владельцы создавали страницу регистрации Яндекса, которая полностью имитирует сам Яндекс. Данным примером мы лишь хотим показать, насколько важно обращать внимание на URL страницы, на которой вы находитесь.
Рис. 63. Поле для ввода логина и пароля на фальшивой странице Яндекса.
Рис. 64. Предупреждение при переходе на Яндекс с фальшивого «зеркала»
Создание документов PDF из Microsoft Office и наоборот
С помощью программы Adobe Acrobat Professional. Подключаемый модуль Adobe PDF появляется в главном меню документов Office. После загрузки файла в Word, Excel или Power point просто кликнуть мышью по ярлыку Adobe Acrobat. В результате автоматически сформируется файл с тем же названием, но в формате PDF. Единственный недостаток этого метода – высокая стоимость лицензии программы Adobe Acrobat Professional.
С помощью программы OpenOffice. В этот бесплатный сервис плагин, позволяющий создавать PDF-файлы, встроен по умолчанию. Сначала загружается программа OpenOffice, после чего в ней открывается документ MS Office, который затем сохраняется в формате PDF аналогичным предыдущему путем.
Необходимость создания таких файлов нередко возникает, когда требуется уменьшить размер файла MS Office. Например, презентация размером 150 МБ в виде файла Power Point после превращения ее в PDF-файл весит всего 5 МБ. C величиной изменений размера документов Word или Excel ситуация обстоит примерно так же.
Как восстановить поврежденный файл Office
Иногда возникают крайне неприятные ситуации: скажем, файл Word отказывается открываться, при этом выдается сообщение, что он поврежден и поэтому не может быть открыт. Нами разработан простой прием, который позволяет загрузить такой файл и избежать тем самым потери хранящейся в нем информации.
Для этого, как правило, достаточно открыть поврежденный файл в программе OpenOffice, а затем просто сохранить в формате «.DOC», и он снова становится читаемым в обычном порядке с помощью программы Word. Эта нехитрая манипуляция позволяет избежать по-настоящему серьезных проблем.
Как продвинуть свое предприятие в Интернете
Для решения практических задач по продвижению рекомендуем читателю обратиться к соответствующим специалистам, поскольку мы таковыми не являемся, либо изучить вопрос самостоятельно и приобретать опыт методом проб и ошибок.
Однако представитель конкурентной разведки должен знать основные принципы продвижения сайтов, хотя бы для того, чтобы при просмотре веб-ресурса предприятия понимать, насколько квалифицированные люди им занимаются.
Для того чтобы сайт оказывался в первых рядах в выдаче по запросу, следует соблюдать несколько основных правил.
Чтобы пользователь находил ресурс по тем словам, которые владелец сайта считает ключевыми, эти слова должны присутствовать на первой его странице. При этом нельзя просто написать миллион ключевых слов размером в один пиксель (это справедливо сочтут поисковым спамом и могут навсегда выбросить сайт из поисковой машины). Текст должен быть осмысленным. Поэтому специалисты рекомендуют создавать не более трех-пяти ключевых слов.
Ключевые слова должны содержаться не только в тексте, но и в заголовке страницы (в теге <TITLE>). Поисковая машина логично считает, что если всю страницу озаглавили с применением ключевого слова, то содержимое этой страницы наверняка должно иметь отношение к изучаемому вопросу.
Должны быть внешние ссылки на страницу. Считается, что чем больше внешних ссылок указывает на страницу, тем большей популярностью у людей она пользуется и, соответственно, тем выше ее рейтинг в поисковых системах. Здесь есть одна опасность. Существуют программы – так называемые линкаторы, – которые устраивают обмен ссылками «всех со всеми» в автоматическом режиме и в огромных количествах. Многие продавцы подобных программ уверяют, что сайт после применения данного способа продвижения «взлетит ракетой» и непременно окажется в первых рядах результатов запросов. Но при этом продавцы линкаторов забывают уточнить, что эти программы также относятся к разновидности поискового спама и их пользователей поисковые системы наказывают.
На тех страницах, с которых идут внешние ссылки, также должны быть нужные ключевые слова. Таким образом поисковая машина убеждается в том, что ссылающийся ресурс – тематический.
На те страницы, с которых идут внешние ссылки, должны вести свои внешние ссылки с тематических же ресурсов – и опять же чем больше, тем лучше. Тогда «в теме» находятся все участники ссылок и доверие к сайту со стороны поисковых машин возрастает.
На ресурсе должны быть внутренние ссылки – с одной страницы на другую. Тогда паук поисковой системы, придя на сайт, будет долго по нему «бегать», прежде чем покинет его.
Контент сайта должен часто обновляться. Вот почему нередко веб-мастера делают скрипт, который при каждом посещении страницы публикует небольшой новый текст – как правило, афоризм, отзывы клиентов о компании или хотя бы анекдот.
Тем, кто не готов вникать в подробности этих процессов, рекомендуем обратиться к услугам оптимизаторов сайтов или просто купить определенные слова у поисковой машины. В случае покупки слов, деньги платятся не за какое-то время, а понемногу списываются при каждом переходе пользователя поисковой машины по ссылке в результатах выдачи. Таким образом, должен обеспечиваться принцип «вы платите только за реальные переходы на сайт».
А для тех читателей, которые все же решат рассматривать данный раздел не только с точки зрения конкурентной разведки, но и с точки зрения поисковой оптимизации ресурса, отдельно отметим, что специалист конкурентной разведки Евгений Гришин, в функции которого входит поддержка сайта известного на всю страну предприятия, предупреждает об одной опасности в случае, когда речь заходит об оптимизации портала. Он говорит, что если оптимизацией заниматься всерьез, то нельзя забывать о подготовке инфраструктуры компании к резкому увеличению количества телефонных звонков и обращений к сайту. В противном случае, можно устроить самому себе классическую DDOS-атак у, когда желающие посмотреть ресурс или дозвониться так и не смогут этого сделать из-за низкой пропускной способности средств коммуникации на предприятии.
Как защитить компьютер от взлома техническими средствами
Надо сказать, что сами хакеры признают: взлом техническими средствами часто бывает затруднителен. Это связано с тем обстоятельством, что производители программного обеспечения и «железа» непрерывно отслеживают ситуацию с техническими средствами хищения компьютерной информации. Поэтому они достаточно быстро принимают меры по предотвращению подобных инцидентов. Соответственно, компьютеры все чаще оказываются хорошо защищены, если над этим вопросом работает специалист.
Однако существуют как объективные, так и субъективные системные проблемы.
Во-первых, развитие средств передачи данных идет более быстрыми темпами, нежели развитие средств защиты этих данных, а во-вторых, далеко не все, кому положено правильно настраивать защиту, делают это качественно.
Как воспрепятствовать незаметному подключению к своему компьютеру посторонних
Подключение к чужому компьютеру не может произойти незаметно. Для того, чтобы кто-то присоединился к вашей машине, требуется, как минимум, два обстоятельства: чтобы ваш компьютер в принципе был способен подключаться к Сети и чтобы на нем были открытые порты.
Соответственно, первое, что желательно сделать, дабы обезопасить себя от возможного вторжения чужаков, – это без необходимости не подключаться к сети, в особенности – к Интернету. Если полностью прервать связь с Интернетом: выключить модем, через который компьютер подключен к Сети, либо физически отсоединить сетевой кабель или устройство беспроводной передачи данных, – вы будете гарантированно защищены от незаметного присоединения к вашей машине. К сожалению, поступить столь радикально возможно далеко не всегда. Конечно, по окончании работы отключиться от сети можно, но во время работы неизбежно придется быть включенным в сеть. К тому же некоторые машины – обычно серверы – нельзя отключать в принципе, если требуется, чтобы они функционировали круглосуточно.
Для обеспечения безопасности в случаях, когда пользователь подключен к Интернету, служат файрволлы. В персональном компьютере файрволлы обычно программные – то есть, это специальная программа, запущенная на вашей машине.
В больших сетях функции файрволла выполняют специальные отдельные устройства. Программный файрволл легче удаленно взломать, нежели «железяку», да и наладить выход в Интернет большого количества компьютеров значительно проще через отдельное устройство, к которому можно подключиться с помощью кабеля. Именно поэтому аппаратные файрволлы, как правило, и используются в организациях, где есть большие сети.
Слово «файрволл» (или, как еще говорят, «брандмауэр», а также «межсетевой экран») произошло от английского словосочетания «Пожарная стена». Так в старину называли кирпичные перегородки, разделяющие длинные деревянные здания на отсеки, и позволявшие уменьшить ущерб при пожаре.
Задача файрволла – контролировать весь трафик, как входящий, так и исходящий, а также порты, через которые он идет, и программы, которые его инициировали. В случае, если файрволл сталкивается с классической хакерской атакой, он может просто заблокировать действия злоумышленника и написать об этом отчет.
Если же файрволл видит попытку какой-то программы выйти в Интернет, не считая это однозначно отрицательным событием, он блокирует действия программы, которая собралась «выйти за пределы компьютера», и спрашивает пользователя, как поступить.
Собственно, может быть четыре вида возможных действий файрволла:
– разрешать выход в Интернет всегда без запроса дополнительных разрешений;
– запретить выход в Интернет насовсем;
– разрешить выход в Интернет однократно;
– запретить выход в Интернет однократно.
Если пользователь принимает какое-то постоянное решение по поводу работы конкретной программы, файрволл в дальнейшем выполняет это действие автоматически и больше не беспокоит человека вопросами. Для того, чтобы выразить свое волеизъявление, пользователю достаточно просто поставить «галочку» в нужном окошке, которое файрволл предупредительно открывает, когда спрашивает, как ему быть в той или иной ситуации. Если же человек выбирает однократный способ реагирования, то при попытке программы в другой раз выйти в Интернет файрволл вновь задаст вопрос и запросит решение пользователя.
Большинство современных файрволлов снабжено антишпионскими модулями, которые борются против программ, ведущих наблюдение за чужим компьютером, не предупреждая его об этом. Так, в начале 2006 г. нам довелось увидеть ничем не защищенный компьютер, ежедневно выходивший в Интернет. Владелец машины пожаловался, что каждый раз, когда он подключается к Интернету, какие-то программы начинают что-то в Интернет передавать. В общей сложности эта передача составляла порядка полутора мегабайт в день.
После установки системы Agnitum Outpost Pro на компьютере было обнаружено 994 шпионских программы, которые были антишпионским модулем удалены. После их удаления посторонний трафик прекратился.
Анализ показал, что часть этих шпионских программ была установлена сайтами, которые посещал пользователь (практически все эти ресурсы были более, чем сомнительного содержания), а другая их часть – самим пользователем. Такие программы с ведома хозяина компьютера инсталлируются, как правило, в составе бесплатных приложений – например, некоторых мультимедийных проигрывателей или дополнений к браузерам. Формально пользователь и впрямь самолично дает добро на их установку, когда принимает условия лицензионного соглашения при инстолировании. Примерно на четвертой странице из пяти, в середине этого текста обычно упоминается о том, что человек одобряет установку шпионского программного обеспечения, которое передает статистическую информацию «неличного характера». Возможно, создатели программ действуют с расчетом на то, что никто из пользователей, с их любовью к бесплатным программам, не дочитает текст документа до конца. Если так, то этот расчет оправдывается в большинстве случаев.
Такие программы обычно не передают никакой по-настоящему конфиденциальной информации вроде файлов или паролей, хранящихся на компьютере. Однако сведения о посещаемых владельцем компьютера сайтах передаются ими регулярно. После чего вниманию пользователя представляется реклама, в полной мере соответствующая его интересам. Пользователь же оплачивает трафик по передаче этой «неличной информации», который, как видно из приведенного примера, может быть не таким уж и маленьким. А при использовании медленного соединения с Интернетом этот шпионский трафик еще и сильно крадет время.
Один из самых популярных персональных файрволлов – это как раз программа Agnitum Outpost Pro. Она написана и поддерживается отечественными специалистами, поэтому полностью русифицирована и обеспечивается технической поддержкой на русском языке. Невысокая стоимость программы – в несколько сотен рублей, – на наш взгляд, делает Agnitum Outpost Pro незаменимым инструментом при работе на компьютерах под управлением операционной системы Windows.
Заканчивая разговор о файрволлах, отметим, что нельзя устанавливать на один компьютер более одного файрволла. Бытовая логика, согласно которой два файрволла вдвое усилят защиту, здесь оказывается ошибочной. На самом деле, они будут мешать друг другу и ни один из них в результате не будет работать корректно. Это при условии, что машина вообще сохранит работоспособность и способность выходить в Интернет. Поэтому, если вы решите установить файрволл Agnitum Outpost Pro или какой-то другой, то сначала отключите встроенный файрволл Windows и файрволл, встроенный в антивирусную программу, если таковой имеется.
Как бороться с вирусами и другими вредоносными программами
Вирус.Компьютерный вирус – это программа или программный код, введенные и запущенные на компьютере без ведома пользователя и приводящие к нарушению нормального функционирования системы, в том числе открывающие несанкционированный доступ к информации, записанной на машине.
Вирусы бывают загрузочными и файловыми. Загрузочный вирус «поселяется» в загрузочной части диска и активизируется при каждом запуске системы.
Файловые вирусы встроены в файлы программ, при этом в большинстве случаев программы сохраняют свою работоспособность.
В общих чертах механизм работы файлового вируса выглядит так: он запускается в начале или в середине работы программы, а затем передает команду тому файлу, которому положено передать ее при работе приложения в штатном режиме. В результате программа внешне сохраняет все свои свойства, но вирус активируется при каждой попытке пользователя ее запустить. Процесс запуска вируса настолько непродолжителен по времени, что пользователь просто не успевает его заметить.
Основные вирусы, создающие сегодня проблемы, – это Трояны и Черви. Трояны, в свою очередь, принято делить на похищающие пароли и на открывающие доступ к компьютеру. В последнем случае компьютер может превратится в «зомби», выполняющего команды удаленного пользователя.
Черви специализируются на массовой рассылке самих себя всеми возможными способами. Именно эти вирусы при попадании в машину направляются в адресную книгу, а затем создают электронные письма и рассылают сами себя по почте всем адресатам из адресной книги. Нередко Троян устанавливается своими создателями в связке с Червем, чтобы последний выступал в качестве транспортного средства для Трояна. В таком случае Червь вместе с прикрепленным к нему Трояном обеспечивает распространение этой пары на максимально большое число компьютеров, а последний выполняет разрушительную работу.
Нам приходилось наблюдать компьютер подростка, подключенный к Интернету в течение года и не защищенный никакими сервисами, предназначенными для борьбы с преступным программным обеспечением. Заплатки на операционную систему на нем также не устанавливались, поскольку копия операционной системы была нелицензионной. После установки на компьютер «Антивируса Касперского» было выявлено 460 вирусов. Половина из них была червями, а вторая половина – Троянами.
Клавиатурный перехватчик. Это группа программ, которые записывают в специальный файл все нажатия клавиш на клавиатуре. Они позволяют сохранить важный документ, если вдруг «упадет» текстовый редактор. Кроме того, эти программы помогают узнать, кто и как использовал компьютер в отсутствие его владельца. И как инструмент проверки лояльности персонала эти системы также могут быть востребованы.
Один из многочисленных представителей клавиатурных перехватчиков – GoldenKeylogger (). Файл журнала, в котором записаны перехваченные нажатия клавиш, может находиться где угодно в локальной сети, и получить к нему доступ реально в том числе и через Интернет.
Основные задачи, которые сегодня ставятся перед вирусами их создателями, – получение полного управления чужим компьютером, либо взлом паролей, либо кража информации. Для достижения этих целей вирусу, как правило, необходим выход в Интернет.
Существуют несколько рубежей защиты от компьютерных вирусов. Ни один из них не является абсолютно эффективным, но вместе они обеспечивают практически стопроцентную защиту.
1. Антивирус.
Антивирусные программы работают в двух режимах – Сканер и Монитор. Режим Монитор следит за открытыми на компьютере программами и блокирует вредоносные попытки вирусов помешать их работе. В режиме сканер антивирусная программа проверяет каждый файл, хранящийся на жестком диске компьютера, заглядывает внутрь каждого архива. Проверка в режиме Сканер может проводиться как по команде пользователя, так и автоматически – по расписанию. Выявить «врага» программе позволяет сравнение файлов со своей базой данных известных ей вирусов.
Однако антивирусники имеют один существенный недостаток: прежде, чем включить вирус в базу данных, программисты соответствующей лаборатории должны его увидеть и разобрать на части. То есть он должен сначала поразить кого-то из пользователей, после чего его отправят в лабораторию, и лишь затем его можно будет исследовать и включить в базу данных вирусов, с которыми и призван бороться антивирус.
Попытки научить антивирус бороться с еще неизвестными угрозами путем «объяснения» ему косвенных признаков, которые могут указывать на преступное программное обеспечение, пока что приводят к тому, что жизнь пользователя порой превращается в кошмар, так как эта программа регулярно блокирует нормальные программы.
Сегодня существует немало антивирусных программ. После того, как был устранен ряд технических проблем, «Антивирус Касперского» можно считать одним из самых удачных решений для русскоязычного пользователя. Хотя есть немало и других предложений от уважаемых и хорошо зарекомендовавших себя производителей – например, Dr.Web, Norton, Panda, McAfee.
2. Файрволл.
Мы уже достаточно подробно обсудили этот тип программ, поэтому не будем повторяться. Отметим лишь в контексте этого раздела, что файрволл способен зафиксировать факт попытки выхода вирусной программы в Интернет и заблокировать его. Это позволяет противостоять любым вирусам, в том числе тем, которые пока неизвестны специалистам. Уничтожить вирус файрволл не может, но предотвратить его выход в Интернет файрволлу по силам.
3. Сторож реестра.
Программа отслеживает попытки вируса записаться в реестр. Точнее, она информирует о каждом приложении, которое записалось в реестр Windows, и спрашивает, оставить его там или удалить. Таким образом, тайно вирус не сможет записаться в реестр операционной системы, а значит, и запускаться в ней не сможет. Он останется просто безобидным файлом на диске, который со временем будет обнаружен антивирусом и уничтожен. Хотя, скорее всего, пользователь, увидев неизвестную программу, которая самостоятельно решает записаться в реестр, сам ее удалит, не дожидаясь вмешательства антивируса. К сторожам реестра относится, в частности, простая и бесплатная программа AnVir Task Manager. Помимо функций контроля записей в реестре, сторож обладает другими полезными функциями: позволяет легко убирать программы из автозапуска, чтобы они не открывались автоматически при включении компьютера, а также показывает, какое именно приложение и на сколько процентов загружает процессор.
4. Ревизор дисков.
В общих чертах работу ревизора дисков можно представить следующим образом. Программа после ее установки анализирует все файлы, находящиеся на жестком диске компьютера, и запоминает результат. Затем при работе пользователя или операционной системы с файлами, контролирует их действия и рассчитывает, как должна измениться первоначальная картина после всех этих манипуляций. По команде пользователя ревизор дисков проводит «инвентаризацию», сравнивая плановые показатели с фактическими. Если при этом показатели сходятся, значит, все нормально. Но если видны расхождения, то это свидетельствует о том, что был осуществлен несанкционированный запуск некой программы. Таким образом, сторож дисков способен отлавливать те вирусы, которые также пока что не описаны в базах данных. Мы можем рекомендовать в качестве ревизора дисков программу Adinf32.
Работая в комплексе, эти программы способны предотвратить активность практически любого вируса.
Кто такие хакеры и социальные инженеры и как от них уберечься
В общем виде к хакерам относят тех людей, которые несанкционированно проникают в чужие компьютеры. Проблема хакерства столь серьезна, что ей посвящена отдельная статья в Уголовном Кодексе РФ, наряду с наказанием, предусмотренным за создание компьютерных вирусов и нарушение работы сетей.
Техническими средствами проникновения в компьютер в совершенстве владеют немногие, поскольку оно требует хорошего знания программирования. Без этого сложно найти «дыру» в операционной системе, через которую можно попасть внутрь чужой машины.
Причем, со временем о существовании «дыры» узнает все больше людей, и, в конечном счете, эта информация доходит до производителя операционной системы. Тот принимает необходимые меры, уязвимость ликвидируется, и хакеру приходится начинать все с начала. Надо сказать, что большое количество брешей в операционной системе Windows – результат не ее низкого качества, по сравнению с другими операционными системами, а широкого распространения этой операционной системы в мире. Великолепная по своему функционалу операционная система MacOS была бы не менее «дырявой», если бы занимала не несколько процентов мирового рынка, а хотя бы половину от доли рынка Майкрософт. И тогда взгляды хакеров устремились бы на нее – они изучили бы ее программный код и совершенно неизбежно нашли бы в нем лазейки.
Подобная ситуация была с браузером Mozilla Firefox. Пока его не скачали семьдесят миллионов человек (а на момент написания книги число скачиваний этого браузера превысило сто миллионов), уязвимостей в Mozilla Firefox никто не обнаруживал. А затем их стали находить (и устранять) регулярно.
Невозможно написать текст, состоящий из нескольких миллионов строк (а именно такой текст представляет собой операционная система), и не сделать в нем ни одной ошибки. Правда, в операционных системах с так называемым открытым кодом (например, Linux) они обычно исправляются быстрее, чем в операционные системах с закрытым кодом (например, Windows). Это связано с тем, что исходный код системы с закрытым кодом известен только сотрудникам компании-производителя, а исходный код системы с открытым кодом общеизвестен. Соответственно, и количество людей, исправляющих недостатки систем с открытым кодом, гораздо больше.
Итак, квалифицированных хакеров, владеющих достаточными для взлома компьютеров навыками программирования, относительно немного.
Но есть технические приемы проникновения в чужой компьютер и получения доступа к хранящейся в нем информации, овладеть которыми под силу практически каждому человеку, поэтому имеет смысл подумать о том, чтобы оградить себя от их действий. Перечислим вкратце эти способы.
1. Человек, имеющий возможность физического доступа внутрь компьютера и вооруженный отверткой, способен сделать с ним абсолютно все:
– снять пароль с BIOS’а и получить возможность загрузки с мобильных носителей, даже если загрузка с флэшек, дискет и компакт-дисков на компьютере запрещена;
– поставить собственный винчестер с установленной системой Windows’98 и загрузиться с него;
– извлечь жесткий диск с компьютера и унести;
– унести весь компьютер.
2. Человек, имеющий бесконтрольный доступ к компьютеру, в особенности,
– к работающему, способен:
– осмотреть его и найти пароли на вход в систему (нередко они записаны в очень «секретном» месте – под клавиатурой или в менее «секретном» – прямо на мониторе);
– попытаться штатно загрузить компьютер и при загрузке нажать клавишу F8 с целью войти в систему в режиме защиты от сбоев под учетной записью администратора (большое количество людей не устанавливают пароль на учетную запись администратора вообще, потому что просто не знают или не вспоминают о ней). Эта запись не видна пользователю после обычной загрузки, но появляется при загрузке в «Безопасном режиме»;
– прочитать пароли на доступ к электронной почте, которые хранятся в почтовом клиенте (для этого достаточно воспользоваться одной из многочисленных программ для просмотра паролей под «звездочками», которые в изобилии выложены в Интернете);
– скопировать на мобильный носитель нужную информацию;
– просмотреть и запомнить нужную информацию;
– сфотографировать экран компьютера с нужной информацией;
– установить на компьютере вирус, позволяющий получить управление им или нужную информацию;
– установить на компьютере клавиатурный перехватчик;
– открыть общий доступ к папкам компьютера, чтобы впоследствии иметь к ним удаленный доступ;
– скопировать и унести с собой файл с паролем на доступ к компьютеру, который позволит взломать его в спокойной обстановке.
В случае, если человек не обладает доступом к компьютеру и специальными навыками программирования, существует менее всего технических предпосылок для проникновения в чужую машину. В основном, возможности такого пользователя сводятся к попыткам прислать по электронной почте или по ICQ инфицированное программное обеспечение.
Элементарное запирание двери от компьютерной комнаты и выключение машины, когда она остается без присмотра, способны устранить большинство возможных проблем, описанных выше.
В связи с этим, в последние несколько лет на первое место в хакинге зачастую выходит так называемая, «социальная инженерия» – введение человека в заблуждение с целью вынудить его совершить действия в интересах атакующего. Людей, умеющих талантливо обманывать, значительно больше, чем хороших программистов.
В общем виде, социальная инженерия базируется на том, что человек, обладающий нужной информацией, не осознает всей ее важности. Поэтому, когда такого человека ставят в искусственно созданную ситуацию, которая ему кажется безобидной, он даже не замечает, как снабжает социального инженера крайне ценными для того сведениями. Существуют и приемы, когда жертву, наоборот, помещают в обстоятельства, куда более стрессовые, грозящие, якобы, немалыми неприятностями как самой жертве, так и окружающим, и таким образом заставляют выдать нужные сведения.
Например, молодой сотруднице в конце рабочего дня позвонили и, представившись помощником системного администратора, завязали с ней такой диалог.
«Помощник сисадмина» (громко): Вы что там творите?! Ваш компьютер завесил всю сеть!
Сотрудница (обычно – испуганно): Я ничего не делаю!
«Помощник сисадмина» (еще громче): Она еще и отпирается! У меня по логам ясно видно, что это ваш компьютер всю сеть держит! Что вы мне тут очки втираете! Шефу завтра с утра надо везти наверх документы, а сеть висит! Вообще обнаглели! Флэшками пользовались в последние пять дней?
Через минуту-другую такой «беседы» сотрудница обычно с радостью принимает информацию о том, что «что-нибудь попробуют придумать для разблокировки сети» и обычно свободно сообщает логин и пароль на доступ в систему. А если ей пообещают не рассказывать никому, что это именно ее машина «устроила аварию», то она, как правило, еще и сохранит эту беседу в тайне. По крайней мере, до утра. А больше хакеру и не требуется.
Мы не будем подробно рассматривать здесь всю разнообразную социальную инженерию, а приведем в качестве примера небольшой отрывок из книги Кевина Митника «Искусство обмана»,[30] иллюстрирующий методы и возможности социальных инженеров.
Первый звонок: Андреа Лопес.
Андреа Лопес ответила на телефонный звонок в видео-прокате, где она работала, и сразу улыбнулась: всегда приятно, когда клиент говорит много хорошего про сервис. Тот, кто позвонил, сказал, что у него осталось очень хорошее впечатление о сервисе видео-проката, и он хотел послать менеджеру письмо, и сообщить об этом.
Он спросил имя менеджера и его почтовый адрес. Андреа сообщила ему, что менеджер это Томми Элисон, и дала адрес. Когда звонивший хотел положить трубку, у него появилась другая идея, и он сказал: «Я б мог написать в офис вашей компании, тоже. Какой номер вашего магазина?» Девушка также дала ему и эту информацию. Он поблагодарил, добавил что-то приятное про то, насколько полезной была она, и попрощался.
«Звонок подобный этому, – подумала Андреа, – всегда помогает сделать карьерное продвижение быстрее. Как мило было бы, если люди делали подобное более часто».
Второй звонок: Джинни.
«Спасибо за звонок в Видео Студию. Это – Джинни, чем могу Вам помочь?»
«Привет, Джинни, – звонящий сказал с большим энтузиастом, как будто бы он говорил с Джинни каждую неделю или что-то вроде того. – Это – Томми Элисон, менеджер магазин 863 в Форест Парке. У нас есть клиент здесь, что хочет арендовать Рокки 5, но у нас нет ни одного экземпляра. Вы можете проверить, есть ли у вас?»
Она вернулась на линию через несколько секунд и сказала: «Да, у нас есть три копии».
«Хорошо, я спрошу, хочет ли он подъехать к вам. Спасибо. Если Вам когда-либо будет нужна любая помощь нашего магазина, просто позвоните и попросите Томми. Я буду рад сделать для Вас все, что смогу».
Три или четыре раза на протяжении следующих нескольких недель, Джинни получала звонки от Томми для помощи в том или ином деле. Это были на вид законные просьбы, и он был всегда очень дружественным, не пытался сильно надавить. Он был очень болтливым, когда они общались, например – «Ты слышала о большом пожаре на Oak Park? Там, на перекрестке…», и тому подобное. Звонки были небольшим перерывом в рутине дня, и Джинни была всегда рада услышать его. Однажды Томми позвонил и спросил: «У вас есть проблемы с компьютерами?»
«Нет, – ответила Джинни. – А почему должны быть?»
«Кто-то разбил автомобиль о телефонный столб, и телефонная компания заявляет, что целая часть города останется без связи и Интернета до тех пор, пока как они все исправят».
«О нет! Были человеческие жертвы?»
«Они увезли его в скорой помощи. Как бы то ни было, мне нужна небольшая помощь. Здесь ваш клиент, он хочет арендовать Крестного Отца II, и у него нет с собой его карты. Ты не могла бы проверить его информацию для меня?»
«Да, конечно».
Томми дал имя клиента и адрес, и Джинни нашла его в компьютере. Она дала Томми учетный номер.
«Никаких поздних возвращений или долга?» – Спросил Томми.
«Ничего не вижу»
«Хорошо, прекрасно. Я подпишу его вручную для счета и внесу в нашу базу данных позже, когда компьютеры снова заработают нормально. Он хочет оплатить счет карточкой Visa, которую он использует в вашем магазине, а у него нет с собой карты. Какой номер карты и дата истечения срока?»
Она дала ему номер, вместе с датой истечения срока. Томми сказал: «Спасибо за помощь. Поговорим позже», и положил трубку.
История Долли Лоннеган.
Лоннеган – это не тот молодой человек, которого вы хотели бы увидеть, когда открываете входную дверь. Бывший сборщик долгов в азартных играх, он все еще делает это иногда. В этом случае, ему предлагали значительную суму наличных за несколько телефонных звонков в видеомагазин. Звучит достаточно просто. Никто из этих «клиентов» не знал, как проделать этот трюк; им нужен кто-то с талантом Лонеганна.
Люди не выписывают чеки, чтобы покрыть их долги, когда им не везет или они поступают глупо за игрой в покер. Каждый знает это. Почему эти старые друзья продолжали играть с жуликом, что не имел денег на столе? Не спрашивайте. Может быть, у них чуть-чуть меньше IQ, чем у остальных. Но они – старые друзья – что вы можете поделать?
Этот парень не имел денег, так что они взяли чек. Я спрашиваю вас! Надо было бы подвести его к машине ATM (аппарат обналички чеков?), – вот что надо было сделать. Но нет, чек. На $ 3,230.
Естественно, он обманул. Чего вы еще ожидали? Потом они позвонили мне; могу ли я помочь? Я не закрываю двери перед людьми, которые пришли ко мне. Кроме того, в настоящее время есть лучшие пути. Я сказал им, что 30 процентов комиссионных мои, и я посмотрю, что смогу сделать. Итак, они дали мне его имя, адрес и я нашел в компьютере ближайший к нему видео магазин.
Я не очень спешил. Четыре телефонных звонка к менеджеру магазина, и затем, бинго – у меня есть номер карты Visa мошенника.
Другой мой друг – хозяин topless бара. За пятьдесят долларов, он сделал проигранную парнем сумму денег в покер долгом бару (через Visa). Пускай мошенник объясняет это все своей жене. Вы думаете, он мог бы попытаться сообщить в Visa, что это не его долг? Подумайте снова. Он знает, что нам известно кто он. И если мы смогли получить его номер карточки Visa, он догадается, что мы можем получить намного больше. Не волнуйтесь на этот счет. Анализ обмана.
Звонки Томми к Джинни были просто для построения доверия. Когда время пришло для атаки, она потеряла бдительность и осторожность и сообщила Томми о том, про кого он спросил, так как он – менеджер в другом магазине одной компании.
И почему она помогла ему – она уже знала его. Она только познакомилась с ним через телефон, но они установили деловую дружбу, которая является основой для доверия. Однажды она приняла его как менеджера в той же компании, доверие было установлено, а остальное было уже как прогулка в парке.
Сообщение от Митника.
Техника построения доверия является одной из наиболее эффективных тактик социальной инженерии. Вы должны подумать, хорошо ли вы знаете человека, с которым вы говорите. В некоторых редких случаях, человек может быть не тем, кем он представился. Следовательно, мы должны научиться наблюдать, думать, и спрашивать о полномочиях.
Социальная инженерия может быть применена где угодно и к какому угодно случаю. Защититься от нее можно лишь при одном условии: если люди знают о ее существовании (но даже в этом случае нельзя гарантировать, что социальный инженер не достигнет цели).
Как распознать, что письмо по электронной почте фактически пришло не с того адреса, который указан в заголовке письма
Если в письме написано, что оно пришло с определенного адреса, это не значит, что оно действительно пришло именно с этого адреса.
Существуют программы, вроде персонального SMTP-сервера Spectral (), и онлайновые сервисы по рассылке почты от любого имени.
Spectral превращает ваш собственный компьютер в почтовый сервер и отправляет письма от имени адреса, который пользователь введет в строку «от кого». При этом сообщение выглядит так, как если бы оно и впрямь пришло с того адреса, который указан в строке координат отправителя. И если получатель ответит на такое послание, номинальный отправитель действительно получит его письмо.
Существует техническая возможность определить при использовании персонального SMTP-сервера, с какого ip-адреса письмо отправлено. Раздел «помошь» этого сервера написан очень понятно и снабжен иллюстрациями, поэтому настройка программы не представляет никаких проблем.
Онлайновые сервисы по отправке писем от имени любого адресата обеспечивают более полную анонимность, и при их использовании люди, не являющиеся сотрудниками правоохранительных органов, расследующими преступление, узнать ip-адрес отправителя не могут. Такие сервисы называются ремейлерами (remailers). Они полезны в случае, если нет уверенности в порядочности получателя письма и в том, что тот не использует конкретное сообщение в противоправных целях. Нам известны случаи, когда специалисты конкурентной разведки и просто граждане отправляли письма с домашних или служебных компьютеров незнакомым людям, с которыми знакомились в Интернете, а те устанавливали местонахождение корреспондента и использовали эту информацию в своих целях, оказывая на отправителя психологическое воздействие.
На момент написания книги работоспособный ремейлер был доступен по адресу -bin/mixemail-user.cgi
Для того, чтобы попытаться проследить реальный путь письма, которе было получено по электронной почте, требуется зайти в его свойства. В почтовой программе Outlook Express это можно сделать, наведя курсор на письмо, нажав правую кнопку мыши и выбрав затем «Свойства». В почтовой программе The Bat! это же можно сделать, нажав клавишу F9 (либо тоже нажать правую кнопку мыши и затем пройти по меню «Специальное» > «Исходный текст письма»).
В исходном тексте письма видны ip-адреса, через которые сообщение шло от отправителя к получателю. Важно знать, что ip-адрес, с которого отправитель зашел в Интернет, транслируется каждый раз, когда используется почтовый клиент, а также в тех случаях, когда отправитель, войдя в Интернет, сразу открывает почтовый ящик, которым управляет через веб-интерфейс.
И только в случае, когда отправитель после входа в Интернет, сначала прописывает в своем браузере ip-адрес прокси-сервера, а затем идет через этот прокси-сервер в свой почтовый ящик, управляя им через веб-интерфейс, в «теле» письма, как часто его называют специалисты, подлинный ip-адрес этого пользователя фигурировать не будет.
После того, как установлены ip-адреса, через которые шло письмо, нередко представляется возможным определить город отправителя, а иногда – и физический адрес. Последнее чаще всего возможно в случае, когда письмо было послано из корпоративной сети, даже если при этом использовался веб-интерфейс бесплатной почтовой службы.
Вот пример «тела» письма, вызванного с помощью клавиши F9 в почтовой программе The Bat! (ip-адрес, адрес электронной почты и имя отправителя – вымышленные). Более крупным шрифтом выделены значимые участки текста, комментарии даны ниже этого текста.
Received: from YAMAIL (camay.yandex.ru) by mail.yandex.ru
id <S16642AbWEPEbg>; Tue, 16 May 2006 08:31:36 +0400
Received: from [87.89.236.115] ([87.89.236.115]) by mail.yandex.ru with
HTTP; Tue, 16 May 2006 08:31:36 +0400 (MSD)
Date: Tue, 16 May 2006 08:31:36 +0400 (MSD)
From: «Ulyana Petroff-Smit» <[email protected]>
Sender: [email protected]
Message-Id: <[email protected]>
MIME-Version: 1.0
X-Mailer: Yamail []
Errors-To: [email protected]
To: [email protected]
Subject: Re: Re[76]:
In-Reply-To: <[email protected]>
Reply-To: [email protected]
References: <S2078897AbWD3TAg/20060430190047Z+[email protected]> <[email protected]>
X-Source-Ip: 87.89.236.115
Content-Type: text/plain;
charset=«KOI8-R»
Content-Transfer-Encoding: 8bit
Проверка ip-адреса на ресурсе Vline:
– дала приведенный ниже результат.
Network Whois record
% This is the RIPE Whois query server #1.
% The objects are in RPSL format.
%
% Note: the default output of the RIPE Whois server
% is changed. Your tools may need to be adjusted. See
% http: //-proposal-20050331.html
% for more details.
%
% Rights restricted by copyright.
% See http: //
% Note: This output has been filtered.
% To receive output for a database update, use the «-B» flag.
% Information related to 87.89.76.0 – 87.90.255.255
inetnum: 87.89.76.0 – 87.90.255.255
netname: T-ONLINEFRANCE-ADSL
descr: Pools for VoIP ADSL customers
country: FR
admin-c: NOCT1-RIPE
tech-c: NOCT1-RIPE
status: ASSIGNED PA
mnt-by: T-ONLINEFRANCE
mnt-lower: T-ONLINEFRANCE
mnt-routes: T-ONLINEFRANCE
source: RIPE # Filtered
role: Network Operation Centre T-ONLINE FRANCE
address: T-Online France – Club Internet
address: 11 rue de Cambrai
address: 75019 Paris
address: France
phone: +33 1 55 45 45 00
fax-no: +33 1 55 45 47 78
e-mail: [email protected]
admin-c: AV-RIPE
tech-c: AV-RIPE
tech-c: OB346-RIPE
tech-c: DA3757-RIPE
tech-c: OT1274-RIPE
nic-hdl: NOCT1-RIPE
mnt-by: T-ONLINEFRANCE
source: RIPE # Filtered
% Information related to 87.88.0.0/14AS5410
route: 87.88.0.0/14
descr: T-Online France – Club Internet
origin: AS5410
mnt-by: T-ONLINEFRANCE
source: RIPE # Filtered
Итак, если рассматривать приведенные фрагменты служебной информации последовательно сверху вниз, то можно увидеть, что в самом начале фигурирует некий ip-адрес 87.89.236.115.
Письмо оформлено от имени Ulyana Petroff-Smit (это видно из записи «From: „Ulyana Petroff-Smit“ [email protected]») и направлено на адрес [email protected] (что отражено в строке «To: [email protected]»). Далее в тексте тела письма видно, что оно шло через серверы Яндекса: присутствуют многочисленные служебные адреса, принадлежащие данному ресурсу. В самом низу тела письма фигурирует ip-адрес, с которого был осуществлен вход в Яндекс (X-Source-Ip: 87.89.236.115). Проверка этого адреса показала, что он принадлежит французскому провайдеру и закреплен за ADSL. По всей вероятности, это фиксированный ip-адрес.
Причем, учитывая, что в «теле» письма нет никаких упоминаний о почтовом клиенте, это письмо уходило через веб-интерфейс. Тем не менее, реальный ip-адрес зафиксирован, поскольку именно с ним был произведен вход в почту Яндекса.
На практике, при проверке действительно содержавшихся в документе данных, наши предположения подтвердил отправитель письма, которому мы показали полученные результаты.
Если письмо отправляется с помощью почтового клиента, текст в «теле» письма удлинняется, поскольку содержит информацию о том, каким именно почтовым клиентом пользовался отправитель и через какие почтовые серверы письмо проходило. Таким образом, можно проследить весь путь сообщения при его отправке почтовым клиентом.
Тем, кому кажется слишком сложным разбираться во всех нюансах строчек, приведенных в теле письма, мы можем дать универсальный совет: «пробивать» все ip-адреса, которые содержатся в сообщении, особенно те, которые находятся в начале и в конце письма.
Как восстановить стертую с жесткого диска информацию и как удалить информацию без возможности восстановления
Все пользователи Windows знают, что для того, чтобы стереть файл, его надо поместить в корзину.
Многие из пользователей осведомлены, что корзину надо очистить.
Однако о том, что же происходит после очистки корзины, люди обычно не задумываются.
Для того чтобы понять, почему очистка корзины сохраняет возможность восстановления файла, попробуем разобраться в вопросе, как выглядит запись файла на жесткий диск и его удаление оттуда.
Винчестер компьютера при форматировании разбивается на радиальные сектора и концентрические дорожки. Все они пронумерованы, поэтому можно считать, что каждая точка физической поверхности диска имеет свои координаты. Это позволяет компьютеру при обращении к файловой системе безошибочно находить нужные файлы и их фрагменты. В момент, когда физически производится магнитная запись на жесткий диск компьютера, информация о координатах и имени записанного файла появляется и в специальном разделе, который можно уподобить таблице, фиксирующей положение файлов и их привязку к поверхности диска. Итак, можно сказать, что в момент записи происходит два события: файл физически записывается на жесткий диск и информация о нем заносится в таблицу.
В момент стирания файла информация о нем из таблицы удаляется. Тем самым компьютер разрешает запись новой информации на этот участок диска. Но на самом диске файл остается. Физическое удаление файла с жесткого диска произойдет лишь тогда, когда на его место будет записан другой файл. С каждым днем емкость винчестеров, доступных на рынке, увеличивается. Соответственно, вероятность, что файл будет «затерт» после удаления, становится все меньше.
Понимание этих обстоятельств породило появление двух типов программ – тех, которые стирают файл без возможности восстановления, и программ диаметрально противоположного назначения – тех, которые восстанавливают файлы, удаленные с жесткого диска штатными средствами операционной системы.
Программы, стирающие файлы без возможности их восстановления (например, Steganos Security Suite с сайта ), удаляют документы с поверхности жесткого диска, затем записывают на их место произвольные фрагменты информации, после чего их также удаляют. Этот цикл, в зависимости от выбранного уровня секретности, повторяется у некоторых программ от 12 до 36 раз. Причем, те из них, которые уничтожают информацию без возможности ее восстановления, часто могут работать в двух режимах: они стирают либо непосредственно те файлы, которые отметили как объекты удаления, либо стирают «пустое пространство» – те самые файлы, которые удалены из таблицы, но сохранены на поверхности диска. Работа по стиранию «пустого пространства» на современном компьютере с современными винчестерами может занимать до десяти часов и более. На практике проще всего запускать эту программу на ночь или на выходные дни, чтобы она заведомо успела справиться с работой.
Программы по восстановлению стертой информации (при условии, что ее стирали, как мы уже говорили, штатными средствами Windows) «смотрят» на поверхность жесткого диска и вновь записывают в таблицу ту информацию, которая на жестком диске содержится фактически.
Примером такой программы может служить R-Undelete (www.r-undelete.com). Таким образом, восстановленные файлы снова отображаются в «Проводнике» и становятся доступны для работы пользователя.
Мы не будем останавливаться подробно на конкретных программах этих групп, поскольку их достаточно много и все они подробно описаны в Интернете. Так, например, программы по восстановлению данных легко находятся по элементарному запросу:
«программа восстановление стертых файлов».
Как спрятать информацию на своем компьютере от посторонних глаз
Мы не рассматриваем в данном случае программы, предназначенные для шифрования информации на дисках, подобно тому, как это делает Secret Disk Server. Желающие ознакомиться с программами, защищающими информацию на серьезном уровне, могут обратиться за справкой в Интернет, где содержится исчерпывающая информация по этому поводу.
Мы говорим о необходимости просто скрыть от посторонних глаз папки или отдельные файлы, не зашифровывая их содержимое. Такая необходимость возникает даже в бытовых целях, дабы соседи по офису или домочадцы не видели некоторой информации. Тем более полезны подобные утилиты для конкурентной разведки, в работе которой известная доля конфиденциальности присутствует всегда. Для поставленной задачи вполне подходит простая в обращении программа Hide Folders (/).
Для того, чтобы максимально использовать возможности этого приложения, требуется в настройках запретить программе показываться в списке «Установка и удаление программ», а также не создавать ярлыка быстрого запуска. Иконку программы, представленную в виде папки с волшебной палочкой, можно сменить на любой другой значок и убрать в какой-нибудь каталог. А кроме того, не помешает поставить в настройках опцию «скрывать папки в защищенном режиме». Включение папки в список скрываемых достигается нажатием одной кнопки. Для исключения ее из этого списка также требуется нажать одну-единственную клавишу.
Программа, как уже было сказано, не шифрует папки и файлы и не позволяет защититься от человека, который загружается под DOS, но в подавляющем большинстве случаев в обычном офисе компании это и не требуется.
Заключение
В заключение хотим еще раз напомнить, что Интернет – мощный инструмент в работе специалиста конкурентной разведки, хотя и не главный. Интернет доступен практически из любой точки Земного шара и недорог в использовании. Он содержит массу полезной информации, но легко может и дезинформировать. Интернет очень уступает по своей значимости для конкурентной разведки такому классическому методу, как работа с людьми в качестве источника информации, однако многое из того, что он может, либо вовсе недоступно другим приемам указанной службы, либо неоправданно дорого при попытке добиться того же результата иными методами.
Понимание сильных и слабых сторон Интернета позволяет использовать его с максимальной эффективностью там, где это может сэкономить время и средства, и вместе с тем отказаться от его применения там, где это заведомо не плодотворно. Кроме того, понимание плюсов и минусов метода способствует правильной оценке полученных с его помощью результатов.
Мы искренне надеемся, что эта книга поможет специалистам российских предприятий максимально полно использовать преимущества Интернета и минимизировать при этом влияние его недостатков. Как следствие, повысится конкурентоспособность отдельного специалиста, отдельного предприятия и всей нашей страны.
Ющук Евгений Леонидович
Екатеринбург, 2006 г.
Примечания
1
Артур Вейс, в личной беседе, из неопубликованного, 2006 г.
(обратно)2
Price G., Sherman С. The Invisible Web: Uncovering Information Sources Search Engines Can't See. CyberAge Books, 2001.
(обратно)3
.
(обратно)4
/
(обратно)5
Price G., Sherman С. The Invisible Web: Uncovering Information Sources Search Engines Can't See. CyberAge Books, 2001.
(обратно)6
Форум Яндекса «Где найти?» .
(обратно)7
Цит. по: Голикова Л. Любовь к искусству со взглядом на будущее (14.12.1999).
(обратно)8
Бутрин Алексей. Иголки в стоге сена // Игромания. – № 73, № 74, 2003; № 76, 2004.
(обратно)9
Сайт программы Check&Get .
(обратно)10
Сайт программы Check&Get .
(обратно)11
Arthur Weiss «Secondary Source Information», материалы тренинга на Десятой Европейской конференции SCIP, Лондон, 2005 г.
(обратно)12
-group.ru/radiusgroup/-/news/it/1/9/12225.phtml Новости индустрии IT (АРХИВ).
(обратно)13
/.
(обратно)14
Гиперссылка SearchDNS на главной странице сайта
(обратно)15
.
(обратно)16
.
(обратно)17
Е. Л. Ющук «Конкурентная разведка: маркетинг рисков и возможностей», М., Вершина, 2006.
(обратно)18
.
(обратно)19
:41:02/cia.
(обратно)20
-05-05
(обратно)21
/.
(обратно)22
Kahaner L. Competitive Intelligence. – N. Y.: Simon & Shuster, 1997.
(обратно)23
.
(обратно)24
.
(обратно)25
.
(обратно)26
Burwell H. P. Online Competitive Intelligence: increase your profits using cyber-intelligence. – Facts on Demand Press, 1999.
(обратно)27
Weiss A. Secondary Source Information // Материалы тренинга на Десятой Европейской конференции SCIP, Лондон, 2005 г.
(обратно)28
/.
(обратно)29
Price G., Sherman С. The Invisible Web: Uncovering Information Sources Search Engines Can't See. CyberAge Books, 2001.
(обратно)30
Митник К. Д., Саймон В. Л. Искусство обмана. – М.: Компания АйТи, 2004.
(обратно)
Комментарии к книге «Интернет-разведка. Руководство к действию», Евгений Леонидович Ющук
Всего 0 комментариев