Билл Фрэнкс Революция в аналитике. Как в эпоху Big Data улучшить ваш бизнес с помощью операционной аналитики
Переводчик И. Евстигнеева
Редактор В. Мылов
Руководитель проекта М. Султанова
Арт-директор Л. Беншуша
Корректор И. Астапкина
Компьютерная верстка Д. Жаровский
© 2014 by Bill Franks. All rights reserved
© Издание на русском языке, перевод, оформление. ООО «Интеллектуальная Литература», 2016
Все права защищены. Произведение предназначено исключительно для частного использования. Никакая часть электронного экземпляра данной книги не может быть воспроизведена в какой бы то ни было форме и какими бы то ни было средствами, включая размещение в сети Интернет и в корпоративных сетях, для публичного или коллективного использования без письменного разрешения владельца авторских прав. За нарушение авторских прав законодательством предусмотрена выплата компенсации правообладателя в размере до 5 млн. рублей (ст. 49 ЗОАП), а также уголовная ответственность в виде лишения свободы на срок до 6 лет (ст. 146 УК РФ).
* * *
«Я знаю Билла на протяжении многих лет и всегда восхищался его в высшей степени прагматичным и прямым подходом к операционализации аналитики. Два десятилетия практического опыта работы в условиях реального бизнеса выделяют Билла на фоне остальных экспертов и делают его одним из лидеров аналитической мысли!»
Эльпида Орманиду, вице-президент по аналитике в области человеческих ресурсов, компания Walmart«Фрэнкс создал очередной шедевр прагматичного руководства, показав, как можно взять стандартные практики и вывести их на совершенно новый качественный уровень. Специалисты по аналитике и ИТ-специалисты по достоинству оценят информацию, которую представляет Фрэнкс в своей книге с точки зрения бизнеса. Также эта книга будет чрезвычайно полезна всем тем, кто хочет вывести свои организации на новый уровень использования аналитики и принятия решений на основе данных».
Джефф Тэннер, автор книги «Аналитика и стратегия динамического управления отношениями с клиентами» и директор Инновационной бизнес-коллаборатории Университета Бэйлора«Еще несколько лет назад многие организации и люди сомневались в ценности больших данных и в необходимости аналитики как таковой. Сегодня те, кто продолжает сомневаться, упускают колоссальные возможности. Их бизнес быстро переходит в разряд устаревших и отстающих. Но с чего начать? Хотя ни одна книга не в состоянии охватить весь спектр вопросов, «Революция в аналитике» предлагает комплексный взгляд на внедрение операционной аналитики. Я искренне рекомендую эту книгу».
Фил Саймон, спикер, журналист и автор книг «Визуальная организация» и «Слишком большие, чтобы их игнорировать»«Это исчерпывающее и столь востребованное сегодня руководство по внедрению операционной аналитики, автоматизации принятия решений и интеграции анализа данных в бизнес-процессы. В эпоху больших данных аналитика стремительно становится ключевым стратегическим дифференцирующим фактором, и трудно найти лучшего проводника в мир аналитики, чем Билл Фрэнкс».
Джил Пресс, обозреватель Forbes.com«Книга доходчиво и систематизированно излагает то, что должен знать и применять руководитель, который хочет сделать свою организацию успешной при помощи аналитики. Сегодня аналитика кардинально меняет способы принятия решений в организациях в рамках операционных процессов и даже самими клиентами! Это революционное изменение в подходе к принятию решений становится новой реалией бизнеса. Я рекомендую эту книгу тем, кто хочет доподлинно узнать, чего следует ожидать от операционной аналитики и, главное, что следует делать!»
Рассел Уокер, адъюнкт-профессор в области экономики управления и науки о принятии решений в Школе менеджмента имени Келлога Северо-Западного университета«Если вы находитесь в гуще движения по внедрению больших данных в вашей организации (а кто может остаться от него в стороне?), вы должны прочитать эту книгу. Используя свой уникальный дар рассказчика, Билл Фрэнкс предлагает нам увлекательный и содержательный рассказ о том, как компании по всему миру превращают собираемые ими массивы данных в новые источники доходов и конкурентного преимущества. В частности, Билл уделяет внимание такой важной теме, как грамотное управление данными, которая часто игнорируется при обсуждении больших данных. Продолжая тему книги «Укрощение больших данных», своими четкими и компетентными рекомендациями он дает в руки читателей доску для серфинга, при помощи которой они смогут укротить волну больших данных и операционной аналитики. Билл также излагает свое видение мира будущего, где правят данные».
Линда Бёртч, управляющий директор рекрутингового агентства Burtch Works Executive Recruiting«Один из ключевых уроков, который мы выучили в Kaggle, состоит в том, что анализ больших данных – это не только создание продвинутых алгоритмов. Билл написал отличную книгу о том, что нужно знать и делать, чтобы успешно претворить операционную аналитику в жизнь».
Энтони Голдблум, основатель и генеральный директор компании KaggleЭта книга посвящается Стейси, Джесси и Даниэль
Предисловие к русскому изданию компании Teradata Чем больше данных, тем «умнее» наш мир
Человечество умеет прогнозировать процессы и события, опираясь на накопленные знания, известные факты, процессы и связи. Но что, если опыт, полученный ранее, больше не помогает нам ориентироваться в современном мире? Как реагировать на взрывной рост объемов данных и новые экономические вводные, которые постоянно ставят руководителей в неизвестные им до этого условия? Интуиция, которая помогала раньше, подводит, и очевидные, казалось бы, действия приводят к неудачам. Жизнь руководителя сегодня – это принятие решений в максимально неопределенных условиях, при ежедневно нарастающем объеме информации и ее источников.
К 2020 году почти все взрослое население планеты, т. е. не менее пяти миллиардов людей, будет подключено к Интернету. К этому времени в мире будет насчитываться примерно 50 млрд подключенных устройств – источников данных, к ним будут относиться не только всевозможные стационарные, настольные и носимые с собой компьютеры, но и бытовая электроника, транспортные средства, торговое оборудование, медицинские приборы, промышленные системы, датчики ЖКХ и т. д. Возможно, к этому времени Big Data и Internet of Things окончательно перестанут быть предметом дискуссий визионеров и станут повседневной реальностью, которая нас окружает. Объем доступной информации будет колоссальным, и важнейшей задачей станет извлечение ценности из этой информации. Например, человек приехал в торговый центр – на какой машине? Куда он пошел – в кафе? В кино? В магазин? Что он купил? Что он в этот момент искал в Интернете? Заходил ли он в магазин детских товаров или товаров для животных? Как часто он сюда приезжает? Какие точки в этом торговом комплексе посещает в первую очередь, а до каких не добирается вовсе? Все эти данные – золотая жила для ритейлеров.
Но изучение покупательского поведения – только одна из множества областей применения больших данных. Уже в обозримом будущем аналитика поможет нам решать, без преувеличения, любые задачи. Например, возьмем оборудование нефтяных вышек. Как и любое оборудование, оно изнашивается и ломается, каждый день простоя обходится нефтяным компаниям в миллионы долларов. Постоянный мониторинг, сбор и анализ всех данных позволит заблаговременно выяснить, что происходит с этим оборудованием, и своевременно провести его недорогое плановое обслуживание, прежде чем возникнут серьезные неисправности. Каким рабочим нагрузкам оно подвергается? Каковы природные, климатические предпосылки поломок? Какие паттерны отказов можно выделить? Какая возможна профилактика простоев? Если же поломка произошла, как максимально сократить время простоя? Аналитика данных позволит узнать об этом оборудовании буквально все – как оно работает, как ведет себя в той или иной ситуации, когда оно дает сбои и как их предотвратить.
А теперь представьте на месте нефтяной вышки любой другой сложный технический объект. Обслуживание авиалайнера – проект еще более высокой сложности, чем ремонт нефтяной вышки, но аналитика позволит не только прогнозировать, какие узлы самолета стоит диагностировать заранее, не дожидаясь планового осмотра, но и запланировать доставку запчастей в определенный аэропорт – оперативно и экономно!
Обслуживание автомобиля – сравнительно простая задача, но что, если масштабировать ее на миллионы машин? Осознавая сложность подобного проекта, компания Volvo Cars, тем не менее, нашла его осуществимым. Проект сбора и анализа данных со всех датчиков всех автомобилей Volvo, начатый при поддержке Teradata, позволит успешно идентифицировать и предупреждать изначальные причины неисправностей и поломок автомобилей. Для потребителя это будет выглядеть так, будто автомобиль сам следит за собой и прогнозирует необходимость технического обслуживания. Чем больше будет накоплено данных для аналитики, тем «умнее» станут машины.
Огромные перспективы – у предприятий, недавно приступивших к внедрений технологий больших данных и бизнес-аналитики, таких, как службы государственного управления, инфраструктурные предприятия, организации коммунального хозяйства, розничные сети, предприятия здравоохранения. Но даже в тех отраслях, которые изначально и с большим успехом опирались на информационные технологии и бизнес-аналитику – банковский бизнес, телекоммуникационные услуги, – есть, над чем работать. Кардинально улучшить картину взаимоотношений поставщиков и клиентов на соответствующих рынках может аналитический подход к разработке пакетов услуг, условий оказания сервиса, программ лояльности. Необходимые для этого условия – сбор и накопление данных, их обработка с использованием соответствующих аналитических инструментов, методологическая помощь консультантов по бизнес-аналитике и глубокая операционно-аналитическая работа отраслевых специалистов.
Такие подходы успешно работают и в различных областях научных исследований. Именно глубокий анализ данных делает возможным прорыв в изучении генома человека, глобальных изменений климата и поведении Мирового океана. И, если вдуматься, нет ничего удивительного в том, что изначально наукоемкие технологии дают возможность развиваться и бизнесу.
Поэтому я очень рад представить вам новую книгу «Революция в аналитике», которую написал Билл Фрэнкс, директор компании Teradata по аналитике и один из крупнейших в мире специалистов по бизнес-аналитике. Билл Фрэнкс – один из тех, кто очень хорошо понимает, в чем ценность данных и как поставить большие данные и интернет вещей на службу человеку.
Я уверен, что знакомство с этой книгой даст вам новые знания, свежие идеи и понимание удивительных процессов, участниками которых мы все с вами сегодня являемся.
Приятного вам чтения!
Андрей Алексеенко,глава компании Teradata в РоссииПредисловие к русскому изданию компании IBS
Взрыв интереса к технологиям «больших данных» породил массу смелых ожиданий и, возможно, некоторое количество разочарований. Да, мы живо представляли себе потрясающее будущее, где компьютеры предотвращают эпидемии, решают транспортные проблемы, управляют экономикой, угадывают желания потребителей и следят за безопасностью. Однако будущее оказалось чуть дальше, чем нам хотелось, потому что по пути к этому светлому будущему нужно еще найти ответы на массу вопросов – технических, организационных, юридических, психологических, – связанных с каждодневным прикладным применением «больших данных».
Так когда, наконец, наступит это удивительное цифровое будущее?
Я рискну высказать мысль, что мы уже в этом будущем. Мы лишь, как обычно, с близкого расстояния не можем оценить глубины тех изменений, которые сейчас переживает мир. Посмотрите на множество успешных стартапов, буквально взорвавших мир и изменивших жизнь миллионов людей, чьи бизнес-модели построены на глубокой аналитике данных и переработке огромных объемов информации! Цифровые модели управляют сегодня такси, маршрутами самолетов и грузовиков, магазинами, логистическими сетями и заводами. Как покупатели и пользователи Интернета и смартфонов мы уже в полной мере живем «цифровой жизнью». А как бизнесменам и менеджерам нам пора задуматься о том, каковы перспективы наших бизнесов в этом новом мире непрерывного цифрового взаимодействия и онлайн-аналитики. Каждый бизнесмен сегодня должен подумать о том, какие возможности и угрозы создает для него современная цифровая среда.
Книга Билла Фрэнкса мне кажется очень своевременной именно потому, что она не пытается убедить нас, что аналитика данных – это будущее, а говорит об «аналитической революции» как об уже свершившемся факте. Автор, не отрицая прогресс в «больших данных», считает совершенно непринципиальным разделять разные виды и источники данных. Главное, по его мнению, уметь эффективно вовлекать правильную информацию всевозможных форматов в процесс анализа и принимать на ее основе правильные решения.
Фрэнкс говорит об «операционализации аналитики», т. е. о переходе к совершенно новой для бизнеса ситуации, когда аналитические решения внутри компании не просто помогают видеть результаты прошлого и тестировать сценарии будущего. Теперь правильно настроенная аналитическая машина способна на основании доступных ей данных самостоятельно принимать решения операционного уровня – безошибочно делая это тысячи или миллионы раз за день. Автор утверждает, что очень многие управленческие решения могут приниматься роботизированными алгоритмами без вмешательства человека. Такая аналитика транзакционного уровня – безусловно, новый шаг по сравнению с традиционным пониманием бизнес-анализа как базы для принятия решений на стратегическом горизонте. Кому-то это покажется слишком смелым, но подобная идея – принципиальное отличие современного цифрового бизнеса! Например, правильно настроенный рекомендательный алгоритм на сайте интернет-магазина гораздо лучше любого человека-продавца умеет предлагать покупателю дополнительные сервисы и покупки. Или, скажем, автоматизированные методы оценки деловых и личных качеств сотрудников уже сейчас демонстрируют достаточно качественные результаты – почему бы не предположить, что в будущем компьютер сможет самостоятельно принимать решения о приеме человека на работу или о его увольнении? А с повсеместным распространением так называемого Интернета вещей (о его приложениях Билл Фрэнкс также упоминает в своей книге) объем данных, доступных для анализа и принятия решений, возрастет еще на порядок, а значит, возрастет точность этих решений и области применения операционной аналитики.
Безусловно, внедрение аналитики операционного уровня – это вызов, и Билл Фрэнкс дает очень конкретные и прикладные советы и рецепты по имплементации такого операционно-аналитического процесса в бизнес. Он предлагает структуру и конкретные шаги, как выстроить внутри компании индустриальный механизм сбора и переработки всевозможных данных. Он предостерегает нас от ошибок, говорит о рисках и анализирует удачные и неудачные примеры из собственной практики. Эта книга – готовая модель по внедрению практики управления компанией на основе анализа данных реального времени.
Я уверен, что Россия не сможет и не захочет остаться в стороне от тренда на создание цифровых бизнес-моделей. В ряде приложений эти новые алгоритмы – самый эффективный способ решения актуальных для нас задач. Скажем, при наших географических расстояниях цифровые логистические модели – очень важная тема, и аналитические системы операционного уровня тут обязательно найдут свое применение. Актуальны задачи управления рабочей силой при нашем сжимающемся рынке труда – алгоритмы могут помочь и здесь.
Мы уже сейчас нередко обсуждаем подобные вопросы с партнерами и клиентами и видим, что компании не всегда знают, с чего начать. Накопленных опыта и знаний в этой новой для нас сфере пока недостаточно, не хватает структурного взгляда – с чего начать, как строить команду, что внедрять, какие управленческие решения принимать. Это вопросы, ответы на которые дает в своей книге Билл Фрэнкс. Я уверен, его советы очень помогут многим компаниям успешно перешагнуть устаревшие бизнес-модели и перейти к цифровому бизнесу завтрашнего дня.
Сергей Мацоцкий,председатель правления компании IBSПредисловие автора
Если в течение последних 10–20 лет вы интересовались темами корпоративного интеллекта, аналитики и больших данных, то, возможно, задавались вопросом: что будет дальше? В конце концов первоначальный ажиотаж вокруг больших данных начинает спадать, и аналитика всех видов постепенно становится важной, но уже привычной частью бизнеса.
О том, что будет дальше, вы можете узнать в этой книге. Билл Фрэнкс называет новый феномен «операционной аналитикой», но его также можно назвать «производственной аналитикой», «аналитикой в режиме реального времени», или «автоматизацией принятия решений». Как становится понятным из этих терминов, подход к практическому применению аналитики меняется стремительно. Причем сама по себе аналитика меняется не так сильно. Фрэнкс отмечает, что операционная аналитика по большей части остается той же традиционной аналитикой, которой мы занимались на протяжении десятилетий и даже столетий. Изменился же контекст ее применения.
В подробностях об этом вы можете – и должны – прочитать в данной книге. Отмечу лишь, что, в отличие от неторопливой пакетной аналитики, бывшей уделом бэк-офисов, сегодняшняя операционная аналитика выполняется намного быстрее и к тому же непрерывно. Причем выполняется не отдельно, а интегрируется с существующими бизнес-процессами и системами. Я называю эту тенденцию «Аналитикой 3.0», и вы прочитаете о том в первой главе, но термин Билла «операционная аналитика», безусловно, точнее. И Билл описывает ее феномен гораздо подробнее, чем это когда-либо удавалось сделать мне.
Такое развитие давно уже запоздало – лет на 50, пока существовало разделение между аналитикой и деловыми операциями, породившее ряд проблем. Хотя руководители часто требовали аналитику и данные для поддержки своих решений, но фактически ими не пользовались. Вероятно, они просто хотели предстать более рассудительными и интеллектуальными, чем были на самом деле. Количественные аналитики, которые должны находиться на переднем крае и в центре всех деловых решений и действий, как правило, находились от руководства на значительном удалении (отмечает Фрэнкс в главе восьмой, исходя из собственного опыта). Все, что касалось аналитики, производилось гораздо медленнее, чем следовало бы. Даже и в этих условиях аналитика приносила пользу, но далеко не настолько, насколько была способна.
Принимая во внимание все эти проблемы традиционной аналитики, пожалуй, следует рассматривать как приверженность силе привычки тот факт, что организации по-прежнему планируют внедрение и регламентацию аналитики в своей деловой деятельности, а не переводят ее в разряд дополнительных и необязательных действий. Использование же операционной аналитики исключает пренебрежение к аналитике как таковой вследствие неправильного ее применения. Аналитика нужна для формирования как стратегических, так и тактических решений, и ее нужно выполнять в одно время, в одном месте с основной операционной деятельностью и на той же скорости. Насколько ускоряется поток данных внутри компаний, настолько должна увеличиваться и скорость аналитической обработки и принятия решений.
Если же вы не заглядывали в будущее, то, возможно, сочтете эту книгу очередным опусом на тему больших данных. Ничего подобного. Во-первых, Фрэнкс уже написал замечательную книгу на эту тему: «Укрощение больших данных»1[1] (Taming the Big Data Tidal Wave). Во-вторых, здесь он рассматривает использование любых данных – всех типов и размеров. Фактически его новый труд можно определить как первую книгу после больших данных. Фрэнкс считает само собой разумеющимся, что организации будут использовать имеющиеся у них как небольшие структурированные, так и крупные, менее структурированные информационные активы. Разве может быть иначе? Кажется очевидным, что данные могут быть полезными независимо от их размера или структуры. К сожалению, поскольку «малые данные» появились до «больших», редко кто из авторов рассматривает «все данные» и рекомендует приспособить технологическую среду и аналитические процессы к различным типам данных, которыми вам придется управлять и которые придется анализировать.
Кроме того, это одна из первых книг, где рассматривается «аналитика вещей». Об Интернете вещей уже написано немало: быстрый поиск на Amazon выдает больше десятка книг, несмотря на относительную новизну термина. Но гораздо меньше написано о том, как можно извлечь пользу из сенсорных данных, т. е. анализировать и использовать их для нахождения решений и обнаружения аномалий. Многие из приведенных Фрэнксом примеров применения операционной аналитики включают Интернет вещей, и автор рассматривает то, как аналитика может быть использована для работы с огромными потоками данных, производимых сенсорами.
Хотя Билл Фрэнкс и является ведущим аналитиком компании Teradata, он не отдает предпочтения конкретным технологиям и поставщикам. Например, в главе пятой совершенно беспристрастно обсуждаются сравнительные достоинства платформы Hadoop и коммерческих хранилищ данных, основанных на реляционной технологии. Думаю, что Билл прав в том, что большинство организаций будут использовать разнообразные технологии хранения и анализа данных. Похоже, ничто не исчезает бесследно; новые технологии дополняют старые, а объемы данных растут достаточно быстрыми темпами, чтобы нашлось применение всем технологиям.
Книга охватывает широкий круг вопросов – от технологий и неприкосновенности частной жизни до кадровых проблем. Все это изложено в очень приемлемой форме и доступным языком. Не в стиле Фрэнкса шокировать читателей сенсационными заявлениями и предсказаниями, вместо этого вам предлагается спокойное и откровенное описание состояния операционной аналитики в 2014 г.
Слово «революция» в названии книги вполне уместно. Переход к операционной аналитике является революционным во многих отношениях, что и раскрывается в книге. Тем не менее есть по крайней мере одна нестандартная проблема, которую Фрэнкс не рассматривает подробно. Встроенная в систему, создаваемая в режиме реального времени аналитика поднимает множество вопросов о том, как будут функционировать организации в будущем. Когда принятие решений в значительной степени перейдет к компьютерам, что станет с людьми, ранее принимавшими решения? Как смогут люди контролировать и совершенствовать процесс принятия решений, если он фактически станет невидимым? Фрэнкс указывает – когда решения принимаются в режиме реального времени и без (или почти без) вмешательства человека, потребуется действительно хороший подбор аналитики и правил принятия решений, иначе можно очень быстро потерять много денег. Однако он не раскрывает подробно новые роли людей в этой среде. Должен признаться, что я несказанно рад такому его упущению, поскольку сам как раз пишу книгу на данную тему!
Итак, погрузитесь в эту книгу и в прежде неведомый вам мир, где многие важные решения принимаются благодаря операционной аналитике. Вы ничего не потеряете, кроме нерешительности и своего офиса за вашей спиной!
Томас Дэвенпорт,почетный профессор в области информационных технологий и менеджмента в Колледже Бэбсона, соучредитель и руководитель научно-исследовательских работ в Международном институте аналитикиВступление
Подобно индустриальному производству в XVIII в., сфере аналитики необходимо пройти через свою промышленную революцию. Аналитические процессы сегодня обычно осуществляются кустарным способом, причем с осторожностью и ориентированностью на потребителя. Во многих случаях это срабатывает, а кустарный способ зачастую оказывается вполне подходящим. Тем не менее нам необходимо начать выводить аналитику на новые уровни с точки зрения как масштаба, так и воздействия. Промышленная революция трансформировала процессы производства из ремесленничества в современные фантастические технологии, позволяющие производить качественные продукты в массовом масштабе. Такого же рода революция должна произойти и в области аналитики.
Много веков назад, если людям требовалась чаша, они обращались к гончару. Гончар изготавливал чашу в соответствии с потребностями заказчика. Проблема заключалась в том, что такой подход нельзя было масштабировать. Ограниченное количество гончаров могло изготовить лишь определенное количество чаш в день. Сегодня посуда в основном производится в промышленных масштабах на фабриках. Разумеется, по-прежнему можно заказать индивидуальную посуду у гончара, но такой подход будет неразумным с точки зрения затрат и годится только для особых случаев. Помимо финансовых соображений люди сегодня зачастую делают выбор в пользу стабильности продукции массового производства. Тем не менее даже в современном мире посуда не появляется неким волшебным образом. Кто-то по-прежнему должен придумывать ее дизайн, создавать прототипы, пресс-формы и следить за тем, чтобы пресс-формы раз за разом производили одинаковую продукцию. И только когда производственная линия полностью собрана и отлажена, новую посуду запускают в массовое производство.
Подобный процесс требуется и для операционной аналитики. По-прежнему необходимо для каждого нового вида анализа разрабатывать его модель и структуру. И по-прежнему необходимо создать прототип анализа и протестировать его со многими повторами, чтобы убедиться в правильности его работы. Только после этого аналитический процесс может быть переведен на уровень операционного и запущен в автоматическом режиме. А после запуска исполнение аналитического процесса должно постоянно отслеживаться подобно тому, как отслеживается работа реальной производственной линии.
Переход к операционной аналитике не устраняет ни одного из шагов, которые традиционно требовались для создания аналитического процесса. При этом он развивает процесс дальше. Операционная аналитика придает аналитике промышленный масштаб, точно так же как индустриальное производство позволило сделать это с изготовлением посуды.
Операционная аналитика интегрирует аналитику в бизнес-процессы и автоматизирует принятие решений, с тем чтобы тысячи или миллионы повседневных решений принимались в ходе аналитических процессов без какого-либо вмешательства человека. Независимо от того, касаются ли эти решения напрямую клиентов или же направлены на оптимизацию негласной деятельности организации, воздействие нового подхода может оказаться существенным.
Если же организация не станет осваивать операционную аналитику, то ей придется нелегко в борьбе с конкурентами, которые будут все глубже внедрять аналитику в свои деловые процессы. Сегодня бизнесу доступны мириады возможностей для применения операционной аналитики, благодаря увеличению доступности данных, мощностей по их обработке и понятности надежных аналитических технологий.
Осознаем мы это или нет, операционная аналитика уже постоянно работает вокруг нас, воздействуя на нашу жизнь. Во многих случаях аналитика больше не скрывается. Сегодня потребители зачастую знают о ее применении и даже ожидают ее результатов. Чтобы подготовить читателя к дальнейшему повествованию, перечислю лишь вкратце, как операционная аналитика влияет на наши повседневные будни:
• В случае задержки рейса авиакомпании автоматически перенаправляют пассажиров на другой маршрут, чтобы ограничить нарушение расписания и повысить удовлетворенность клиентов. При этом аналитические программы принимают во внимание множество факторов, в том числе касающихся конкретного клиента, других пассажиров и статуса альтернативных рейсов.
• Посещая свои любимые веб-сайты, пользователи получают рекомендации насчет того, что еще им может понравиться. Рекомендации формируются на основе прошлых просмотров пользователей, терминов поискового запроса, а также, видимо, важнейших для них особенностей, судя по шаблонам их поведения в прошлом. Зачастую учитываются все действия пользователей вплоть до последнего клика.
• Когда клиент обращается за помощью к страховому агенту, последний, как правило, располагает страховой историей позвонившего, а аналитическая программа предлагает агенту, как можно решить вопрос наилучшим образом. Действия рекомендуются с учетом многих факторов, касающихся как самого клиента, так и продукта или услуги, интересующих его.
• Социальные медиасайты позволяют находить старых друзей или коллег, с которыми давно потеряна связь, при помощи анализа протяженных социальных сетей. Через несколько секунд после установления связи с другом пользователю выдаются дополнительные рекомендации.
• Приходя в магазин, люди могут на месте получить кредит на основе оценки их текущей кредитоспособности, которая определяется с помощью анализа широкого диапазона данных о кредитной истории клиента.
• Банки и эмитенты кредитных карт постоянно используют анализ для защиты нас от мошенничества. Выявляя на счетах поведенческие аномалии, которые указывают на мошенничество, банки могут быстро заморозить счет до тех пор, пока подозрительная транзакция не будет сверена с клиентом.
Это всего лишь несколько примеров повседневного воздействия на нас операционной аналитики, когда она приносит нам несомненную пользу и когда мы вправе рассчитывать на ее дальнейшую активизацию. Ниже мы рассмотрим широкое разнообразие других ситуаций, когда люди в основном даже не подозревают о воздействии на них аналитики.
При этом многие технологии и архитектуры, которые поддерживали традиционные подходы к развитию и применению аналитических процессов, перестали удовлетворять сегодняшним усложнившимся требованиям. Классические системы и архитектуры, как и классические методы аналитики, начали ломиться под тяжестью требований операционной аналитики. Следовательно, организации должны адаптироваться к реальности и изменить свои способы хранения и анализа данных, а также использования полученных результатов. Это обусловливает необходимость изменения не только инфраструктуры и аналитических методологий, но и корпоративной политики. Если организация попытается втиснуть оперативную и высокообъемную операционную аналитику в существующие системы и процессы, созданные и спроектированные для поддержки только пакетной обработки, такую организацию ожидают очень серьезные трудности.
Вероятно, по мере продолжения гонки аналитических вооружений мы станем свидетелями дальнейшего распада существующих бизнес-моделей и конкурентной среды. 20 лет назад многие организации вообще не использовали аналитику или использовали ее понемногу. Сегодня большинство организаций используют изрядное количество аналитики. Раньше можно было довольствоваться данными недельной давности и аналитическими процессами, построенными на редко проводимой пакетной обработке. Сегодня, когда лидеры аналитической сферы сделали аналитику операционной, этого уже недостаточно.
Еще через пять – десять лет не останется практически ни одного бизнеса, которого не затронет данная тенденция. Сопротивление бесполезно. Вашей организации придется внедрить операционную аналитику, и эта книга поможет вам приступить к делу. В ближайшие годы будет происходить непрерывная трансформация бизнеса по мере того, как аналитика станет превращаться из просто приятного дополнения в действительно важнейший операционный компонент деловой деятельности. Основное внимание в книге уделяется тому, как протекает эта эволюция и что требуется для понимания и использования операционной аналитики в вашей организации.
Усаживайтесь поудобнее, и приступим!
Кому стоит прочитать эту книгу?
Книга призвана снабдить читателей практическими знаниями о том, что такое операционная аналитика, что о ней должна знать организация и каким образом успешно ее использовать. Тема рассматривается на стратегическом и концептуальном уровне, а не на тактическом и техническом.
Хотя книга доступна для понимания любого читателя независимо от его квалификации, однако наибольший интерес она представляет для тех руководителей и менеджеров, чьи функции будут соприкасаться с операционной аналитикой. Ценной могут найти книгу и специалисты, отвечающие за разработку процессов операционной аналитики.
Если вы читали мою книгу «Укрощение больших данных» и вам она понравилась, значит, вам понравится и новая книга. Несмотря на иной предмет обсуждения, здесь я придерживался тех же общих структуры и стиля повествования. И хотя в основном внимание уделяется совершенно новым вопросам, порой вы найдете отсылки к некоторым темам из моей предыдущей работы. В то же время содержание этой книги значимо само по себе, а потому знакомство с «Укрощением больших данных» не является обязательным.
Кому не стоит читать эту книгу?
Эта книга относится к разряду деловой, а не технической литературы. Тем, кто ищет подробные технические детали, математические формулы или образцы кодов, лучше обратиться к другим работам.
В этой книге вы не найдете рекомендаций конкретных продуктов, услуг или платформ. Она сосредоточивается на товарных классах и общих архитектурах, с тем чтобы читатели узнали, на что именно им нужно обращать внимание при выборе продуктов или услуг. Конкретных рекомендаций касательно компаний и наименований продукции здесь нет.
Наконец, книга предполагает наличие некоторых практических знаний в области аналитики. Здесь вы не найдете обзора фундаментальных аналитических концепций. Я исхожу из того, что основные термины и методы уже знакомы читателям, поэтому не трачу времени на их разъяснение.
О чем эта книга?
Эта книга состоит из трех частей, разделенных на девять глав. В первой части описываются рыночные тренды, движущие операционной аналитикой, очерчивается основная тематика и приводятся примеры для иллюстрации обсуждаемых концепций. Во второй части рассказывается о подготовке организации к внедрению операционной аналитики: вкратце излагается, как подготовить бизнес-кейс, какая инфраструктура подлежит рассмотрению и как наладить управление процессами операционной аналитики. В последней части обсуждается, какая потребуется аналитика, какие люди и команды будут ее создавать и поддерживать и какая корпоративная культура необходима для достижения успеха. Ниже приводится более подробный обзор содержания каждой части и главы.
Часть I. Революция началась
Первая часть посвящена трендам, ведущим нас к операционной аналитике, и содержит примеры того, как операционная аналитика уже стала частью нашей жизни. Здесь обозначены темы, которые послужат основой для дальнейшего, более подробного рассмотрения в книге.
Прежде всего, мы дадим определение операционной аналитике и рассмотрим, каким образом аналитические подходы, методы и процессы развились до такой степени, что оказались в состоянии поддерживать операционную аналитику. Далее попробуем разобраться в шумихе, поднятой вокруг больших данных, и сосредоточиться на том, что действительно важно знать предпринимателям во время включения больших данных в операционную аналитику. Наконец, рассмотрим ряд примеров, наглядно демонстрирующих операционную аналитику в действии.
Глава 1. Постигаем операционную аналитику
В некоторых случаях переход к операционной аналитике может сводиться к модернизации существующего аналитического процесса на основе пакетной обработки до уровня регламентированного, автоматизированного, осуществляемого в режиме реального времени. Однако чаще операционная аналитика включает в себя различные типы аналитики, применяемые различными способами. Кроме того, с пришествием больших данных в возрастающей степени используются различные источники данных. Необходимость разнообразия во многом объясняется тем, что операционные решения отличаются от многих традиционных решений, на которые была ориентирована аналитика. Поэтому нужно объяснять изменения в построении аналитических процессов, в использовании методов и способов работы профессиональных аналитиков.
В этой главе дается определение операционной аналитики и показывается, чем она отличается от аналитики прошлого. Также объясняется, как эволюция аналитических технологий создала основу для появления операционной аналитики, и показывается, как аналитика меняет способы ведения бизнеса современными компаниями.
Глава 2. Больше данных… Еще больше данных… Большие данные!
Трудно припомнить другую такую тему, подобную большим данным, вокруг которой столь быстро возник столь широкий ажиотаж. Если всего несколько лет назад мало кто о них слышал, то сегодня они стали в бизнесе одним из самых обсуждаемых вопросов. Как и следовало ожидать после этого стремительного взлета, сегодня вокруг больших данных безудержно нарастают неразбериха и дезинформация. В результате многие организации выбирают неверные пути. Неудачи, которые станут следствием этих ошибочных шагов, будут болезненными и дорогостоящими. К счастью, приложив немного усилий и набравшись кое-каких знаний, средняя по размерам компания вполне способна избежать наиболее вопиющих ошибок и выбрать самый здравый с экономической точки зрения путь.
В этой главе рассматриваются многие рекламные трюки и заблуждения по отношению к большим данным. Не только выявляются ошибки в общераспространенном представлении о больших данных, но и предлагаются альтернативные точки зрения и методы, более реалистичные и рациональные. Большие данные будут играть крупную роль в операционной аналитике, поэтому важно разобраться, для чего именно они годятся.
Глава 3. Операционная аналитика в действии
Концепция превращения традиционной аналитики в операционную не нова, однако в прошлом редко реализовывалась на практике. Ведь компании могли обойтись меньшими усилиями, так они и поступали. Но сегодня, по мере развития технологий и усложнения природы бизнеса, применение операционной аналитики становится неизбежным. В перспективе невозможно будет успешно конкурировать, если аналитика не окажется в центре широкого спектра повседневных решений и действий.
В этой главе приводятся разнообразные примеры операционной аналитики в действии. Они наглядно показывают, как операционная аналитика способна поддерживать принятие решений многих типов и действует в диапазоне от самого простого до невероятно сложного уровня.
Часть II. Закладываем основу
Вторая часть книги помогает читателям понять, как заложить основу для поддержания операционной аналитики. Надежная основа – необходимое условие успеха.
Мы начнем с обсуждения того, как разработать бизнес-кейс для инвестирования в операционную аналитику. Пока не принято решение об инвестициях, ничего существенного произойти не может. Далее рассмотрим, как создать надлежащую аналитическую инфраструктуру и как ее следует использовать. Сегодня деловая среда предельно усложнилась и ориентироваться в ней стало гораздо труднее. Наконец, обсудим вопросы управления и конфиденциальности, что надо сделать непременно. Ведь когда аналитика будет внедрена и автоматизирована до уровня операционной, ответственное управление потребуется с первых же шагов.
Глава 4. Хотите бюджет? Создайте бизнес-кейс!
Первым шагом по внедрению операционной аналитики должно стать обоснование затрат и усилий, требуемых для успешной реализации. Вам понадобятся новые инструменты, новые источники данных и новые навыки, а большие данные только усложняют ситуацию. Многие организации испытают неудобства из-за того, что на этом пути их ожидает больше неизведанного, чем обычно, а также больше предполагаемых рисков. Чтобы убедить организации предпринять необходимые действия, потребуются значительные усилия и серьезное обоснование.
В этой главе рассматриваются факторы, которые нужно учитывать при разработке бизнес-кейса. Данные факторы включают технологии, услуги по их внедрению и обслуживанию, разработку аналитических процессов и меры по их интеграции и выводу на операционный уровень. Только с учетом всего спектра затрат можно принять правильное инвестиционное решение. Сосредоточение внимания лишь на отдельных позициях дезориентирует организацию.
Глава 5. Создаем аналитическую платформу
Взрывной рост использования аналитики привел к наводнению рынка продуктами, призванными ее продвигать. Хотя в этом разнообразии нет ничего плохого, но оно создает путаницу и вынуждает отбраковывать бесчисленные варианты, прежде чем найдется оптимальный именно для конкретной организации. Некоторые технологии являются почти универсальными, тогда как другие станут эффективными только при определенных условиях. Таким образом, каждая организация должна подобрать для себя правильное сочетание технологий в соответствии со своими нуждами.
В этой главе рассматривается технологический ландшафт по состоянию на начало 2014 г. Мы рассмотрим наиболее значимые технологии и специфику их применения. Далее сосредоточимся на том, как, сочетая технологии, можно создать аналитическую платформу, которая обеспечит искомые результаты. Самое важное, в этой главе даются рекомендации по сведению различных технологий в отдельное связанное единое аналитическое окружение.
Глава 6. Управление и конфиденциальность
Операционная аналитика действует напрямую, без вмешательства человека. Следовательно, чтобы свести к минимуму риски возникновения непредвиденных проблем, способных нанести серьезный ущерб, необходимо ввести систему ответственного управления. Сбор данных и их анализ требуют одного типа управления, а использование результатов – другого. Особое внимание должно быть уделено соблюдению конфиденциальности информации с учетом чувствительной природы большей части используемых сегодня данных.
В этой главе рассматриваются концепции управления процессами как сбора данных, так и их использования. Предлагаются эффективные способы инноваций и экспериментов, при этом обеспечивающие надежное и безопасное применение. Особое внимание уделяется вопросам конфиденциальности.
Часть III. Превращаем традиционную аналитику в операционную
Третья часть сосредоточена на том, как запустить операционную аналитику в действие. После того как создана основа, о которой говорилось во второй части, следует наладить ее эффективное использование, чтобы оценить заложенный в ней потенциал.
В этой части мы рассмотрим ключевые аналитические методы, необходимые для успешного перехода к операционной аналитике. Также поговорим о том, как подбирать и организовывать эффективные команды аналитиков. Наконец, обсудим, какие изменения в свою корпоративную культуру потребуется внести организации в процессе подготовки к внедрению операционной аналитики. Один из самых тяжелых этапов на этом пути будет заключаться в том, чтобы преодолеть страх перед изменениями и убедить сотрудников принять новый подход.
Глава 7. Аналитика
Основу операционной аналитики, разумеется, составляет аналитика как таковая. Но что представляют собой та и другая? Хотя операционная аналитика имеет много общего с традиционной аналитикой, между ними существуют и различия. Для преуспевания в сфере операционной аналитики и больших данных нужны новые подходы: потребуется использовать новые типы аналитических техник и данных, разбираться в новых типах проблем и выработать новые критерии для оценки успешности.
В этой главе мы рассмотрим требования, предъявляемые к аналитике в целом, а не только к операционной аналитике. Рассмотрим некоторые техники и методологии, а также классические уроки прошлого, способные нам пригодиться. Наконец, обратимся к тому, как следует эффективно измерять успешность процессов операционной аналитики и отслеживать их исполнение.
Глава 8. Аналитическая команда
Независимо от выбранной стратегии кто-то должен воплотить ее в жизнь. Таким образом, важное условие для превращения традиционной аналитики в операционную – наличие подходящей для этого команды. Чтобы ее создать, недостаточно просто нанять толковых людей с навыками, охватывающими все аспекты операционной аналитики. Команду еще надо правильно структурировать и организовать. Также необходимо предложить ее участникам эффективные стимулы и наделить команду необходимыми полномочиями вкупе с ответственностью, нацелить ее на успех.
В этой главе мы рассмотрим, как создать такую команду и способствовать ей в успешном применении операционной аналитики к большим данным. Будут даны рекомендации по структуре и составу аналитической команды. Обсудим, какими методами она может пользоваться и какие стимулы ей следует предложить. Также поговорим о том, какие модели поведения и взаимоотношений помогут команде добиться максимальной продуктивности.
Глава 9. Аналитическая культура
Одна из самых сложных задач при переходе к операционной аналитике – это процесс изменения корпоративной культуры. К сожалению, его важность часто недооценивается. Когда компания начнет управляться аналитикой на операционном уровне, ей потребуются иные установки и принципы деятельности. Аналитика должна вызывать доверие, быть востребованной и активно использоваться всеми сотрудниками на всех уровнях организации. А культурная трансформация может продлиться дольше и протекать куда тяжелее, чем трансформация технологического и аналитического процессов. Когда имеешь дело с человеческими эмоциями и личностями, а не с фактами и цифрами, всегда можно ждать неприятностей.
В этой главе мы поговорим о значительных изменениях менталитета, которые должны произойти внутри организации, чтобы она преуспела с операционной аналитикой. Также рассмотрим, как можно с пользой для дела применить человеческие эмоции и личностные черты при внедрении новых аналитических процессов. Наконец, еще одна тема для обсуждения – как организация может способствовать успеху, преодолевая неудачи, неизбежно происходящие время от времени.
Заключение. Присоединяйтесь к революции!
Здесь дается краткий обзор ключевых положений книги наряду с призывами к действию.
Благодарности
Я премного благодарен членам моей команды рецензентов, добровольно согласившихся критически оценить книгу (полностью или частично) и делавших мне замечания по мере ее написания. В эту команду входили (в алфавитном порядке): Эллен Боергер, Чанс Буроммавонг, Скотт ван Валкенбург, Сара Гейтс, Дэн Грэм, Брайан Джонс, Джек Ливайс, Боб Сиверт, Джефф Таннер, Джон Тума, Билл Фрэнкс (не я, мой отец!), Ричард Хэкеторн и Шек Чо. Ваш потрясающий вклад помог мне намного улучшить текст! Также хочу поблагодарить всех людей и компании, которые поделились со мной своими знаниями, опытом и примерами, позволившими мне написать эту книгу.
Часть I Революция началась
Глава 1 Постигаем операционную аналитику
Да, революция началась. Операционная аналитика движет промышленной революцией в аналитике и уже начинает раздвигать границы традиционного применения аналитики компаниями. Со временем операционная аналитика намного увеличит количество аналитических процессов, которые нужно создавать, и скорость, с которой аналитика будет выполняться. Далее в книге мы увидим, что такие новые концепции, как время принятия решения и время инсайта, станут главными факторами, определяющими характер инвестиций и точки приложения сил.
Операционная аналитика требует дисциплинированного и упорядоченного подхода в рамках всей организации, а также множества изменений в технологиях, процессах и корпоративной культуре. Поначалу люди будут недоверчиво относиться к передаче многих повседневных решений в вéдение машин и аналитических процессов. Тем не менее время покажет, что при отлаженной операционной аналитике результаты с лихвой окупят предпринятые усилия.
Да, революция началась! Прежде чем вы осознаете это утверждение, необходимо в точности разобраться с тем, что именно оно означает. Данная глава закладывает основу, на которой выстраивается вся остальная книга. Прежде всего, мы дадим определение операционной аналитике. Рассмотрим рыночные тренды, поддерживающие движение к операционной аналитике. Далее закрепим ряд важных тем, которые необходимо держать в уме при переходе организации от традиционной к операционной аналитике.
Определение операционной аналитики
Эта книга посвящена операционной аналитике. Но что такое операционная аналитика? Если уж она стала главной темой, надо дать определение данному термину. После чего попытаемся разобраться, в чем заключается уникальность операционной аналитики и что отличает ее от традиционного подхода.
Что такое операционная аналитика?
Термин «операционная аналитика» применим к ситуации, когда аналитика{1} становится неотъемлемой частью принятых индивидуальных решений и осуществленных индивидуальных действий в рамках организации. Операционная аналитика используется для поддержки не стратегических и значимых, а повседневных тактических решений. Что еще важнее, когда аналитический процесс выведен на операционный уровень, он напрямую управляет деятельностью – не просто рекомендует те или иные действия, а непосредственно их реализует. Все вышеперечисленное и составляет суть операционной аналитики. Непосредственно реализуя решения и действия без вмешательства человека, операционная аналитика выводит интеграцию и воздействие аналитики на совершенно новый уровень.
Традиционные аналитические процессы в своем большинстве приносят результаты, которые далее используются в виде информации для принятия решений или вводятся в процесс принятия решений. Однако человек обычно включает в этот процесс свои личные суждения и затем одобряет полученный результат. В случае же операционной аналитики аналитический процесс и действия на основе проведенного анализа осуществляются незамедлительно. Человек не вмешивается ни в решения, ни в действия.
Разумеется, именно человек принимает решение о необходимости внедрения операционно-аналитического процесса и налаживает его. Однако когда процесс запущен, он уже самостоятельно получает доступ к данным, осуществляет анализ, принимает решения и фактически выполняет необходимые действия. Он может выполняться тысячи и даже миллионы раз в день. После того как люди в организации осозна́ют, что можно получать аналитику, интегрированную на таком уровне, у них часто возникает потребность в ее увеличении. В результате рождается спрос на еще большее количество аналитики и на все возрастающем уровне сложности. В то же время наличие автоматизированной операционной аналитики создает необходимость в тщательном мониторинге процессов. Об этом мы поговорим в шестой главе.
Предписывайте!
Определяющая особенность операционной аналитики – она выходит за пределы описаний или даже прогнозов. Операционная аналитика предписывает. Это значит, что операционная аналитика встраивается в бизнес-процесс, чтобы самостоятельно принимать решения и выполнять действия на основе заложенных в нее алгоритмов – все это без вмешательства человека.
На протяжении последнего десятилетия много внимания уделялось переходу от описательной аналитики к прогностической. В классической бизнес-аналитике внимание сосредоточивалось на анализе произошедшего с описательной точки зрения, например определение объема продаж по каждому региону, доли своевременных поставок или других важных показателей. Цель же прогностической аналитики, наоборот, состоит в предсказании того, что произойдет в будущем. Как увеличить долю своевременных поставок? Какие клиенты с наибольшей вероятностью откликнутся на грядущее маркетинговое предложение? Операционная аналитика идет еще дальше и делает аналитику предписывающей. Операционно-аналитический процесс начинается с определения того, какие действия повлияют на время поставки или повысят уровень откликов, а затем автоматически вынуждает эти действия произойти. В таблице 1.1 суммируются вышеназванные различия.
Отличие операционной аналитики
Очень важно различать операционную аналитику и операционное применение аналитики. Хотя, на первый взгляд, здесь может привидеться игра слов, я уверяю вас, что это не так. После того как мы рассмотрим несколько примеров, различие станет для вас вполне очевидным.
Аналитика применялась для решения операционных проблем на протяжении многих лет. Так будет продолжаться и дальше, и операционное применение аналитики сохранит свою значимость. Однако операционная аналитика выходит за прежние пределы. В идеале хотелось бы иметь новый термин, который четко бы отделял операционную аналитику от операционного применения традиционной аналитики, но я такового не знаю. Это печально, поскольку сходство определений может привести к путанице, особенно когда они произносятся подряд. На одной из конференций во время обсуждения данной темы один из участников в шутку предложил мне использовать термин «фрэнксова аналитика», что, разумеется, слишком эгоцентрично, тем более если воспринять предложение всерьез. Поэтому я постараюсь сосредоточиться на различиях между двумя подходами, а не на их наименованиях.
Различия между операционным применением аналитики и операционной аналитикой наглядно демонстрируют всю важность и сложность последней. Операционно-аналитические процессы зачастую так же сложны, как любые аналитические процессы, использовавшиеся организацией до сих пор, но вдобавок новые процессы должны быть автоматизированы, существенно масштабированы и осуществляться с молниеносной скоростью. Эти мощные процессы вместе с тем отличаются сложностью и требуют серьезного труда. Давайте рассмотрим несколько примеров, которые помогут прояснить имеющиеся различия.
Одно из важных отличий операционной аналитики состоит в том, что анализ выполняется в автоматическом и интегрированном режиме в пределах так называемого времени принятия решения. Другими словами, анализ выполняется со скоростью, позволяющей принять решение. В некоторых случаях принятие решений происходит в режиме реального времени (или очень близко к тому). В других случаях период ожидания может составлять несколько минут, часов или даже дней. Знать время принятия решения крайне важно для достижения успеха, поскольку аналитический процесс должен быть доступен и выполняться в пределах этого интервала.
Традиционно многие организации подстраивали свои веб-сайты под клиентов через определение их индивидуальных покупательских привычек с дальнейшим размещением соответствующих предложений и адаптацией под потребителей к следующему посещению сайта каждым клиентом. Подобная веб-кастомизация доказала свою эффективность и сегодня используется почти повсеместно. Обработка сведений о клиенте по состоянию на сегодняшний вечер, с тем чтобы завтра утром клиент увидел уже адаптированный под него сайт, – таково операционное применение аналитики. Однако подобная предварительная кастомизация не является примером операционной аналитики. Это всего лишь пример применения традиционной пакетной обработки в операционном окружении.
Операционная аналитика требует кастомизации следующей открываемой клиентом страницы с момента клика по кнопке next до момента открытия страницы. Этот процесс должен использовать не только всю историческую информацию о клиенте, но и новейшую, в том числе о его самых последних действиях на веб-сайте. Адаптацию веб-страницы за короткий промежуток времени между кликами и выполняет операционная аналитика. Обратите внимание: подобный анализ осуществляется не для одного, а для всех клиентов, посещающих сайт, что выливается в миллионы микрорешений, основанных на аналитике. Даже если при навигации по сайту клиенты не замечают разницы между пакетным и операционным подходами, на самом деле разница, пусть и скрытая, существенна.
Применяйте аналитику не только к операциям
Аналитические процессы применялись для решения операционных проблем на протяжении многих лет. Однако операционная аналитика выходит за пределы использования результатов традиционной пакетной аналитики в операционных целях. Операционная аналитика применяется в пределах «времени принятия решений» для каждого индивидуального решения.
Еще один наглядный пример, на котором мы подробнее остановимся далее, относится к производственной области. Показания датчиков двигателей дают возможность производителям разработать оптимальный график технического обслуживания. Наличие детальной информации о функционировании двигателя автомобиля, самолета или любого другого транспортного средства позволяет выявить шаблоны, со временем ведущие к отказу двигателя. Такая разработка более эффективного графика на основе показаний датчиков – это результат операционного применения аналитики.
В свою очередь, операционная аналитика, основанная на показателях датчиков двигателя, выдается почти сразу и гораздо более индивидуализирована. Она выполняется параллельно с работой двигателя, а поступающая с датчиков информация анализируется в режиме реального времени. Если выявляется некий шаблон, который, как известно, неминуемо приведет к проблеме, принимаются меры по предотвращению либо исправлению этой проблемы. Когда водитель за рулем автомобиля получает упреждающее уведомление о том, что с двигателем начинает твориться что-то неладное, – это пример операционной аналитики в действии.
Предостерегаю: если организация не научилась успешно применять традиционную аналитику на основе пакетной обработки, то не сумеет и сделать аналитику операционной. Сначала нужно обзавестись основными аналитическими возможностями, а уже потом их масштабировать. Первым делом необходимо развить качественную аналитику, эффективную при пакетной обработке. Этот процесс можно сделать операционным только после подтверждения того, что данные и навыки, которыми обладает организация, могут быть использованы для построения надежного аналитического процесса. Если хотите, чтобы ваша организация вышла на следующий уровень, нужно прежде всего убедиться в наличии прочной аналитической основы. Без нее операционная аналитика останется недостижимой мечтой.
Здесь нет «быстрых» клавиш
Не овладев мастерством традиционного пакетного анализа, организация не сможет перейти к операционной аналитике, которая должна опираться на прочную основу.
Основные элементы, делающие операционную аналитику уникальной
Итак, мы рассмотрели, чем операционная аналитика отличается от традиционной в ряде важных аспектов. Давайте суммируем эти различия в виде четырех характеристик, которые определяют отличия операционной аналитики от традиционной.
Определяющая характеристика № 1: операционная аналитика интегрирована и автоматизирована. Традиционно организации вели аналитику в режиме оффлайн и затем передавали ее результаты повсюду, чтобы их принимали во внимание при принятии решений. Человек участвовал не только в построении аналитического процесса, но и в его осуществлении на постоянной основе. А операционно-аналитический процесс выполняется внутри операционных систем в автоматическом и интегрированном режиме.
Определяющая характеристика № 2: операционная аналитика предписывает действия. Операционная аналитика выходит за рамки описательной и даже прогностической – она предписывает действия. Не просто рекомендует, какое наилучшее предложение следует сделать клиенту, когда он вернется, а действительно предписывает сделать это предложение, отдав распоряжение соответствующей системе.
Определяющая характеристика № 3: операционная аналитика принимает решения. Ее процессы не только предписывают или рекомендуют, но и принимают решения, а затем выполняют действия, которые из них вытекают. Этим она в корне отличается от традиционной аналитики, где анализ производит рекомендации, а человек решает, принять их или отклонить: смотрит на результаты анализа и принимает окончательное решение, на основании которого выполняются дальнейшие действия.
Определяющая характеристика № 4: операционная аналитика осуществляется в пределах «времени принятия решения». Во многих случаях оно соответствует реальному времени. В некоторых случаях аналитика применяется к входящему потоку, а не к хранилищу данных. Операционная аналитика не может позволить себе ждать до следующего сеанса пакетной обработки – она должна осуществляться немедленно, чтобы принять решение и исполнить его.
Определяющие характеристики операционной аналитики
Операционная аналитика – это интегрированные автоматические процессы принятия решений, предписывающие и реализующие действия в пределах «времени принятия решения». Как только операционно-аналитический процесс получает одобрение и запускается, он начинает автоматически принимать тысячи или миллионы решений.
Добывать новые знания при помощи аналитики – это замечательно. Но после того как знания обнаружены среди данных, предстоит сделать важный шаг – наилучшим образом применить их аналитически. Разработать процесс, который будет воспроизводить новые знания, масштабировать их, а затем подкреплять ими решения – и все это почти в режиме реального времени, – очень трудно. Таким образом, центральная роль по-прежнему остается за человеком. Кто-то должен разрабатывать, выстраивать, конфигурировать и контролировать операционно-аналитические процессы. Компьютеры сами по себе не смогут принимать решения.
Важный момент, который стоит лишний раз подчеркнуть, состоит в том, что операционная аналитика представляет собой новую ступень эволюции аналитических технологий. Организация не может сразу же перепрыгнуть на уровень операционной аналитики, пока не овладеет мастерством традиционного пакетного анализа. Кроме того, как мы обсудим в шестой главе, операционно-аналитические процессы требуют тщательного тестирования перед запуском, поскольку автоматизированные плохие решения могут нанести серьезный ущерб. Прежде чем система начнет принимать миллионы микрорешений, необходимо убедиться в том, что они будут высокого качества.
Добро пожаловать в Аналитику 3.0!
Эволюция аналитики с течением времени хорошо отражена в концепции Аналитики 3.0, разработанной Международным институтом аналитики (International Institute for Analytics, IIA) и его руководителем научных исследований Томом Дэвенпортом{2}. Я преподаю в IIA, поэтому мне посчастливилось участвовать в обсуждении концепции на начальных этапах ее разработки. Давайте рассмотрим, в чем именно она заключается, поскольку это позволит нам увидеть эволюцию операционной аналитики в более широкой перспективе. Знание того, что и как менялось в мире аналитики на протяжении его истории, поможет нам понять, почему операционная аналитика готовится занять господствующее положение.
Аналитика 1.0: традиционная аналитика
Эпоха Аналитики 1.0 на протяжении многих лет охватывала все действия организаций в сфере аналитики. Я говорю об Аналитике 1.0 в прошедшем времени, поскольку организациям следует оставить этот подход в прошлом, если они этого еще не сделали. Как показано на рис. 1.1, Аналитика 1.0 в очень большой степени опиралась на описательную статистику и отчетность с редкими вкраплениями прогностической аналитики. Предписывающей аналитики тогда не существовало. Что касается данных в эпоху Аналитики 1.0, то они поставлялись почти исключительно из внутренних источников и были хорошо структурированы. Они включали все данные, связанные со сделками организации, информацию из систем управления предприятия и т. п. Хотя в то время эти данные считались невероятно большими и сложными для обработки, по сегодняшним меркам они являются относительно малыми и простыми. Данные собирались и хранились ИТ-отделом и предоставлялись по запросу. К сожалению, чтобы сделать данные доступными для анализа, ИТ-специалистам требовалось довольно много времени. Все это ограничивало широту и глубину применения аналитики, а также ее воздействие.
Что еще хуже, когда аналитики наконец-то получали эти данные, то, прежде чем приступить к анализу, им требовалось проделать еще массу дополнительной подготовительной работы. Дело в том, что в корпоративных системах данные редко хранятся в формате, пригодном для анализа. Выстраивание аналитического процесса требовало разного рода преобразований, агрегирования и комбинирования данных из различных источников. Все это еще больше увеличивало временной промежуток между моментом, когда ИТ-специалисты делали данные доступными, и моментом получения результатов. Таким образом, время в эпоху Аналитики 1.0 тратилось на сбор данных, а не собственно на анализ.
С точки зрения организационной культуры профессиональные аналитики относились к секретным сотрудникам. В большинстве случаев они были изолированы как от бизнеса, так и от информационных технологий. Их считали чокнутыми учеными, которые иногда могли предложить интересные идеи. Они не входили ни в какие другие команды, кроме собственной. (Подробнее мы рассмотрим эту тему в восьмой главе.) Почти все разрабатываемые ими аналитические процессы предназначались для поддержки внутренних решений. Клиенты или пользователи продукции редко, если вообще когда, были осведомлены об этой закулисной аналитике.
Организации должны оставить Аналитику 1.0 в прошлом
Аналитика 1.0 на протяжении многих лет играла крайне полезную роль. Но в сегодняшней экономической ситуации необходимо подключать дополнительные возможности и использовать новые подходы. Оставьте Аналитику 1.0 в прошлом.
Традиционные технологии, такие как бизнес-аналитика и инструменты отчетности, использовались для создания широкого диапазона отчетов, панелей управления и оповещений. Но даже простые отчеты создать было не так просто. Для этого требовалось, чтобы специалист из центрального аналитического отдела узнал требования пользователя, составил отчет и представил его в пригодной для просмотра форме. Процесс был длительным и формализованным, и очень немногие пользователи могли создавать такие отчеты самостоятельно. Встречались и вкрапления прогностической аналитики, но эпоха Аналитики 1.0 по большей части опиралась на описательную аналитику и отчетность.
Ирония состояла в том, что потребности в более оперативной аналитике и отчетности не существовало, поскольку сам бизнес не мог реагировать на них намного быстрее. В начале моей карьеры при разработке модели кампании прямой рассылки мы использовали данные трех-четырехнедельной давности для определения домохозяйств, которые следует включить в рассылку. Затем составленный нами список отправлялся в отдел рассылки, а ему требовалось еще две недели, чтобы напечатать рекламные материалы и отправить их по указанным адресам. Наконец, проходила еще неделя, прежде чем письма доставлялись в почтовые ящики адресатов. Это означало, что между моментом сбора данных и тем временем, когда результаты анализа могли повлиять на клиентов и бизнес, проходило шесть, а то и восемь – десять недель. Ускорять аналитические процессы не имело смысла, поскольку рассылки осуществлялись по фиксированному месячному графику и списки требовались с той же регулярностью. Легко понять, почему в такой среде многие аналитические процессы не реализовывали свой потенциал в полной мере.
Аналитика 2.0: аналитика больших данных
В начале 2000-х началась эпоха Аналитики 2.0, открывшая перед нами мир больших данных{3}. Они во многих отношениях были новинкой – зачастую гораздо объемнее и сложнее, чем данные, которые использовались в эпоху Аналитики 1.0, и при этом необязательно так же структурированные. Большие данные могли включать в себя все что угодно – от документов, фотографий и видео до сенсорных данных. Множество больших данных, используемых для анализа, поступают из внешних источников, например социальных сетей. Несмотря на свое внешнее происхождение, они могут оказаться очень ценными.
Сегодня, в эпоху Аналитики 2.0, как видно на рис. 1.2, мы обнаружили, что для обработки больших данных и выполнения разнообразных аналитических процессов нам нужны новые аналитические технологии и новые вычислительные возможности. В результате из забвения на свет вышли такие технологии, как Hadoop (о ней мы расскажем позднее), а аналитические процессы были модернизированы, чтобы соответствовать этим новым технологиям. Основное внимание в эпоху Аналитики 2.0 сосредоточено на поиске наиболее дешевых способов сбора и хранения необработанных данных, а уже затем на поиске способов их применения.
Отчетливо выраженным трендом стало недавнее появление «науки о данных», изучающей способы анализа больших данных профессиональными аналитиками, а также такой профессии, как «исследователи данных». Основное различие между ними и традиционными профессиональными аналитиками состоит в выборе инструментов и платформ, используемых для анализа. Традиционные профессиональные специалисты в крупных организациях склонны использовать такие инструменты, как SAS и SQL, для анализа базы данных в окружении реляционной базы данных. Исследователи данных чаще применяют такие инструменты, как R и Python, для анализа данных в окружении Hadoop. Тем не менее эти различия носят тактический и в основном семантический характер. Любой специалист, хорошо разбирающийся в том или другом окружении, легко может переключаться между ними. Несмотря на разные наименования, профессиональные аналитики обладают практически одинаковыми базовыми наборами навыков и складом ума. (Подробнее мы обсудим эту тему в восьмой главе.)
В эпоху Аналитики 2.0 профессиональные аналитики хотя и не были включены в процесс принятия решений, но повысили свой статус в организациях до такого уровня, что могут напрямую влиять на принимающих решения лиц. Профессиональные аналитики перестали быть секретным ресурсом, тщательно огражденным от бизнес-сообщества.
Как мы увидим далее в этой главе, многие организации, особенно фирмы, работающие онлайн и в области электронной коммерции, начали разрабатывать коммерческие продукты и услуги, основанные исключительно на данных и аналитике. Первыми это предприняли онлайновые фирмы, они же первыми вступили в эпоху Аналитики 2.0. Одним из самых примечательных примеров является социальная сеть LinkedIn, создавшая такие продукты, как «Люди, которых вы можете знать» и «Группы, которые вам могут понравиться». Такие основанные на аналитике продукты используют информацию, собираемую в рамках управления и поддержания аккаунтов пользователей, и генерируют новую информацию, за которую во многих случаях пользователи платят.
Один из парадоксов Аналитики 2.0 состоит в том, что производимая аналитика зачастую оказывается не очень-то и продвинутой. Отчасти это было обусловлено тем, что объем и сложность данных затрудняют их перевод в пригодный для анализа формат. Отчасти объясняется незрелостью источников данных и аналитических инструментов. При всем поднятом вокруг нее ажиотаже эпоха Аналитики 2.0 по-прежнему в значительной степени опирается на отчетность и описательную аналитику с относительно малыми вкраплениями прогностической и предписывающей аналитики.
Одной лишь Аналитики 2.0 недостаточно
Эпоха Аналитики 2.0 выводит на передний план большие данные и новые возможности для применения аналитики. При этом нецелесообразно создавать отдельные команды, технологии и инструменты исключительно для анализа больших данных. Аналитические процессы должны охватывать любые данные и соответствовать любым требованиям, предъявляемым к аналитике. Вот почему Аналитика 2.0 – это не конечный результат.
Одно из заблуждений, характерных для эпохи Аналитики 2.0, проистекает из того факта, что многие профессиональные аналитики не прошли через эпоху Аналитики 1.0. Многие из них имеют подготовку в области компьютерных наук и пришли в аналитику из технологической сферы. Порой аналитики поколения 2.0 попросту не знают всего того, что делали крупные инновационные компании в эпоху Аналитики 1.0. Как следствие, они могут предположить, что все используемые ими концепции и методики являются совершенно новыми. Иногда это действительно так, но чаще всего нет. Давайте рассмотрим пример, который иллюстрирует эту ситуацию.
Как-то на конференции я услышал выступление одного молодого человека. Не буду называть его имя и компанию, поскольку моя цель – пролить свет на распространенную логическую ошибку, а не поставить кого-то в неловкое положение. Докладчик подробно изложил методы, посредством которых он со своей командой разрабатывал разнообразные аналитические процессы для сайта электронной коммерции его компании. И доводы, и методы были вполне разумными. Компания поступала правильно: например, применяла аффинитивный анализ и совместную фильтрацию для определения того, какие дополнительные продукты могли заинтересовать клиента исходя из истории его прошлых покупок и просмотров. Такого рода анализ традиционные ретейлеры применяли на протяжении многих лет.
Однако докладчик ошибочно заявил, что метод аффинитивного анализа нельзя было применять до появления больших данных и некоторых новых технологий. Он искренне верил в то, что применение широко распространенных алгоритмов открывает новые горизонты, поскольку не имел представления о происходившем на протяжении многих лет в традиционной розничной торговле. Метод аффинитивного анализа оказался в новинку только для этого молодого специалиста (и подобных ему). Парень попросту не знал истории аналитики. Действительно, в атмосфере ажиотажа вокруг больших данных легко предположить, что в прошлом ничего интересного не происходило. К сожалению, из-за такой неосведомленности можно потратить массу времени на выработку давно уже существующих решений, вместо того чтобы заняться более полезным делом.
Эпоха Аналитики 2.0 может многое выиграть, если будет заимствовать знания и опыт из эпохи Аналитики 1.0. Для достижения же максимального успеха организациям следует объединить все лучшее из эпохи Аналитики 1.0 и эпохи Аналитики 2.0, а затем двигаться дальше. Так мы придем в эпоху Аналитики 3.0.
Аналитика 3.0: всеобъемлющая аналитика воздействует максимально
Аналитика 3.0 сосредотачивается на дальнейшем развитии, а не на замене знаний, полученных в эпохи Аналитики 1.0 и 2.0. Подобно тому как Аналитика 2.0 не заменила собой Аналитику 1.0, так и Аналитика 3.0 не заменяет собой других. Аналитика 3.0 сочетает все предыдущие знания, накопленные ранее, в единой схеме деятельности, как это видно на рис. 1.3. Она объединяет традиционную аналитику на основе традиционных данных с новой аналитикой больших данных. Когда организации начали использовать большие данные, они обнаружили, что невозможно выделить аналитику больших данных в полностью автономную функцию. Большие данные – это не просто большие объемы обычных данных, требующие больше аналитики. Они требуют интеграции со всеми остальными процессами. Эпоха Аналитики 3.0 знаменует появление новой – интегрированной и развитой – аналитической парадигмы. Сейчас, в начале 2014 г., мы видим, что лидеры из сферы как традиционного, так и интернет-бизнеса начинают вступать в эпоху Аналитики 3.0. Операционная аналитика – естественное следствие этого тренда.
Причем Аналитика 3.0 вновь привлекает внимание к процессу обнаружения нужных данных. Этот процесс направлен на быстрое обнаружение новых знаний в данных и определение действий, продуктов и услуг, которые можно извлечь из добытых знаний. Полная реализация потенциала, заложенного в процесс обнаружения, требует от многих организаций значительной культурной эволюции. Аналитика должна стать сердцевиной стратегии предприятия, и повышение статуса аналитики должно направляться и санкционироваться сверху. Кроме того, необходимо перестроить существующие аналитические платформы и процессы. Далее в книге мы поговорим о процессе обнаружения данных и об изменениях, которые он потребует.
Разнообразие и новизна типов данных и доступных источников представляют собой один из главных вызовов в эпоху Аналитики 3.0 и в то же время ведут к появлению столь же разнообразных и инновационных аналитических технологий. Новые аналитические методы будут одной из определяющих характеристик эпохи Аналитики 3.0. Власть данных и расширение их обработки в конечном итоге подвигнут организации к широкому применению прогностической и предписывающей аналитики. Хотя потребность в описательной аналитике и отчетности по-прежнему останется, в эпоху Аналитики 3.0 организации наконец-то начнут осуществлять мечту об интегрированной и операционной аналитике. Она будет встроена не только в централизованные крупномасштабные корпоративные системы, но и в операционные приложения, используемые конечными пользователями, например в мобильных устройствах, банкоматах и интерактивных терминалах.
Развивайтесь до Аналитики 3.0
Эпоха Аналитики 3.0 представляет собой последний на сегодняшний день этап развития аналитики. Сочетая в себе все лучшее, что создано в эпохи Аналитики 1.0 и Аналитики 2.0, она развивает аналитику дальше.
Новые архитектуры, требуемые для Аналитики 3.0, добавят организациям сложностей. Аналитика 3.0 делает необходимым наличие параллельной обработки не только в окружении реляционной базы данных, но и в таком окружении, как распределенная файловая система Hadoop. Также может потребоваться смешение различных систем запоминания, графических процессоров и т. д. Все это мы рассмотрим в пятой главе.
Пожалуй, сильнее всего в эпохе Аналитики 3.0 меня, как профессионального аналитика, воодушевляет то обстоятельство, что мои коллеги наконец-то будут объединены в официально оформленную команду, ставшую стратегически значимой частью бизнес-организации. Такую команду возглавит директор по аналитике или как минимум руководитель уровня вице-президента, специалист, который будет курировать всю корпоративную аналитику. Более распространенной станет и должность директора по данным. Все эти роли мы обсудим подробнее в восьмой главе. Эпоха Аналитики 3.0 открывает новый захватывающий мир для профессиональных аналитиков.
Операционализация аналитики посредством Аналитики 3.0
Давайте рассмотрим один из видов анализа, который сегодня применяют многие крупные банки и телекоммуникационные компании. Он направлен на выявление действий, связанных с закрытием счета клиентом, и может проиллюстрировать операционную аналитику эпохи 3.0 в действии. Обратите внимание на то, что новым здесь является не прогнозирование убыли или текучести клиентов как таковое, а расширение сферы анализа и применения его результатов.
В процессе анализа текучести необходимо собирать данные о любых действиях, которые могут быть связаны с закрытием счета. Это касается источников как традиционных, так и больших данных, например истории транзакций, жалоб, запросов по нескольким каналам на аннулирование комиссии, постепенного уменьшения остатка на счете, заявлений в социальных сетях и т. д.
Со временем анализ текучести был усовершенствован, с тем чтобы выявлять определенные шаблоны действий, которые в сочетании гораздо опаснее, чем по отдельности. Такого рода анализ часто называют пат-анализом. Другими словами, не будет большой проблемы, если отклонить запрос на отмену комиссии, сделанный клиентом в тот момент, когда он проверяет свой счет онлайн и видит ее в первый раз. Но если клиент звонит в клиентскую службу и снова просит отменить комиссию, а вслед за звонком наносит визит в офис, то отказ клиенту в его просьбе может существенно повысить риск закрытия счета.
Построение пат-анализа для точного определения пути действий представляет собой довольно сложную задачу. Клиент может обратиться в банк в любое время и по любому каналу, включая колл-центр, филиал банка, чат в режиме онлайн или электронную почту. Банк должен знать, что именно уже произошло, чтобы предпринять правильное действие. Создание операционно-аналитического процесса требует обновления рекомендуемых действий по отношению к каждому клиенту после любого с ним контакта. Например, после того как клиент запросил об отмене комиссии и было принято решение об одобрении или отклонении запроса, эта новая информация должна быть немедленно включена в повторное вычисление правильной реакции во время следующего взаимодействия с клиентом. Отсутствие операционно-аналитического процесса в этом случае может привести к проблемам. Давайте посмотрим почему.
Легко опоздать навсегда
Операционная аналитика позволяет организации принимать наилучшее решение в любой момент времени. Использование же для аналитики данных, которые устарели всего лишь на несколько минут, может привести к неблагоприятным, а то и глубоко ошибочным решениям.
Например, я обращаюсь с просьбой об отмене комиссии в банк, который использует пакетную обработку данных только раз в сутки. Итак, банк получает мой запрос по электронной почте и отказывает мне. Его аналитики определяют, что в моем случае отказ не увеличит риска закрытия счета, и поэтому рекомендуют отклонить мой следующий запрос на отмену комиссии. Эта рекомендация загружается в систему и готова для использования на следующий день.
Назавтра я из машины снова звоню в банк с той же просьбой. Моя просьба отклоняется, как и было запланировано. Но отказ раздражает меня настолько, что я решаю зайти в филиал банка, мимо которого сейчас проезжаю, и лично поговорить с менеджером. Вот где начинаются проблемы. Поскольку обработка данных производится только вечером, то ни руководитель филиала, ни система не знают, что я только что звонил в банк и снова получил отказ. Рекомендация об отказе по-прежнему действует. Только вечером аналитики определят, что филиал должен был удовлетворить мой запрос, чтобы сохранить меня как клиента. Последнее взаимодействие существенно увеличило риск закрытия мной своего счета, однако руководитель филиала не знал об этом, поскольку его не снабдили аналитикой. Это классический пример операционного применения традиционной аналитики, и легко увидеть, почему такой подход может давать сбои.
При использовании же операционной аналитики система обновила бы данные, отразив мой последний звонок, а затем с учетом обновления немедленно выработала бы рекомендации удовлетворить просьбу, и, когда я входил в филиал, его руководитель уже был бы готов сообщить мне об отмене комиссии, благодаря чему я и дальше останусь с этим банком. Если еще несколько минут назад действовала рекомендация об отказе, то мой звонок в клиентскую службу полностью изменил бы представление об адекватной реакции. Ради своего преуспевания банк должен быть способным собирать все данные о взаимодействиях со мной в текущем режиме, а затем после каждого такого взаимодействия запускать аналитический процесс, чтобы правильно совершать свои дальнейшие шаги. Именно так работает операционная аналитика в эпоху Аналитики 3.0. Мой друг Джеймс Тейлор, генеральный директор компании Decision Management Solutions и автор книги «Системы, управляющие принятием решений: Практическое руководство по использованию бизнес-правил и прогностической аналитики» (Decision Management Systems: A Practical Guide to Using Business Rules and Predictive Analytics, 2011), много писал об операционной аналитике. Вот его мнение: «Организации, которые хотят процветать, а не просто выживать, должны преобразовать себя сверху донизу. Высокое качество операционных действий стало обязательным, а путь к такому качеству пролегает через аналитику. В планах каждого руководителя должен значиться переход к принятию каждого решения на основе аналитики и внедрению лучших решений во все операционные процессы».
Как аналитика меняет бизнес
Несмотря на все более широкое распространение аналитики, многие руководители не осознают, насколько фундаментально она меняет бизнес-модели. В этом разделе мы рассмотрим несколько важных для понимания концепций и трендов. Возможно, вашей организации потребуется более масштабно и без боязни рассмотреть, каким образом аналитика может изменить ваше будущее.
Аналитика как цель, а не побочный продукт
Четко выраженный тренд в операционной аналитике проявляется в том, что сегодня все большее количество продуктов собирает данные. Во многих случаях аналитика, применяемая к этим данным, является одним из главных – если не самым главным – назначением продукта. Другими словами, физический продукт сегодня зачастую является просто механизмом для сбора данных. Давайте посмотрим, что это означает.
В прошлом компании всегда создавали новые продукты, будь то игрушки, тарифные планы или типы банковского счета. Целью являлось, разумеется, успешное продвижение продукта, однако его успех мало зависел от данных или аналитики. Мало-помалу компании собирали данные о продажах продукта, его потребителях, а также о часто выявляемых дефектах и проблемах. Это позволяло понять, как можно улучшить продукт, однако данные получались как побочный результат продажи продукта, а не вследствие присущего ему свойства.
Сегодня же выпускаются продукты, чье единственное назначение – сбор данных, позволяющих применить аналитику. Сам по себе физический продукт фактически вторичен и является не более чем каналом для сбора и анализа данных. В одних случаях ценность продукта для потребителей определяется именно предусматриваемой им аналитикой; в других – ценность продукта для потребителей может заключаться в чем-то ином, в то время как компания извлекает пользу из аналитики. Когда аналитика используется во благо потребителей, тот продукт, который может обеспечить наиболее ценные данные и аналитику, а не традиционные функции, и преуспеет в конкуренции.
Кого интересует ваш продукт? Сверьтесь с аналитикой!
Одним из драйверов операционной аналитики является эволюция продуктов, которые существуют главным образом для обеспечения сбора и анализа данных. В некоторых случаях физические продукты служат не более чем инструментами сбора данных для аналитических процессов.
Таких продуктов появляется все больше. В эту категорию попадают многие доступные в Интернете бесплатные услуги. Возьмем, например, бесплатную электронную почту. Компании предоставляют ее вовсе не из любви к общественно-полезной деятельности, а потому что могут многое узнать об ее пользователях. Провайдер получает возможность размещать рекламу с учетом поведения пользователей, и она окупается, когда пользователи на нее откликаются. В некоторых случаях сервисы фактически читают от начала до конца электронные письма пользователей и анализируют их, чтобы генерировать рекламные предложения. Скажем, если вы часто переписываетесь с друзьями на спортивные темы, то можно держать пари, что будете получать много предложений, связанных со спортом. Кроме того, провайдер электронной почты может продать информацию о вашем интересе к спорту другим организациям, готовым заплатить за поиск любителей спорта. Так что надо очень внимательно читать правила хранения личной информации, прежде чем соглашаться с ними. В шестой главе мы поговорим о вопросах конфиденциальности более подробно.
На рынке сегодня также присутствуют аналитические процессы, которые напрямую превращаются в продукты. Наглядный тому пример – рекомендательный механизм популярного поставщика потокового видео Netflix{4}. Он использует данные о навигации пользователя по сайту и определяет, какие фильмы могут ему понравиться. Этот рекомендательный механизм рассматривается Netflix как реальный продукт. За него отвечают собственные продакт-менеджеры, управляющие им точно так же, как любым другим продуктом. Netflix постоянно старается добавить своему рекомендательному механизму новые функции и свойства, усилить его привлекательность для пользователей. Так, введен интерфейс Max, который превращает подбор рекомендаций в игру{5}.
Успех Netflix в огромной степени приписывают именно ее рекомендательному механизму, хотя этот продукт, по сути, состоит из аналитики и использования данных. Механизм также представляет собой законченный операционный процесс, который управляет своими алгоритмами и предоставляет результаты пользователям миллионы раз в день без вмешательства человека.
Аналитические продукты стирают границы между отраслями
Теперь давайте рассмотрим интересный пример того, как ориентированные на аналитику продукты начинают стирать границы между отраслями. Речь идет о новой волне персональных приборов контроля физической формы, носимых на запястье или талии. Такие устройства на рынке предлагаются Nike, Jawbone и FitBit, в данном случае мы остановимся на Nike{6}.
Если выйти на улицу и спросить у 100 первых встречных, что они знают о компании Nike, то 99 % из них ответят, что это производитель спортивной одежды, спортивного снаряжения или чего-то в том же духе. Все ответы правильные. По крайней мере, на протяжении многих лет именно этой продукцией славилась компания. Но произошедшие за последнее время изменения заставляют нас пересмотреть представление о том, в какой же отрасли на самом деле работает Nike. То же самое происходит и со многими другими предприятиями.
В 2012 г. Nike выпустила продукт под названием FuelBand{7}. Это устройство носят на запястье, как часы, а измеряет оно показатели физической активности, например количество сделанных за день шагов, и некоторые характеристики сна. Подобные устройства сегодня стали очень популярны. Сейчас, когда я пишу эту книгу, одно из таких как раз надето на моем запястье. Давайте посмотрим, каким образом FuelBand изменяет традиционную бизнес-модель Nike и посягает на ее отраслевую классификацию.
Хотя большинство людей все еще считают Nike производителем спортивной одежды и обуви, FuelBand ломает это устоявшееся представление. Начать с того, что FuelBand представляет собой высокотехнологичный прибор, снабженный датчиками, передатчиком и т. п. Таким образом, Nike сегодня работает в производственной отрасли хай-тека.
Что первым делом должны сделать потребители после покупки FuelBand, чтобы обеспечить его эффективное использование? Скачать на свой компьютер, планшет или мобильник программный продукт. Итак, сегодня Nike также является поставщиком ПО.
Ваша компания по-прежнему работает в традиционной для себя отрасли?
По мере того как традиционные производители вдруг обнаруживают, что им приходится в интересах своих потребителей внедрять датчики, собирать данные и применять аналитику, границы между отраслями стираются. Сегодня требуются не только новые компетенции. Причины, по которым потребители выбирают продукт, определяются, возможно, не столько традиционными критериями, сколько возможностями продукта, связанными со сбором данных и аналитикой.
Но зачем потребителям необходимо это ПО? Для того чтобы их смартфон или компьютер мог взаимодействовать с FuelBand, получать от него собранные данные и передавать их Nike. Итак, еще один бизнес Nike – это сбор и хранение данных.
Цель этих действий состоит в том, чтобы Nike могла выполнять аналитику и выявлять шаблоны физической активности и сна пользователей. Таким образом, Nike предоставляет аналитику в сфере услуг. А если компания сумеет соотносить данные, собираемые FuelBand, с вопросами здоровья, то можно будет даже утверждать, что Nike работает и в сфере здравоохранения. Я думаю, теперь вы уловили суть: вследствие применения FuelBand компания стала заниматься множеством различных видов деятельности, не имеющих никакого отношения к производству одежды.
Возможно, самое главное заключается в том, что выбор при покупке FuelBand или аналогичного конкурирующего с ним продукта определяется вовсе не его привлекательным внешним видом или следованием моде. Эти факторы играют роль при выборе традиционных продуктов Nike, но в случае с таким продуктом, как FuelBand, для потребителей гораздо важнее то, какое устройство точнее соберет данные и предоставит лучшую аналитику. Другими словами, данные и аналитика определяют приобретение продукта. Да, сам по себе физический продукт может наличествовать, но на самом деле Nike продает, а потребители покупают данные и аналитику.
Nike превращается в производителя пригодных для ношения технологий и аналитических потребительских товаров. Со временем компания начнет вставлять датчики в обувь, футболки, перчатки, другую свою продукцию, и товары будут работать вместе, чтобы формировать расширенный набор аналитики как для потребителей, так и для Nike.
Это важный и глубинный сдвиг. Мы имеем дело с физическим продуктом, который покупается не ради присущих ему свойств собственно физического продукта. Признавая это, Nike разворачивает свой бизнес лицом к новому поколению продуктов. Чтобы добиться с ними успеха, компании пришлось нанимать веб-разработчиков и дизайнеров высокотехнологичной электроники. А вдобавок к ним – профессиональных аналитиков для разработки отчетности и аналитики, а также ИТ-специалистов для создания систем хранения данных, Такие продукты, как FuelBand, требуют широкого спектра навыков, отличных от тех, которые необходимы для производства традиционной спортивной одежды.
В этом примере я сосредоточился на персональных устройствах для проверки физической формы, однако аналогичная концепция применяется и в других отраслях. Автомобили, самолеты, тракторы, ветряные турбины и грузовики снабжаются встроенными датчиками. Потребители начинают все шире использовать данные, собираемые сенсорными системами, в самых различных целях. Например, при выборе модели автомобиля, если разница между предложениями невелика, то решающее значение может иметь поставляемый вместе с машиной пакет аналитических услуг.
Такой сдвиг с собственно физического продукта на предоставляемые им аналитику и данные несет с собой как новые возможности, так и риски. Но в сегодняшнем мире бизнес нельзя вести по старинке. Данные и аналитика скорее всего приведут в бизнесе ко множеству перемен.
Преобразующая сила операционной аналитики
Появление новых данных и аналитики обусловит глубокие преобразования в некоторых отраслях. Особенно там, где в прошлом ни данные, ни аналитика не играли большой роли. Это подтверждает множество примеров, однако я предлагаю сосредоточиться на отрасли, которая уже созрела для перемен, – на образовании.
В настоящее время здесь все еще используется модель, которая сложилась десятки и даже сотни лет назад. Мы берем детей, по воле случая родившихся примерно в одно время, и – независимо от их уровня развития и подготовки (за редким исключением) – сводим вместе в одном классе. Так, все девятилетние дети учатся в третьем классе и проходят одинаковую программу независимо от того, насколько хорошо или плохо они усваивают материал. Вместо того чтобы отходить от этой модели, Соединенные Штаты лишь еще больше ужесточают правила в отношении программы каждого года школьного обучения.
Но в эпоху больших данных и аналитики почему бы не разрешить детям самим выбирать, с какой скоростью они будут изучать материал? Разве не повысим мы у них интерес к учебе, если учителя превратятся из пересказчиков обязательного материала в помощников, которые будут отвечать на вопросы учеников и помогать им? Изучая материал в собственном темпе, школьники смогут обращаться к учителям за помощью в любое время. Некоторые образовательные организации, такие как Khan Academy и Coursera, уже применяют такой подход{8}. Они размещают учебные материалы онлайн, а пользователи смотрят видеоуроки и проходят тесты, чтобы проверить качество усвоения материала.
Почему бы нам не использовать возможности данных и аналитики, чтобы ученики постоянно обучались с выбранной ими скоростью? И причем каждый день с разного этапа обучения? Например, чтобы окончить третий класс, пусть школьнику по-прежнему нужно будет пройти всю обязательную учебную программу, но почему бы при этом ему не выполнять домашние задания за пятый класс? Если учащийся усваивает весь необходимый материал и успешно сдает тесты, то имеет ли значение, в каком году он родился и какой путь избирает для себя в обучении?
Будьте готовы к тому, что аналитика преобразит бизнес-модели
Некоторые отрасли уже внедрили аналитику и соответственно изменили способы ведения бизнеса, но другие продолжают работать так же, как работали десятилетия тому назад. Чем сильнее отстает отрасль, тем больше в ней накапливается потенциал для подрывных (и притом положительных) перемен, которые принесет с собой внедрение операционной аналитики.
Именно данные и аналитика позволяют осуществить этот переход. Можно с точностью отследить, какие учебные видеоматериалы просмотрел каждый учащийся, какие задания и контрольные тесты он выполнил и насколько хорошо. Можно с легкостью определить, какие темы ему следует пройти еще раз, поскольку аналитика выявит затруднения не только с решением конкретной задачи, но и с усвоением учебной темы в целом.
Благодаря быстрой аналитической обработке каждого ответа и столь же быстрому выявлению шаблона, определившего выполнение теста, учащемуся можно немедленно предложить нужный ему вспомогательный материал. Собирая и анализируя данные на очень детализированном уровне, операционная аналитика ненавязчиво поможет учащемуся получить знания, предоставив при этом свободу действий и обеспечив изучение необходимого материала в полном объеме.
Помню, как я откровенно скучал в школе. Более того, из-за ошибки при передаче сведений о пройденных мною в старших классах предметах мне пришлось в колледже повторно их изучать. В результате я целый семестр был вынужден слушать, как преподаватель излагал уже знакомый мне материал, и проходить тесты, которые мог бы сдать в первый же день. При этом я не мог показать свои знания и избавить себя от бесполезной траты времени. Применение операционной аналитики для управления процессом обучения и отслеживания успеваемости учащихся может до неузнаваемости изменить сферу образования в ближайшие годы.
Взгляд на операционную аналитику в перспективе
Операционная аналитика выходит за рамки традиционной аналитической практики, однако это вовсе не означает, что уроки прошлого не имеют никакого значения. На протяжении всей книги я буду обращать внимание на постоянство многих основных принципов, сохраняющих свою значимость. В этом разделе мы рассмотрим несколько важных тем, которые позволят нам взглянуть на операционную аналитику в перспективе.
Качество и актуальность данных важны как всегда
Качество и актуальность данных всегда имели решающее значение для аналитических процессов. При превращении традиционной аналитики в операционную эти свойства приобретают еще большую значимость. Когда процесс использует данные, полученные несколько секунд назад, чтобы принять решение за несколько секунд, данные должны быть актуальными и точными. Автоматизированный процесс принятия решений при помощи операционной аналитики практически не оставляет возможностей для отслеживания и устранения ошибок в данных.
У меня есть друг, работающий в крупной логистической компании. Я не буду называть ее здесь, поскольку аналогичный вопрос встает и перед многими другими организациями. Мой друг рассказывал о трудностях, которые приходится преодолевать его компании при выработке маршрутов для своих водителей. И главным источником проблем является качество картографических данных.
Вспомните о своем опыте использования GPS-навигаторов или других распространенных картографических приложений. Вы же замечали, что зачастую они приводят вас не совсем туда, куда нужно? Например, согласно официальному адресу, отель располагается на Мейн-стрит, а вот въезд на парковку находится за углом на Элм-стрит. Навигационное приложение приведет вас на Мейн-стрит, после чего вам придется думать, как добраться до парковки.
Такая небольшая ошибка вызывает не более чем досаду, когда вы пытаетесь добраться до ресторана или найти магазин. Потерять однажды минуту-другую не страшно. Однако это крайне разорительно для логистической компании, тысячи водителей которой постоянно сталкиваются с подобной дезориентацией сотни раз в день. Поэтому в компании моего друга существует большая команда, которая занимается обновлением базы картографических данных на основе новейшей информации, сообщаемой водителями.
Не экономьте на качестве!
Качество данных всегда имело важнейшее значение, но в мире операционной аналитики оно наиважнейшее. Автоматизированный и оперативный характер процессов оставляет мало возможностей для выявления и устранения ошибок в данных. Данные должны быть безупречными.
Сотрудники картографического отдела принимают во внимание всё. Так, они отмечают в базе данных, что въезд на парковку находится за углом от центрального входа в отель. Если отель переносит въезд на парковку в другое место из-за проблем с дорожным движением, они немедленно обновляют информацию. Типичное навигационное приложение приводит вас на улицу перед входом в здание. Однако в сельской местности дом может находиться метров на 800 в сторону да еще по грязной дороге. Для доставки груза на дом водителю придется потратить дополнительные пять минут на дорогу туда и обратно, поэтому алгоритмы должны учесть этот факт при составлении маршрута. Если логистическая компания не будет обладать такими актуальными и точными данными, она будет нести миллионы долларов убытков из-за снижения производительности. Для того чтобы аналитическая программа могла оптимизировать маршруты для водителей, компания уделяет усиленное внимание получению правильных данных.
Легко представить, как неверные данные могут пустить под откос операционную аналитику. Это возвращает нас к вопросу о том, почему организация не может перепрыгнуть через традиционную аналитику и начать с нуля внедрение операционной аналитики. Значительная часть операционной аналитики по-прежнему состоит в сборе необходимых данных и проверке их качества. Аналитика всегда была и будет оставаться дисциплиной, которую определяет принцип «мусор на входе дает мусор на выходе». Разница при переходе от традиционной к операционной аналитике состоит в том, что у вас остается гораздо меньше времени и возможностей для проверки достоверности данных, прежде чем будут приняты решения и предприняты действия. Качество данных должно соответствовать очень высоким стандартам, иначе ошибки в данных неизбежно приведут к ошибкам в анализе, а затем и в решениях. К тому моменту, когда ошибка в данных будет обнаружена, она уже может причинить вред.
Операционная аналитика задушит творчество?
Некоторые люди ставят под сомнение связь аналитики с творчеством. Когда она проникнет в организацию, не задушит ли аналитика творчество? Другими словами, передавая все больше решений автоматизированным компьютерным алгоритмам, не исключим ли мы из бизнеса креативность и человеческий фактор?
Но я утверждаю, что все обстоит с точностью до наоборот. Я считаю, что операционная аналитика способствует творчеству. Дело в том, что после принятия автоматизированных решений очень легко отследить их эффективность. Это, в свою очередь, позволяет организациям протестировать, что работает, а что нет. Вместо того чтобы сначала проводить творческий и продуктивный мозговой штурм, а затем выбирать всего один-два варианта действий, которые сочтены наиболее приемлемыми, аналитика позволяет протестировать много идей, а затем двигаться дальше на основе полученных результатов. Чтобы придумать все эти варианты, по-прежнему требуется креативный подход. Однако благодаря аналитике можно точнее оценить потенциал каждой творческой идеи и снизить риск путем экспериментирования с ней. Именно этим и занимаются постоянно веб-сайты.
Высвобождайте дух творчества
Аналитика должна высвобождать дух творчества, а не подавлять его. Благодаря тому что креативные идеи можно протестировать путем экспериментов и применения аналитики, организация получает возможность проверить гораздо больше, чем в прошлом, творческих предложений.
При посещении таких ведущих веб-сайтов, как eBay или Amazon, можно почти с полной уверенностью ожидать, что при просмотре каждой страницы подвергнешься какому-либо тестированию. Оно может быть совсем простым, как определение цвета баннера наверху страницы, размещение двух или трех объявлений, длинное или короткое описание продукта. Пользователи никогда не знают, какая часть страницы является стандартной, а какая используется для тестирования, и в этом суть. Те, кто отвечает за работу сайта, проводят такие небольшие эксперименты все время. Таким образом, компании могут быстро тестировать любые креативные идеи и выявлять выигрышный вариант фактически без риска и с минимальными затратами.
Внедрение аналитики и превращение ее в операционную действительно способно высвободить больше времени для творчества. Создайте передовые операционно-аналитические процессы и переложите на них принятие элементарных повседневных решений. Тем временем сотрудники могут расслабиться и заняться разработкой замечательных идей. Таким образом, сбор и анализ данных создадут благоприятные условия для творчества и инноваций в организации, а об удушении и речи не будет.
Многие концепции операционной аналитики отнюдь не новы
В завершение этой главы давайте рассмотрим пример того, как классические, проверенные временем аналитические принципы применимы и в операционной аналитике. Многие ее концепции не несут в себе ничего нового, хотя на первый взгляд могут казаться сложными и даже безумными. Зачастую они представляют собой всего лишь новейшее логическое развитие давно применяемых и самых лучших методов. Новы же скорость, своевременность и автоматизированный характер процессов операционной аналитики, а лежащие в их основе аналитические концепции давно известны.
Мой любимый пример обновленного применения старых концепций – это веб-кастомизация и оптимизация ключевых слов. Данные темы кажутся новыми, поскольку еще 20 лет назад не существовало никаких веб-страниц, не говоря уже о возможности кастомизировать эти страницы сотнями разных способов в текущем режиме. Однако концепции, лежащие в основе адаптации веб-страниц и оптимизации ключевых слов, существовали и прежде.
Этот замечательный пример привел мне европейский журналист во время нашего с ним интервью. Он рассказал мне о своем знакомом, который проработал в газетной индустрии несколько десятилетий. Четверть века назад во время подготовки к выпуску ежедневной газеты нередки были споры о том, какие статьи следует разместить наверху полосы, а какие в ее «подвале», какие лучше выбрать заголовки и т. д. Благодаря своему богатому опыту этот человек всегда мог предложить хорошие идеи по поводу заголовков и размещения статей.
Опыт же помогал газетчику тем, что на протяжении многих лет он лично собирал и анализировал данные о том, какие материалы и какие заголовки продавались лучше всего в регионе, где распространялась газета. Некоторые из этих данных он записывал, но бо́льшую часть держал у себя в голове. Сам того не осознавая, он фактически занимался оптимизацией ключевых слов и макетов газетных полос. Его логика, методы и мыслительные процессы были аналогичны тем, которые сегодня применяются в веб-пространстве. Разумеется, он применял куда более простой метод, но следовал тем же самым фундаментальным принципам. Таким образом, важно отметить, что значительная часть современной аналитики является естественным продолжением того, что делалось в прошлом, с той лишь разницей, что сегодня применяются гораздо более изощренные аналитические методы. То же относится и к операционной аналитике.
Подведем итоги
Наиболее важные положения этой главы:
• Операционная аналитика совершает «промышленную революцию» в области аналитики. Она выводит аналитику за традиционные рамки применения к операционным проблемам.
• В последние десятилетия организации совершили переход от описательной аналитики и отчетности к прогностической аналитике. Операционная аналитика идет еще дальше и делает аналитику предписывающей.
• Операционная аналитика представляет собой интегрированные автоматизированные процессы принятия решений, которые предписывают и выполняют действия в рамках «времени принятия решения».
• Добиться успеха в операционной аналитике невозможно без прочной основы в виде традиционной аналитики.
• Эпоха Аналитики 1.0 представлена традиционным подходом к аналитике, когда внимание сосредоточивалось на пакетной обработке внутренних структурированных данных.
• Эпоха Аналитики 2.0 ознаменована взлетом больших данных, появлением новых типов данных и аналитических методов, использованием внешних источников данных.
• Эпоха Аналитики 3.0 сделала возможной применение операционной аналитики. Взяв все лучшее из эпох Аналитики 1.0 и Аналитики 2.0, она выработала целостный аналитический подход.
• Всё в большей степени принятие решения о покупке определяет, наряду с физическими характеристиками продукта, поставляемая вместе с ним аналитика.
• Границы между отраслями стали размываться после того, как компании внезапно осознали, насколько выгодно встраивать высокотехнологичные датчики в свою продукцию и создавать аналитику на основе полученных данных.
• Ввиду автоматизированного и стремительного процесса принятия решений посредством операционной аналитики качество данных становится как никогда важным.
• Аналитика поощряет творчество, а не душит его. Сегодня можно свободно тестировать творческие идеи с минимумом затрат.
• Операционная аналитика в значительной степени основана на старых концепциях, которые она выводит на новый уровень.
Глава 2 Больше данных… Еще больше данных… Большие данные!
В этой главе мы рассмотрим важный тренд, связанный с большими данными. Читатели должны в нем разбираться, если в их организациях планируется использовать большие данные для поддержки операционной аналитики. Разумеется, организации всегда собирали данные о своей деятельности, однако в последние годы темпы накопления возросли. И не только потому, что увеличились и источники данных. Дело в том, что зачастую данные поступают в новых форматах и содержат информацию, требующую различных аналитических технологий. Таким образом, «большие данные» – это общий термин, который применяется ко всему тренду, приведшему к проблемам в виде увеличения объемов данных, количества их источников и разнообразия форматов.
Когда организация приступает к рассмотрению больших данных и пытается понять, как они повлияют на ее аналитические процессы, она должна учесть ряд важных моментов. В этой главе мы рассмотрим несколько рекламных трюков, сопровождающих большие данные (на эти трюки иногда попадаются организации), а также разберем способы подготовки к внедрению технологий больших данных с учетом перспективы. Большие данные вовсе не так страшны, как может показаться вначале. Понимание того, как большие данные вписываются в общую картину, позволит вам успешно включить их в операционную аналитику.
Разбираемся с обманами
Нет никаких сомнений в том, что большие данные окружены столь же большой рекламной шумихой. Организации должны разобраться с обманами и сосредоточиться на действительно важном, чему может способствовать ряд методов, предложенных в этом разделе. Ни в коем случае мы не намерены преуменьшать важность или ценность больших данных. Наша цель – вернуть большие данные к реальности. Формирование реалистичных ожиданий должно стать первым шагом в процессе работы с большими данными.
Определение больших данных? Не нужно!
Один из первых вопросов, который мне часто задают клиенты: «Что такое большие данные, Билл? Вы можете дать им определение?» По-видимому, оно очень заботит людей{9}. Чтобы убедиться в этом воочию, посетите некоторые группы на LinkedIn, посвященные большим данным. В каждой группе вы столкнетесь с вопросом определения больших данных, который задается в той или иной форме на протяжении последних нескольких лет. На одном из форумов, где я был вовлечен в дискуссию, размещались не то что десятки, а сотни ответов на вопрос: «Каково определение больших данных?» И это на форуме, где любой пост собирал в лучшем случае пару откликов. По мере развертывания дискуссии ее участники пытались превзойти друг друга, добавляя всё новые нюансы, подходящие или не подходящие к определению. Мне это занятие показалось глупым и заумным.
Люди чересчур озабочены определением больших данных. Лично я всегда предпочитал самое короткое из всех существующих определений. Пусть оно противоречит остальным, зато состоит всего из двух слов: «Не нужно!» Поначалу такой ответ может показаться вам экстремальным. С чего я это взял? Позвольте объясниться.
Если главная задача организации – решить некую бизнес-проблему путем внедрения операционной аналитики, ее не должно волновать определение больших данных. И вот почему. Схема действий, которой должна следовать организация и которой она, вероятно, следовала много лет в прошлом, очень проста. Если у вас есть проблема, требующая решения, вы должны посмотреть вокруг и задать себе вопрос: «Какие данные, если их собрать, организовать и использовать для аналитического процесса, помогут нам решить эту проблему?» Когда вы определите, что это за данные, вы должны придумать, как их собрать, организовать и включить в аналитику. Но тут возникает ключевой момент. Вопрос «Полезны ли эти данные для моего бизнеса?» не имеет абсолютно никакого отношения к определению больших данных. Полезными для бизнеса могут оказаться большие данные, малые данные или же ряд электронных таблиц.
Если же организация придет к пониманию, что ей необходимо использовать нечто похожее на большие данные, то беспокоиться насчет определения будет уже поздно: нужны будут данные как таковые. Они могут быть не очень хорошо структурированными и в переизбытке. Они могут просто соответствовать знаменитой концепции «трех V»: Volume, Variety, Velocity (объем, многообразие, скорость), выведенной исследовательской компанией Gartner{10}. Однако знание того, что нужные вам данные соответствуют концепции «трех V», бесполезно, поскольку в момент, когда данные вам понадобятся, не останется иного выбора, кроме как придумать способ их использования, – и совершенно не важно, являются ли они большими данными. Я всегда считал, что в концепции не хватает самой важной V, которая часто упускается из виду, а именно Value, т. е. ценности больших данных{11}. Можно добавить и прочие характеристики, если веришь, что в данных есть ценность, и считаешь, что усилия по их сбору и анализу того стоят.
Важно не определение, а результат
Даже если бы существовало общепринятое и единственное определение больших данных, это ничем бы не способствовало решению проблем бизнеса. Попытка дать определение большим данным – занятное теоретическое упражнение, но если вы узнáете, что конкретный источник данных официально относится (или нет) к категории больших данных, то в этом не будет никакого проку. Когда потребуется проанализировать источник данных, вам придется найти для этого способ вне зависимости от того, какой ярлык вы к нему прикрепите.
Поймите мои слова правильно. Если организация имеет дело с данными, подпадающими под типичные определения больших данных, это, безусловно, будет влиять на выбор тех методов и инструментов, которые она должна использовать для включения больших данных в аналитические процессы. Однако выбор методов и инструментов относится уже к области тактики, и в этом важное отличие. В первую очередь нужно ответить на стратегический вопрос: «Содержат ли эти данные важную для нас информацию?» Только получив на него положительный ответ, организация может приступить к запуску данных в работу.
Не тратьте силы на попытки понять, относятся ли нужные вам данные к категории больших данных или нет. Лучше сосредоточьтесь на включении выявленных вами значимых источников данных в аналитические процессы организации.
Начните с правильного подхода
Как следует из вышесказанного, важно начать с правильного подхода. Нет смысла собирать данные и хранить их в надежде на то, что однажды им будет найдено полезное применение. Как показано на рис. 2.1, организация должна для начала определить бизнес-проблему, а затем подобрать для нее необходимые данные. Сделайте усилие и примите на себя расходы по приобретению и использованию источника данных, когда это станет необходимо. В мире больших данных очень легко удариться в собирательство всех данных подряд с прицелом на то, что когда-нибудь они пригодятся. В результате организация может настолько увлечься сбором данных, что никогда ими и не воспользуется.
Хотя и кажется очевидным, что нужно начинать с бизнес-проблемы, а не со сбора данных, я знаю множество случаев, когда очень умные и расчетливые в иных отношениях организации полностью забывают про этот принцип, когда дело доходит до больших данных. Поначалу меня очень удивляла подобная склонность, но потом я понял что к чему. К началу 2014 г., когда я пишу эту книгу, вокруг больших данных поднялось столько шумихи, что никто не хочет остаться от них в стороне. Каждый совет директоров спрашивает у своего генерального директора: «А вы используете большие данные?» В свою очередь, каждый генеральный директор спрашивает у своих директоров по информационным технологиям, маркетингу и финансам: «А вы используете большие данные?» И каждый из этих директоров спрашивает у членов своей команды: «А вы используете большие данные?»
Не поддавайтесь давлению!
Не поддавайтесь давлению и не используйте большие данные только ради того, чтобы показать, что вы их используете! Ваша задача – создать системы и наладить сбор данных для поддержки только обоснованных возможностей бизнеса. Многие сильные организации поддались всеобщей лихорадке вокруг больших данных, что грозит обернуться для них весьма поучительными и дорогостоящими уроками.
Никто не хочет отвечать на этот вопрос так: «Еще нет» или так: «Мы планируем их использовать, но сначала хотим выяснить, как лучше это сделать». В обстановке всеобщей лихорадки такие ответы считаются неприемлемыми. В результате организации очертя голову набрасываются на большие данные. Некоторые запускают масштабные, дорогостоящие проекты, не имея продуманного плана насчет того, как извлечь пользу из инвестиций. Они просто собирают множество данных и покупают множество места для их хранения в надежде на то, что когда-нибудь придумают, как их использовать.
В этом и заключается главная проблема такого подхода. В текущем году вы бодро отвечаете на вопросы руководства, а оно вас гладит по головке за то, что вы идете в ногу со временем и «что-то делаете» с большими данными. Но через год-полтора то же начальство обращается к вам уже с другим вопросом: «Вы потратили столько ресурсов на этот проект и что же теперь можете продемонстрировать?» Если вы изначально не знали, для чего вам нужны большие данные, вам потребуется немало усилий, чтобы доказать, что ресурсы потрачены не зря. Я бы не хотел оказаться на месте человека, который вынужден отвечать: «Мы активно занимались большими данными, как от нас того требовали, но пока не получили никаких результатов».
Убедитесь, что ваша организация дисциплинированно подходит к внедрению больших данных. Потратьте еще немного времени на то, чтобы начать с реальной бизнес-проблемы и разработайте для ее решения план. Определите, какую конкретно аналитику можно будет выполнить на основе данных. Это займет не так уж много времени, однако существенно повысит ваши шансы на успех. Не поддавайтесь давлению рекламной шумихи и не отказывайтесь от основных принципов ведения бизнеса.
Существует ли пузырь больших данных?
На фоне сегодняшнего ажиотажа вокруг больших данных часто возникает вопрос о том, а не превращаются ли большие данные в очередной пузырь?{12} В январе 2013 г. исследовательская компания Gartner высказала официальное мнение, что большие данные прошли пик цикла ажиотажа и вступили в этап избавления от иллюзий{13}. После публикации этой статьи мне позвонил журналист и спросил, что я думаю по поводу заката больших данных и пузыря, который вот-вот лопнет. Мой ответ сначала может показаться противоречивым, но после моего объяснения вы поймете, в чем дело. Я ответил, что в некоторых отношениях угроза пузыря больших данных действительно существует. Но с других более важных, точек зрения, такого пузыря нет. Мой ответ кратко изложен в тексте и в таблице 2.1.
Я считаю, что в определенном смысле пузырь больших данных действительно скоро лопнет. Породили же проблему нереалистичные ожидания рынка. Похоже, многие люди считают, что большие данные – это легкий и дешевый способ добыть своего рода «волшебную кнопку», нажав на которую, можно получить ответы на любые вопросы. Это всегда было смешным предположением для любого аналитического начинания. И остается смешным в мире больших данных.
Никакой волшебной кнопки не существует! Для того чтобы успешно разработать и внедрить аналитические процессы для больших данных, требуется ничуть не меньше времени и сил, чем для любых других видов данных. А поначалу может потребовать даже больше времени, поскольку большие данные являются новшеством. Следствием ошибочных предположений, безусловно, станут крайне показательные неудачи с большими данными на рынке. Я уже вижу первые признаки таких провалов. Но, поскольку эти первоначальные неудачи поспособствуют взрыву раздутого пузыря нереалистичных ожиданий, они пойдут всем нам на благо. Ведь добиться успеха при помощи больших данных и сделать их операционными вполне возможно. Но для этого организации необходимо отнестись к большим данным с реалистичными ожиданиями по части затрат, сроков и усилий.
Для больших данных нет «волшебной кнопки»
Совершенно очевидно, что сегодня на преуспевание с большими данными возлагаются необоснованные надежды. В этом смысле пузырь существует. Тем не менее воздействие больших данных и их анализа со временем намного превзойдет сегодняшние раздутые ожидания. Как пузырь доткомов не уничтожил потенциал Интернета, так и пузырь больших данных не уничтожит их потенциала.
Теперь давайте рассмотрим, почему пузырь больших данных не лопнет. Люди часто считают, что взрыв пузыря свидетельствует о том, что его основа была фальшивой. Но вы можете быть уверены в том, что большие данные строятся не на ложной посылке. Большие данные будут оказывать очень сильное влияние на наше будущее. Я воспользуюсь аналогией, чтобы объяснить, почему так произойдет.
Вспомните интернет-пузырь конца 1990-х гг. Из-за этого гигантского пузыря, раздутого интернет-компаниями, многие люди потеряли много денег. Но вот что важно понять. Если вернуться в 1999 или 2000 г., на самый пик ажиотажа вокруг Интернета, и почитать тогдашние статьи о том, как Сеть изменит наши личные жизни и способы ведения бизнеса, то, уверен, вы подметите, что Интернет уже превзошел самые смелые мечты той эпохи.
Видите ли, интернет-пузырь был обусловлен отнюдь не мошеннической природой Сети или ее неспособностью воплотить в жизнь все раздутые обещания того времени. На деле же пузырь возник из-за того, что люди посчитали, что реализовать преимущества Интернета будет очень дешево, быстро и легко. Тогда, для того чтобы привлечь финансирование, компании было достаточно вставить в начале своего названия букву «i» или «e». Это сильно напоминает мне сегодняшнюю ситуацию с большими данными. Если бы в 2013 г. я заявил, что создал компанию в облаке и она будет заниматься большими данными, машинным обучением и предоставлять аналитические услуги, то, вероятно, достаточно быстро собрал бы наличные.
В ближайшие несколько лет произойдут как банкротства, так и консолидация рынка в пространстве больших данных. Неизбежны и разочарования, по мере того как компании, без достаточных на то оснований поспешившие ринуться в большие данные, начнут осознавать свою ошибку. Тем не менее через пять – десять лет большие данные с лихвой воплотят в жизнь все ожидания, с ними связанные. Влияние операционной аналитики на основе больших данных намного превзойдет все сегодняшние предположения. Несмотря на все предостережения, высказанные мной в начале этого раздела, ваша организация не должна оставаться на обочине и буквально обязана войти в мир больших данных. Просто это нужно делать грамотно и рационально.
Готовимся к внедрению больших данных
После того как организация сформирует реалистичные ожидания в отношении больших данных, как ей подготовиться к их внедрению? Какие ключевые моменты необходимо учесть при разработке стратегии? В этом разделе мы сосредоточимся на темах, которые помогут организации подготовиться к внедрению больших данных, после того как она избавится от ажиотажа вокруг них.
Приливная волна больших данных уже нахлынула
Нет никаких сомнений в том, что сегодня на нас обрушивается приливная волна больших данных и что любая организация должна ее укротить, дабы добиться успеха. Этой теме и посвящена моя книга «Укрощение больших данных» (Taming the Big Data Tidal Wave){14}. Я выбрал такое название, поскольку считаю, что океан является очень хорошей аналогией для пространства данных. Представьте себе накатывающие на берег волны. Если вы сидите на резиновой камере в том месте, где волны разбиваются, то узнаете, что волна даже чуть выше талии вполне способна опрокинуть вас на спину. Когда же волны наберут силу, они могут причинить вам осязаемый вред, если вы позволите им обрушиться на вас. Точно так же происходит и с данными. Вырастая в объемах, данные могут вас подавить, и справиться с ними будет нелегко. Если вы позволите волне данных ударить вас, она отправит вас в нокаут и не позволит довести дело до конца.
Вы должны придумать, как оседлать волну. В океане можно использовать доски для серфинга. Те, кто ничего не знает о серфинге, могут подумать, что все доски для него одинаковы. Но это не так. Зайдите в спортивный магазин и увидите, что существуют доски длинные и короткие, разной формы, с плавниками и без них. Серфер выбирает доску в зависимости от того, на каком виде волны он собирается кататься, и в зависимости от своих опыта и целей – гонки на скорость или выполнения трюков.
Аналогичным образом, когда речь идет о данных и аналитике, неосведомленные люди часто предполагают – только и нужно, что нагрести данные, складировать их, а потом проанализировать каким-нибудь инструментом. Но любой специалист знает, что существует огромное разнообразие платформ и инструментов, которые дают доступ к данным и обеспечивают их анализ. Большие данные, несомненно, могут потребовать добавления новых инструментов в уже имеющийся набор, подобно тому как серферу со временем могут понадобиться новые доски. И подобно тому как между использованием различных досок для серфинга существует больше сходства, чем различий, то же верно для применения различных аналитических платформ и инструментов к различным типам данных и аналитики.
Вы готовы оседлать волну больших данных
Если в штате организации имеются опытные специалисты, которые обеспечивали эффективное использование данных в прошлом, они же вполне способны справиться и с большими данными, приложив некоторые усилия. Подобно тому как профессиональный серфер может кататься где угодно и на любой доске, так и профессиональные аналитики могут проанализировать любые данные при помощи любых платформ и инструментов.
Когда организация встает перед необходимостью внедрения новых инструментов для больших данных, ей потребуются и люди, способные пользоваться этими инструментами. Если вы дадите мне лучшую доску для серфинга и отправите меня по самым пологим волнам, я не прокачусь и метра, потому что не умею этого делать. В то же время опытные серферы проявят свое умение, даже если дать им новую доску и отправить на новый пляж, где катят другие по размеру и типу волны, отличающиеся от привычных для них. Поначалу они могут держаться на доске чуть неуклюже, но спустя пару часов будут серфинговать, как обычно, уверенно. Каждая новая доска, каждый новый пляж и каждая непривычная волна представляют собой не квантовый скачок, который невозможно одолеть, а пошаговое изменение. Точно так же опытные аналитики уже имеют базовые навыки, чтобы работать с большими данными, и им просто нужно немного времени, чтобы подстроиться к требованиям других типов данных и анализа. Подобно тому как опытные серферы могут приспособиться к любой доске на любом пляже, так и опытные аналитики могут адаптироваться к любому типу данных и любому типу анализа, поскольку для них это будет пошаговым изменением, а не непреодолимым квантовым скачком.
Именно новая информация придает силу большим данным
Что же делает большие данные настолько мощными и захватывающими? Почему я прогнозирую, что они будут оказывать огромное воздействие на наше будущее? Причина – в той новой информации, которую они могут предоставить{15}. Большие данные часто снабжают организации информацией, которая является оригинальной в одном или сразу в двух аспектах. Во-первых, с небывалым уровнем детализации. Во-вторых, зачастую недоступной ранее.
Давайте рассмотрим, как производители автомобилей в настоящее время используют большие данные для целей предупредительного техобслуживания. На протяжении многих лет в прошлом, когда происходила поломка автомобиля, производитель прилагал усилия, стараясь выяснить, почему она случилась, а затем проследить путь вплоть до коренного изъяна, вызвавшего проблему. Сегодня встроенные датчики обеспечивают интенсивные потоки данных в процессе разработки и испытания двигателей, а также двигателей уже проданных автомобилей. Благодаря этому автопроизводители часто могут выявлять опасные шаблоны до того, как те приведут к поломке. Это и называется предупредительным техобслуживанием.
С получением информации от датчиков двигателей теперь стало возможным идентифицировать первые признаки надвигающихся проблем. Ведет ли перегрев детали к ее отказу? Предшествует ли небольшое падение напряжения в аккумуляторе распространенной проблеме с электричеством? Ломаются ли некие детали обычно в паре, в наборе или по отдельности? Ответы на эти вопросы невозможно было получить ранее, до появления доступных ныне данных.
Сильной стороной сенсорных данных в этом случае является не увеличение информации, а предоставление совершенно новой информации, не доступной ранее. Возможность прогнозировать и устранять проблемы до того, как произойдет поломка, позволяет значительно повысить удовлетворенность потребителей и снизить расходы на гарантийное обслуживание, поскольку автомобили меньше времени находятся в автомастерской и, как правило, гораздо дешевле принять профилактические меры и устранить проблему, чем ремонтировать уже сломавшийся автомобиль.
Традиционно профессиональные аналитики тратили много времени на совершенствование аналитических моделей, использующих существующие наборы источников данных. Они старались внедрять новейшие методики моделирования и добавлять новые метрики, извлеченные из данных. Эти усилия оправдывали себя, поскольку позволяли понемногу повышать эффективность моделей.
Новая информация почти всегда побеждает новые алгоритмы
Причина, обязывающая организацию активно использовать большие данные, заключается в той совершенно новой информации, которую они часто предоставляют. Да, необходимо корректировать существующие аналитические процессы, использующие имеющиеся данные. Но добавление новой информации может привести к настоящим прорывам. Всегда отдавайте приоритет тестированию новой информации перед тестированием новых методологий или новых метрик, основанных на имеющейся информации.
Между тем существует простой способ значительно повысить мощность аналитического процесса. Организации следует отказаться от традиционного подхода в виде подстройки имеющихся моделей, как только обнаруживается новая информация, относящаяся к проблеме. Эта новая информация может оказаться настолько значимой, что профессиональным аналитикам придется заняться не улучшением существующих моделей, а немедленно приступить к включению в них и тестированию новых данных.
Даже упрощенное использование новой информации может оказать воздействие на качество аналитического процесса, причем намного сильнее, чем при подстройке процесса, использующего имеющуюся информацию. Включайте новую информацию в процесс как можно быстрее, пусть даже поначалу в черновом варианте. Как только это будет сделано, возвращайтесь к пошаговым отладке и улучшению аналитики. И почти всякий раз новая информация будет побеждать новые алгоритмы и новые метрики, основанные на старой информации.
Ищите и задавайте новые вопросы
По мере того как организация расширяет ассортимент используемых данных и инструментов, она также должна сосредоточиться на поиске новых вопросов, которые следует задать, и новых способов задавать старые вопросы. Часто, найдя новый источник данных, люди сразу же задумываются о том, как бы его использовать в уже готовых решениях старых проблем. Однако в каждом случае наряду с этим подходом нужно рассматривать и два других, как показано на рис. 2.2.
Во-первых, необходимо посмотреть, какие совершенно новые и различные проблемы могут быть решены при помощи новой информации. Это кажется очевидным, однако люди с легкостью попадают в привычную колею и просто используют данные для решения обычных проблем. Организация должна сделать акцент на поиске новых возможностей для применения данных. Во-вторых, нужно попробовать найти новые, лучшие способы решения старых проблем. Для этого необходимо изучить проблемы, уже считающиеся преодоленными, и подумать, можно ли подойти к ним совсем с другой стороны за счет внедрения новых данных. Это позволит глубже вникнуть в проблему{16}.
Одной из полезных концепций для осуществления подобной деятельности в контексте клиентских данных является стратегия динамического управления отношениями с клиентами, описанная Джеффом Тэннером в книге «Стратегия динамического управления отношениями с клиентами: Большая прибыль от больших данных» (Dynamic Customer Strategy: Big Profits from Big Data){17}. Она может послужить хорошим подспорьем для читателей, интересующихся заявленной темой.
С тем, как искать новые проблемы, должно быть все понятно, поэтому давайте рассмотрим пример того, как можно использовать большие данные для поиска новых способов решения старых проблем. В сфере здравоохранения клинические испытания служат золотым стандартом, а в их составе заключительный тест и управляющая конструкция выполняются посредством так называемого двойного слепого метода, когда ни пациенты, ни врачи не знают, кто какое лечение получает. Это исследование проводится в строго контролируемых условиях и позволяет с высокой точностью определить положительные и отрицательные эффекты тестируемых процедуры или препарата. Однако, после того как на их разработку были потрачены сотни миллионов долларов и многие годы исследований, клинические испытания в лучшем случае охватывают от 2000 до 3000 человек. Такой размер выборки недостаточен. И это означает, что хотя клинические испытания позволяют очень точно измерить показатели согласно пожеланиям исследователей, но попросту не хватит данных для того, чтобы выявить весь спектр непредвиденных последствий.
К чему ведет такая ограниченность выборки? К ситуациям наподобие тех, что случились несколько лет назад, когда применение многих препаратов-анальгетиков из класса ингибиторов ЦОГ-2, в том числе Vioxx и Celebrex, обернулось неприятностями. Исследователи обнаружили, что эти препараты в два – четыре раза повышают вероятность развития сердечных заболеваний по сравнению с нормой{18}. А ведь проблема не была выявлена в ходе первоначальных клинических испытаний, и прошло несколько лет после выведения препаратов на рынок, прежде чем ее определили.
Взгляните по-новому на проблемы, которые считаете уже решенными
Когда вы находите новые данные, содержащие новую информацию, обязательно вернитесь к былым проблемам. Довольно часто оказывается, что проблему, уже считающуюся решенной, можно решить гораздо эффективнее, если использовать новую информацию и подойти к проблеме с другой стороны.
Теперь давайте перенесемся немного вперед. Можем ли мы повысить точность клинических испытаний при помощи больших данных, даже если они собираются за пределами контролируемой среды? В ближайшем будущем детальная электронная медицинская документация станет нормой. Благодаря этому после выпуска препарата на рынок можно будет отслеживать его действие на тысячах, сотнях тысяч или миллионах людей, которые начнут его использовать. А также проанализировать действие препарата при любых комбинациях болезней, которыми страдают использующие его пациенты, и в комбинациях с любыми другими препаратами и методами лечения, применяемыми одновременно с ним. Люди же, использующие препарат не по назначению и наряду с противопоказанными лекарствами, останутся за рамками клинических испытаний.
Использование электронных историй болезней позволит выявлять непредвиденные положительные и отрицательные эффекты препарата (разумеется, при сохранении конфиденциальности сведений о пациентах). Несмотря на то что эти данные будут поступать не из строго контролируемой среды, как при клинических испытаниях, они позволят намного раньше обнаруживать скрытые проблемы наподобие сердечных осложнений при использовании Vioxx. Чтобы подтвердить эти аналитические результаты, могут потребоваться контролируемые исследования, зато можно будет гораздо быстрее обнаружить источник проблем. Речь идет не о том, чтобы заменить клинические испытания анализом неконтролируемых медицинских данных, а о том, что использование этих данных способно помочь исследователям выявлять непредвиденные положительные и отрицательные эффекты препаратов и намного улучшать методы лечения. Всего-то и требуется задуматься о том, как по-иному подойти к решению проблем… Даже если сегодня они считаются уже решенными.
Хранение данных больше не требует двоичного выбора
Внедрение больших данных требует от организации изменения подходов к тому, как она собирает данные, хранит их и настолько долго. До недавнего времени было слишком дорого тратиться на что-то иное, кроме хранения самых важных данных. Если данные были достаточно важными для того, чтобы их собирать, значит, они были достаточно важными и для того, чтобы хранить их очень долго, если не бессрочно. Учитывая сегодняшнее изобилие источников больших данных, организации должны отказаться и от двоичного выбора «собирать или не собирать», и от бессрочного хранения собранного. Теперь необходимы многовекторные решения.
Во-первых, необходимо ли выбирать все части из источника данных или только отдельные части? Во-вторых, какие данные и на протяжении какого времени должны храниться? Возможно, потребуется лишь малая доля и хранить ее надо будет недолго, а потом удалить. Определение правильного подхода требует сначала определения ценности данных на сегодняшний день и в перспективе.
Чтобы наглядно проиллюстрировать, какие данные не нужно собирать, приведу вам следующий пример. Представьте себе современный умный дом, оснащенный массой всевозможных датчиков. В каждой комнате имеется свой термостат, который постоянно посылает данные о текущей температуре в центральную систему для того, чтобы поддерживать в комнатах постоянную температуру. В процессе взаимодействия термостатов с центральной системой генерируется непрерывный поток данных, но имеют ли они ценность? Эти данные необходимы для выполнения конкретной тактической задачи, но трудно представить, для чего бы они могли потребоваться спустя долгое время. Показания с разрывом в миллисекунду нужны только для выполнения главной задачи – обновления сведений в системе. Если же энергетическая компания будет скрупулезно собирать и хранить такие данные, поступающие из всех обслуживаемых ею домов и зданий, она переполнит свои хранилища данных и не создаст ничего ценного.
Для сокращения данных можно прибегнуть к аналитике. Сокращение данных – это процесс идентификации тех их областей, которые можно проигнорировать или же скомбинировать, чтобы уменьшить количество используемых метрик при небольшой потере информации. Например, если установлено, что температура в смежных комнатах вашего дома всегда отличается не более чем на полградуса, то можно собирать данные не для каждой комнаты, а только для одной и экстраполировать их на соответствующую зону внутри дома. Это позволит значительно сократить хранимые объемы данных без снижения качества информации, доступной для аналитики.
Установите сроки хранения данных
Сейчас происходит масштабное изменение точки зрения на хранение данных. Утверждается правило их удаления по истечении определенного периода времени. Организация должна определить временну́ю ценность данных. Некоторые пригодны только для немедленного применения, другие будут терять свою ценность постепенно. Только небольшую долю данных стоит хранить долго, в отличие от стандартной сегодняшней практики.
Давайте рассмотрим сценарий, когда данные остаются крайне важными только на протяжении определенного периода времени. Железнодорожники устанавливают на рельсах датчики для измерения скорости проходящих поездов. Недавно я узнал, что они также измеряют температуру вагонных колес. Если груз в вагоне несбалансирован и смещается в одну сторону, то вагон начинает перекашиваться. С этой стороны давление груза возрастает, что увеличивает трение, которое, в свою очередь, ведет к большему нагреванию колес. Когда они нагреваются выше определенной температуры, индикатор указывает на серьезный дисбаланс и возможный сход вагона с рельсов. Железнодорожники отслеживают температуру колес в режиме реального времени, когда поезд движется. При нагревании колесной пары выше установленного уровня поезд останавливается и к нему направляется бригада рабочих, чтобы проинспектировать состояние вагона и зафиксировать груз. Это экономит железнодорожным компаниям в перспективе массу денег, поскольку сход состава с рельсов обернется дорогостоящей, а подчас и смертоносной катастрофой.
Теперь обратимся к данным о температуре колес и подумаем, на протяжении какого времени они сохраняют свою ценность. Предположим, что состав должен проехать более 3000 километров за несколько дней. Датчики измеряют температуру колес, скажем, с регулярностью в 30 секунд. Крайне важно собирать и анализировать эти данные в режиме реального времени, чтобы немедленно выявлять возможные проблемы.
Далее перенесемся на пару недель вперед. Поезд благополучно прибыл к месту назначения. Все показатели температуры колес находились в пределах полуградуса от нормы. Дальше хранить эти данные не имеет смысла. Возможно, имеет смысл сохранить выборку данных по нескольким благополучным рейсам, чтобы использовать ее для сравнения с отклонениями от нормы. В то же время данные по рейсам, когда возникали проблемы с температурой колес, могут храниться практически бессрочно наряду с небольшой выборкой по благополучным рейсам. Прочие данные никакой ценности не представляют.
Разумеется, существуют данные, которые имеет смысл хранить очень долго. Банки и брокерские дома могут поддерживать отношения с клиентами на протяжении нескольких последних лет и даже десятилетий. Для них важно хранить информацию о каждом вкладе, сделанном каждым клиентом, и о каждом обмене имейлами опять-таки с каждым клиентом. Это позволяет им улучшить качество обслуживания с течением времени, а также обеспечить себе правовую защиту. В этом случае собираемые данные также хранятся практически вечно, как и было заведено при традиционном подходе.
Итак, ключевое положение этого раздела состоит в том, что организации должны изменить свои подходы к сбору, накоплению и хранению данных. Поначалу вам может быть некомфортно от мысли о том, что некие данные вы упускаете и сознательно удаляете уже собранные. Но в эпоху больших данных делать это необходимо.
Интернет вещей грядет
Концепция Интернета вещей неуклонно привлекала все больше внимания в 2013-м и начале 2014 г. Речь идет обо всех «вещах», работающих онлайн и взаимодействующих друг с другом и с нами. По мере того как датчики и коммуникационные технологии дешевеют, всё больше вещей становятся «умными», приобретая способность оценивать обстановку и передавать информацию. Уже обыденными стали подключенные к Интернету холодильники и часы, которые регулярно отправляют и получают информацию.
Интернет вещей способен порождать огромные массивы данных. В этом он даже может опередить все остальные источники больших данных. Примечательно, что значительная часть генерируемых им данных нередко носит чисто функциональный характер. Любая коммуникация длится очень недолго и может содержать только упрощенную информацию. Например, часы могут получать информацию об обновлении времени из надежного внешнего источника, а затем передавать ее другим часам в домашней сети. В совокупности это создает обширный объем данных, но в большинстве своем у них крайне низкая ценность и крайне короткий срок пригодности.
Многие примеры, описанные в этой книге, можно отнести к сфере Интернета вещей, скажем показания датчиков. Такие умные устройства, «разговаривающие» друг с другом, принесут благо и компаниям, и потребителям. По мере того как все больше вещей вокруг нас приобретают способность сообщаться между собой, перед нами открываются новые возможности:
• Ваш дом изучит ваши предпочтения касательно освещения, отопления и т. п., а затем будет автоматически подстраивать эти функции для вас.
• Такие приборы, как лампочки и освежители воздуха, будут предупреждать вас о необходимости их скорой замены.
• Холодильники будут автоматически выдавать вам списки покупок, учитывая ваше потребление и сроки годности хранящихся продуктов.
• Видео– и аудиоконтент будет плавно следовать за вами из комнаты в комнату, избавляя вас от необходимости что-либо включать и выключать.
• Датчики на вашем теле или рядом с ним будут отслеживать ваш режим сна, потребление калорий, температуру тела и сообщать эти и массу других всевозможных показателей.
Наши вещи могут стать крупнейшим источником персональных данных
Интернет вещей надвигается с быстрой скоростью. Недолго осталось ждать того времени, когда многие из наших личных вещей, больших и малых, будут обладать датчиками и способностью к сообщению. Объемы данных, генерируемых нашими вещами, превзойдут все персональные данные, что мы собираем сегодня. Личные фотографии и видео будут составлять лишь малую долю в общем объеме всех сообщений, отправляемых нашими вещами.
В то время как Интернет вещей будет производить, возможно, один из самых больших объемов данных, последние, вероятно, будут фильтроваться гораздо жестче по сравнению с другими данными. В результате объем, который мы решим оставить, может быть вполне управляемым. Мы позволим всем нашим вещам свободно сообщаться на постоянной основе, а отлавливать будем только самые важные части этого взаимодействия. Более подробно рассмотрим эту концепцию в шестой главе.
Вскоре Интернет вещей станет очень горячей и популярной темой. Я не могу уделить ей того должного внимания, которого она заслуживает. Но, как это произошло и с феноменом больших данных, вскоре в изобилии появятся книги и статьи, посвященные Интернету вещей. Заинтересованные читатели должны внимательно следить за развитием этого тренда. Как свидетельствуют многие из примеров, использованных в книге, операционная аналитика во множестве будет опираться на данные, поставляемые из окружающих нас вещей. Тогда Интернет вещей станет компонентом аналитической стратегии практически каждой организации.
Помещаем большие данные в правильный контекст
Как большие данные вписываются в общую картину? В чем их специфика? Что будет с ними дальше? Эти типичные вопросы возникают у большинства организаций. Как и в любой другой относительно новой области, возникает немало путаницы и разногласий по поводу того, чем являются большие данные на самом деле. В этом разделе мы рассмотрим ряд тем и концепций, которые следует усвоить, чтобы поместить большие данные в правильный контекст. Это позволит гораздо эффективнее включить их в процессы операционной аналитики и добиться успеха.
Данные не столько большие, сколько разнообразные
Как мы уже отмечали ранее в этой главе, именно новая информация, которую содержат большие данные, делает их такими захватывающими. И также отмечали, что многие люди считают, будто сложность в управлении большими данными проистекает из их объема. Но отнюдь не объемом выделяются многие источники больших данных. Часто главная сложность связана с тем, что новая информация обнаруживается в данных разного типа или формата и может потребовать различных аналитических методологий.
Большинство данных, собиравшихся ранее для анализа в мире бизнеса, носили деловой или описательный характер и были хорошо структурированы. Это значит, что информация в них была представлена в четко установленной и легко читаемой форме. Например, колонка под названием «Продажи» в электронной таблице содержала только суммы в долларах. Менее структурированные данные, такие как письменные документы или изображения, считались непригодными для целей анализа. Сейчас, в эпоху больших данных, организации сталкиваются с новыми типами и форматами данных, многие из которых структурированы не так, как традиционные источники. Датчики выдают информацию в специальных форматах. Данные GPS устанавливают местонахождение людей и вещей в пространстве. Часто возникает необходимость определить, насколько крепки взаимоотношения между людьми или организациями. Все это принципиально разные типы данных в плане как формата, так и способов их анализа. О различных типах анализа мы поговорим в седьмой главе.
Главная сложность не в объеме, а в разнообразии
Несмотря на то что основное внимание привлекает «громадность» больших данных, зачастую реальную сложность представляет их разнообразие. Существует множество новых источников данных во множестве новых форматов, содержащих новые типы информации. Определить, как извлечь из этого разнообразия нужную информацию, может потребовать больше усилий, чем определить, как масштабировать аналитические процессы.
Анализ социальной сети с определением количества и крепости связей между ее подписчиками требует совершенно других методологий, чем, скажем, прогнозирование продаж. Подобное разнообразие больших данных представляет собой куда больший вызов, чем их «громадность». В чем заключается сложность? Давайте посмотрим на примере.
Предположим, что организация впервые решает запустить текстовый анализ сообщений по электронной почте. Даже для того чтобы проанализировать всего несколько тысяч имейлов, потребуется приобрести специальное программное обеспечение, установить его и настроить, а также определить желательную для организации логику анализа. Создание процесса текстового анализа для 10 000 писем потребует столько же времени и усилий, как и для 10 млн или 100 млн. Будет применяться одна и та же логика, только увеличится масштаб. Поскольку текст представляет собой иной тип данных, придется проделать много подготовительной работы, чтобы запустить анализ даже очень малого объема текстовых данных.
Разумеется, при выполнении аналитического процесса 10 000 имейлов будут обработаны быстрее, чем 100 млн. Несмотря на то что увеличение объема требует масштабирования процесса, лежащая в его основе логическая схема анализа остается прежней. Поэтому первым делом нужно решить, как управлять разнообразием источника больших данных. А затем решить, как управлять разнообразием при масштабировании.
Большие данные требуют масштабирования по нескольким параметрам
Главное внимание при работе с большими данными обычно уделяется проблеме масштабирования. Если конкретнее, то количеству данных и объему требуемой обработки. Между тем нужно учитывать и другие параметры масштабирования в том случае, если организация решает внедрить аналитику на уровне всего предприятия и особенно если решает превратить ее в операционную. Эти аспекты проиллюстрированы на рис. 2.3 и 2.4.
Во-первых, необходимо произвести масштабирование касательно количества и разнообразия пользователей, имеющих доступ как к исходным данным, так и к результатам основанных на них аналитических процессов. Десяткам и сотням тысяч сотрудников может потребоваться в любое время ознакомиться в разных аспектах с первичными данными и результатами их анализа. Корпоративные платформы должны быть дружественными к пользователям и совместимыми с широким спектром инструментов и приложений.
Масштабирование касается не только хранения и обработки
Основное внимание при внедрении больших данных, как правило, уделяется возможностям масштабирования хранения и обработки данных. При этом часто упускаются из виду другие важные параметры, которые также требуют масштабирования, такие как количество пользователей, уровень параллелизма, управление рабочей нагрузкой и протоколы безопасности. Если системы не будут масштабированы по всем перечисленным параметрам, организации не удастся добиться успеха в операционной аналитике.
Во-вторых, крайне важно произвести масштабирование такого параметра, как параллелизм. Под ним понимается количество пользователей или приложений, которые одновременно могут получить доступ к определенному набору информации. Также параллелизм на уровне предприятия означает, что по мере изменения данных все пользователи получают согласованные ответы на свои запросы. По мере роста параллелизма значительно возрастает и риск того, что система перестанет справляться с обработкой запросов. Следовательно, если крупная организация решает внедрить у себя операционно-аналитические процессы, она должна создать такую среду, где множество разных пользователей и приложений могут одновременно взаимодействовать с одной и той же информацией.
В-третьих, существует потребность в масштабировании инструментов управления рабочей нагрузкой. Когда различные типы пользователей подают широкий спектр запросов на анализ да еще и на защищенном уровне, необходимо наладить управление рабочей нагрузкой. Сбалансировать разом множество запросов – не такая простая задача, как кажется, однако этот аспект масштабирования легко упустить из виду. Очень нелегко создать систему, которая способна эффективно управлять как незначительными тактическими, так и крупными стратегическими запросами.
Наконец, нужно масштабировать и протоколы безопасности. Организация при необходимости должна быть способна контролировать и блокировать доступ к данным. Пользователям предоставляются только те части данных, которые им позволяется видеть. Крупная организация должна встроить надежные протоколы безопасности во все свои платформы.
Все перечисленные параметры масштабирования – данные, обработка, пользователи, параллелизм, управление рабочей нагрузкой и безопасность – должны присутствовать с самого начала, если организация хочет добиться успеха в операционной аналитике. И потерпят неудачу те, кто заботится только о масштабировании хранения и обработки данных.
Как получить максимальную отдачу от больших данных
Одна из самых распространенных ошибок, которую я видел в организациях, пытающихся внедрить большие данные в свои аналитические процессы, состоит в подходе к большим данным как совершенно отдельной и самостоятельной проблеме. Многие компании даже создают специальные подразделения, занимающиеся только большими данными{19}. А некоторые доходят вплоть до того, что открывают в Кремниевой долине офисы, призванные заниматься реализацией проектов в области больших данных. Однако такой подход может встретиться с трудностями, поскольку большие данные всего лишь один из аспектов общей корпоративной стратегии управления данными и аналитикой. Необходима единая согласованная стратегия, охватывающая все данные, большие и малые, как это проиллюстрировано на рис. 2.5 и 2.6.
Давайте рассмотрим историческую параллель, которая наглядно показывает, почему отсутствие единой стратегии управления данными и аналитикой может привести к проблемам. Когда электронная коммерция уже достигла зрелости, многие ретейлеры все еще рассматривали ее не в качестве аспекта своих стратегий розничного бизнеса, а как совершенно новое направление деятельности. В результате многие из них создавали специальные подразделения электронной коммерции, иногда даже придавая им статус отдельных юридических лиц. Эти отдельные организации создавали собственные цепочки поставок, иерархии продуктов, политику ценообразования и т. д.
Теперь перенесемся в сегодняшний день. Те же самые ретейлеры сейчас желают, чтобы их бизнес воспринимали как единое целое, включая традиционные стационарные магазины и электронную коммерцию. Более того, они хотят обеспечить потребителям плавное переключение между различными каналами торговли. Однако, для того чтобы объединить в некоторых случаях совершенно несовместимые системы, ретейлерам требуются миллионы долларов инвестиций и годы работы.
Разработайте общую стратегию в области данных и аналитики
Вы должны рассматривать большие данные как один из аспектов общей стратегии управления данными и аналитикой. В противном случае вы столкнетесь с теми же проблемами, с которыми сегодня сталкиваются ретейлеры, изначально не включившие электронную коммерцию в свои стратегии розничной торговли.
10–15 лет тому назад ретейлеры справедливо признали, что электронная коммерция имеет свою специфику. Но им также нужно было бы признать, что ее следовало вписать в их общую стратегию розничной торговли. Если бы они развивали электронную коммерцию в интеграции с основным бизнесом, то это немного растянуло бы процесс поначалу, зато в долгосрочной перспективе сэкономило бы много денег и времени.
Убедитесь, что ваша организация не совершает ту же ошибку в отношении больших данных. Потратьте время на то, чтобы продумать, как большие данные могут быть интегрированы в вашу общую стратегию управления данными и аналитикой. Это важный момент, поскольку ни один источник данных сам по себе не способен обеспечить оптимальные результаты. Сочетание различных источников данных – единственный способ извлечь из них максимальную ценность. Например, для того чтобы составить представление о потребителе, нужно совместить данные о продажах и поисковых запросах в веб-браузере, демографические данные и другие.
Если же организация внедрит отдельные системы и процессы для больших данных, не подумав о необходимости интеграции, ей будет гораздо труднее добиться в итоге искомой оптимизации. Компании должны стремиться создать единое аналитическое окружение, которое позволяет его пользователям осуществлять любой тип анализа с использованием любого типа и объема данных в любой момент времени. Далее в книге мы подробнее рассмотрим, как создать такое окружение. Читателям, желающим больше узнать о том, как получить максимальную отдачу от использования больших данных в маркетинге, я рекомендую прочитать книгу моей коллеги Лайзы Артур «Маркетинг на основе больших данных: как эффективнее привлечь потребителей и извлечь ценности» (Big Data Marketing: Engage Your Customers More Effectively and Drive Value){20}.
Назад в будущее
Одна из шумно разрекламированных концепций касательно больших данных связана с якобы новым миром, создаваемым набором нереляционных инструментов, которые не опираются на реляционные базы данных и не используют SQL в качестве первичного интерфейса. Аббревиатура SQL расшифровывается как «язык структурированных запросов», и на протяжении многих лет его называли «языком бизнеса». Нереляционнные наборы инструментов не используют SQL эксклюзивно либо вообще его не используют. Приверженцы нереляционного подхода считают, что возникла потребность в дополнительных языках, поскольку SQL во многих компаниях был практически единственным языком бизнеса. В конце концов почему бизнес не может быть многоязычным? Он и должен быть таковым. Более того, он должен был быть таковым с самого начала.
Давайте сразу же разоблачим роковое заблуждение. Дело в том, что нереляционная аналитика – далеко не новая концепция. Когда я начинал свою карьеру аналитика, реляционных баз данных в мире бизнеса еще не существовало. Как и не существовало SQL. Поэтому всю аналитику мы выполняли с помощью нереляционных методов. Например, я обычно использовал инструменты из SAS (системы статистического анализа). Для специалистов вроде меня язык SQL действительно был новинкой. Со временем мы поняли, что SQL лучше подходит для определенных видов задач и обработки. Но всегда встречались и такие виды обработки, которые профессиональные аналитики по-прежнему осуществляли вне окружения SQL.
Сегодня же, с появлением больших данных, организации вновь открыли для себя ценность обработки вне контекста SQL в тех случаях, когда это имеет смысл. Оказалось, что источники больших данных гораздо чаще, чем источники традиционных данных, оправдывают использование нереляционных технологий. Однако многие компании зашли слишком далеко и постарались втиснуть всю обработку в парадигму SQL. Это было ошибкой; организациям действительно необходимо включать в свой набор различные подходы. Просто вы должны знать, что нереляционные технологии были доступны всегда. И дело не в том, что в течение 2010-х гг. не существовало никакой необходимости в нереляционной обработке. Скорее компании слишком сильно сконцентрировались на SQL. Можно ожидать, что в будущем SQL останется доминирующим подходом для анализа данных, а нереляционная аналитика станет применяться в специфических целях.
Огромный сдвиг во взглядах на большие данные
После того как на протяжении нескольких лет предсказывалась скорая смерть SQL, сегодня нереляционные платформы стремятся дополниться интерфейсами SQL. В этом нашли отражение не только огромный сдвиг во взглядах, но и реальные потребности бизнеса.
Организациям следует внедрять набор нереляционных инструментов когда это уместно, но ни в коем случае нельзя предполагать, что при этом отпадет необходимость в использовании наряду с ними и SQL. Ведь так легко впасть в противоположную крайность, и многие организации сегодня подвергаются риску поступить именно так. Но, хотя в течение нескольких лет многие эксперты провозглашали смерть SQL, вследствие массовой перемены мнений сейчас возникло сильное движение за внедрение функциональности в стиле SQL в широкий спектр нереляционных платформ, таких как Hadoop. В очередной раз мы возвращается назад в будущее. Подробнее об этом тренде и о том, как правильно выбрать тип обработки, мы поговорим в пятой и шестой главах.
Большие данные следуют кривой зрелости
Многие люди жалуются мне на то, что большие данные их подавляют. Существует так много новых источников данных и так много новых возможностей применения этих данных, что организации попросту не знают, как с ними справиться и с чего начать. Прежде чем отчаиваться, подумайте о том, что большие данные следуют той же кривой зрелости, что и любой новый источник данных{21}. Такова жизнь, что, когда появляется новый источник данных, он всегда представляет собой вызов. Люди не знают в точности, как наилучшим образом использовать эти новые данные, какие метрики создать на их основе, какие проблемы с качеством данных могут возникнуть, и т. д. Однако с течением времени работа с этим источником нормализуется.
Много лет назад, когда я со своей командой впервые занялся анализом данных с точек продаж (point‐of‐sale, POS), мы тоже не знали, как лучше их использовать в целях анализа покупательского поведения и улучшения результатов в бизнесе. О том, чтобы применить к POS-данным операционную аналитику, мы тогда и помыслить не могли. У нас было множество теорий и идей, но ни одна из них на тот момент не была проверена на практике. Разумеется, мы не располагали никакими стандартизированными подходами к вводу, подготовке и анализу этих данных. Со временем в процессе регулярного анализа POS-данных все эти аспекты были стандартизированы. Сегодня использование POS-данных считается простым делом и применяется для решения широкого круга задач.
Не отчаивайтесь
Новые источники данных всегда пугают, когда мы впервые начинаем их анализировать. Но со временем наше понимание их крепнет, и нам становится удобно с ними работать. Такой же процесс вызревания произойдет и с большими данными. Ситуация с ними кажется более пугающей, чем обычно, только лишь потому, что нам приходится одновременно иметь дело со множеством новых источников.
Организациям предстоит пройти одним и тем же путем познания каждого нового источника данных (см. рис. 2.7). Принципиальное отличие сегодняшней ситуации состоит в том, что в прошлом организация получала доступ к действительно новому и уникальному источнику данных раз в несколько лет, тогда как в эпоху больших данных она может получить доступ сразу ко множеству таких источников.
Сегодня перед профессиональными аналитиками может стоять задача одновременно наладить анализ в таких областях, как взаимодействие в социальных сетях, взаимодействие по обслуживанию клиентов, веб-поведение клиентов, сенсорные данные и т. д. Иногда требуется использовать все эти данные в одном аналитическом процессе. В таком случае множественные новые источники, следующие кривой зрелости, применяются все вместе. Сделать это гораздо сложнее, чем в случае с одним лишь новым источником. Ситуация усугубляется тем, что необходимо представлять себе не только как обращаться с каждым источником данных, но и как соединить их вместе (мы обсуждали это выше),
Помните, что работа с новыми данными всегда сложна и всегда поначалу пугает. На этом пути вам всегда придется преодолевать ухабы, но неизбежно со временем процесс ввода и анализа данных будет в основном стандартизирован – и станет для вас простым делом. Затем вы сможете перейти к следующему новому источнику данных. Именно так произойдет и уже происходит с большими данными сегодня.
Большие данные как глобальный феномен
Наконец в этой главе мы рассмотрим, насколько велика зрелость больших данных и устойчивы взгляды на них в различных точках земного шара{22}. Ведь одни организации находятся впереди, а другие отстают в циклах внедрения и развития больших данных. Тем не менее, объехав несколько континентов и пообщавшись со множеством банков, страховых компаний, ретейлеров, государственных учреждений и т. д., я обнаружил, что все они сталкиваются фактически с одними и теми же проблемами. Несмотря на особенности местных рынков, определяемые законами и обычаями, фундаментальные проблемы бизнеса отличаются постоянством. Кроме того, люди в большинстве своем считают, что в других отраслях и в других частях света ситуация куда лучше, чем в их организации, хотя зачастую это совсем не так.
Математика, статистика, аналитика и данные не пользуются особым языком и не принадлежат особой культуре. Они универсальны по своей природе. График тренда в Китае выглядит точно так же, как график тренда в Испании, и основан на одинаковой информации. Средние значения вычисляются в Индии точно так же, как и в Германии. Запись транзакции в Японии содержит точно такую же информацию, как и запись транзакции в Бразилии. Утверждение о том, что большие данные представляют собой уникальную проблему для какой-либо отрасли или страны, является ошибочным за очень редкими исключениями.
Ваша организация может отставать не на столько, на сколько вы считаете
Организации по всему миру сталкиваются с очень похожими проблемами в области больших данных. Однако организации часто считают, что в своей отрасли они попали в число отстающих, и точно так же считают организации в той же отрасли, но в другом регионе мира. Несмотря на то что каждый считает себя отстающим, во многих случаях реальное отставание гораздо меньше, чем предполагается.
Подумайте над тем, чтобы наладить сотрудничество с другими похожими организациями где угодно в мире. Благодаря социальным сетям сегодня это сделать легко. Вполне может оказаться, что другая организация сталкиваются со сходными проблемами. Разумеется, нет смысла пытаться наладить конструктивный диалог со своим прямым конкурентом. Но вы можете найти организацию на другом конце земного шара, которая не представляет для вас конкурентной угрозы. Обмен информацией и усвоенными уроками будет выгодным для обеих сторон.
С какими бы трудностями ни сталкивалась ваша организация при внедрении больших данных, вы можете быть уверены в том, что многие другие организации проходят через то же самое. Со временем для всех этих проблем будут найдены решения, которые станут общеизвестными и общедоступными. Включение больших данных в операционную аналитику превратится в намного более легкую и стандартную процедуру. Организации необязательно стремиться во что бы то ни стало стать первопроходцем, но ей не следует и дожидаться полного решения проблем. Догоняющее развитие не приведет к выигрышу.
Подведем итоги
Наиболее важные положения этой главы:
• Не беспокойтесь насчет определения больших данных. Гораздо важнее определить, какие именно данные, будь то большие или малые, необходимы вам для аналитики. Важно не определение, а результаты!
• Всегда начинайте с конкретных бизнес-проблем. Не внедряйте технологии больших данных только лишь для того, чтобы заявить об этом.
• Несмотря на чрезмерную шумиху и нереалистичные краткосрочные ожидания, большие данные останутся с нами. Точно так же как пузырь доткомов не означал, что у Интернета не было огромного потенциала, так и пузырь больших данных не означает отсутствия огромного потенциала у больших данных.
• Что делает большие данные настолько захватывающими, так это новая информация, которая в них содержится. Новая информация почти всегда побеждает новые алгоритмы.
• Не используйте большие данные только для улучшения существующих аналитических процессов. Ищите способы, при помощи которых большие данные позволят решить старые проблемы с новой точки зрения или решить совершенно новые проблемы.
• В ближайшие годы будьте готовы к стремительному росту ажиотажа вокруг Интернета вещей, а также к пересмотру своей политики по отношению к сохранению данных, чтобы справляться с грядущими потоками малоценных данных.
• Разнообразие больших данных, по сравнению с традиционными, гораздо проблематичнее, чем их «огромность».
• Большие данные требуют масштабирования не только при обработке и хранении, но и в параметрах касательно пользователей, параллелизма, управления рабочей нагрузкой и безопасности.
• Большие данные должны стать компонентом общей стратегии управления данными и аналитикой. Большие данные не могут эффективно работать сами по себе.
• После нескольких лет предсказаний о скорой смерти SQL сегодня нереляционные платформы стремятся дополниться интерфейсами SQL. В этом находят отражение не только огромный сдвиг во взглядах, но и реальные потребности бизнеса.
• Хотя сегодня большие данные могут казаться подавляющими, они следуют той же кривой зрелости, что и другие источники данных. Большие данные довлеют над нами сильнее ввиду количества новых источников данных, которые все разом стали нам доступны.
• Большинство организаций во всех отраслях и странах мира считает, что они далеко отстали в области больших данных. На самом же деле немногие организации вырвались далеко вперед, соответственно и немногие далеко отстали.
Глава 3 Операционная аналитика в действии
В этой главе мы обратим внимание на различные примеры операционной аналитики в действии. Они ясно показывают, что в будущем организации сосредоточатся не просто на увеличении старой традиционной аналитики, а на применении новыми способами разных типов аналитики. Аналитика, которой организации занимались годами, сейчас становится необходимым, но недостаточным условием работы во все большем числе отраслей и контекстов. Для того чтобы добиться успеха в будущем, организациям придется выйти за пределы традиционной пакетной аналитики. Иными словами, сделать последнюю операционной.
Одним из главных изменений, которые операционная аналитика позволяет осуществить организации, является возможность резко активизировать свои действия. В некоторых случаях аналитика может быть очень простой, в других – весьма изощренной. Описанные в этой главе примеры охватывают весь диапазон случаев, однако во всех них красной нитью проходит свидетельство о том, что операционная аналитика позволяет организации действовать на упреждение, а не реагировать на уже возникшие обстоятельства. Тем самым она позволяет избежать проблем, а там, где сделать это невозможно, операционная аналитика позволяет решать возникающие проблемы оперативно и в автоматическом режиме.
Итак, давайте рассмотрим ряд примеров, иллюстрирующих как очень простые, так и весьма необычные случаи применения операционной аналитики. Примеры изложены в произвольном порядке, без учета затронутой области и уровня сложности анализа. Читатели обратят внимание на то, что многие из них связаны с использованием датчиков, т. е. имеют отношение к теме Интернета вещей, о которой мы говорили во второй главе и которой посвящена значительная часть операционной аналитики.
Улучшение обслуживания потребителей
Одна из областей, где потребители заметят наибольшие изменения в связи с внедрением операционной аналитики, – это их повседневные взаимодействия с организациями. На протяжении многих лет организации стремились всё более персонализировать свои продукты, услуги и маркетинг. Операционная аналитика позволит далее развивать кастомизацию и персонализацию. Следующие примеры дают представление о ее потенциале.
Волшебные моменты про запас
Давайте обратимся к компании Walt Disney Company. В течение многих лет она осуществляет весьма сложный анализ поведения посетителей своих парков развлечений – стремится понять их предпочтения и шаблоны с целью улучшения обслуживания. В том числе Disney вкладывает много ресурсов в изучение передвижения посетителей по паркам и в изучение воздействия этого потока на своих гостей.
В прошлом, опираясь на имеющиеся данные, Disney была вынуждена рассматривать толпу как единичный объект. Другими словами, толпа изучалась как отдельный объект большого размера, находящийся в постоянном движении. Например, утром эта масса людей могла сосредоточиться на одной стороне парка, а в течение дня постепенно перемещаться на другую сторону. Однако введение технологии MagicBand («Волшебный ремешок») позволило компании произвести революцию в своем подходе к управлению потоком посетителей и их восприятием{23}. Данные с MagicBand могут быть использованы как для традиционной, так и для операционной аналитики с целью улучшения обслуживания.
MagicBand – это браслеты со встроенным радиочастотным микрочипом. Disney использует эту технологию, чтобы изменить восприятие посетителей. Начать с того, что посетителям больше не нужно носить с собой билет и кредитную карту. MagicBand – это и есть билет, который дает гостям возможность делать покупки в любом из магазинов и ресторанов парка, а также приобретать билеты Fast Pass («Быстрый проход») для аттракционов. Fast Pass позволяют гостям посещать аттракционы в указанное время без длительного ожидания в очереди.
MagicBand не только облегчают передвижение по парку, но и позволяют компании изучать трафик посетителей на гораздо более детализированном уровне. Вместо того чтобы рассматривать толпу как единый объект, Disney может рассматривать гостей как индивидов, демонстрирующих уникальное поведение. Это дает возможность выделить различные пути людей по парку. Некоторые предпочитают прокатиться на одном-двух аттракционах, после чего сделать перерыв, перекусить, отдохнуть и только потом отправиться на следующий аттракцион. Другие посещают один аттракцион за другим без перерывов. Компания может использовать эту информацию, чтобы управлять шаблонами трафика, добиваясь более равномерного распределения посетителей по парку.
Например, посетителей могут предупреждать о том, что в той или иной части парка наблюдается меньшее скопление народа, чем там, где они находятся сейчас. Или же, если очереди удлиняются, гостей могут поощрить к продлению перерыва, предложив им закуски со скидкой. Разумеется, анализ перемещения толпы может выходить за рамки операционной аналитики, но это уже другая тема.
Благодаря информации, поставляемой MagicBand, Disney также смогла изменить взаимодействие со своими гостями до и во время посещения парка. Давая возможность получать Fast Pass, используя браслет, компания позволяет посетителям тратить меньше времени на стояние в очереди. Тем самым она соблазняет их провести больше времени в магазинах и ресторанах, чтобы они потратили там больше денег. Таким образом, анализируя перемещение гостей по парку и управляя им, Disney способна не только значительно улучшить их восприятие, но и заработать дополнительную прибыль. Люди могут даже не замечать влияния этих технологий, а просто порадуются тому, что им не приходится стоять лишний час в очереди, – и могут потратить этот час на перекус и приобретение очередного сувенира. Все довольны.
Чем больше аналитики, тем лучше восприятие
По мере того как организация собирает все больше информации о наших с ней взаимодействиях, она способна лучше подстроиться к нам. Благодаря запуску процессов операционной аналитики, которые в текущем режиме учитывают все наши последние действия, организация может как персонализировать, так и улучшить восприятие ее нами.
Когда посетители желают воспользоваться функциями MagicBand, например на подходе к кассе или анимированному персонажу, сотрудники парка узнают, кто перед ними. Это легко сделать благодаря устройствам, которые считывают с браслетов уникальные идентификаторы. В нижеприведенном примере косвенно затрагивается неприкосновенность личной жизни, о чем мы подробнее поговорим в шестой главе, а сейчас сосредоточимся на том, как MagicBand может воздействовать на посетителей.
Представьте себе маленького ребенка, который впервые посещает Диснейленд. Одно из самых потрясающих впечатлений для него возникнет, когда к нему подойдет принцесса или Микки Маус и заговорит с ним. Благодаря новым браслетам, при приближении к ребенку Микки Мауса его помощник с помощью планшета считает идентификатор с браслета ребенка и получит на экране примерно следующую информацию: «Это Джон Смит. Он из Атланты, штат Джорджия. Здесь он празднует свой девятый день рождения. Он очень любит конфеты “Мишка Гамми”». Скрытый анализ позволит определить, какие специальные предложения можно сделать, исходя из информации, известной о ребенке и его семье. Эти детали помощник может прошептать на ухо Микки.
Теперь представьте, насколько будет потрясен ребенок, если к нему подойдет Микки и вместо простого «Привет, как дела?» произнесет: «Привет, Джон! Как здорово видеть тебя здесь! Тебе пришлось проделать длинный путь из Атланты, и я очень рад, что ты решил отпраздновать свой день рождения с нами! Если ты сейчас зайдешь вон в ту кондитерскую, то сможешь выбрать там себе подарок – пакетик “Мишки Гамми”. Просто скажи, что это я послал тебя к ним, и ты получишь свои сладости да еще с улыбкой впридачу!» Если теперь семья пойдет в кондитерскую, то кассир увидит на своем терминале предложение бесплатно выдать пакетик сладостей и быстро выполнит операцию. Такая персонализация совершенно изменит восприятие парка ребенком и его семьей.
В этом случае не требуется очень сложная аналитика. Тем не менее аналитический процесс должен определить, кто и какие предложения должен получить, а также гарантировать, что другие многочисленные персонажи в тот же день не сделают аналогичное предложение и что семья не попытается получить бесплатный пакетик еще раз. Обновление информации о гостях должно происходить очень быстро. Такая простая аналитика, опирающаяся на детализированные и быстро обновляемые данные, способна сильно повлиять на восприятие посетителей.
Создание прозрачности для потребителей
Теперь давайте рассмотрим пример того, как датчики могут напрямую обслуживать клиентов. Продукт, в котором образцовое обслуживание выведено на новый уровень благодаря использованию данных и аналитики, – это программа SenseAware («Сведущий разум») от компании FedEx{24}. SenseAware предлагается к продаже в виде оснащенного датчиками устройства, прикрепляемого к пересылаемой таре. Датчики отслеживают несколько параметров окружающей среды, их мы рассмотрим чуть ниже. С учетом его стоимости продукт нецелесообразно использовать при отправке документов и небольших посылок. Однако он настоятельно рекомендуется при отправке дорогостоящего или чувствительного к окружающим условиям груза.
Возьмем предметы искусства и коллекционирования или дорогостоящие скоропортящиеся товары. Один из главных рисков при их покупке связан с транспортировкой. Помещенный в тару и активированный девайс SenseAware в постоянном режиме отслеживает многочисленные важные показатели окружающей среды. Они включают в себя местонахождение посылки, температуру, влажность и даже уровень освещенности и барометрическое давление внутри упаковки. Например, изменение уровня освещенности указывает на то, что упаковка была вскрыта: как только упаковка открывается, в нее попадает поток света, который немедленно регистрируется световыми датчиками.
Все эти данные передаются в режиме реального времени в FedEx, так что клиент может в любой момент проконтролировать, что происходит с его посылкой. Текущий мониторинг недоступен только на борту самолета. В соответствии с правилами все собираемые за время полета данные кэшируются. По приземлении самолета кэшированные данные пакетом передаются в центральную систему, после чего устройство возобновляет передачу данных в текущем режиме. Клиенты могут проверить последние данные в любое время.
Такой сервис снабжает клиентов ценной информацией. Когда вам нужно переслать дорогостоящий или хрупкий груз, разве вы не хотели бы иметь возможность проконтролировать, что перевозчик транспортирует его при правильной температуре и аккуратно на протяжении всего пути? Перевозчик, который обеспечивает такого рода присмотр, будет иметь серьезное конкурентное преимущество перед теми, кто этого не делает.
Разумеется, продукт также полезен для самой FedEx, поскольку, если компанию обвинят в неправильной транспортировке и причинении ущерба, она может использовать данные SenseAware в качестве доказательства, чтобы защитить себя от обвинений. Например, данные могут показать, находился ли груз под контролем сотрудников FedEx в то время, когда температура и влажность поднялись до неприемлемого уровня. Применение SenseAware уместно не во всех случаях. Но, когда уместно, польза от него очень-очень большая. Пусть аналитика здесь элементарная, зато ценная.
Оптимизация обслуживания пассажиров
Операционная аналитика может повысить удовлетворенность клиентов при одновременном снижении операционных издержек. Замечательный пример тому – это перенаправление пассажиров при нарушениях расписания авиарейсов. В прошлом, когда задержавшийся рейс приземлялся в аэропорту, недовольные и раздраженные пассажиры, опоздавшие на пересадку, были вынуждены осаждать местных агентов авиакомпаний и обрывать их телефоны. Свободные места на альтернативных рейсах выделялись по принципу «первый пришел – первый обслужен». Кто первым добирался до агента, тот и получал место на ближайший рейс.
Сегодня процессы, используемые для разрешения таких ситуаций, стали гораздо более утонченными. Если авиакомпания понимает, что рейс будет задержан, она может определить, какие пассажиры столкнутся с проблемами. Например, если мой рейс задерживается на час и пункт прилета является конечной целью моего путешествия, никаких мер принимать не нужно. Точно так же не нужны никакие меры в том случае, если рейс задерживается на 30 минут, а до пересадки у пассажиров есть в запасе два часа. Авиакомпания может определить, кто нуждается в помощи и какие альтернативы доступны. Затем она может расставить приоритеты, распределив эти альтернативы среди пассажиров на основе стоимости билета, статуса постоянного клиента авиалинии, предыдущих нарушений расписания и ряда других факторов. Аналитика, стоящая за этими решениями, способна включать и такие сложные модели, которые прогнозируют вероятную реакцию конкретного пассажира в зависимости от степени нарушений.
Разумеется, полностью предотвратить негативную реакцию пассажиров невозможно, но можно свести ее к минимуму. Сегодня, если рейс прибывает с опозданием, пассажирам, как правило, не приходится стоять в очереди или звонить в офис авиакомпании. Они могут быстро выяснить информацию у агента на входе в аэровокзал или, проверив свое мобильное устройство, удостовериться, что о них позаботились и направили на другой рейс. Если пассажир предпочитает обратиться к агенту, процесс проходит гораздо быстрее и дружелюбнее, поскольку агент просто подтверждает факт изменений в маршруте пассажира и ему не нужно ничего придумывать. Агент также может предложить альтернативные варианты, если выбранный автоматически вариант не удовлетворяет пассажира.
Таким образом, у пассажиров значительно снижается уровень стресса, связанный с нарушением расписания (могу подтвердить это лично!), и они могут расслабиться и перекусить в ожидании нового рейса. В то же время этот процесс значительно снижает операционные издержки для самих авиакомпаний. Решения о перенаправлении принимаются быстро и автоматически, и не нужно привлекать квалифицированных сотрудников авиакомпаний для изменения маршрута. Кроме того, решения являются наиболее оптимальными, поскольку алгоритмы строго следуют руководящим указаниям. Наконец, сокращается количество взаимодействий сотрудников в личном общении и по телефону, что обеспечивает авиакомпаниям дополнительную экономию.
Автоматизированные операционно-аналитические процессы принятия решений о перенаправлении рейсов являются выигрышными как для пассажиров, так и для авиакомпаний. В этом случае аналитика носит более сложный характер, чем в предыдущих примерах. И закончим мы этот раздел примером использования очень сложной аналитики.
Усиление восприятия в онлайне
Есть ситуации, где в операционную аналитику уже повседневно включается высокий уровень сложности. Веб-персонализация – один из таких примеров. Раньше при посещении веб-сайта пользователи видели предложения или настройки, которые были определены задолго до их визита. Хотя сайт и мог адаптироваться под конкретного пользователя, это происходило не в режиме реального времени. Как правило, владелец сайта использовал аналитический процесс на основе пакетной обработки, подсказывавший системе определенные предложения и кастомизацию для каждого пользователя, когда он возвращается на сайт. Если же аналитика выполнялась накануне вечером, то информация о пользователе, которая стала известна по завершении аналитического процесса, никак не учитывалась. Стоит ли говорить о том, что текущие поисковые сеансы пользователей также не принимались во внимание при кастомизации веб-страниц.
Нужно начинать с простого
Большинство операционно-аналитических процессов начинается с довольно простой аналитики, которая служит фундаментом для надстройки. После того как простой процесс успешно внедрен и запущен в действие, аналитику можно постепенно усложнять.
Сейчас многие организации осуществляют веб-персонализацию на совершенно новом уровне, оптимизируя восприятие клиента в режиме реального времени на основе всех данных о нем, вплоть до последнего клика. Буквально любое действие клиента влияет на то, что он увидит в следующую секунду. Здесь применяется гораздо более сложная аналитика, чем во всех предыдущих примерах, приведенных в этом разделе. Современные подходы к веб-персонализации включают сложные алгоритмы оптимизации, опирающиеся на разнообразие статистических моделей и бизнес-правил.
Развитие до таких устойчивых решений нужно начать с простых способов персонализации, а затем утвердить операционные процессы, которые станут обслуживать адаптированный под пользователей контент. Только после того как основы займут свое место, можно будет изощряться. Вот и в этой главе готовьтесь увидеть, как многие приведенные здесь примеры со временем усложняются и усложняются.
Время существенно
Скорость, с которой должны осуществляться аналитические процессы, сжимается. Вот и операционная аналитика должна выполняться с молниеносной скоростью. В некоторых случаях речь идет о секундах и даже миллисекундах. Давайте рассмотрим два конкретных примера операционной аналитики в действии, когда скорость имеет первостепенное значение.
Аналитика обеспечит безопасность
Международная ассоциация воздушного транспорта (International Air Transport Association, IATA) считает, что в будущем за линиями тревожной сигнализации в аэропортах станет наблюдать крайне изощренная аналитика, работающая в режиме реального времени{25}. IATA предвидит создание в аэропортах туннелей безопасности длиной порядка 20 метров. Еще до прибытия каждого пассажира компьютер определит его профиль риска, после чего пассажир будет направлен в туннель с соответствующим уровнем проверки безопасности. Проходя по туннелю со своими вещами, как по обычному коридору, пассажиры будут подвергаться разнообразным тестам и сканированию. При этом им даже не придется замедляться при прохождении металлодетекторов, детекторов взрывчатых веществ и прочего. После выхода из туннеля пассажиры свободно продолжат свой путь дальше, если не сработает сигнал тревоги. Такое предвидение IATA является огромным шагом вперед по сравнению с современными методами, из-за которых пассажирам приходится останавливаться, ждать в длинных очередях, снимать предметы одежды и поворачиваться в сканерах под пристальными взглядами сотрудников службы безопасности.
Задумайтесь на мгновение о том, что потребуется, чтобы сделать предвидение IATA реальностью. Предложенный протокол безопасности всецело основан на данных и аналитике. Всего за десяток секунд, пока пассажир идет по туннелю, потребуется выявить любого рода риск и отреагировать на него. За это время сканеры и сенсоры внутри туннеля должны собрать данные о наличии взрывчатых веществ, запрещенных к провозу жидкостей или животных, оружия или предметов, которые могут быть использованы как оружие, и т. д. После сбора данных они в подавляющем большинстве должны быть автоматически проанализированы для определения наличия или отсутствия угрозы. Если угроза обнаружена, у сотрудников службы безопасности будет 20–30 секунд на то, чтобы перехватить подозрительного пассажира, прежде чем он уйдет.
Операционная аналитика будет решать жизненно важные вопросы
Аналитика уже поддерживает многие решения в сфере безопасности. В перспективе важно будет не «кто», а «что» сканирует и досматривает людей. Большинство сканеров безопасности станет действовать автоматически на основе данных и аналитики.
Весь сбор и анализ данных должен осуществляться в режиме реального времени, а операционно-аналитические процессы – за несколько секунд проанализировать данные и принять жизненно важные решения. Аналитика будет не только очень сложной, но и должна быть в высшей степени точной. Если система пропустит хотя бы одну бомбу или один пистолет, последствия окажутся тяжелыми. Известно, что сегодня сотрудники службы безопасности иногда пропускают оружие из-за усталости или отсутствия концентрации. Автоматизированные же алгоритмы смогут работать непрерывно без снижения точности. Если предвидение IATA осуществится, нам добавится безопасности и мы получим более простые и быстрые процедуры ее проверки. Это операционная аналитика в ее лучшем виде.
Сто миллионов долларов за миллисекунду
Недавно я прочитал очень интересную книгу Кристофера Стейнера «Автоматизируй это: Как алгоритмы будут управлять нашим миром» (Automate This: How Algorithms Came to Rule Our World){26}. В ней рассматривается эволюция компьютеризированной торговли на фондовом рынке. Если вы не в курсе, сейчас компьютеры используют сложные аналитические алгоритмы, которые за миллисекунды принимают решения о покупке или продаже ценных бумаг. Затем они в мгновение ока напрямую размещают ордера на продажу/покупку бумаг. Как правило, цель – поймать крайне малую разницу в ценах и тут же закрыть сделку. Повторите такие действия миллионы раз в день и прилично заработаете, даже если отдельная сделка принесет гроши. Автоматическая торговля ценными бумагами при помощи аналитики с интервалами в миллисекунду – еще один наглядный пример операционной аналитики в действии.
Если еще несколько лет назад автоматизированный трейдинг был в общем-то новинкой, то сегодня на него приходится значительно больше половины всего объема торгов на ведущих биржах{27}. Такой вид операционной аналитики сопряжен как с большой ответственностью, так и с большими рисками. Ведь компьютеры самостоятельно анализируют последние данные и немедленно ставят на кон реальные деньги. Требуется принять на себя серьезную ответственность за то, чтобы гарантировать, что торговые алгоритмы полностью протестированы и отслеживаются на случай, если возникнет непредвиденное отклонение. Риски возникают тогда, когда непредвиденное все-таки происходит, но вовремя не выявляется.
В 2010 г., казалось бы, ни с того ни с сего и без видимых причин произошел так называемый мгновенный обвал американского фондового рынка. Оказалось, что толчок к обвалу дал сбой в автоматической торговой программе{28}. Но к тому моменту, когда источник проблемы установили и приняли меры для ее смягчения, уже был причинен огромный реальный ущерб. Очевидно, что из-за осложнений, возникших в аналитических процессах, которые использовались для сомнительных торговых программ.
Иногда важны даже миллисекунды
Кажется безумием инвестировать сотни миллионов долларов в сокращение на несколько миллисекунд процесса передачи данных. Но с учетом того, на какой скорости работают компьютеризированные торговые программы, эти инвестиции себя окупают. На автоматические алгоритмы, представляющие собой операционную аналитику в ее наивысшем проявлении, сейчас приходится более половины объема торгов на фондовых биржах.
Таким образом, в число проблем, с которыми сталкивается операционная аналитика, входят прием непредвиденных вопросов и работа с ними. Когда организация позволяет алгоритмам с упреждением и автоматически принимать решения, система может разладиться (и разлаживается!). Однако важно помнить, что система может разладиться (и разлаживается!) при любом способе принятия решений. Например, когда люди водят машину, они понимают, что время от времени будут совершать ошибки. ДТП являются неотъемлемым риском вождения. Однако люди не перестают водить машины, поскольку в долгосрочной перспективе выгоды от вождения намного перевешивают риски и издержки периодически случающихся ДТП.
Аналогичным образом будут происходить негативные инциденты с операционной аналитикой. Каждая организация, применяющая операционную аналитику, время от времени будет сталкиваться с глюками и ошибками. Тем не менее в долгосрочной перспективе, если организация правильно осуществляет свои процессы, выгоды намного перевесят любые издержки, которые неизбежны при ведении бизнеса. Несколько отдельных инцидентов не должны стать поводом для отказа от всего подхода.
Что же касается скорости аналитики, интересно посмотреть, каких пределов она может достичь. В книге Стейнера рассказывается о том, как инвесторы вложили сотни миллионов долларов в строительство спрямленной линии связи для передачи данных из Нью-Йорка в Чикаго. Вместо того чтобы прокладывать ее по традиционным полосам отвода вдоль автомобильных и железных дорог, инвесторы приобретали частные участки, лишь бы спрямить маршрут. Сокращение его протяженности на несколько миль, по сравнению с существующей линией, сокращало время передачи данных на несколько миллисекунд. С учетом скорости работы торговых алгоритмов эти сэкономленные миллисекунды со временем вполне могут вылиться в многомиллиардные прибыли. Ведь алгоритмы, использующие более быструю подпитку данными, способны получать, анализировать и применять информацию прежде, чем конкуренты, использующие традиционные линии связи, даже ее получат. Поэтому инвесторы были уверены в том, что их вложение средств с лихвой себя оправдает.
Аналитика делает мир безопаснее
Широкое разнообразие методов операционной аналитики направлено на обеспечение безопасности людей, имущества и продуктов питания. Применяя новые источники данных для создания новых аналитических процессов, можно сделать наш мир безопаснее. В следующем разделе мы рассмотрим несколько таких примеров, в том числе один из государственного сектора. Ведь коммерческие организации не единственные, кто может выиграть от внедрения операционной аналитики. Государственным структурам это тоже по силам.
Предотвращение неблагоприятных событий
Сегодня автомобили становятся все более и более сложными. Современные автомеханики при обслуживании автомобиля должны разбираться не только в его механических, но и в компьютерных системах. Несколько последних инноваций направлены на повышение безопасности вождения за счет предотвращения неблагоприятных событий.
Системы круиз-контроля могут вскоре усовершенствоваться благодаря аналитике, автоматически предупреждающей столкновения. Если, исходя из разницы в скорости между своим и впереди идущим автомобилем, компьютер определяет, что столкновение неизбежно, он автоматически активирует тормоза, опережая водителя. В беспилотных автомобилях (о них мы поговорим чуть дальше) водителям вообще не нужно нажимать на тормоза. Также очень простая аналитика помогает обнаружить людей и объекты при движении задним ходом. Многие автомобили сейчас уведомляют водителей звуковым сигналом о наличии препятствия и информируют о расстоянии до него. Невероятно простая в этом случае аналитика, однако, позволяет спасти жизни, особенно маленьких детей, которые часто остаются незамеченными для водителей при движении вспять.
Вспомните пример из второй главы о датчиках, устанавливаемых рядом с железнодорожным полотном, чтобы в режиме реального времени они отслеживали температуру колес у проходящих составов. Если система обнаруживает перегрев колес, состав получает приказ остановиться. К нему направляется бригада рабочих, чтобы проверить состояние вагона и правильно разместить груз. Для железнодорожной компании гораздо дешевле остановить состав и устранить проблему до схода его с рельсов, чем потом устранять последствия катастрофы. Ведь сход с рельсов не только приведет к серьезной задержке движения, но и может причинить значительный материальный ущерб и даже привести к человеческим жертвам. Использование же сенсорных данных не только делает железные дороги более безопасными, но и бережет средства. Хотя в этом случае используются довольно простые алгоритмы, их роль весьма значительна.
Обеспечение свежести продуктов
Теперь давайте перейдем к производителям свежей продукции. Они обычно хранят ее на поддонах на складе, а затем транспортируют в магазины. В течение всего времени хранения температура продуктов должна оставаться в пределах заданного диапазона наряду с заданным диапазоном влажности. Но что если на одном из участков склада выйдут из строя кондиционеры или обогреватели? Заведующий складом может быстро узнать об этом, поскольку датчики начнут подавать сигналы тревоги, и поручить сотрудникам переместить поддоны с продукцией в другое место. Но производителю также важно знать и то, какие поддоны со свежей продукцией могли пострадать, чтобы проверить их состояние.
В прошлом могло пройти много часов, прежде чем кто-то замечал, что на одном конце склада стало немного теплее, чем должно быть. К этому моменту поврежденная продукция уже могла быть отправлена в магазины. И производителю приходилось уведомлять все магазины, получившие продукцию со склада в тот день, о необходимости перепроверить ее качество.
Сегодня поддоны с испортившейся продукцией могут выявляться до того, как они покинут склад. Бóльшую часть времени аналитика используется в основных приборах оповещения, которые сравнивают текущие показания датчиков с заданными пороговыми значениями. Со временем алгоритмы будут развиты до такой степени, что станут учитывать колебания температуры и влажности у каждого поддона и прогнозировать риск порчи продуктов. Нагревание на несколько градусов в течение нескольких минут обычно не вызывает проблем, однако серия небольших отклонений в течение нескольких дней значительно увеличивает этот риск. Для поиска подобных аномалий, несомненно, будут разработаны более продвинутые аналитические процессы.
Правительство тоже может стать операционным
Операционная аналитика предназначается не только для частных компаний. Правительства и некоммерческие организации также могут извлечь из нее пользу. Давайте посмотрим на так называемый предсказывающий контроль, один из наиболее интересных примеров применения аналитики для осуществления государственной функции. Причем предсказывающий контроль сочетает операционное применение традиционной и операционной аналитики.
Давайте начнем с объяснения того, что представляет собой предсказывающий контроль{29}. В течение уже нескольких лет полицейские департаменты и правоохранительные органы всех видов используют аналитику для повышения эффективности своей деятельности. Например, они пытаются выявлять различные закономерности в совершении преступлений, связанные с такими факторами, как неблагоприятные погодные условия, температура воздуха, праздники, особые мероприятия и т. д. В определенное время с учетом прогнозируемого уровня преступности городской департамент полиции может увеличивать или уменьшать количество полицейских в конкретном районе{30}. Это операционное применение традиционной аналитики, поскольку аналитика основана на пакетной обработке данных и используется для составления прогнозов на ближайшую патрульную смену или на несколько дней.
Однако сегодня правоохранительные органы начинают использовать более актуальную информацию, чтобы корректировать прогнозы ближе к режиму реального времени. Другими словами, аналитика становится операционной. Например, на основе прежних закономерностей местный полицейский участок прогнозирует шаблоны преступлений на этот вечер и соответственно распределяет свои силы. Но в результате изменения погодных условий или обнаружения нескольких вечеринок, проводящихся вблизи друг от друга, прогноз может быть пересмотрен, а силы полиции, если потребуется, перегруппированы. Корректировка планов на основе новейшей информации делает аналитику операционной.
Там, где есть неэффективность, есть и потенциал эффективности
Посмотрим правде в глаза. Государственные структуры не отличаются высокой эффективностью и рациональностью. Но именно ввиду масштабности многих действий государства и их печально известной неэффективности государственные органы могут значительно улучшить свою деятельность благодаря эффективному использованию операционной аналитики.
Недавно полиция начала использовать еще одну важную операционную тактику – мониторинг каналов социальных медиа. Оказывается, многие члены преступных группировок, как и все мы, очень активны в социальных сетях. А правоохранительные органы способны определить, когда известные им гангстеры затевают ссору онлайн. Следя за перебранкой, возможно определить, когда ее градус начнет повышаться. Ссоры и насмешки в социальных сетях часто становятся поводом для физических столкновений между бандами. Полиция способна установить, кто нагнетает страсти, выйти на зачинщиков и разрядить ситуацию, прежде чем она перерастет в разборки. При этом одно сообщество ведет себя в сетях бурно, а другое непривычно спокойно. В результате полицейских можно направить туда, где они особенно нужны.
Повышение операционной эффективности
Одна из областей применения операционной аналитики, где она способна оказать наибольшее воздействие, – это повышение эффективности деловых операций, что особенно верно для тех бизнес-процессов, в которых аналитика традиционно не использовалась вообще или же использовалась очень ограниченно. Для крупных организаций повышение эффективности даже на 1–2 % может вылиться в миллионы долларов дополнительной прибыли. Давайте рассмотрим несколько очень интересных примеров, в том числе относящихся к области эффективного производства и использования энергии.
Максимизация отбора энергии
Ветряные мельницы существуют уже много веков. Сегодня они стали гораздо более эффективными, чем в прошлом, и в них используются поистине удивительные технологии. В конце 2013 г. мне довелось выступать вместе с Биллом Рухом из General Electric (GE) на конференции «Рок-звезды в области больших данных» в Сан-Хосе. Билл рассказал, что сейчас GE оснащает производимые ею ветряные турбины целым набором датчиков, предназначенных отслеживать и оценивать все виды информации о работе и производительности турбин. Сенсорные данные анализируются, и в работу турбин почти в режиме реального времени беспрерывно вносятся необходимые корректировки, чтобы оптимизировать их производительность.
Я был поражен, узнав, что современные ветряные турбины способны реагировать на изменение направления и силы ветра, корректируя положение и угол наклона лопастей таким образом, чтобы обеспечить равномерную предсказуемую выработку электроэнергии. Изменение угла наклона лопастей позволяет повысить отбор энергии ветра на 1–2 %. Хотя это может показаться совсем небольшим выигрышем, но со временем он выльется в огромную дополнительную прибыль, учитывая масштабы ветровых электростанций. По словам Билла, новые технологии позволили GE закрепить за собой лидирующее положение в отрасли. При этом он приписывает подобный успех как техническим инновациям, так и в равной степени софтверному видоизменению, обеспечившему внедрение операционной аналитики в машины.
Оптимизация производства электроэнергии
Большие газовые турбины и генераторы также становятся все более изощренными в использовании операционной аналитики для максимального повышения производства и эффективности. На том же мероприятии Билл Рух рассказал, как в его компании аналитика применяется в производстве электроэнергии газовыми турбинами. Исследования показали, что при определенных рабочих условиях нагревание топлива перед подачей в турбину увеличивает выходную мощность, тогда как при других условиях нагревание топлива снижает ее. GE встраивает в свои турбины датчики, чтобы отслеживать текущие рабочие условия с высоким уровнем точности. Операционно-аналитические процессы мониторят работу турбин и с упреждением нагревают (или нет) топливо перед подачей в турбину, чтобы обеспечить ее максимальную производительность в конкретных условиях. И хотя выигрыш в производительности опять-таки кажется довольно скромным, со временем он принесет весомую финансовую отдачу. Например, увеличение эффективности работы турбины всего на 1 % в течение всего срока эксплуатации электростанции может вылиться в $750 млн дополнительной прибыли.
Небольшие усовершенствования суммируются
Зачастую эффективность любого отдельно взятого процесса повышается при помощи операционной аналитики ненамного – в пределах 1–2 %. Однако в больших масштабах и особенно при ограниченной рентабельности такой выигрыш может иметь серьезное значение. Сочетание нескольких процессов с малым воздействием способно привести к сильному воздействию, которое обеспечит организации весомое конкурентное преимущество.
Повышение топливной эффективности
Выше мы уже рассмотрели несколько способов использования аналитики железнодорожными компаниями. Теперь давайте рассмотрим еще один. Машинисты поездов традиционно стремятся как можно быстрее доставить свои грузовые составы в пункт назначения. В результате они, соблюдая осторожность, все же стараются развивать максимально возможную скорость, пока не достигнут остановки в пути следования. В некотором отношении это похоже на вождение автомобиля. Большинство из нас предпочитают быстро ускоряться и ехать на близкой к разрешенной скорости или даже превышая ее – до следующего красного сигнала светофора, знака «Стоп» или пробки. Однако такой метод езды не является оптимальным с точки зрения эффективности расхода топлива ни для автомобилей, ни для поездов.
Ускорение после остановки требует гораздо больше топлива, чем просто для движения. Кинетическая энергия – мощная сила! Однако, интегрируя GPS-технологии на грузовых составах с уточненной информацией о текущем графике движения поездов по всей сети железных дорог, железнодорожные компании получили возможность экономить больше топлива. Алгоритмы непрерывно просчитывают, с какой скоростью поезд должен ехать, чтобы ему не пришлось задерживаться на следующей остановке в пути следования. Это означает, что на некоторых участках он может двигаться гораздо медленнее, чем возможно, что на первый взгляд может показаться странным. Однако топливо, сэкономленное за счет устранения торможения и последующего возобновлении движения с потерей движущей силы, оправдывает изменения. Кроме того, в конечном итоге поезд прибывает в пункт назначения вовремя, поскольку он двигался медленнее только тогда, когда все равно бы простаивал на остановках.
Когда алгоритмы диктуют выбор скорости, чтобы оптимизировать эффективное расходование топлива, выигрыш опять же получается небольшим. Тем не менее с учетом масштабов железнодорожных перевозок и объемов потребляемого топлива экономия может быть весьма существенной. Также важно отметить, что повышение топливной эффективности при помощи аналитики положительно отражается не только на прибылях компаний. Аналитика служит всем нам, поскольку чем меньше сжигается топлива, тем лучше для окружающей среды.
Повышение эффективности колл-центров
Наконец, последний пример, иллюстрирующий повышение операционной эффективности, принадлежит совершенно к другой области. До того, как мне об этом рассказали, я и понятия не имел, что подобное происходит сегодня. Большинство людей знают, что сейчас колл-центры в обычном порядке записывают все разговоры с клиентами. Как правило, звонящих предупреждают: «Ваш разговор с сотрудником может быть записан для улучшения качества обслуживания или для использования в целях обучения». Другими словами, вам сообщают, что разговор не будет конфиденциальным.
Однако организации вышли за рамки простой записи разговоров с клиентами и перешли к их анализу. Теперь алгоритмы могут сообщить многое о позвонившем клиенте и его настроении, исходя из манеры его речи. Они даже способны определить акцент клиента, и колл-центр переключит его на сотрудника, разговаривающего с похожим акцентом. Но зачем это нужно?
Оказывается, исследования показали, что люди больше доверяют незнакомым людям с похожим, чем с непохожим акцентом{31}. Следовательно, соединение клиентов с сотрудниками, имеющими похожий акцент, увеличивает шансы на успешное разрешение проблемы. Если вы на минуту задумаетесь, то поймете, что в этой идее есть смысл. Только представьте себе, как легко может возникнуть недопонимание в разговоре между жителем города Мобил в штате Алабама и обитателем острова Лонг-Айленд в штате Нью-Йорк, учитывая, как сильно отличается их речь по скорости и манере говорить. Интуиция подсказывает, что менее рискованно будет соединить клиента из Алабамы с сотрудниками из южных штатов, то же касается и ньюйоркцев. Сходный акцент поспособствует установлению доверительных отношений – и для этого надо востребовать операционную аналитику.
Улучшение качества нашей жизни в будущем
Многие примеры, рассмотренные в этой главе, не имеют прямого отношения к нашей частной жизни. Улучшение обслуживания клиентов или восприятия в онлайне, безусловно, приятно, но не добавляет благополучия нашему повседневному бытию. К счастью, в некоторых случаях операционная аналитика будет оказывать на него заметное воздействие. И в этом разделе мы рассмотрим два таких примера, когда операционная аналитика, хотя она еще и находится в периоде становления, уже готова влиять на вашу жизнь и жизнь ваших близких.
Больше свободного времени
Беспилотные автомобили уже стали реальностью{32}. Хотя у вас такой машины еще нет и пройдет несколько лет, прежде чем она у вас появится, но уже существуют технология и аналитика, поддерживающие беспилотные автомобили. Вас удивляет, почему я связал аналитику с беспилотными автомобилями? Здесь нет ничего удивительного. Объем и разнообразие аналитики, призванной помочь автомобилю самостоятельно и безопасно передвигаться по улицам города без участия человека, поражают воображение.
Как беспилотный автомобиль сможет определить, что разметка на дороге разграничивает полосы движения, а не является маркировкой, оставшейся после строительных работ, или же пролитой краской либо грязью? Все сводится к аналитике. Автомобиль сканирует дорогу впереди себя, анализирует изображения в режиме реального времени и решает куда направиться, определив компоненты изображения в качестве разметки полос.
Автомобиль также должен постоянно определять, не нужно ли ему ускориться, притормозить или остановиться. Чтобы остановиться, ему нужно рассчитать, с какой силой жать на тормоза в зависимости от расстояния до объекта, к которому он приближается, и скорости этого объекта. Расчеты должны постоянно обновляться, чтобы учесть любые изменения, например если резко затормозит едущий впереди автомобиль или внезапно выскочит на дорогу олень. Таким образом, беспилотные автомобили требуют многочисленных и зачастую очень сложных аналитических процессов, которые при этом должны быть очень надежными, стабильными и точными, поскольку от них зависит жизнь людей.
Многие пассажиры беспилотных автомобилей не будут знать о том, какую сложную работу выполняют данные и аналитика. Но в этом-то и суть. Хорошо выполненная операционная аналитика способна настолько управлять процессами и восприятием, что людям не надо будет знать о том, какая работа происходит под капотом.
Аналитике не нужно быть заметной, чтобы оказывать воздействие
Одни из самых сильных впечатлений, которые будет производить на нас аналитика, возникнут в тех ситуациях, когда мы даже не осознáем ее присутствия. Когда операционная аналитика будет выполнена на должном уровне, как, например, в беспилотных автомобилях, пользователям и не нужно будет знать, что происходит у них под капотом. Они могут просто наслаждаться поездкой.
С заботой о нашем здоровье
Как вы помните, в первой главе мы говорили о растущей популярности фитнес-браслетов. Сфера здравоохранения начинает предлагать широкий спектр возможностей для изменения наших взглядов на здоровье и предоставление медицинской помощи. На стыке медицины, Интернета вещей и операционной аналитики создается огромный потенциал. Через несколько лет мы совсем по-иному будем прибегать к медицинской помощи и пользоваться ею. Давайте рассмотрим сценарий, который будет реализован в ближайшее время. Причем отдельные части этого сценария уже сегодня начинают претворяться в реальность, пусть и в небольших масштабах.
Хронические заболевания, такие как сахарный диабет, не только ведут к серьезным проблемам со здоровьем и ухудшению качества жизни у страдающих ими людей, но и влекут за собой значительные расходы на лечение. Современные глюкометры позволяют легко контролировать уровень сахара в крови. Кроме того, сегодня появились носимые устройства, которые ведут постоянный мониторинг уровня глюкозы, анализируют данные и подают предупредительный сигнал, если требуется вмешательство{33}. Это не только повышает безопасность для пациентов, но и позволяет избежать дорого обходящихся медицинских проблем.
Также пациенты получают возможность проходить реабилитацию после серьезных травм или болезней дома, а не в медицинском учреждении. Многочисленные датчики могут контролировать показатели жизнедеятельности, назначать лекарства и т. д. Состояние пациентов отслеживается автоматически, без постоянного присутствия врачей и медсестер, от которых в реабилитационный период часто требуется только прописывать таблетки или делать уколы. Лекарства могут назначаться автоматически, на основе анализа текущей информации о состоянии здоровья.
Если показатели жизнедеятельности или результаты анализа крови вызывают тревогу, пациенту звонит врач или медсестра, чтобы узнать, в чем дело. Если необходимо, они могут посетить пациента лично. Гораздо дешевле нанять дополнительный штат медсестер и врачей, чем возводить пристройки для размещения дополнительных больничных коек. Больницы могут расширить охват своей деятельности без увеличения физических мощностей. Идея вернуть домашние визиты медицинских специалистов кажется дорогостоящей. Но когда пациенты находятся в стабильном состоянии, необходимость в их посещении возникает редко, и это может стоить намного дешевле, чем длительное пребывание в больнице. К тому же в домашних условиях пациенты чувствуют себя более комфортно и восстанавливаются гораздо быстрее, чем в больнице{34}.
Чтобы предоставить пациентам возможность домашней реабилитации, требуется как очень простая аналитика – например, сравнение показателей жизнедеятельности с пороговыми значениями, так и более сложная – например, расшифровка электрокардиограмм или электроэнцефалограмм. В течение следующих нескольких лет операционная аналитика может открыть новую эру в сфере здравоохранения.
Обнаружение в данных неожиданных сведений
Необходимые для осуществления операционной аналитики данные можно использовать повторно при изобретательном к ним подходе. Это позволит создавать новые источники дохода, которые компенсируют затраты на сбор и анализ данных. Концепция повторного использования особенно пригодна для данных, которые применяются во многих операционно-аналитических процессах. Причем некоторые дополнительные способы использования данных не имеют никакого отношения к операционной аналитике. Однако ценность операционной аналитики состоит в том, что именно она способствовала сбору этих данных.
В каждом из трех случаев, описанных в этом разделе, огромное количество данных изначально собирается для целей операционной аналитики, после чего становится активом, способным создавать доход или сокращать расходы. Поиск творческих способов повторного использования данных и компенсации затрат на их сбор для операционной аналитики позволяет оправдать требуемые инвестиции. Убедитесь, что ваша организация ищет новые способы монетизации собираемых ею данных за рамками их первоначальной операционной области применения. Эта стратегия связана с концепцией превращения аналитики в продукт, которую мы обсуждали в первой главе.
Использование данных о местонахождении для обновления информации о трафике
И сотовые операторы, и провайдеры GPS должны собирать данные о местонахождении каждого абонента в любой момент времени, чтобы предоставлять свои основные услуги. Сотовый оператор знает о местонахождении своих абонентов благодаря тому, что их телефоны подключаются к вышкам сотовой связи. И очевидно, что GPS-навигатор не сможет сообщить пользователям, как им «отсюда» добраться «туда», если не знает, где находится «здесь». Однако те же данные, которые требуются этим организациям для предоставления своих основных услуг, обладают огромной ценностью и для использования в других целях.
Когда вы проверяете информацию о трафике на своем мобильном устройстве, очень часто она извлекается из тех же данных о местоположении абонентов, которые собираются для оказания основных услуг. Когда абонент едет по автомагистрали между штатами, оператор знает, с какой скоростью тот движется. Причем в любой момент времени оператор обладает такой информацией о большом количестве своих абонентов. Сведения о их местоположении обладают и дополнительной ценностью.
Поставщики услуг, собирая данные о местонахождении и скорости передвижения своих абонентов, повторно используют их на агрегированном уровне для поддержки систем слежения за дорожной обстановкой. И абоненты в часы пик могут получить новейшую информацию о трафике благодаря входным данным от тысяч таких же абонентов, которые движутся по тому же маршруту. Причем единственное, что нужно абонентам, так это пользоваться своими мобильными телефонами или GPS-навигаторами.
Использование сенсорных данных для повышения урожайности
Мы уже говорили о том, что детализированные сенсорные данные собираются с автомобилей, самолетов и другой техники. Теперь обратимся к данным, собираемым современными тракторами. Когда фермеры выводят трактор на поле, датчики собирают информацию о его работе. С какой скоростью трактор передвигается по полю? На какую глубину обработки установлен его культиватор? Какова температура почвы и воздуха? И многое другое. Изначально эти данные предназначены для использования в операционных целях, скажем, в виде аналитики для профилактического техобслуживания или контроля за соблюдением условий гарантии. Однако существуют и другие интересные способы применения этой информации.
Ценность данных может быть скрыта на самом виду
На первый взгляд, данные, собираемые для операционной аналитики, по большей части кажутся скучными и временными. Тем не менее зачастую этим данным можно найти творческое и неожиданное применение, которое не будет ни скучным, ни временным.
Постепенно углубляя свое понимание того, как фермеры в разных точках земного шара используют их оборудование, производители тракторов могут определить, какие методы земледелия позволяют получить максимальную урожайность. Они соотносят данные об урожайности, сообщаемые фермерами, с особенностями применяемых ими сельскохозяйственных технологий. Что если путем внесения небольших изменений можно урожайность повысить? Такие знания окажутся очень ценными для фермеров. Например, представьте, насколько полезно фермерам будет узнать о том, что увеличение глубины обработки культиватором всего на 0,3 миллиметра позволяет повысить урожайность. Однако такие знания могут быть получены только благодаря объединению операционных данных о применении оборудования большим количеством фермеров и использованию этих данных новыми способами.
Использование данных о соответствии условиям для увеличения продаж
Производители фасованных потребительских товаров ежегодно тратят огромные суммы денег на рекламу, промоакции и специальные выкладки товаров в магазине. Производители, с учетом высокой стоимости таких выкладок, хотят убедиться в том, что они размещаются в обговоренном месте и на протяжении обговоренного срока. Установка датчиков позволяет производителям контролировать местоположение выкладок без необходимости направлять в магазины своих сотрудников для визуальной проверки. Это дает возможность экономить много денег, а производители будут точно определять, когда была сделана выкладка их товара и как долго она находилась в этом месте.
Сопоставляя данные о местоположении с данными о продажах можно составить более ясное представление об эффективности промоакции. Например, некое место в торговом зале может казаться отличным для привлечения покупателей, а выяснится, что на самом деле это не так. Или же окажется, что выкладка была размещена в непривлекательном месте либо ее убрали на день раньше срока. Аналитика, оценивающая эффективность промоакции, способна принять вышеназванные обстоятельства во внимание. Соответственно при планировании следующих промоакций производитель будет договариваться о выделении лучшего места для выкладки и об оплате с учетом уточненных показателей продаж, привязанных ко времени и месту. Несмотря на то что изначально эти данные собираются с целью контроля за соблюдением условий, они могут использоваться для того, чтобы внести поправки в стратегии продвижения товара.
Создавайте и стратегическую аналитику
Итак, мы обсудили широкий спектр примеров тактического применения операционной аналитики. Однако собранные данные могут быть разнообразно использованы и в стратегической долгосрочной аналитике. Например, многие организации сегодня используют сенсорные данные и аналитику для того, чтобы выявлять возникающие со временем закономерности отказов оборудования. Это особенно характерно для производителей автомобилей, авиационных двигателей и тяжелой техники, такой как тракторы и самосвалы.
Собираемые данные используются для предупредительного техобслуживания – практического применения аналитики с целью опережающего выявления и устранения проблем, прежде чем те приведут к серьезным неполадкам. Мы уже вкратце касались этой темы в первой и второй главах, а теперь давайте рассмотрим ее подробнее, чтобы понять, как одни и те же данные можно использовать и в операционных, и в стратегических целях.
Чтобы проиллюстрировать потенциал подобного подхода, обратимся к такой дорогостоящей технике, как самолет. Сотрудник одной авиакомпании как-то по секрету сообщил мне, что снять крупный коммерческий самолет с рейсов и демонтировать с него двигатель для ремонта обойдется владельцам, по скромным оценкам, в сумму порядка $1 млн. Эта сумма складывается из потерянных доходов за время простоя самолета и стоимости рабочего времени, необходимого для демонтажа и повторного монтажа двигателя. Понятно, что авиакомпании (или военно-воздушные силы) прибегают к такому дорогостоящему ремонту только при крайней необходимости. К счастью, аналитика и данные позволяют радикально изменить подходы к техобслуживанию как на краткосрочном операционном, так и на долгосрочном стратегическом уровне.
Традиционно в случае отказа двигателя механики его осматривали, выясняли, какие симптомы наблюдались непосредственно перед поломкой, и пытались установить, что именно требует ремонта.
Сегодня же производители могут использовать датчики, которые в мельчайших подробностях отслеживают, как двигатель работает по прошествии времени. А когда возникают проблемы, данные анализируются с целью выявить ранние предупреждающие индикаторы. Например, может быть установлено, что поломке конкретного узла двигателя предшествовало усиление трения определенного компонента вместе с небольшим повышением температуры в течение нескольких дней или недель. После чего аналитика будет искать похожую комбинацию в других двигателях и, если обнаружит, подаст предупреждающий сигнал о необходимости проведения профилактического ремонта. Такова суть предупредительного техобслуживания.
Тем самым обеспечиваются два важных стратегических преимущества. Это позволяет производителям, во-первых, лучше понять динамику работы оборудования в реальных условиях и внести необходимые технические изменения, чтобы усовершенствовать оборудование в будущем. Во-вторых, заранее предупреждать серьезные поломки. В идеале такие процессы должны происходить в рамках планового техобслуживания, чтобы свести к минимуму издержки. Техобслуживание к тому же дешевле ремонта.
Обратите внимание, что здесь, помимо операционной аналитики, возникают возможности и для операционного применения традиционной аналитики. Операционная аналитика следит за работой двигателя в режиме реального времени и носит тактический характер. Стратегический компонент вступает в действие при корректировке долгосрочных планов техобслуживания на основе анализа сенсорных данных. Аналитика может быть применена для уточнения рекомендуемых графиков проведения техобслуживания с учетом работы двигателей в прошлом – таково стратегическое операционное применение традиционной аналитики. Данные об истории эксплуатации большого количества двигателей анализируются в пакетном режиме с целью выработать обновленные правила техобслуживания.
Предупредительное техобслуживание на основе аналитики снижает затраты производителей. Также аналитика способствует повышению безопасности для потребителей и уровня обслуживания со стороны производителей. Это еще один пример ситуации, когда в выигрыше остаются все. Организации, которые лучше других преуспеют в определении способов предупредительного техобслуживания и мониторинга работы своих продуктов, выделятся из толпы конкурентов.
Подведем итоги
Наиболее важные положения этой главы:
• Сегодня многие примеры операционной аналитики в действии включают довольно простую аналитику. Со временем уровень сложности будет возрастать.
• Операционная аналитика может обеспечить клиентам совершенно новый уровень сервиса и кастомизации. Преуспела в этом компания Walt Disney.
• Когда нарушается расписание авиарейсов, операционная аналитика позволяет смягчить последствия для пассажиров, а также сэкономить время и деньги для авиакомпаний.
• В некоторых процессах все могут определить миллисекунды. Компьютеризированные трейдеры фондового рынка вкладывают огромные суммы денег в то, чтобы выиграть всего несколько миллисекунд себе для анализа.
• Обеспечивая прозрачность, операционная аналитика может защитить как организации, так и их клиентов. Примером тому – продукт SenseAware компании FedEx.
• Операционная аналитика может сделать более безопасными места, которые мы посещаем и где живем, благодаря предсказывающему контролю и гарантировать качество продуктов питания благодаря использованию датчиков для контроля за состоянием окружающей среды.
• Государственные органы могут значительно повысить свою эффективность за счет внедрения операционной аналитики, учитывая масштабы и пресловутую неэффективность многих их действий.
• Повышение эффективности операций даже на малую долю может принести весомую финансовую отдачу. Это особенно справедливо для таких областей, как энергетика, где GE проделала много соответствующей работы.
• Когда операционная аналитика выполняется хорошо, например как в беспилотных автомобилях или мониторинге состояния здоровья, пользователи даже не замечают ее присутствия. Им просто остается наслаждаться улучшенным качеством жизни.
• Данные и аналитика уже активно преобразуют сферу здравоохранения. Операционная аналитика позволит внедрить новые, более эффективные и дружественные к пациентам процедуры.
• Всегда ищите новые способы использования данных, специально собираемых в операционных целях. Подобно тому, как определение местонахождения при помощи GPS может повлечь за собой улучшение трафика, так и многим другим данным можно найти разнообразное применение.
• В добавление к использованию источника данных в тактической операционной аналитике попробуйте найти способы использовать его и в стратегических целях.
Часть II Закладываем основу
Глава 4 Хотите бюджет? Разработайте бизнес-кейс!
Внедрение операционной аналитики требует инвестиций – в людей, инструменты и технологии, которые необходимы для успешной реализации операционно-аналитических процессов. Процесс преобразования аналитики в операционную не будет ни дешевым, ни легким, но при соблюдении правил может с лихвой окупиться. Разумеется, добиться выделения инвестиций сегодня ничуть не легче, чем когда-либо в прошлом. Следовательно, разработка бизнес-кейса для операционной аналитики становится важнейшим шагом.
В этой главе мы рассмотрим основные принципы и концепции, которые помогут вам разработать бизнес-кейс для операционной аналитики в вашей организации. Многие из них могут быть применены в более широком плане для обоснования инвестиций в аналитику вообще. Хорошая новость состоит в том, что вы и ваша организация можете преуспеть в своем деле, если уделите время и силы разработке бизнес-кейса с учетом некоторых уникальных аспектов аналитики.
Определение приоритетов
Прежде чем приступать к составлению бизнес-кейса для операционной аналитики, необходимо определить, какие инвестиции он будет предполагать и как будет их распределять. Четкая направленность и форма изложения так же важны для бизнес-кейса, как и факты и цифры для его обоснования. В этом разделе мы обсудим, как правильно в начале определить перспективу, чтобы сразу предоставить вашему бизнес-кейсу максимальные шансы на успех. Ряд небольших улучшений общепринятой практики позволит сделать бизнес-кейс более интересным и убедительным, а следовательно, повысит вероятность его одобрения.
Начните с бизнес-проблемы, а не с данных или технологии
Во второй главе мы уже говорили о том, что необходимо сначала определить бизнес-проблему, а уже потом собирать под нее данные. Запускать сбор данных или приобретать технологию, не имея четкого плана, – заведомо проигрышная стратегия. Соответственно бизнес-кейс надо разрабатывать не ради приобретения нового источника данных или новой технологии, а ради решения реальной проблемы, с которой столкнулась организация. Если повезет, приобретение потрясающего нового источника данных или программного обеспечения действительно может стать необходимым условием для решения обозначенной проблемы. Грамотно составленный бизнес-кейс не предполагает отказа от покупки технологий, инструментов и источников данных, а просто помещает ее в правильный контекст.
Разница между сосредоточением внимания либо на технологиях, либо на бизнесе отражает разницу между обоснованием либо затрат, либо инвестиций. В большинстве организаций гораздо проще заинтересовать людей бизнес-кейсом, который позволяет решить конкретный набор деловых проблем, чем бизнес-кейсом, который позволяет решить конкретный набор технических проблем. Я не понимаю, почему так много организаций продает услуги по приобретению данных или технологий, а не решения проблем. Давайте рассмотрим две гипотетические дискуссии, чтобы проиллюстрировать разницу между этими подходами.
В первом случае вице-президент по информационным технологиям крупной энергетической компании в одиночку приходит на заседание ее правления и говорит: «Нам необходимо организовать сбор сенсорных данных в нашей инфраструктуре умных электросетей. Это обойдется нам в несколько миллионов долларов. Все наши бизнес-партнеры запрашивают эти данные и готовы частично профинансировать проект. Таким образом, мы можем покрыть все расходы на сбор и хранение данных за счет предлагаемых ими средств с небольшим добавлением наших пошаговых инвестиций в ИТ».
Организуйте совместный проект
Сделайте деловое предложение по инвестициям в операционную аналитику в виде совместного проекта бизнеса и ИТ-службы. Сосредоточьтесь на решении конкретной бизнес-проблемы, а не на покрытии затрат на ИТ, которые должны рассматриваться всего лишь как необходимый компонент общего решения.
Во втором случае вице-президент по ИТ приходит на заседание комитета вместе с партнером по бизнесу, также в ранге вице-президента. Совместно они сообщают следующее: «Мы собираемся сделать так, чтобы наши существующие мощности могли удовлетворять спрос потребителей в течение следующих пяти лет, что позволит нам отсрочить строительство нескольких новых электростанций. Мы планируем добиться этого, стимулируя клиентов изменить свои привычные модели потребления, чтобы мы могли снизить уровни пикового спроса путем анализа сенсорных данных от наших умных электросетей. Разумеется, сбор, хранение и анализ этих данных обойдутся нам в несколько миллионов долларов. Но эти расходы будут с лихвой компенсированы теми десятками миллионов долларов, которые, как мы установили, можно сэкономить за счет отсрочки строительства новых электростанций. К тому же мы сможем выполнить много другой аналитики, как только получим данные от умных электросетей».
Первое предложение свелось к затратам и данным, исходило из интересов ИТ-службы и не очень убеждало, несмотря на обещание покрыть расходы. Второе предложение исходило из интересов бизнеса при поддержке ИТ-службы и сосредоточивалось на экономической ценности сбора данных, а не на затратах. Как вы думаете, какое предложение руководство компании сочтет более привлекательным?
Сосредоточьтесь на доходах, а не на затратах
Предыдущие примеры иллюстрируют два подхода к запросу на финансирование. Главное различие между ними состоит в том, что первый просто пытается оправдать себя, делая акцент на нейтральных затратах, тогда как второй стремится извлечь значительную экономическую выгоду. К сожалению, многие заявки на инвестирование, связанные с аналитикой и технологиями, уделяют слишком большое внимание затратам и способам компенсации этих затрат. Полезнее же затраты просто представить в качестве части высокоэффективного решения, как это показано в таблице 4.1.
Отчасти такой акцент на затратах объясняется тем, что в прошлом инвестиции в технологии было принято обосновывать именно таким образом. Эти инвестиции нередко включали в себя огромную предоплату, которой обременяли широкий спектр производств, способных со временем компенсировать затраты. Например, в связи с огромной стоимостью больших ЭВМ в 1980-е гг. инвестиции в них ни за что бы не получили одобрения только ради удовлетворения нескольких аналитических потребностей. Для обоснования такой покупки ЭВМ должна была удовлетворять широкий спектр потребностей в масштабах всей организации.
Сегодня же инструменты и технологии зачастую относительно недороги, так что можно обойтись скромными инвестициями. Выгоды, достигнутые благодаря начальным инвестициям и начальному внедрению аналитики, могут быть использованы для того, чтобы обосновать дальнейшее финансирование. Инвестиции в аналитику больше не превращаются для организации в масштабные затраты, неподъемные для бизнеса. Благодаря сегодняшней гибкой структуре затрат нередко можно начать внедрение аналитики в гораздо меньшем масштабе, и зачастую на уровне бизнес-подразделения вполне можно выполнить простой анализ рентабельности.
Нацельтесь на факторы, определяющие различия, а не на поэтапные улучшения
Захватывающие новые концепции обычно привлекают больше внимания, чем улучшения уже существующих концепций. Это же верно и в случае аналитики. Если новые данные и новая аналитика могут быть использованы для решения новых проблем, будет гораздо легче привлечь внимание к бизнес-кейсу. Решение новых проблем при помощи новых данных зачастую обещает более весомую финансовую отдачу, чем при простом приспособлении существующих аналитических процессов к решению существующих проблем. Вместе с тем нередко можно разработать план, который предусматривает как краткосрочные поэтапные улучшения, так и долгосрочную конкурентную дифференциацию. Такая ситуация особенно благоприятна, поскольку обещает быстрый и наглядный прогресс в ходе достижения крупных долгосрочных преимуществ. Это будет победа сразу в двух измерениях.
Отметим одну из самых замечательных особенностей, связанных с появлением больших данных (см. вторую главу) и Аналитики 3.0 (см. первую главу), – возможности для применения аналитики расширяются и намного превзошли те, что были еще несколько лет назад. Обязательно отразите это при разработке своего бизнес-плана. Вдохновляющий мир больших данных и операционной аналитики открывает перед организациями широкие возможности для того, чтобы сосредоточиться на конкурентной дифференциации, и в то же время вносить поэтапные улучшения в существующие аналитические процессы. Как мы уже убедились, собираемым данным очень часто можно найти самое разное применение. Это означает, что, даже если кейс создан для решения одной-двух конкретных бизнес-проблем, в нем необходимо упомянуть и грядущие выгоды, которые могут появиться и в других областях, даже если пока что они расплывчаты и неопределенны. Процесс поиска новых ценностей называют еще «разговором с данными». Такой «разговор» способен привести к новым знаниям, идеям – и прибылям.
Конкурентная дифференциация обеспечивает поддержку
Сегодня часто можно использовать аналитику для того, чтобы с самого начала сделать организацию несхожей с другими. Даже если вы нацеливаетесь на поэтапные улучшения, постарайтесь обозначить конкурентные дифференциации на будущее.
Давайте рассмотрим следующий пример. Не будет ли интересно ресторанам или магазинам розничной торговли узнать, сколько людей посещают их каждый день и что это за люди? Могу побиться об заклад, что будет интересно, а помогут им данные о местоположении абонентов, создаваемые мобильными телефонами. Если провайдер сотовой связи хочет окупить затраты на хранение в операционных целях детализированных данных о местоположении абонентов, он может рассмотреть и такие альтернативные варианты их применения, как предоставление магазинам и ресторанам информации о потоке посетителей. Провайдер может даже взымать плату с ретейлеров за информацию о том, сколько человек ежедневно проходят или проезжают мимо их магазинов.
Путем сопоставления данных о местоположении с демографическими данными и данными об использовании мобильных телефонов можно предоставлять подобную информацию и с разбивкой людей по категориям. Предложение такой аналитической услуги может стать для провайдера конкурентной дифференциацией, создать новый поток доходности и окупить затраты на сбор для себя операционных данных. Обратите внимание на то, что я не предлагаю провайдерам разглашать любую информацию о любом индивидуальном абоненте. Это было бы нарушением неприкосновенности частной жизни, о чем мы подробно поговорим в шестой главе. Провайдер будет предоставлять агрегированные сведения, например такие: ежедневно мимо дома № 124 на Мейн-стрит в среднем проходят 200 человек, из которых 30 % имеют годовой доход свыше $100 000.
Чтобы созреть для предоставления таких услуг, организации может потребоваться время. Но обсуждение подобного варианта позволяет выявить бóльшую ценность нового источника данных, которую он постепенно способен приобрести. Это может сильнее заинтересовать инвесторов, чем первоначальные планы, нацеленные только на извлечение прибыли в краткосрочном периоде. Даже если организация сумеет преодолеть планку рентабельности, установленную на основе первоначальных краткосрочных инициатив, определенный аналитикой потенциал в дальнейшем может поспособствовать одобрению новых инвестиций.
Выбор правильных критериев принятия решения
При разработке бизнес-кейса для операционной аналитики необходимо определить критерии, которые станут играть решающую роль при принятии решения. Другими словами, что именно позволит максимизировать или минимизировать инвестиции? Причем необходимо не только правильно определить критерии, но и учесть все последствия каждой альтернативы. При оценке затрат и выгод от внедрения операционной аналитики следует принимать во внимание множество факторов. Потребуются и новые критерии, которые не так широко использовались в прошлом.
В качестве критериев при принятии решения об инвестициях в аналитику нельзя использовать классические ИТ-метрики, такие как цена за терабайт, узел оборудования, лицензию на рабочее место или время обработки запросов. Разумеется, все эти критерии могут быть приняты во внимание, чтобы убедиться в их соответствии нормам, но не могут быть единственными. Одним из ключевых критериев для аналитики является повышение продуктивности человеческого труда, которое может быть достигнуто при инвестировании того или иного варианта. Например, рассмотрите следующие вопросы:
• Насколько быстрее и эффективнее специалисты-аналитики смогут выполнять свои профессиональные обязанности при каждом варианте инвестирования?
• Насколько эффективно организация сможет разрабатывать, тестировать и внедрять новые операционно-аналитические процессы при каждом из вариантов?
• Насколько легко будет экспериментировать с новыми аналитическими техниками?
• Сможет ли оборудование быстро усваивать новые данные и поддерживать стремительные изменения?
• Потребуются ли новые и, возможно, дорогостоящие наборы навыков?
Все эти соображения имеют значение для принятия решений об инвестициях в операционную аналитику и должны применяться для каждого из рассматриваемых вариантов.
Чем быстрее команда аналитиков сможет создать для организации новые аналитические наработки и внедрить их в операционный контекст, тем выше будут доходы. Повышенную цену за терабайт можно оправдать, если команда сумеет выполнять аналитику намного быстрее по сравнению с более дешевым вариантом. Можно заплатить побольше и за лицензию на аналитическое приложение, если оно является более надежным и удобным в использовании. Все это позволит получить результаты наиболее эффективным образом.
Не так уж и сильно отличается это от того, как вы принимаете решение о покупке вещей для личного пользования. Например, многие готовы заплатить подороже за компьютер с бóльшим объемом памяти или диска либо другими важными для пользователя характеристиками. А вот самый дешевый компьютер способен значительно затруднить выполнение важных для вас задач. Например, если у него недостаточно места на диске для хранения всех ваших видеоматериалов, его будет трудно использовать как платформу для архивирования и редактирования видео. В этом случае покупка более дорогого компьютера вполне себя оправдает.
Нарисуйте более полную картину
Многие организации в качестве первого шага осуществляют целевую проверку концепции (proof of concept, POC), или, проще говоря, запускают пилотный проект. Это отличная идея, однако важно не ограничиваться рамками пилотного проекта. Частичное решение проблемы вряд ли станет решающим аргументом в пользу выделения инвестиций, особенно если речь идет о значительных капиталовложениях и затратах труда. Другими словами, пилотный проект может сосредоточиться на одном типе анализа в отношении одного набора продуктов. Если же в завершающей фазе планируется инвестиционная поддержка множества типов анализа для всех наборов продуктов, то об этом нужно заявить со всей определенностью. Если же рассматривается только отдача от ограниченного пилотного проекта, то вряд ли достигнутые показатели будут очень впечатляющими. Кроме того, масштаб пилотного проекта вряд ли позволит увидеть всю ценность заложенного в проект потенциала. Вот почему необходимо ясно изложить свой план.
Любой пилотный проект следует позиционировать как всего лишь пример возможного, а не как окончательный результат. Составьте список других бизнес-проблем, как схожих, так и несхожих между собой, которые также могут быть решены в случае одобрения вашего плана. Обязательно подчеркните, что, хотя пилотный проект и не способствует конкретно решению других проблем, есть резон предположить, что примененная к ним аналитика добавит ценности выводам относительно POC. Если же пилотный проект сам по себе принес весомую финансовую отдачу, то наличие дополнительных преимуществ, которые можно включить в общую структуру, только поможет вам получить зеленый свет.
Подтвердите концепцию, не ограничивайтесь частным случаем
Постарайтесь разработать пилотный проект таким образом, чтобы продемонстрировать потенциал более широкого подхода. Используйте искусство возможного, а не стремитесь просто доказывать ценность ограниченного масштаба пилотного проекта. Несмотря на то что за пределами проекта вы не будете располагать объективной статистикой, выявленный вами потенциал добавит достаточно глазури на пирог, чтобы ваше инвестиционное предложение было одобрено.
Мой клиент из крупной медиакомпании рассказал мне о том, как он добился выделения инвестиций под свою инициативу касательно аналитики. (Я не буду называть эту компанию, чтобы защитить его конфиденциальность.) Его команда осуществила ряд успешных пилотных проектов, однако руководство отказывалось выделять более крупные инвестиции, необходимые для масштабирования полученных результатов. Он предположил, что проблема может заключаться в том, что их инвестиционные предложения фокусировались исключительно на масштабе проведенных пилотных проектов. Это было фатальной ошибкой. Сосредоточенность только на отдаче от аналитики, протестированной в рамках ограниченного пилотного проекта, не обеспечивала достаточно большую доходность. Что не менее важно, при таком подходе мой клиент не мог создать более полную картину, способную впечатлить руководителей, принимающих решения. На рис. 4.1 показано, в чем состоит разница между подходами.
Мой клиент решил, что при следующей попытке он представит POC как всего лишь пример, иллюстрирующий возможности инвестиций. При этом четко укажет, что пилотный проект предназначен показать, как в нескольких относящихся к делу сценариях можно иначе использовать новый источник данных в нестандартных аналитических процессах. Многие другие сценарии не могли быть протестированы в рамках пилотного проекта, но логично предположить, что они также будут успешно реализованы, учитывая их сходство со сценариями, уже доказавшими свою работоспособность. Такой подход, который некоторые называют демонстрацией «искусства возможного», является гораздо более действенным.
Время инсайта
При инвестировании в аналитический процесс обнаружения данных я рекомендую учитывать критерий «времени инсайта» – времени, которое проходит с момента появления нового вопроса до того момента, когда будет схвачена суть проблемной ситуации (произойдет инсайт). Этот критерий отчетливо отличается от критериев, применяемых при операционализации инсайта, полученного в процессе обнаружения данных. При операционализации инсайта важны традиционные ИТ-метрики, например, насколько можно увеличить скорость процесса, создающего инсайт, для поддержки операционных решений.
Различные потребности процессов обнаружения и операционализации более глубоко рассматриваются в шестой главе. Сейчас же просто обратите внимание на то, что бизнес-кейс, нацеленный на обнаружение данных, и бизнес-кейс, нацеленный на операционализацию сбора данных, будут отличаться друг от друга. Эту разницу важно осознать, поскольку в каждом случае присутствуют совершенно разные цели и приоритеты. Кроме того, в современном мире более неприемлемы аналитические циклы, измеряемые многими неделями или месяцами. Время инсайта должно составлять от нескольких дней до нескольких недель.
Инвестирование в обнаружение данных
Цель процесса обнаружения данных – быстро найти новые инсайты. Для этого требуется иной взгляд на инвестиции. Вместо того чтобы ориентироваться на исходные вычислительные мощности или их производительность, лучше ориентироваться на такой показатель, как время инсайта. Сама по себе производительность не настолько важна, как совокупное время, которое требуется для поиска инсайта. Время инсайта приведет в соответствие удобство использования, гибкость и производительность аналитики.
Время инсайта включает в себя все – от приобретения до подготовки данных, периода программирования, осуществления аналитического процесса, поиска инсайта в результатах (см. рис. 4.2). Другими словами, это время от старта до финиша. Например, если один вариант требует 60 минут на программирование, 30 минут на выполнение программы и 10 минут на исследование результатов, то время инсайта составит 100 минут. Если другой вариант требует всего 20 минут на программирование, но 60 минут на выполнение программы и еще 20 минут на исследование результатов, то время инсайта также составит 100 минут. Таким образом, у обоих вариантов одинаковое время инсайта, хотя и ведут к нему разные пути. Это значит, что в бизнес-кейсе необходимо учесть различия в стоимости отдельных компонентов двух вариантов. Например, дополнительные затраты труда (программирование) стоят намного дороже, чем дополнительная компьютерная обработка, и человеческий труд зачастую является самым большим компонентом времени инсайта.
Сосредоточенность на времени инсайта позволяет учесть все факторы, влияющие на время построения аналитических процессов. Переход от типичных критериев к другим, наподобие времени инсайта, имеет огромное значение при инвестировании в обнаружение данных. В конце концов новые инсайты и определяют доходную часть бизнес-кейса. Минимизация времени инсайта максимизирует шансы на обнаружение новых идей, которые сгенерируют доход. Сегодня дифференцированный подход к инвестированию в поиск данных еще не стал типичным. Тем не менее постепенно эта практика распространится и станет обычным явлением.
Метрика времени инсайта будет влиять не только на стоимость, но и на удовлетворенность и мотивацию сотрудников. Профессиональные аналитики стремятся создавать эффективные аналитические процессы. Чем быстрее они смогут добраться до нового инсайта, тем быстрее смогут оказать воздействие и перейти к следующему поиску данных. Небольшая средняя продолжительность времени инсайта повысит удовлетворенность и мотивацию аналитиков. Никто не любит трудиться там, где из-за неэффективности работа занимает больше времени, чем необходимо.
Возможность операционализации
В предыдущем разделе мы рассмотрели, насколько такой новый критерий, как время инсайта, востребован при инвестировании в поиск данных. Теперь давайте посмотрим, какие критерии имеют значение при инвестировании в операционализацию аналитических процессов. К сожалению, в этом случае аналитические инструменты невозможно оценивать только на основе их функциональности. Необходимо также учитывать, насколько хорошо инструменты интегрируются с операционным окружением. Инструмент может быть очень надежным с точки зрения функциональности, но если он не может быть легко интегрирован в операционную среду и обеспечить на требуемом уровне масштаб и простоту процесса, то не будет работать.
В операционной аналитике счет часто идет на миллисекунды. В конечном счете лучше выбрать инструмент, который хотя и не дружественен к пользователю, но может быть более эффективно интегрирован в операционные процессы, чтобы принимать тысячи или миллионы аналитических решений в день. Таким образом, при выборе инструмента наряду с функциональностью необходимо оценивать и его возможности в части операционализации.
Это другой взгляд на вещи. Традиционно организации старались выбирать среди аналитических инструментов наиболее дружественные к пользователям и с максимальной функциональностью. Аналитические процессы осуществлялись в офлайне и в четком режиме, когда интеграция не имела большого значения. Однако при переходе на операционные рельсы организация должна уделить первостепенное внимание интеграции, масштабируемости и производительности. Это может потребовать выбора таких инструментов, которые организация не выбрала бы в прошлом. Удобство для пользователя по-прежнему крайне важно для процесса обнаружения данных, но для операционных процессов еще важнее интегрируемость и масштаб. Возможно, для построения операционного процесса с нуля могут потребоваться дополнительные усилия, но они со временем окупятся благодаря возможности ускоренного принятия миллионов решений. Эти различия в требованиях мы подробнее рассмотрим в шестой главе.
При переходе к операционной деятельности одной функциональности недостаточно
Для операционной аналитики функциональность и дружественность к пользователям больше не могут служить главными критериями при выборе инструментов. Инструменты должны эффективно интегрироваться с окружением, чтобы обеспечить применение данных с масштабированием. Имеет смысл пожертвовать функциональностью и удобством ради масштабируемости и облегчения интеграции.
Такой подход, когда функциональность и удобство не ставятся во главу угла, является не столь уж необычным, каким он выглядит. Скажем, при строительстве дома на одну семью применяются удобные в использовании, многофункциональные материалы. Но когда речь идет о коммерческой недвижимости, часто выбираются гораздо более прочные материалы, соответственно гораздо более дорогие и сложные в установке. Они могут выглядеть менее привлекательно и быть менее удобными в применении, но, главное, должны выдерживать высокую интенсивность использования в коммерческой среде. Возьмем, например, дверные ручки. Дешевые и со стандартным креплением будут замечательно служить, если дверь в вашем доме открывается всего три раза в день, но в большом офисном здании они сломаются через несколько недель. Этот же принцип лежит и в основе выбора аналитических инструментов для поддержки операционных процессов.
Учитывая вышесказанное, вам вряд ли удастся найти у одного поставщика единый комплект аналитических инструментов, который удовлетворял бы все ваши потребности. Скорее всего, вам придется использовать разные наборы инструментов для обнаружения данных и для внедрения их в операционный процесс. Разумеется, со временем инструменты будут развиваться, так что будем надеяться на появление наборов инструментов, способных удовлетворять ту и другую потребность с одинаковой эффективностью. Но по состоянию на начало 2014 г. таких пока нет.
Ценность аналитики в сравнении с ценностью технологии
При инвестировании в аналитику важно принимать во внимание два компонента создаваемой ценности. Зачастую они тесно переплетены между собой, однако их важно различать и рассматривать по отдельности. Первый компонент – это ценность самой аналитики. Другими словами, какие бы ни использовались инструменты, технологии или методологии, весомую долю выгоды можно получить, просто добившись результатов. Понятно, что для этого требуются соответствующие инструменты и технологии. Однако важно не увязывать выгоду, полученную от применения аналитики, с выбором конкретных платформы или инструмента.
Например, ценность представляет простой аффинитивный анализ с целью определения возможностей для перекрестных продаж. Независимо от используемых инструментов и платформ его результат ценен сам по себе. Ценность же инструментов и технологий определяется тем, насколько эффективно они, по сравнению с другими инструментами и технологиями, позволяют создать, протестировать и осуществить аналитический процесс, необходимый для аффинитивного анализа. В большинстве случаев, как показано на рис. 4.3, собственная ценность анализа намного превосходит ту дополнительную ценность, которая создается конкретным инструментом или технологией.
Первым делом необходимо определить отдачу от анализа как такового, независимо от любых платформы или инструмента. А после этого можно приступать к определению эффективности различных вариантов проведения анализа с учетом их скорости, продуктивности и затрат. Однако организации часто попадают в ловушку, когда доверяются продавцу, который превозносит огромную доходность инвестиций, обеспечиваемую его аналитическими продуктами. При этом продавец нередко объединяет доходность инвестиций, предлагаемую собственно аналитикой, с дополнительной ценностью, которую обеспечивают его технологии или инструменты. Вот почему необходимо отделять ценность инструментов от ценности базового анализа.
В качестве ремарки: если каждый продавец для каждого варианта, который вы рассматриваете, объединяет ценность анализа с ценностью инструмента, то, по крайней мере, это дает возможность для беспристрастного сравнения вариантов. Поскольку все расчеты будут включать в себя одинаковую изначальную ценность, то возникающая разница будет отражать разницу в дополнительной ценности, создаваемой инструментом или технологией.
Обратите внимание на структуру бизнес-кейса
Ричард Винтер из фирмы WinterCorp опубликовал потрясающую статью «Большие данные: сколько они стоят на самом деле?»{35}. В ней он описывает структуру, в рамках которой можно будет принять во внимание все типы затрат и использовать показатель, названный Винтером “total cost of data” (TCOD) – «суммарная стоимость данных», при инвестировании в аппаратное и программное обеспечение для поддержки аналитики. TCOD отражает общую стоимость широкого разнообразия необходимых компонентов, их мы рассмотрим далее в этой главе.
Обратите внимание на то, что модель TCOD Винтера, а также бо́льшая часть этого раздела сосредоточены главным образом на одной стороне баланса, а именно на затратах. Я поступил так преднамеренно, поскольку компоненты затрат в разных организациях довольно схожи, тогда как получаемые за счет их преимущества могут значительно варьироваться в зависимости от конкретных аналитических процессов. Кроме того, когда речь идет об аналитике, точная оценка затрат часто упускается из виду. Вот почему я предлагаю сосредоточиться на этой стороне вопроса.
Большое преимущество модели TCOD Винтера состоит в том, что она не склоняется в пользу того или иного конкретного решения, а просто предлагает способ, который позволяет оценить и принять в расчет различные компоненты стоимости. Например, в статье описываются две различные ситуации, когда использование этой модели привело к двум совершенно противоположным выводам. В первом случае на основе свойств, требуемых для данных и обработки, был сделан вывод о том, что создание массивного параллельного окружения обойдется в три-четыре раза дороже, чем использование Hadoop. В другом случае с учетом свойств, требуемых для данных и обработки, был сделан вывод о том, что инвестиции в Hadoop обойдутся в три-четыре раза дороже, чем создание необходимого окружения.
Использование этой модели, нейтральной по отношению к оценке инструментов и технологий, позволяет объективно учесть все затраты. Применительно к операционной аналитике модель TCOD требует некоторой модификации, поскольку предусматривает слегка иной характер инвестирования. Однако, как мы увидим в следующем разделе, сочетание модели TCOD с дополнительными метриками, привязанными конкретно к операционной аналитике, создает великолепную стартовую позицию.
Каковы совокупные расходы на операционную аналитику?
При рассмотрении вариантов инвестирования в аналитику очень важно точно оценить совокупные расходы. Например, рассматривая инструменты с открытым исходным кодом, организации не должны слишком радоваться, получив бесплатную лицензию на программное обеспечение. Необходимо представить полную картину затрат с течением времени. Да, инструменты с открытым исходным кодом могут оказаться полезнейшим дополнением к аналитической среде. Однако при этом необходимо учесть все совокупные расходы и с осторожностью воспринимать ложные стимулы, чтобы по своему недосмотру не попасть со временем на повышенные издержки.
Итак, что следует учесть, оценивая затраты, связанные с внедрением операционной аналитики? Вам придется потратиться на следующее (а возможно, и не ограничиться этим){36}:
• оборудование для поддержки аналитической обработки;
• программное обеспечение (обратите внимание, что даже в случае с открытым исходным кодом возникнут затраты, связанные с установкой и настройкой ПО);
• пространство для размещения оборудования и потребляемую электроэнергию;
• полностью загруженную рабочую силу, потребную для обеспечения безопасности, назначения приоритетов ресурсов и настройки связности сети;
• сбор, загрузку и подготовку данных;
• рабочую силу для развития аналитического процесса;
• действия по тестированию логики программы и точности результатов процесса;
• обслуживание платформы, ПО и аналитических процессов с течением времени;
• обучение персонала навыкам пользования всеми различными компонентами аналитического окружения.
Все эти затраты должны быть оценены, исходя из периода в несколько лет до завершения инвестиционного цикла.
Не забывайте про важные компоненты затрат
Легко упустить из виду некоторые важные компоненты затрат на фоне совокупных инвестиций в поддержку аналитики. За первоначальными расходами последуют текущие затраты на рабочую силу и обслуживание технологий в течение всего инвестиционного цикла. Эти текущие затраты в конечном итоге могут значительно превысить первоначальные.
Очевидно, что принять по внимание придется много компонентов затрат, чьи основные категории представлены на рис. 4.4. Некоторые компоненты, такие как покупка оборудования, требуют значительных начальных инвестиций, но впоследствии влекут за собой небольшие текущие расходы. Другие, такие как затраты на техобслуживание, будут с течением времени распределяться более равномерно. Чтобы объективно сравнить разные варианты, необходимо оценить суммарную стоимость всех компонентов в перспективе. Кроме того, важно учесть и другую сторону баланса, а именно различные доходы, которые будут получены при реализации инвестиций. Далее мы обсудим ряд концепций, способных помочь вам в составлении точного бизнес-кейса.
Учитывайте все затраты с течением времени
Как и с любыми инвестициями, при создании бизнес-кейса по внедрению операционной аналитики нужно принимать во внимание все затраты, а не только их основные статьи, и оценивать их исходя из всего инвестиционного цикла. Организации совершают ошибку, когда упускают из виду отдельные вполне реальные расходы, с которыми им придется столкнуться. Отчасти это объясняется тем, что некоторые статьи затрат более чем очевидны и/или конъюнктурно мотивированны, чем другие. Убедитесь, что ваши сотрудники внимательно отслеживают все расходы, даже если они стремятся сосредоточиться только на тех немногих, в которых наиболее заинтересованы. Давайте рассмотрим несколько примеров того, к чему может привести игнорирование суммарных затрат в повседневной жизни.
Гостиничные тарифы
Рядом с офисом, куда я часто ездил в командировки, находился популярный отель. Мой тогдашний работодатель платил за номер по тарифу $109 в сутки, включая завтрак и услуги Интернета. Это было выгодно, поскольку завтрак и Интернет по отдельности стоили $10. Таким образом, тариф в $109 фактически равнялся $129.
На следующий год последовало значительное снижение среднесуточной суммы командировочных, выделяемых нам на оплату отеля. Отдел организации поездок начал бронировать для нас номера по цене $99 в сутки, но уже без включения завтрака и Интернета. Когда же завтрак и Интернет добавлялись, почти все командированные стали платить по $119 в сутки. Цель компании состояла в снижении среднесуточных командировочных, и кто-то наверняка получил награду за «экономию» $10 в сутки. Другие предписания, вероятно, ударили еще по разным позициям, но в конечном счете компании пришлось заплатить больше по совокупности.
Затраты на единицу оборудования
Один клиент рассказал мне о том, как он боролся за инвестиции в компьютерное оборудование. Но единственное, что интересовало его руководство, так это цена сервера. Производительность более дорогих серверов была по крайней мере в три раза выше, чем более дешевых, тогда как по цене они различались всего на 25 %. И компания клиента собиралась потратить почти в три раза меньше только лишь потому, что для ее руководства в первую очередь была важна низкая цена сервера. Клиенту так и не удалось убедить ответственных за покупку взглянуть на ситуацию пошире, поскольку они прицепились к одной-единственной метрике. Я не знаю, чем все закончилось, но надеюсь, что здравый смысл возобладал. Упереться только в цену сервера и не принимать во внимание его производительность – проигрышная формула.
Выигрыши в телеигре
В детстве моей любимой телеигрой была «Цена правильна» (Price Is Right)[2]. Многие победители этой игры были шокированы, узнав, что выигранный ими «бесплатный» жилой автофургон облагается огромным налогом и требует дорогостоящего техобслуживания{37}. Если сегодня участники хотят выиграть жилой автофургон стоимостью $60 000, они должны быть готовы к тому, что им придется заплатить примерно $20 000 подоходного налога и налога с продаж, а также нести большие расходы на бензин и техобслуживание. Если такие расходы участнику не по карману, то бесплатный дом на колесах становится совсем не бесплатным, верно? Участникам телеигры следовало бы узнать цену его перепродажи, чтобы убедиться в том, что, продав автофургон, формально считающийся бывшим в употреблении, по достаточно высокой цене и уплатив налоги и сборы, они получат в итоге реальный доход. Это большая ошибка – рассматривать только возможные доходы и игнорировать расходы. В качестве ремарки: вы же не думаете, что олимпийские медали в США не облагаются налогом? Американские участники Олимпийских игр налоги платят, поскольку за завоеванные медали Олимпийский комитет США выделяет им денежные премии{38}.
Самый недооцениваемый компонент затрат
Одним из чаще всего недооцениваемых или вообще игнорируемых компонентов бизнес-кейса, подготовленного для инвестирования в инструменты и системы, поддерживающие аналитику, являются затраты на оплату труда. А учитывать их крайне важно. Все аспекты разработки, тестирования, внедрения и обслуживания операционно-аналитических процессов требуют вполне реальных затрат человеческого труда. Кроме того, таких же реальных трудозатрат требует внедрение и обслуживание аналитических платформ или набора аналитических инструментов.
Затраты на рабочую силу могут значительно вырасти, если у сотрудников организации не имеется нужных навыков и они демонстрируют низкую эффективность при разработке и внедрении необходимых процессов. Очень часто затраты на рабочую силу могут в несколько раз превысить затраты на оборудование и лицензирование. Это может быть особенно верно применительно к аналитическим процессам, которые еще не достигли зрелости и требуют повышенной заботы и подпитки. Многие операционно-аналитические процессы сегодня как раз попадают в эту категорию.
Сотрудник правительственного агентства (его имя я оставляю в тайне по понятным причинам!) признался мне, что его организация значительно сократила расходы на лицензионное ПО, распорядившись использовать технологии с открытым исходным кодом везде, где это возможно. Однако его команда в итоге потратила дополнительно миллионы долларов в связи с увеличением трудозатрат и по некоторым проектам отстала от сроков на несколько кварталов. Дело в том, что бесплатные инструменты, к которым прибегло агентство, оказались не способны заменить ранее использовавшиеся коммерческие инструменты. Мало того, что организация в итоге ничего не сэкономила, но она еще и потеряла миллионы долларов и массу времени. Нацеленность только на линейку инструментов с бесплатной лицензией завела агентство в тупик, что дорого обошлось ему с точки зрения затрат на оплату труда, хотя и позволило резко сократить затраты на покупку лицензий.
Узнайте стоимость рабочей силы
Затраты на оплату труда часто недооцениваются при оценке затрат на инвестиции в аналитику. Проще простого упустить из виду неэффективность, порожденную отсутствием навыков или удобства пользования ПО. В зависимости от проблемы один вариант может потребовать значительно больше трудозатрат, чем другой, при построении одного и того же аналитического процесса.
Наконец, есть еще одна область, где в игру вступает фактор трудозатрат, хотя подсчитать их в количественном выражении очень трудно, но они вполне реальны. Если для выполнения задачи на имеющейся платформе или при помощи имеющегося инструмента требуется больше времени в сравнении с другим вариантом, тогда это дополнительное время необходимо учесть при выборе объекта инвестиций. Помимо затрат на оплату труда, важны затраты на внедрение и текущее обслуживание, которые легко определить. Если же организация снизит свою эффективность в избранном ею варианте, то нехватка эффективности может быстро сказаться на ограничении других расходов.
Когда вы оцениваете потенциальные инвестиции, необходимо объективно оценить все расходы и все навыки, которых они потребуют (см. рис. 4.5). Исходя только из имеющегося у нее набора навыков, организация может выбрать совершенно иной путь развития, в отличие от других организаций. Как и везде, правильным ответом зачастую будет: «В зависимости от…» А без изучения сложившейся ситуации вам не сделать правильного выбора.
Факторы, изменяющие формулу
Разумеется, реалии бизнеса могут не позволить организации реализовать даже самый дешевый вариант. Например, если бюджет капиталовложений на текущий год полностью израсходован, и всем было сказано, что никакие капитальные затраты больше не будут утверждены, и точка. В этом случае придется поискать альтернативу, например использовать облачное решение или лизинг вместо покупки оборудования. Конечно, с течением времени такие варианты могут и подорожать, но повышенная долгосрочная стоимость – это та цена, которую приходится платить за жесткую экономию сегодня.
Важно понимать, что оправдан и выбор более дорогого варианта при условии полного осознания организацией того, за что она платит и с какой целью. Одно дело, когда организация сознательно решает заплатить повышенную цену, руководствуясь практическими соображениями. И совсем другое, когда организация пропускает исследование грядущих затрат и, возможно, даже сама себя дурачит, полагая, что не переплачивает, когда в реальности именно это и делает.
Масштабирование касается не только хранения и обработки
Во второй главе мы уже говорили о том, что операционная аналитика и большие данные требуют масштаба во многих измерениях – не только в хранении и обработке данных, но и касательно количества пользователей, параллелизма, безопасности, управления рабочей нагрузкой и интеграции с другими инструментами. Учитывая, что при превращении традиционной аналитики в операционную миллионы и потенциально десятки миллионов решений будут приниматься на постоянной основе, важно гарантировать, что необходимый масштаб будет применен ко всем вышеперечисленным измерениям.
Если выбранный вариант инвестирования окажется не способен поддерживать все виды масштаба, требуемые для операционной аналитики, то организация дорого заплатит за преодоление ограничений масштаба в конечной стадии проекта. Цена за придумывание обходных решений может аккумулироваться, и в худшем случае преодолеть эти ограничения окажется невозможным, так что организации придется начинать все сначала.
Приведу вам аналогию из собственной жизни. Несколько лет назад я купил дешевый триммер для прополки. Мне надо было выполоть немного сорняков у себя во дворе, и я решил, что обойдусь самой дешевой моделью, какую только смогу найти. Однако, когда я запустил триммер, оказалось, что он работает не очень-то хорошо, так что на прополку у меня ушло больше времени, чем я рассчитывал. К тому же леска у него то и дело рвалась, а менять леску на катушке было очень трудно, как и вернуть катушку на место.
В конечном итоге этот дешевый триммер обошелся мне дорого с учетом потраченного времени и его неэффективной работы. Через несколько недель я оставил напрасные попытки приноровиться к нему и купил более дорогую модель. Если бы я с самого начала думал не только о цене, но и о суммарных усилиях, которые мне придется приложить, чтобы заставить триммер работать, как я планировал, то я сразу бы сделал иной выбор. К счастью, триммер для прополки – сравнительно недорогая вещь, поэтому я усвоил этот урок с минимальными денежными потерями. Но они возрастут неизмеримо, если подобные ошибки будут допущены по отношению к инвестициям в операционную аналитику.
Рекомендации по созданию успешного бизнес-кейса
Теперь, когда мы рассмотрели некоторые соображения, которые должны войти в бизнес-кейс для аналитики, давайте обратимся к концепциям, способным повысить шансы на успешное представление кейса руководству. Создав солидный бизнес-кейс, как позиционировать его наиболее эффективно, чтобы гарантировать одобрение? Давайте рассмотрим несколько важных правил.
Не форсируйте подготовку бизнес-кейса
Не тратьте время на разработку бизнес-кейса без повода. Вместо того чтобы притягивать цифры за уши, лучше переключитесь на другую проблему. Сегодня, когда вокруг определенных подходов поднято много шумихи, можно с легкостью поддаться всеобщему ажиотажу и застрять, вновь и вновь пытаясь заставить работать бизнес-кейс. Не позволяйте блеску новых технологий, данных или инструментов, а также окружающему их ажиотажу заставлять вас руководствоваться при разработке бизнес-кейса эмоциями, а не фактами.
В 2013 г. сотрудники многих организаций по всему миру жаловались мне на трудности, с которыми они столкнулись, пытаясь обосновать значительные инвестиции в сбор данных из социальных сетей и соответственно в аналитику этих данных. Им никак не удавалось придумать способы применения такой аналитики, позволившие бы им оправдать увеличение инвестиций. У каждой организации имелся свой внешний поставщик, предоставлявший ей на высоком уровне смысловой анализ контента и анализ тенденций на основе агрегированных данных из социальных сетей. Однако организации не могли составить кейс, с тем чтобы начать собирать необработанные данные из социальных сетей для внутреннего употребления. Предполагаемая отдача от расходов на сбор данных и развитие аналитических процессов не выглядела достаточной для того, чтобы оправдать инвестиции. И все мои клиенты, с кем я разговаривал, были удручены своей неспособностью обосновать то, что, как они считали, с легкостью делали на рынке другие. Все они хотели узнать, что именно они упускают из виду.
В таких случаях я говорю своим клиентам, что им не стоит беспокоиться. Возможно, инвестирование в сбор детализированных данных из социальных сетей в текущий момент действительно не имело смысла для их организации. И, возможно, никогда не будет его иметь. Если выполненные на высоком уровне сводки, к которым организация имеет доступ, удовлетворяют ее потребности и она не может доказать необходимость увеличения инвестиций, значит, нет поводов для беспокойства. В конце концов, даже потратив усилия и средства на сбор данных, организация может столкнуться с трудностями при нахождении соответствия между аккаунтами в социальных сетях и клиентскими счетами внутренних потребителей, причем доля успешных попыток такого сопоставления остается весьма низкой. Вот почему обычно я рекомендую организациям оставить ситуацию с социальными сетями такой, как она есть, и переключить свою энергию на поиск других, более значимых аналитических возможностей.
Не поддавайтесь давлению
Отнюдь не каждый бизнес-кейс может сработать, поэтому не форсируйте его подготовку. Если определенный подход привлекает повышенное внимание на рынке, то это вовсе не означает, что его внедрение немедленно окупится для вашей организации. Сосредоточьте усилия на подготовке бизнес-кейсов, под которые вы можете легко подвести обоснование, и не следуйте туда, куда направляет вас рыночный ажиотаж.
Отчасти проблемы у моих клиентов были связаны с той большой шумихой, которая в то время поднялась вокруг аналитики социальных сетей. Создавалось впечатление, что каждый инвестировал в аналитику социальных сетей и получал от этого доход. Я же указывал в разговоре с клиентом, что подобное слышал от других организаций, схожих с его собственной, и все они полагали, что прочие обгоняют их, хотя в действительности дело обстояло иначе.
Эта ситуация напоминает мне старшие классы школы, когда казалось, что у каждого одноклассника жизнь куда более интересная, чем у тебя. На деле же бóльшая часть «интересной жизни» была основана на слухах, и другие ребята, вероятно, так же завидовали мне и моей жизни. В старших классах никто не хочет оказаться в отстающих, и точно так же происходит и в мире бизнеса. Не поддавайтесь давлению с целью получить одобрение бизнес-кейса, которого не существует. Лучше сосредоточьте свою энергию на создание бизнес-кейсов в таких областях, где, по вашему убеждению, ценности существуют, и вы можете это доказать.
Чтобы добиться успеха, начните с малого
Как мы уже говорили в начале этой главы, способ, посредством которого инструменты и технологии применяются для создания аналитических процессов, позволяет сегодня начинать с гораздо меньших инвестиций и затем на их основе развиваться дальше. Этот момент настолько важен, что я рассматриваю его с разных сторон в своей книге «Укрощение больших данных» и в своем постоянном блоге для Международного института аналитики и в блоге для Harvard Business Review{39}. Здесь же я хочу рассмотреть несколько ключевых тем.
Что вам действительно нужно доказать?
Не заходите слишком далеко в первоначальном продвижении нового операционно-аналитического процесса. Первым делом вам нужно просто доказать жизнеспособность идеи. Не нужно с самого начала предлагать готовый к эксплуатации полномасштабный процесс. Начните с малого, чтобы продемонстрировать ценность этого подхода, а затем используйте приобретенные знания для создания более эффективного процесса.
Одна из причин, почему люди не любят начинать с малого, вызвана так называемым эффектом якорения, о котором я впервые узнал из книги Дэна Ариели «Предсказуемая иррациональность»{40} (Predictably Irrational)[3]. Чтобы проиллюстрировать эту концепцию, приведу следующий пример. Представьте себе комнату, полную людей. Я вывожу половину из них в холл и сообщаю им, что сегодня собираюсь пригласить на обед 10 человек, после чего возвращаю их в комнату. Затем вывожу в холл другую половину и говорю им, что сегодня после обеда поеду в аэропорт, где помимо меня будет находиться еще 10 000 человек. Когда все возвращаются в комнату, я ставлю на стол банку с леденцами и прошу присутствующих угадать их количество. Вот здесь и начинается самое интересное.
Те, кто услышал от меня цифру 10, называют в среднем более низкие цифры, чем те, кто услышал от меня цифру 10 000. Это никак не связано с реальным количеством леденцов в банке. Причина в том, что сознание людей «заякорилось» на услышанной ими цифре 10 или 10 000. В результате люди из первой группы начинают с цифры 10 и постепенно движутся в сторону увеличения, пока не придут к тому числу, которое кажется им соответствующим количеству леденцов в банке. А люди из второй группы начинают с 10 000 и движутся в сторону уменьшения. Такой психологический трюк разыгрывает с нами наше сознание.
То же самое происходит с большими данными и операционной аналитикой. Эти термины звучат устрашающе. Наш разум сосредоточивается на большой, сложной, масштабной аналитике. В результате, когда мы задумываемся о том, с чего начать, наш разум склонен выбирать очень сложные и очень трудные пути. Мы стремимся сразу же достичь конечного состояния, вместо того чтобы сосредоточиться на первых шагах, которые приведут к этому состоянию.
Здесь крайне важно видеть перспективу. Нам не нужны все данные за все годы эксплуатации по каждому элементу оборудования, чтобы определить возможности предупредительного техобслуживания. Что нам нужно, так это достаточное количество данных за достаточный период времени по достаточному количеству элементов оборудования, чтобы выявить шаблоны и оценить общую амплитуду этих возможностей. Вместо того чтобы начинать с масштабного проекта, начните с пилотного или проверьте концепцию на подмножестве данных. Это позволит вам доказать, что идея жизнеспособна и может принести доход. Одновременно выстраивайте окончательный бизнес-кейс по мере того, как будете узнавать о действиях, которые нужны для создания окончательного операционного процесса, и о проблемах с данными и процессом, которые придется принять во внимание. Все это поможет вам разработать грамотное инвестиционное предложение. Используйте результаты пилотного проекта для обоснования более крупных инвестиций. Только не позволяйте своему разуму попасть в ловушку якорения на чем-то очень масштабном.
Смиритесь с некоторой неопределенностью
При вступлении в новые области, такие как большие данные и операционная аналитика, вам придется столкнуться с гораздо большим количеством неведомого, чем при развитии бизнес-кейса. Кроме того, при реализации новой инициативы в масштабах операционной аналитики вам придется опираться на множество предположений. Они включают как очевидные, например насколько хорошо будет работать аналитика или насколько точными будут данные, так и менее очевидные, например насколько эффективно результаты аналитики будут внедрены в деятельность организации и восприняты ею. Скажем, если степень сопротивления на уровне корпоративной культуры окажется выше или ниже, чем вы предполагали, это может значительно сказаться на конечном воздействии операционной аналитики.
Вспомните, как в первой главе мы обсуждали пример использования сложной аналитики с целью оптимизации ежедневных маршрутов для водителей. Если водители примут эти изменения и скорректируют свои привычные маршруты, чтобы экономить несколько миль ежедневно, то отдача будет весомой. Но если водители станут сопротивляться и выполнять лишь небольшую часть рекомендаций, то отдача будет гораздо меньше возможной. Заметьте, что отсутствие воздействия никак не связано с мощностью, точностью и потенциалом собственно аналитического процесса. Просто водители решили не пользоваться рекомендациями. Это уже вопрос соблюдения корпоративной культуры. Подробнее мы обсудим его в девятой главе.
Очень важно, чтобы организация понимала все предположения, на которые ей приходится опираться, и учитывала все риски, которые могут не поддаваться количественной оценке или плохо определяться. В такой новой области, как операционная аналитика, зачастую невозможно оценить все предположения с такой же точностью, как в других бизнес-кейсах. Во многих бизнес-кейсах за основу берется типичная ситуация, с которой уже не раз сталкивались в прошлом и которая поэтому хорошо понятна. Например, представьте, что вам нужно разработать предложение о вложении инвестиций в новый производственный процесс, предназначенный для производства 50-й по счету модификации какого-либо продукта. В этом случае вы будете вполне уверены в предположениях о том, как будет работать оборудование, насколько стабильно станет функционировать производственная линия и как персонал адаптируется к новому процессу. Ведь в прошлом то же самое было проделано уже 49 раз.
Ограничьте неопределенность
Даже если сотрудники не могут договориться о точности предположений вследствие неопределенности опорных фактов, вы все равно сможете запустить бизнес-кейс в работу. Если вы продемонстрируете, что все обсуждаемые предположения указывают в одном направлении, то можно будет двигаться дальше, договорившись о получении не конкретной ценности, а о диапазоне ценностей.
Новые же и инновационные идеи всегда характеризуются повышенной неопределенностью. Поэтому бывает трудно убеждать организацию принять некоторые не очень определенные предположения. Одни руководители заявляют, что не видят опасности в том, что организация плохо воспринимает и принимает новый процесс. Другие, более агрессивные, будут утверждать, что сотрудники примут новый процесс полностью. Как вам преодолеть такое расхождение во мнениях и получить одобрение?
Один из способов – показать, что широкий диапазон разумных предположений указывает в одном направлении, т. е. инвестирование будет умным ходом. Даже если неопределенность не удастся устранить полностью, докажите, что ее влияние не создаст проблем. Если одного руководителя устраивает степень согласия на уровне 80 %, а другого – на уровне 50 %, но при обоих этих допущениях будет достижим положительный эффект, то руководители могут остаться при своих взглядах и не согласовывать расхождение в предположениях, а спокойно двигаться дальше. Со временем, чем больше организация будет использовать аналитику, тем легче будет руководителям совершать своего рода прыжок веры. Людям легче принять некоторую неопределенность, если они уже сталкивались с подобной ей в прошлом, когда все сработало превосходно.
Выбор широкий, поэтому выбирайте по-умному
Когда организация планирует инвестиции в аналитику, необходимо просеять все возможные варианты применения аналитики и решить, на которых нужно сосредоточиться. Даже если организация составила список из 100 сильных операционно-аналитических процессов, которые ей хотелось бы внедрить в текущем году, то сделать это будет попросту невозможно. Поэтому необходимо расставить приоритеты и сократить список до такого количества, которым можно управлять с учетом изменения бизнес-процессов и наличия ресурсов. Невозможно осуществить все и сразу.
Попробуйте раз в квартал или в год организовать сбор предложений от рабочих групп и аналитических команд о возможностях, ради которых стоит создавать кейсы. Собрав все великие идеи, садитесь за стол переговоров и начинайте их просеивать. Задайте следующие вопросы:
• Какие идеи столкнутся с наибольшими внутренними или внешними бюрократическими препятствиями?
• Какие из них слишком ограниченны, чтобы обладать достаточным потенциалом?
• Какие из них согласуются с долгосрочными корпоративными приоритетами?
• Какие из них основаны на уже имеющихся данных и навыках?
• Какие из них бизнес-команда считает наиболее приоритетными?
После обсуждения вариантов решите, какие из них стоят разработки бизнес-кейса. Определите количество вариантов, которые можно будет внедрить на протяжении текущего года, и зарезервируйте еще несколько на случай, если бизнес-кейсы не сработают для некоторых вариантов. Начиная с изучения всех возможностей можно по мере их сокращения обрести уверенность в том, что выбор сделан правильно{41}.
Пример правильного подхода
Несколько лет назад мой клиент, ретейлер из Европы, захотел включить истории просмотра веб-страниц в профили своих клиентов, чтобы улучшить прямой маркетинг и кастомизацию своих веб-сайтов. Стоимость проекта была оценена в несколько миллионов евро, и команда ретейлера безуспешно пыталась добиться его одобрения. В такой ситуации многие команды предпочитают либо сдаться, либо проталкивать один и тот же план квартал за кварталом, пока не получат одобрения. В обоих случаях возможности будут либо упущены, либо реализованы с большим отставанием.
Но эту команду посетило озарение. Ее члены осознали, что действительно, для того чтобы собрать истории просмотра веб-страниц всеми клиентами на всех многочисленных сайтах компании, потребуется вложить несколько миллионов евро. При этом руководство не задавалось вопросом, сработает ли идея, поскольку не понимало, какую выгоду это может принести компании. Тогда команда решила сделать следующий умный шаг.
Члены команды определили пару самых популярных продуктовых линеек на одном из веб-сайтов компании и на протяжении нескольких месяцев собирали данные об истории просмотра клиентами веб-страниц только с этими продуктовыми линейками. Затем осуществили несколько тестов в рамках пилотного проекта. Благодаря значительному сокращению первоначального масштаба проекта объем данных тоже заметно сократился, и команда сумела использовать существующие аналитические инструменты и технологии при небольших трудозатратах. В итоге команда смогла доказать, что, например, последующая отправка электронных писем тем клиентам, которые просматривали страницу с товаром, но не купили его, приносит солидную доходность. Суммарно по результатам тестирования в рамках пилотного проекта она составила 800 % за пять месяцев.
Затем команда вновь обратилась к правлению компании и объяснила, что 800 % доходности в рамках пилотного проекта были получены в течение всего нескольких месяцев с использованием имеющихся в наличии инструментов, технологий и персонала. Если же создать такие же процессы для всех веб-сайтов, продуктов и клиентов компании, то возникнет очень впечатляющая перспектива, достойная обсуждения. Далее команда указала, что оценки касались только начального уровня, поскольку были использованы лишь немногие записи в блогах и только самые простые идеи были протестированы на полученных данных. У членов команды имелась масса других идей по поводу использования еще не протестированных данных. И хотя их доходность сложно было спрогнозировать в количественном отношении, но она только добавилась бы к результатам пилотного проекта. А поразившие всех количественные показатели пилотного проекта представляли собой лишь нижнюю планку ценности, а не ее ожидаемую величину и уж тем более не ее потолок, который можно достичь при основной рассылке рекламы в полном размере. Наконец, члены команды сообщили, что теперь, поработав с данными и лучше их поняв, они смогут снизить риски при основной рассылке, поскольку стали намного увереннее в своих рабочих расчетах.
Располагая такими фактами, команда с легкостью добилась одобрения. Руководство с воодушевлением инвестировало в ее инициативу, будучи уверенным в том, что доходность будет обеспечена, поскольку была обоснована. Инвестиции уже не рассматривались как рискованные огромные расходы с неведомой компенсацией через сколько-то месяцев. Более того, инвестиции расценивались как разумное вложение, которое, как все знали, должно будет окупиться. Причем руководство, возможно, было готово выгребать деньги из закромов быстрее, если бы это позволило ускорить реализацию проекта.
Обратите внимание на то, что ретейлер начал с малого и выстраивал бизнес-кейс поэтапно. В завершающей фазе были не просто масштабированы результаты аналитики конкретных продуктов, включенных в скромный по размерам пилотный проект, – в кейсе были учтены все расходы, в том числе текущие затраты на оплату труда. При этом, как я рекомендовал в начале данной главы, команда обрисовала более полную картину того, чтó она стремилась реализовать. Преимущество такого подхода состоит в том, что он позволяет переместить фокус с затрат на отдачу.
Подведем итоги
Наиболее важные положения этой главы:
• Создавайте кейс для решения конкретной бизнес-проблемы, а не для покрытия затрат на проект. Создайте партнерство ИТ и бизнеса.
• Создавайте кейс для аналитики, способный стать конкурентным дифференциатором, а не просто средством незначительных улучшений существующих аналитических процессов.
• Доказывайте обоснованность концепции, а не кейса. Подтверждая концепцию, продемонстрируйте потенциал подхода более широкого класса. Не пытайтесь доказать только ценность ограниченного масштаба, присущего пилотному проекту.
• При инвестировании в сбор данных используйте разные критерии, включая время инсайта, которые учитывают удобство использования и гибкость вариантов в дополнение к производительности обработки.
• При переводе традиционной аналитики в операционную, если это необходимо, пожертвуйте функциональностью инструментов и удобством для пользователя ради масштабируемости и простоты интеграции.
• Разделяйте собственную ценность аналитики и дополнительную ценность, создаваемую конкретным инструментом или технологией при генерации результатов анализа.
• Определите и примите в расчет все виды затрат, связанных с инвестированием в аналитику, по прошествии времени и с объективной точки зрения. Не зацикливайтесь на отдельных позициях.
• Обратите особое внимание на текущие затраты на оплату труда, связанного как с обслуживанием, так и с созданием и тестированием аналитических процессов. Трудозатраты чаще всего игнорируются или серьезно недооцениваются.
• Убедитесь, что в бизнес-кейсе учтены различные параметры необходимого масштабирования. В противном случае ликвидация разрывов приведет к дополнительным издержкам или же вообще придется начать все сначала.
• Не форсируйте подготовку бизнес-кейса, если его нет. Усердно продвигаемый метод подойдет отнюдь не каждой организации прямо сейчас (если вообще подойдет).
• Начните с малого и используйте целевые пилотные проекты для получения осязаемых результатов. Не нужно полностью внедрять аналитический процесс, чтобы доказать его ценность.
• Смиритесь с тем, что новые инновационные инициативы всегда несут в себе много неопределенности. Если нельзя достичь согласия касательно некоторых предположений, просто покажите, что все рассматриваемые предположения указывают в одном направлении.
Глава 5 Создаем аналитическую платформу
В последние годы аналитический ландшафт все более усложняется. В сегодняшнем мире операционной аналитики совсем не так просто выбрать аналитические инструменты и базы данных. Появилось много новых инструментов и технологий, которые можно включить в современное аналитическое окружение. Эти технологии включают в себя нереляционные платформы, такие как Hadoop, платформы для обнаружения данных, поддерживающие как реляционные, так и нереляционные данные, а также их обработку, аналитика оперативной памяти, аналитика на основе графического процессора, обработка сложных событий и встроенные аналитические библиотеки. Мы поговорим о каждой технологии более подробно.
Со временем дальнейшая интеграция сделает аналитическое окружение еще более цельным и простым в использовании. Но сегодня приходится иметь дело с разнообразием компонентов в аналитической платформе. Главное здесь – надежно настроить платформу в целом так, чтобы она могла удовлетворять все ваши аналитические потребности. Причем и насущные, и те, чье появление предвидится в ближайшие несколько лет.
Для успеха операционной аналитики необходимо соединить компоненты разным образом и без изъятий, как в прошлом, чтобы создать отдельное единое аналитическое окружение, которое можно масштабировать с целью управления любым типом и объемом данных для любого вида анализа. Это может показаться невыполнимой задачей, но сегодня рынок развивается стремительно, так что задача стала уже вполне осуществимой. В этой главе мы рассмотрим, как извлечь пользу из всех вариантов и правильно разместить аналитическую платформу, которая будет выполнять все требования операционной аналитики.
Прежде чем мы начнем, обратите внимание на то, что рынок изменяется крайне быстро. Эта глава была написана в начале 2014 г., и, хотя бо́льшая часть содержания книги не слишком чувствительна к фактору времени, не исключено, что кое-какой представленный в данной главе материал получит развитие к тому моменту, когда вы будете читать книгу. Общие концепции останутся актуальными еще долгое время, но, возможно, вам придется адаптировать некоторые специфические моменты с учетом новейших разработок инструментов и технологий и с учетом предложений, появившихся на рынке.
Планирование
Планирование и внедрение аналитической платформы – непростая задача. В этом разделе мы рассмотрим несколько подходов и концепций, которые должны быть рассмотрены в ходе процесса планирования.
Операционализация аналитики – не технологическая проблема
Клиенты часто удивляются, когда я говорю им о том, что операционализация аналитики не является собственно технологической проблемой{42}. Хотя существующие сегодня технологии позволяют обрабатывать подавляющую часть больших данных и удовлетворять потребности в операционной аналитике для подавляющей части организаций. Да, всегда встречаются нестандартные ситуации, но, пожалуй, все, что требуется вашей организации для успешного внедрения операционной аналитики в плане технологий, сегодня доступно на рынке. Если это так, почему тогда во многих организациях технологии рассматриваются как ключевая проблема?
Чтобы ответить на этот вопрос, важно понимать разницу между технологией как симптомом и технологией как причиной. В конце 2012 г. на ежегодной конференции, организованной моей компанией, у меня состоялся разговор с сотрудником крупного клиента. Этот человек входил в команду, занимавшуюся сетями и инфраструктурой, – сфера, с которой я редко сталкиваюсь по роду своей деятельности. Несмотря на то что наши миры редко пересекались, нам обоим было интересно поговорить друг с другом. Но когда разговор зашел о проблемах его компании, он не согласился с моим мнением о том, что дело вовсе не в технологиях.
Собеседник сказал, что понял меня, но при этом отметил, что в его компании использовались устаревшие сетевые протоколы. Корпоративная сеть попросту не справлялась с новыми объемами больших данных и новыми аналитическими требованиями. Сеть задыхалась, и ее поддержание в рабочем состоянии стало для него ежедневным кошмаром. Он поинтересовался, считаю ли я, что и в данном случае технология не является главной проблемой.
Симптом или причина?
Распространенным симптомом проблем, связанных с фундаментальным процессом или политикой, является влияние этих проблем на сопряженные с ними технологии. Во многих случаях проблема кроется вовсе не в технологиях. Вы должны различать, в каких случаях технология действительно является причиной проблем, а в каких – всего лишь симптомом скрытой проблемы.
Тогда я спросил у собеседника, почему бы не внедрить в его компании продвинутые сетевые продукты, способные успешно обрабатывать потоки данных и удовлетворять аналитические потребности, с которыми не справлялась существующая сеть. Он признал такую возможность, но сказал, что не может модернизировать сеть, потому что ему не выделяют необходимого финансирования. Тем самым он только подтвердил мою точку зрения. Позвольте мне объясниться.
В этой конкретной ситуации технология не была главной проблемой, ведь необходимые технологические решения доступны на рынке. Проблема же заключалась в том, что команде моего собеседника никак не удавалось убедить руководство компании в необходимости внедрения этой технологии. Команда не могла добиться одобрения своего бизнес-кейса и выделения бюджета, потому что не была отмобилизована на реализацию проекта. Таким образом, хотя технологии были источником постоянной головной боли для его команды, но не они являлись главным источником проблем.
То же самое верно и при внедрении организациями операционной аналитики. В некоторых случаях будет казаться, что именно технология создает барьеры. В таких ситуациях я рекомендую вам посмотреть на ситуацию со стороны – действительно ли технология является причиной, а не симптомом проблем?
Компоненты будут добавляться, а не заменяться
Распространено заблуждение насчет того, что новые аналитические технологии полностью заменят проверенные временем технологии. Разумеется, это не так. В действительности по мере расширения потребностей в аналитике и развития имеющихся технологий компании будут добавлять новые компоненты в аналитическое окружение, а не заменять старые на новые.
Пожалуй, наиболее широко распространено ошибочное мнение о том, что Hadoop (или более широкий класс нереляционных инструментов, к которым принадлежит Hadoop) постепенно заменяет окружение реляционных баз данных. Hadoop – это проект с открытым исходным кодом, позволяющий разбивать крупные файлы на части и обрабатывать их параллельно. (Далее в этой главе мы рассмотрим технологию Hadoop подробнее.) В действительности же Hadoop наращивает реляционное окружение, и им обоим найдется место в аналитических структурах современных организаций.
Такая путаница проистекает главным образом из того факта, что сегодня практически 100 % компаний уже используют реляционную технологию. Соответственно по рынку гуляет множество историй о том, как компании «переходят на Hadoop». Однако выражение «переходят на Hadoop» неверно. Правильнее будет говорить, что компании «добавляют Hadoop». При ближайшем рассмотрении практически во всех случаях мы видим, что Hadoop добавляется к существующему окружению, но никак не все окружение мигрирует на Hadoop.
Путаница усугубляется тем фактом, что обратный сценарий встречается крайне редко. Крайне мало организаций используют только Hadoop без реляционного окружения, и эти редкие исключения сосредоточены в основном в Кремниевой долине. Таким образом, нечасто можно услышать о том, что пользователь Hadoop «переходит на реляционную модель» или «добавляет реляционную модель» к своему окружению.
Одна из крупнейших компаний, которая традиционно использовала только Hadoop и нереляционные подходы, – это Facebook. Как известно, Facebook всегда делала ставку на разработку в своих стенах собственных технологий и проприетарных систем. Действительно, Facebook разработала Hive, один из первых и ныне популярных компонентов языка структурированных запросов, доступный пользователям Hadoop. Тем не менее на конференции, организованной Институтом хранения данных (The Data Warehousing Institute, TDWI) в мае 2013 г., Facebook объявила о том, что добавляет к окружению Hadoop реляционный компонент{43}. Почему она это делает? Потому что команда Facebook поняла: реляционная технология исключительно хорошо решает некоторые из проблем, с которыми сталкивается компания. Facebook очень долго пыталась заставить Hadoop делать то, что платформа не предназначена делать. Комбинация технологий оказалась более разумной и позволила высвободить ресурсы для решения других задач.
Разные платформы – разные преимущества
На первый взгляд Hadoop кажется похожей на параллельные платформы реляционных баз данных. Несмотря на то что все они представляют собой механизм параллельной обработки, между ними существуют большие различия. Возможно, наиболее точную характеристику Hadoop дал один оборонный подрядчик из Вашингтона, округ Колумбия. (Комментарий был сделан на частном мероприятии и на условиях неразглашения, поэтому я не могу ничего конкретизировать.) На этом мероприятии группа экспертов обсуждала проблемы, с которыми сталкивались их организации, когда пытались сделать слишком много и слишком быстро при помощи таких новых платформ, как Hadoop.
Один из экспертов сообщил следующее: «Я понял, что Hadoop превосходно решает именно те задачи, для решения которых эта платформа и была создана за большие деньги такими компаниями, как Google и Yahoo! Если и у вас есть именно такие задачи, например соотнесение ключевых слов в поисковых запросах с содержанием веб-сайтов, тогда и для вас Hadoop станет феноменальной технологией. Если и другие задачи могут быть успешно решены при помощи этой парадигмы обработки, тогда Hadoop тоже окажется очень полезна. Однако существуют такие типы аналитики и обработки, для которых Hadoop совершенно неэффективна по сравнению с другими вариантами». Это вовсе не приговор Hadoop. В действительности ни одна технологическая платформа не может идеально подходить для всех видов обработки и всех ситуаций. У каждой платформы есть свои сильные и слабые стороны. Вот почему, как уже было сказано выше, организациям надо использовать разные технологические платформы и инструменты для разных типов аналитических процессов.
Если вы посмотрите, как работает Hadoop, то увидите, что она превосходно подходит для определенных типов вычислений. Например, таких, где при обработке и хранении данных изначально требуется масштабирование, о чем мы говорили во второй и четвертой главах. Но на момент написания книги Hadoop не предусматривала возможностей масштабирования до общекорпоративного уровня других параметров, таких как безопасность, параллелизм и управление рабочей нагрузкой. Hadoop также замечательно подходит для нетрадиционных типов данных, таких как аудио, видео или текст, которые не были отформатированы в пригодную для аналитики форму и все еще находятся в необработанном и неочищенном виде. Преимущество Hadoop в том, что она позволяет хранить данные без каких-либо ограничений по формату.
Задача, с которой массивно-параллельная реляционная платформа справляется лучше всего, – это работа с уже структурированными высокоценными данными, предназначенными для поддержки широкого круга пользователей и приложений, которые нуждаются в частом повторном использовании этих данных с гарантированной производительностью. Такое свойство реляционных технологий будет часто применяться при превращении традиционной аналитики в операционную.
Не сравнивайте яблоки с апельсинами
Разные аналитические платформы имеют свои сильные и слабые стороны, которые должны быть хорошо изучены и приняты во внимание при планировании аналитического окружения. Многие люди ошибочно полагают, что реляционные и нереляционные технологии, такие как Hadoop, эквивалентны, но на самом деле они не конкурируют, а дополняют друг друга. Сравнивать эти платформы – все равно что сравнивать яблоки с апельсинами.
На вебинаре под названием «Суммарная стоимость данных», состоявшемся в ноябре 2013 г., вице-президент Hortonworks (компании, которая специализируется на разработке и внедрении Hadoop, а также связанных с ней услуг) сделал очень важное заявление. Он сказал: «Мы не видим, чтобы кто-нибудь пытался использовать Hadoop для создания корпоративного хранилища данных [Enterprise Data Warehouse – EDW]. Это вопрос мощности, а не стоимости. Hadoop – это не EDW. Hadoop – это не база данных. Сравнивать эти две технологии с точки зрения рабочей нагрузки EDW – все равно что сравнивать яблоки с апельсинами. Я не знаю никого, кто бы пытался построить EDW в Hadoop». Эти слова никоим образом не принижают значение Hadoop, а просто подчеркивают ее предназначение для решения определенных задач. Точно так же можно сказать: «Я не знаю никого, кто бы пытался использовать реляционную технологию для обработки изображений».
Организации, решившие внедрить операционную аналитику, в конечном итоге придут к совместному использованию реляционных и нереляционных технологий. Когда мы далее в этой главе будем говорить об опорах аналитической архитектуры, то подробнее обсудим, как эти технологии могут совмещаться. Пока же вам надо понять: они не заменяют, а дополняют друг друга.
Делайте то, что нужно сейчас
Предположим, что во время летнего отпуска вы решили купить новый телевизор и стали изучать возможные варианты, чтобы выбрать наиболее подходящий. При этом узнаёте, что в начале весны в продаже появится новое поколение телевизоров с замечательными функциями. В результате вы решаете отложить покупку, чтобы весной приобрести новую модель. Но весной, когда эта модель появляется, узнаёте, что осенью ожидается выход еще более усовершенствованной модели. Так может продолжаться бесконечно. Пока вы откладываете покупку снова и снова, вам приходится довольствоваться устаревшим телевизором, не обладающим ни одной из новых функций. В конце концов вам придется решиться на покупку. То же самое верно и по отношению к аналитическим платформам и инструментам. Всегда будет ожидаться выход новых версий с улучшенными функциями. В определенный момент вам все же придется реализовать свой план. Иначе вы упустите все преимущества, как настоящие, так и будущие, которые могут стать доступными вашей организации.
Не застывайте в нерешительности
Не стоит откладывать модернизацию аналитического окружения в ожидании следующего пакета с функциями, который должен выйти «в ближайшее время». Новые функции всегда будут появляться в ближайшее время, поэтому выберите лучшее на данный момент и начните пожинать плоды. Время для новой модернизации наступит раньше, чем вы об этом узнаете.
Принимая во внимание постоянно меняющуюся перспективу, я настоятельно рекомендую вам не медлить с действиями, если только вы не ожидаете появления какой-либо конкретной функции, абсолютно необходимой для нужд вашего бизнеса сегодня. Если же будете постоянно откладывать решение, вашей организации придется пользоваться устаревшими платформами, не способными справиться с текущими потребностями бизнеса. Многие инструменты и технологии предусматривают возможность обновления до новых версий либо бесплатно, либо по льготной цене. Просто решите, насколько интенсивно ваша организация планирует модернизировать систему и заложите в смету соответствующие финансовые затраты и затраты труда. Также имейте в виду, что жизненный цикл инвестиций в технологии сегодня, как правило, составляет всего три – пять лет. Это значит, что не успеете вы оглянуться, как вам снова придется выбирать из разных вариантов.
Если у вас есть грамотный план, хорошие условия и утвержденный бюджет, спросите себя: «Могут ли какие-либо новые функции, появление которых ожидается в ближайшие несколько месяцев, радикально улучшить результаты?» Если могут, то измените график реализации проекта, чтобы воспользоваться преимуществами новых возможностей. Но при этом также учтите сопряженные с решением риски, поскольку в новом программном обеспечении всегда содержатся ошибки, да и выпуск его может быть отложен. Если же новые функции появятся позже, чем спустя несколько месяцев, ждать не имеет смысла. Откладывая решение из-за слухов о том, что может появиться в ближайшее время, вы никогда не выберетесь из замкнутого круга домысливания. Примите лучшее их возможных сегодня решений и обретите с ним счастье.
Построение
Итак, вы готовы к построению обновленного аналитического окружения. В этом разделе представлены некоторые новейшие подходы к процессу обновления вашего окружения. Мы рассмотрим различные технологии и способы их сочетания для того, чтобы помочь вашей организации превратить традиционную аналитику в операционную. Кроме того, как я рекомендовал в начале этой главы, обязательно изучите новейшие альтернативы, ставшие доступными на момент чтения книги.
Добро пожаловать в компьютинг на основе текстуры
На протяжении многих лет крупные организации стремились объединять наиболее ценные данные и аналитические процессы на единственной централизованной платформе, называемой корпоративным хранилищем данных (EDW). Эта большая реляционная база данных обычно использует параллельную платформу баз данных для достижения максимальной масштабируемости и производительности. Параллельные системы состоят из множества машин, которые соединены между собой таким образом, что данные предоставляются пользователю, как если бы система была одной большой машиной. На самом же деле данные в EDW хранятся не в одном месте, а распределены между множеством машин с одинаковой конфигурацией и соединенных друг с другом в высокопроизводительную сеть.
Создание традиционной системы EDW, функционирующей с точки зрения пользователя как единая машина, требует молниеносных соединений между входящими в нее машинами, а также сложного программного обеспечения для выполнения обработки. Такие соединения позволяют осуществлять масштабное перемещение данных, когда это необходимо (например, при объединении двух больших таблиц), и обеспечивают невероятно высокую скорость операций, когда перемещение данных не требуется. В отличие от этой концепции, которая объединяет машины с одинаковой конфигурацией, система на основе текстуры соединяет между собой различные типы платформ. Компьютинг на основе текстуры соединяет множество разных систем в одну большую логическую систему посредством высокоскоростных сетей, что позволяет любому компоненту взаимодействовать и обмениваться данными с любым другим компонентом текстуры. Многие люди приравнивают текстурный компьютинг к технологии Infiniband{44}, действующей гораздо быстрее, чем соединения в традиционных сетях. Однако эта сеть является всего лишь основой для аналитических процессов и соответствующего программного обеспечения по управлению процессами. На рис. 5.1 проиллюстрирована концепция построения компьютинга на основе текстуры.
В современных системах на основе текстуры машины с разными конфигурациями и разными базовыми платформами могут взаимодействовать между собой с молниеносной скоростью. Произвольное и частое перемещение массивных объемов данных по текстуре по-прежнему нежелательно, но очевидное преимущество состоит в том, что сейчас стало возможным достаточно быстро перемещать данные для удовлетворения важных потребностей без серьезного ухудшения производительности. С учетом строгих требований к производительности перемещение больших объемов данных в производственном или операционном окружении по-прежнему должно быть сведено к минимуму. Тем не менее в процессе обнаружения данных, когда производительность не так важна, применение текстуры обеспечивает безграничную эффективность и гибкость.
Единое аналитическое окружение уже на подходе
Компьютинг на основе текстуры развивается с целью удовлетворения сегодняшних потребностей в анализе больших объемов данных различного типа с использованием широкого разнообразия аналитических техник. Конечная цель – создать единое аналитическое окружение, где пользователи смогут всецело сосредоточиться на анализе данных, не думая о том, где эти данные находятся.
Превращение традиционной аналитики в операционную, особенно в эпоху больших данных, требует выбора концепции компьютинга на основе текстуры и создания единого аналитического окружения. Сегодня существует слишком много разных типов данных и различных аналитических потребностей для того, чтобы позволить единственной платформе управляться со всем, что касается скорости и масштаба. В едином аналитическом окружении пользователям будет не важно, какие конкретно технологии оно включает и где в текстуре физически находятся данные. Вместо этого они могут сосредоточиться на построении логики аналитического процесса. Давайте же посмотрим, как создать фундамент для будущего, которое начинается уже сегодня.
Три столпа единого аналитического окружения
Единое аналитическое окружение, способное выполнять операционную аналитику для организации, стоит на трех опорах:
1. Реляционная база данных: используется для развертывания операционной аналитики в масштабах всей организации с учетом широкого круга пользователей и приложений. Это рабочая лошадка, которая внедряет операционную аналитику в бизнес-процессы.
2. Технология обнаружения данных: используется с целью облегчить исследование данных любого типа и тестирования аналитических процессов любого типа. Позволяет организации быстро и эффективно находить в данных новые инсайты.
3. Нереляционная технология (обычно Hadoop): используется для сосредоточения и первичной обработки данных любого типа, поскольку не делает предположений относительно их структуры. Также используется для текущего хранения малоценных и/или редко используемых данных.
Чтобы понять, как эти опоры сочетаются друг с другом в едином аналитическом окружении (рис. 5.2), вы можете представить каждую технологию в виде специализированного мозга. В прошлом все три мозга были автономными и не соединенными между собой. Поэтому каждый мог воспользоваться преимуществами только своей узкой специализации. Компьютинг на основе текстуры объединяет их с целью создать один мозг со множеством специализированных компонентов, которые могут напрямую взаимодействовать между собой и поддерживать друг друга. Это очень похоже на то, как работает человеческий головной мозг. Разные отделы нашего мозга отвечают за разные действия, но все они интегрированы в единую систему, которая гораздо мощнее суммы отдельных ее компонентов. Аналогичным образом единое аналитическое окружение как целое обладает гораздо большим потенциалом, чем сумма его отдельных частей.
Далее мы обсудим каждый компонент более подробно. В добавление к трем несущим опорам можно использовать для специфических нужд по выбору некоторые вспомогательные технологии. К ним относятся обработка в памяти, инструменты на основе графического процессора, технологии для обработки сложных событий и встроенные аналитические библиотеки. Каждая из них будет рассмотрена ниже.
Реляционная опора
Практически все организации сегодня используют механизмы реляционной базы данных для управления данными, предназначенными для поддержки корпоративных приложений. Большинство крупных организаций внедрило массивно-параллельный механизм базы данных, чтобы гарантировать предельную масштабируемость, которую такой механизм может придать аналитическим процессам. Компании, предлагающие предприятиям параллельное пространство для баз данных, включают в том числе Teradata, IBM и Oracle. На протяжении ряда лет реляционная технология была стандартным способом хранения данных и выполнения отчетов и аналитики на основе этих данных. Поскольку из трех опор реляционная технология является наиболее распространенной и понятной, мы рассмотрим ее вкратце.
Очень распространено заблуждение, будто загружать в реляционную базу можно только данные в сложноструктурированном формате, полностью и формально определенные. Несмотря на то что во многих организациях действуют правила, требующие приведения данных к формальной модели и структуре перед загрузкой, на самом деле реляционная технология этого не требует. Изображения или аудио плохо подходят для реляционной системы, а вот сенсорные данные и блоги вполне можно использовать, пусть и с небольшими дополнительными усилиями. Многие поставщики реляционных баз данных сегодня обеспечивают прямую поддержку расширяемого языка разметки Extensible Markup Language (XML), а некоторые недавно начали поддерживать и текстовый формат обмена данными JavaScript Object Notation (JSON). Поддержка этих форматов позволяет, в частности, загружать исходные сенсорные данные и делать запросы к ним напрямую, не прибегая к дополнительным манипуляциям.
Единый мозг со специализированными подсистемами
Единое аналитическое окружение на основе текстуры будет функционировать как единый мозг с несколькими специализированными подсистемами. При таком способе интеграции различных технологий единое целое будет обладать гораздо большим потенциалом, чем его отдельные компоненты, – точно так же, как это происходит в случае человеческого головного мозга.
Оба формата XML и JSON имеют структуру, но она далеко не такая чистая, четко определенная и неизменная, как в традиционных форматах, таких как файлы фиксированной ширины или файлы с разделителями. Форматы XML и JSON часто называют слабоструктурированными. Извлечение информации из данных, представленных в таких форматах, требует некоторых дополнительных усилий, но зато придает необходимую гибкость. На рис. 5.3 приведен пример файла JSON. При взгляде на него легко понять, что означает каждый элемент данных, однако этот формат не очень удобен, когда дело доходит до написания кода для анализа данных и извлечения отдельных полей.
Большое преимущество реляционных технологий корпоративного класса состоит в том, что они позволяют не только масштабировать объем данных и мощность обработки, но и надежно управлять ресурсами, чтобы справиться с широким разнообразием требований, предъявляемых к данным в крупной организации. Это важно, поскольку наряду с операционной аналитикой в режиме реального времени нужно будет осуществлять масштабную пакетную обработку, выполнять запросы для создания отчетности и многое другое. Без управления ресурсами такая смешанная рабочая нагрузка создаст серьезную проблему.
Концепцию смешанной рабочей нагрузки можно представить в виде транспортного затора, когда грузовики, легковые автомобили, мотоциклы, спецмашины, фургоны и т. д. соперничают между собой за полосы движения. В базах данных вместо разных типов транспортных средств поступают запросы разных типов, разных размеров и с разными приоритетами. Если не регулировать потоки этих запросов, система перестанет с ними справляться и возникнет «пробка». В то же время надежная подсистема управления ресурсами организует все запросы по их приоритетности и объему ресурсов: выделяются полосы для спецтранспорта, платные полосы для тех, кто нуждается в привилегиях, и т. п. В результате каждому предоставляются наилучшие условия. Хорошая подсистема управления ресурсами позволяет многим пользователям и процессам эффективно использовать систему совместно.
Главная опора операционной аналитики
Реляционная опора обычно является лучшим местом для развертывания операционной аналитики. С учетом ее масштабируемости по всем необходимым параметрам, а также ее способности легко интегрироваться почти со всеми корпоративными приложениями реляционная технология играет важную роль в превращении традиционной аналитики в операционную.
Реляционные технологии корпоративного класса поддерживают массовый параллелизм и обладают возможностями по обеспечению строгой безопасности. Другими словами, системы могут жестко контролировать, кто и к каким данным имеет доступ, а также позволяют многим пользователям одновременно получать доступ к одним и тем же данным. Другие преимущества реляционных систем: доступность, надежность, восстанавливаемость и управляемость. Эти свойства приобретают важнейшее значение, когда, скажем, сотни сотрудников колл-центра плюс тысячи сотрудников на местах, плюс тысячи сотрудников в штаб-квартире нуждаются в доступе к одной и той же информации. Большинство приложений, которые сегодня используются крупными организациями, предназначены для работы с реляционным сервером баз данных, что еще повышает привлекательность реляционных технологий и легкость их интеграции.
Подведем итог: именно на реляционной опоре организации обычно стремятся развернуть операционно-аналитические процессы. Именно на реляционную технологию, благодаря ее возможностям масштабирования, опирается организация, когда наступает время превратить традиционную аналитику в операционную.
Опора для обнаружения данных
В последнее время немало внимания на рынке привлекает идея добавления к единому аналитическому окружению платформы для обнаружения данных. Обнаружение данных не является новой концепцией как таковой, и большинство организаций уже имеют для этого то или иное окружение. Классическое автономное окружение, в котором специалисты-аналитики годами разрабатывали новые виды аналитики, также является формой для обнаружения данных. Отличие состоит в том, что классическое аналитическое окружение редко когда интегрируется с другими корпоративными системами и, как правило, не масштабируется. Настало время оставить эти устаревшие архитектуры в прошлом. Сегодня для процессов обнаружения данных часто используются такие инструменты, как SAS, IBM SPSS и R. Каждый из них может быть использован в рамках интегрированной платформы для обнаружения данных, а не только в рамках автономного окружения.
Следует заметить, что не так давно изменился способ применения аналитических инструментов. Они гораздо плотнее интегрируются с масштабируемыми платформами, которые являются частью корпоративного аналитического окружения. И реляционные технологии, и Hadoop позволяют перейти от автономного изолированного обнаружения данных к платформам для обнаружения данных. Эти платформы являются частью единого корпоративного аналитического окружения.
Платформы для обнаружения данных выходят за пределы аналитической «песочницы» – изолированной программной среды, которая давно уже встраивалась в другие платформы. Аналитическая «песочница» производит логическое разделение большой операционной системы, что дает специалистам-аналитикам возможность не только запрашивать, но и загружать и создавать данные. Она позволяет осуществлять быстрое исследование и моделирование аналитических процессов в нужном масштабе благодаря использованию самых масштабируемых платформ, которые только есть у организации. Недавно такие «песочницы» стали очень популярны в окружении хранилищ реляционных данных. Хотя окружение для обнаружения данных также может содержать аналитические «песочницы», но оно представляет собой нечто большее.
Сегодня платформы для обнаружения данных, которые являются второй опорой единого аналитического окружения, позволяют смешивание и сопоставление всех типов данных, как структурированных, так и нет. Такая платформа должна поддерживать и реляционную, и нереляционную обработку. Она также должна поддерживать практически любой вид аналитической методологии или подхода. Это означает, что она должна поддерживать не только традиционные методы статистики и прогнозирования, но и текстовый анализ (имейлов, документов и т. д.), анализ объектных графов (взаимных связей между людьми, местностями или объектами), геопространственный анализ (пространственных отношений) и многое другое. На рис. 5.4 проиллюстрировано, как платформа для обнаружения данных комбинирует и упрощает обработку аналитики.
Важная особенность окружения для поиска данных – здесь действуют крайне слабые правила и ограничения. Такие платформы для обнаружения данных, как Teradata Aster и Pivotal Greenplum, не только предоставляют собственные аналитические алгоритмы, но и поддерживают использование общих аналитических инструментов, таких как SAS, SPSS или R. Они также идеально подходят для применения в инновационных центрах{45}. Поисковая платформа может быть встроена или нет в окончательный операционно-аналитический процесс. Разумеется, она используется для обнаружения и определения аналитического процесса, который стоит внедрения. Но как только детализированная аналитическая логика, необходимая для выполнения поиска, определена, ее можно встраивать в процесс обработки напрямую, без использования поисковой платформы. Это происходит благодаря тому, что зачастую можно существенно упростить и оптимизировать аналитический процесс при переходе от фазы обнаружения к фазе обработки. Подробнее об этом мы поговорим в шестой главе.
Ищите инсайты быстрее, чем производите обработку
Поисковая платформа должна быть гибкой и дружественной к пользователям, чтобы ускорить процесс поиска новых инсайтов. Ее необходимо оценивать по другим критериям, чем операционные платформы, например по времени инсайта. Скорость обработки и масштабируемость не так важны для процесса обнаружения данных, как гибкость и простота использования.
В некоторых случаях для поиска данных можно использовать реляционные и нереляционные платформы без добавления отдельной платформы. При этом важно располагать окружением, предназначенным для обнаружения данных. Независимо от того, как она применяется, поисковая платформа должна быть конфигурирована иначе, чем операционные системы. Попытка вести поиск в рамках типичной операционной системы с ее ограничениями – заведомо проигрышный подход. Процесс поиска нуждается в гибкости, чтобы пересчитывать данные, изменять по желанию их расположение, тасовать их и проводить с ними многочисленные эксперименты. В условиях, когда необходимо соблюдать правила операционных процессов, такая свобода попросту невозможна. Ее обеспечивает окружение для поиска данных.
Другой важный момент состоит в том, что поисковая платформа позволяет как можно быстрее найти новые инсайты. Такую платформу не нацеливают на обеспечение максимальной производительности или масштабируемости, хотя это будет не лишним. Производительность и масштабируемость важны для операционного процесса, но далеко не так важны для поискового процесса. Важнее всего при создании моделей и исследовании новой аналитики как можно быстрее провести эксперимент полного цикла. Это возвращает нас к концепции времени инсайта, о которой мы говорили в четвертой главе. Время на программирование и тестирование нового процесса может намного превысить время обработки, необходимое для выполнения программы, вот почему так важно располагать поисковым окружением, позволяющим легко комбинировать данные, управлять алгоритмами и подтверждать новый инсайт. А об операционной производительности и масштабируемости следует беспокоиться уже после того, как вы обнаружили нечто и доказали, что работа с ним стоит усилий. Более подробно об этом мы поговорим в шестой главе.
Нереляционная опора
Сегодня на рынке доступно широкое разнообразие нереляционных платформ. Hadoop быстро стала среди них самой популярной, а в аналитическом окружении – постоянным его компонентом. Нереляционные платформы не требуют, чтобы данные хранились в каком-либо конкретном формате, и наряду с базовым языком SQL используют различные языки программирования для взаимодействия с данными. Hadoop приобрела популярность благодаря своей способности работать с неструктурированными или слабоструктурированными данными, настолько распространившимися в мире больших данных. В действительности все данные имеют какую-либо структуру. Неструктурированными обычно называют данные, находящиеся в сложных форматах, которые не так легко конвертировать в пригодную для аналитики форму. Например, это текстовые, видео– и аудиофайлы. Другой распространенный тип – это слабоструктурированные данные, находящиеся посредине между структурированными и неструктурированными данными. Примеры включают многие журнальные файлы, такие как блоги, сенсорные данные или данные в формате JSON, о чем мы говорили выше в этой главе. Слабоструктурированные данные имеют определенные величины, но необязательно в установленном порядке или простом формате.
Hadoop особенно хорошо справляется с такими типами данных. Имея открытый исходный код и потому будучи бесплатной, Hadoop также позволяет свободно экспериментировать при небольших затратах. Кроме того, такие поставщики, как Cloudera, Hortonworks и MapR, предлагают коммерческие версии Hadoop, а Teradata, IBM и Oracle – приложения к Hadoop. Все эти предложения добавляют ценные свойства к открытому исходному коду.
Между Hadoop и реляционной технологией существует ряд важных отличий, связанных с тем, что для загрузки файлов с данными на эту платформу требуется только разместить их в файловой системе. Причем для загрузки не требуются никакие специфические форматы или структуры данных. Поскольку Hadoop не имеет никаких установок касательно хранимых файлов с данными, то она не предусматривает и никаких особых способов обращения с тем или иным типом данных.
Отсутствие требований к формату означает, что на эту платформу можно загружать тексты, фото, изображения, данные журнала событий, сенсорные данные или данные любого другого типа по мере их поступления, а затем обрабатывать их в параллельном режиме. В этом и состоит отличие от реляционной технологии, для которой данные по умолчанию должны быть представлены в виде таблиц. Несмотря на то что данные с такой реляционной структурой могут быть помещены в Hadoop, работа с ними – не самая сильная сторона этой платформы. На деле же, когда необходимы стандартные реляционные операции, работать с Hadoop будет гораздо сложнее и медленнее, чем с реляционной технологией корпоративного класса. Причина в том, что стандартные базы данных имеют все необходимые инструменты и функции, предназначенные для работы с реляционными данными, а Hadoop – нет. Hadoop предлагает бóльшую гибкость в отношении формата данных, но за счет утраты специализированных функций для обращения с конкретным форматом.
Одна из причин использовать Hadoop заключается в том, что данные неравноценны по своей природе. Например, данные об операциях по текущим банковским счетам отражают реальный факт перемещения денег, тогда как пост на Twitter – всего лишь чье-то мнение. Твиты далеко не так ценны, как сведения о финансовых транзакциях, поэтому нет смысла хранить их в дорогостоящей системе, где они скорее всего редко будут использоваться. Hadoop же позволяет организациям хранить малоценные данные на тот случай, если вдруг они пригодятся. Также в ней можно хранить необработанные лог-файлы, из которых извлечены фрагменты с важной информацией. Благодаря архивированию необработанных файлов в Hadoop всегда можно вернуться к ним позже и извлечь из них дополнительную информацию, если в ней возникнет необходимость. Использование Hadoop для целей архивирования похоже на непрерывное резервное копирование файлов с последующим легким к ним доступом – вместо неудобной заправки ленты. Наконец, архивирование необработанных данных может очень пригодиться в случае аудиторских проверок или возникновения юридических вопросов.
Hadoop можно сравнить с аффинажным заводом по переработке железорудного сырья. Здесь скальную породу, содержащую руду, загружают в плавильную печь, где породу перемалывают, нагревают и переплавляют в железные слитки, отделяя отходы. Hadoop работает точно так же: собирает большие объемы твитов, перерабатывает их при помощи инструментов текстового анализа и выплавляет из терабайтов мнений гораздо меньшие по размеру (и гораздо более ценные!) подборки информации, скажем, о покупательских предпочтениях или трендах. Затем эти железные слитки (аналитические результаты) передаются в производственную систему (реляционное окружение), где им придается еще большая ценность в виде металлопроката, балок и другой готовой продукции. Сегодня, благодаря низкой стоимости хранения малоценных данных, можно хранить гораздо бо́льшие объемы, чем в прошлом.
Hadoop становится первоначальным хранилищем для многих источников данных. Кроме того, она может быть использована для очистки и обработки данных, как было описано выше, чтобы сделать их пригодными для дальнейшего применения в аналитических целях. Например, текстовые данные из имейлов, отзывов клиентов или постов в социальных сетях не очень полезны в необработанном формате. Чтобы извлечь из таких текстовых данных полезную информацию, к ним необходимо применить алгоритмы текстового анализа. Скажем, ценная информация включает знание того, кто разместил пост в социальных сетях, является ли его тональность положительной, о каких продуктах идет речь и т. д. Hadoop идеально подходит для процессов, предназначенных извлекать такую информацию из текста, поскольку она позволяет осуществлять параллельный анализ текста. Затем уже структурированные данные, извлеченные из текста, можно включать в аналитический процесс.
Среди недостатков Hadoop – потребность тщательно следить за тем, чтобы при программировании в параллельном окружении создавался правильный ответ. Многие выкладки, которые просты для выполнения в однопотоковом окружении, требуют совершенно другого подхода в параллельных системах. Существуют два типа параллелизма: на уровне узлов или исполняемых модулей и на уровне системы. Параллелизм на уровне узлов заключается в простом выполнении одной и той же программы на каждом узле. Узлы не взаимодействуют между собой и не обмениваются информацией. Гораздо сложнее параллелизм на уровне системы, поскольку он предполагает координацию работы всех узлов и обмен информацией между ними для получения правильного результата. Таким образом, программисты должны быть внимательны при написании программы, с тем чтобы она соответствовала уровню параллелизма, который требуется для выполнения данной задачи.
Любые данные, в любом формате, любого объема
Способность Hadoop работать с любыми объемами данных в любом формате делает ее важной опорой единого аналитического окружения.
Например, вы не можете получить среднее значение, применяя процесс на уровне узлов или исполняемого модуля, поскольку каждый модуль сначала вычислит среднее значение на основе имеющихся у него данных, а затем сообщит вам свое среднее значение. Но, как вы помните из курса введения в статистику, вычисление среднего значения из средних значений не даст вам искомого правильного ответа. Вам нужно подсчитать общую сумму, чтобы затем вычислить общее среднее значение. (В качестве иллюстрации см. рис. 5.5 и 5.6.) Для обеспечения точности вычислений в Hadoop программисты должны заложить в программу надлежащий уровень параллелизма. В противоположность этому параллельное реляционное окружение построено таким образом, что параллелизм на уровне системы является в ней стандартом.
Сегодня на рынок приходят пакеты, дополняющие Hadoop синтаксисом наподобие SQL или даже методологией извлечения данных. Однако эти варианты все еще не являются настолько надежными, чтобы удовлетворять требованиям крупных организаций. Это возвращает нас к необходимости использовать каждую платформу в соответствии с ее назначением. Как указывалось в четвертой главе, с некоторыми задачами Hadoop справляется лучше других опций, но есть и задачи, где она проявляет себя неважно.
Как узнать, какой тип обработки подходит для Hadoop? Простейший тест должен определить: могут или нет ваши вычисления осуществляться параллельно и независимо друг от друга на отдельных узлах? Если независимая обработка подмножества данных каждого исполняемого модуля даст вам такой же ответ, как и обработка всего массива данных в одной большой системе, то Hadoop подойдет для таких вычислений. На рис. 5.5 и 5.6 проиллюстрированы примеры неправильного и правильного ее применения. Если же вы хотите узнать средний объем продаж по каждому отдельному потребителю, ответ будет правильным при условии, что все данные по каждому потребителю хранятся в одном модуле. Но если для получения ответа требуется передача данных между модулями, то, чтобы получить такой же ответ, как если бы все данные обрабатывались разом, Hadoop придется очень постараться. Разумеется, я чрезмерно упрощаю ситуацию, из которой имеются свои исключения, но эта рекомендация во многих случаях поможет вам выбрать правильное направление.
Еще один способ определить, насколько Hadoop подходит для управления алгоритмом, – это узнать, какого типа обработки, последовательной или непоследовательной, требует алгоритм. В реляционных системах SQL получает отвечающий комплект и шаги для прохождения каждой колонки цифр по маршруту, применяя к каждой записи заданные функции. SQL плохо справляется с задачами, когда для обработки необходимо перепрыгивать от колонки к колонке и от итерации к итерации (часто на основе результатов предыдущей итерации). Hadoop же использует такие языки программирования, как Java, Python или C++, которые лучше подходят для сложного управления данными, поскольку в этом случае не требуется последовательной построчной обработки.
Одна из интересных особенностей, связанных с использованием в Hadoop языков C++, Java и Python, состоит в том, что Hadoop не столько создает новые функции, сколько расширяет возможности масштабирования существующей функциональности. Любая программа, написанная сегодня на Java для Hadoop, могла быть написана несколько лет назад и реализована в традиционной однопоточной системе. Пусть используемый язык и не нов, зато ново окружение, где он применяется, что в огромной степени масштабирует применение Java.
Подведем итог: Hadoop в ее нынешнем виде лучше всего подходит для начального хранения данных из крупных источников и для начальных уточнения и обработки этих данных. Также Hadoop стоит использовать для хранения малоценных или нечасто используемых данных. Наконец, Hadoop замечательно подходит для архивирования. Однако в ближайшем будущем большинство организаций редко когда смогут использовать Hadoop для поддержки операционно-аналитических процессов в режиме реального времени.
Вспомогательные технологии
Вспомогательные технологии могут быть добавлены к единому аналитическому окружению с целью поддержки его опор. Эти вспомогательные технологии предназначены для специфических типов обработки или аналитики, являются гораздо более специализированными и применимы только в определенных случаях. Технологии, которые мы рассмотрим в этом разделе, будут продолжать развиваться, и со временем их список может расшириться. Также вполне возможно, что предлагаемая этими технологиями функциональность в конечном итоге будет встроена в одну или несколько опор и добавления вспомогательных компонентов не потребуется. Давайте рассмотрим некоторые из наиболее распространенных вспомогательных технологий по состоянию на начало 2014 г.
Технологии аналитики в памяти
Технологии аналитики в памяти загружают данные непосредственно в большой пул памяти, а затем приводят в действие сложные алгоритмы. Такие технологии стоят дорого ввиду необходимости иметь большой объем памяти, зато их производительность невероятно высока. Подход «вычисления в памяти» особенно эффективен в тех случаях, когда необходимо продолжать выстраивать и перестраивать большое количество сложных моделей. SAS предлагает устройство для аналитики в памяти вместе с несколькими различными платформами.
Сегодня распространено применение аналитики в памяти к моделям оценки риска в крупных финансовых учреждениях – им может требоваться обновление моделей риска для тысяч разных сценариев и ценных бумаг по крайней мере на ежедневной основе при принятии решений об инвестициях и хеджировании рисков.
Устройства на основе графических процессоров
Устройства на основе графических процессоров (Graphics Processing Units, GPU) предназначены для решения другого типа задач, нежели устройства для аналитики в памяти. Индивидуальный GPU поддерживает масштабную вычислительную обработку, но не обязательно работу с большими массивами данных. При применении GPU к аналитическим процессам заимствуется технология, изначально разработанная для создания сложной компьютерной графики на персональных компьютерах. GPU управляют монитором ПК путем применения сотен и даже тысяч слабых процессоров к массиву данных. Обработка миллионов пикселей для видеоигры требует огромной параллельной обработки. Хотя GPU уступают в скорости и надежности серийным микропроцессорам, они могут быть использованы для сжатия математических данных. Устройства на основе GPU предлагает, например, компания Fuzzy Logix.
Среди областей применения обработки с помощью GPU – моделирование методом Монте-Карло, когда исследуются миллионы и даже миллиарды возможных сценариев. Люди часто прибегают к моделированию методом Монте-Карло (хотя и не в масштабе, требующем применения GPU) при планировании выхода на пенсию. При оценке пенсионных накоплений различные показатели, такие как ставки доходности и темпы инфляции, пропускаются через широкий спектр возможных ставок, чтобы определить, сколько денег будет накоплено к указанной дате выхода на пенсию. По завершении моделирования подводится итог: сколько сценариев приведут к успеху и сколько к провалу.
Поскольку каждый из различных факторов варьируется в широком спектре возможных ставок, то для этого требуется большое количество вычислений. GPU хорошо справляются с такого рода сценариями в производственном масштабе. Вместо простого применения метода Монте-Карло к пенсионным накоплениям финансовые учреждения используют его для очень сложного моделирования рисков в текущем режиме. Так что в ближайшие годы можно ожидать более частого применения GPU в аналитике.
Дополнительная поддержка доступна
Вспомогательные технологии, предназначенные для решения конкретных задач, помогают организации при превращении традиционной аналитики в операционную. Со временем функционал этих технологий может быть включен в основные опоры аналитического окружения. Но пока этого не произошло, пробел может быть заполнен специализированными устройствами или продуктами на основе программного обеспечения.
Технологии для обработки сложных событий
Обработка сложных событий (Complex Event Processing, CEP) используется для анализа потоковых данных в режиме реального времени. CEP следует подходу, отличающемуся от используемых в традиционных аналитических процессах. При обработке потока данных по технологии CEP цель состоит не в соотнесении их с другими данными организации, а в определении того, что происходит прямо сейчас в потоке данных, с целью выявить сигналы, которые требуют немедленного реагирования. Требуемые для CEP обработка данных и управление ими отличаются от типичных аналитических процессов и нуждаются в несколько иных технологиях.
Одно из ключевых отличий между CEP и другими видами аналитики состоит в том, что CEP буквально рассматривает данные еще даже до того, как они помещаются в хранилище. Другими словами, процессы CEP применяется к данным во время их перемещения из источника к месту хранения. Это позволяет максимально быстро реагировать на сигналы, как только они появляются в данных. Среди поставщиков в этой области можно назвать компании TIBCO и Informatica.
CEP может быть использована, например, для выявления мошеннических действий на веб-сайте во время их развертывания, не дожидаясь выполнения других процессов, идентифицирующих мошенничество. Также она может быть использована для мониторинга данных, поступающих с датчиков двигателя, чтобы максимально быстро выявлять ранние признаки проблем. CEP не заменяет, а дополняет типичные аналитические процессы. С учетом природы CEP ее обычно применяют в высокодинамичном окружении.
Встроенные аналитические библиотеки
Набирает популярность тренд встраивать в реляционные или нереляционные платформы аналитические алгоритмы с тем, чтобы их можно было легко добавлять в аналитические процессы. В отличие от ситуации всего несколько лет назад, сегодня появилась возможность встраивать непосредственно в процессы и приложения даже алгоритмы статистического моделирования, прогнозирования и машинного обучения.
Встроенные аналитические библиотеки помогают реализовать потенциал операционной аналитики благодаря тому, что обеспечивают доступ к аналитическим функциям независимо от пользовательского интерфейса или конкретного приложения. Другими словами, не нужно использовать аналитический инструмент в качестве части процесса, поскольку платформа может непосредственно выполнять аналитику. Недостатком таких встроенных функций является то, что они не снабжаются пользовательским интерфейсом. Это просто функции, что означает: выходные данные будут представляться в виде таблиц или файлов, а не красиво отформатированных отчетов. Выходные данные, создаваемые таким образом, хорошо подходят для использования в других приложениях и процессах, но работать с ними нелегко. Программный продукт, доступный для использования на разных платформах, предлагает компания Fuzzy Logix.
Аналитический инструмент или платформа?
По мере того как аналитические функции все глубже интегрируются в аналитические платформы, границы между инструментами и платформами размываются. Когда алгоритмы выполняются полностью в рамках платформы посредством встроенной функции, это позволяет обеспечить максимальное масштабирование.
Я думаю, что в будущем специалисты-аналитики будут использовать традиционные аналитические инструменты с графическими пользовательскими интерфейсами для обнаружения данных, разработки и тестирования аналитических процессов. Определив, какие процессы должны быть переведены в разряд операционных, они затем переключатся на использование встроенных алгоритмических функций для операционализации этих процессов. Со встроенными функциями не так легко работать, как с пользовательскими интерфейсами, но когда пользователи точно знают, что должно быть включено в окончательный аналитический процесс, функции не потребуют много дополнительной работы. Такой подход позволяет использовать гибкий и дружественный к пользователям набор инструментов для обнаружения данных и развития процессов, а также использовать преимущества встроенных родных функций для применения в производственном масштабе.
Использование
Теперь, когда мы определили основные компоненты единого аналитического окружения предприятия, давайте рассмотрим несколько важных тем, связанных с максимизацией выгод, которые обеспечивает окружение.
Любой анализ любых данных в любое время
Вашей целью должно быть создание единого аналитического окружения, которое позволит осуществлять анализ данных любого типа и объема посредством любого аналитического метода в любое время. Именно так. Крайне важна способность анализировать текстовые данные, генерировать социальные графы, прогнозировать реакцию, а затем объединять эти результаты с историей клиента и другой информацией. Однако добавление многочисленных опор имеет смысл только в том случае, если организация планирует использовать эти опоры. Некоторые организации с минимальными потребностями в аналитике какое-то время могут обойтись одной опорой. В то же время большинство крупных организаций найдут необходимым использовать многочисленные опоры вкупе со вспомогательными технологиями.
Решение о добавлении компонентов в аналитическое окружение должно быть основано на анализе затрат и доходов, который принимает во внимание, сколько данных потребуется дублировать на новую платформу, сколько будет стоить синхронизация данных и обучение пользователей новым навыкам, обладает ли новая платформа необходимыми характеристиками для операционного масштабирования и многое другое. Бежать покупать новейшую сверкающую игрушку только потому, что она появилась в продаже, – пустая затея.
После того как опоры будут установлены на место, уже не составит труда оптимизировать их использование и распространить данные и аналитические процессы в масштабах всего аналитического окружения организации. Самая большая проблема состоит в том, чтобы обосновать необходимость добавления новый опоры или вспомогательной технологии в аналитическое окружение (подробнее об этом в четвертой главе). Причина очевидна: гораздо дешевле использовать нечто, уже занявшее свое место, чем ставить на это место нечто новое.
Таким образом, для того чтобы организация смогла осуществлять любой необходимый ей анализ данных любого типа и в любое время, она должна сначала установить на свое место опоры. Стоит проводить периодический (возможно, ежегодный) обзор базовых опор или вспомогательных технологий, которые организация еще не внедрила. Возможно, в ходе очередного обзора вы придете к выводу о необходимости разработки бизнес-кейса с целью добавления недостающего компонента в окружение. Если потребности организации в операционной аналитике понуждают к установке новой опоры, организации следует ее добавить, поскольку это увеличит гибкость и функциональность при построении аналитических процессов.
Конечных пользователей не должно волновать, где хранятся данные
Суть в том, что конечных пользователей, будь то профессиональные аналитики или пользователи традиционной бизнес-аналитики, менее всего волнует, где хранятся данные, потребные им для анализа. Пользователям нужен свободный доступ к данным и возможность создавать и реализовывать любые необходимые им аналитические процессы с максимальной легкостью и с достаточной производительностью{46}. Например, подборки сведений о клиентах, таких как демографические данные, представлены в виде таблиц в реляционном окружении или в виде файлов в нереляционном окружении? Пользователям это безразлично, были бы обеспечены доступ, свободное использование и производительность, желаемые пользователями.
Сосредоточьтесь на том, чего желают пользователи
Пользователям безразлично, где хранятся данные или на каких опорах выполняется аналитика. Им просто нужен доступ к любым данным для любого вида анализа в любое время. Чем меньше пользователи вынуждены думать о физических местах хранения и анализа данных, тем эффективнее они могут действовать.
Поставщики сейчас усиленно работают над тем, чтобы сделать несоизмеримые опоры единого аналитического окружения тесно интегрированными, если не практически прозрачными для пользователей. Они встраивают в них коннекторы, которые позволяют пользователям, работающим на одной платформе, получать свободный доступ к данным на другой платформе. Благодаря этому пользователи могут сосредоточиться на логике аналитического процесса, не беспокоясь о том, где физически находятся данные. На практике это означает, что работающий в реляционной среде пользователь может видеть данные в виде таблицы, тогда как на самом деле они хранятся в виде файла в нереляционной среде. Когда поступает запрос на эти данные, они извлекаются из нереляционного хранилища и передаются на реляционную платформу для обработки запроса. Пользователи не знают о происходящем, да им оно и не важно, пока поддерживается производительность. Если же производительность страдает, системные администраторы могут перенести данные из файла, хранящегося в нереляционном окружении, в реляционную таблицу, чтобы не требовалось осуществлять преобразование данных. И, наоборот, данные из реляционной таблицы могут быть перемещены в нереляционный файл, если общие требования к обработке обусловливают это место как лучшее для хранения данных. В общем, любую часть данных можно разместить на хранение туда, где они будут наиболее пригодны для использования.
При выборе решений для корпоративной аналитической среды важно оценивать как текущие возможности, так и долгосрочные планы поставщиков по добавлению продуктов к единому аналитическому окружению. С одной стороны, не нужно откладывать решение в ожидании следующего поколения продуктов с незначительной дополнительной функциональностью. С другой стороны, не стоит игнорировать долгосрочные дорожные карты продуктов, которые вы планируете приобрести. Технологии меняются быстро, и разные поставщики могут идти разными путями. Вы можете найти двух поставщиков с эквивалентными предложениями для удовлетворения ваших сегодняшних потребностей, но их дорожные карты могут существенно разниться, так что в перспективе один из них способен значительно превзойти другого.
Как насчет облака?
Читатели, безусловно, знакомы с концепцией облака и облачных архитектур, поэтому я не стану давать здесь базовых определений, а остановлюсь на нескольких ключевых моментах, важных в контексте нашего разговора об операционной аналитике. Меня часто спрашивают по поводу использования облака для аналитических процессов, как операционных, так и неоперационных. Чтобы ответить на этот вопрос, важно провести различие между облачными архитектурами и облачными услугами.
Организации могут внедрить облачную архитектуру на собственном оборудовании под защитой своих брандмауэров. Это частное облако позволит обеспечить эффективное совместное использование ресурсов без какого-либо внешнего вмешательства и потери контроля над данными. Другой вариант – аренда пространства на общедоступном облаке у внешнего поставщика облачных услуг. В этом случае организация платит поставщику только за используемые ею оборудование и ресурсы (включая маржу прибыли для поставщика).
Для малого бизнеса или исследователей, которые обычно используют лишь небольшую часть ресурсов сервера, общедоступное облако может быть очень выгодным вариантом, даже несмотря на надбавку к цене со стороны поставщика. У крупных же организаций, использующих большие данные и операционную аналитику, обычно так много пользователей, использующих так много данных, что общедоступное облако в конечном счете может обойтись им гораздо дороже, чем частное. Например, если организация использует вычислительную мощность 20 серверов практически беспрерывно, то аренда ресурсов обойдется ей намного дороже, чем владение собственными. Кроме того, использование общедоступного облака для уязвимых данных поднимает вопросы, связанные с безопасностью и соблюдением конфиденциальности. Эти вопросы могут носить правовой характер или же касаться восприятия: так, многие потребители могут чувствовать себя некомфортно, если компания будет хранить их персональные данные на общедоступном облаке.
Использовать облако или нет?
Частное облачное окружение – это чрезвычайно мощная и экономически эффективная архитектура, к которой прибегнут многие организации. Общедоступные облака могут оказаться дорогостоящими для крупных организаций, поэтому вряд ли будут широко использоваться для целей операционной аналитики, как это сегодня рекламируется на рынке. Все опоры и вспомогательные технологии, рассмотренные нами в этой главе, могут работать в облачной архитектуре.
Сегодня многие поставщики предлагают аналитику в виде сервисных пакетов на базе общедоступного облака. Эти приложения позволяют пользователям создавать и осуществлять аналитические процессы с помощью инструментов, которые предлагаются по подписке или на основе платы по мере пользования. Многие, но не все, аналитические сервисные продукты могут быть юридически закреплены за организацией и присоединены к частному облаку. Прежде чем тратить время на оценку конкретного аналитического метода в качестве сервисного продукта, убедитесь в том, что он подходит для вашего запланированного окружения. Например, если вашей организации не разрешено использовать общедоступные облака, вряд ли имеет смысл рассматривать продукты, доступные только там.
Частное и безопасное облачное окружение способно обеспечить гибкость, необходимую для превращения аналитики в операционную, а также хорошую рентабельность. Вместо того чтобы иметь на 15 отделов один сервер, который к тому же часто простаивает или недостаточно используется, можно иметь пять серверов, которые с лихвой удовлетворят потребности всех отделов. Это позволит снизить затраты на обслуживание и административные накладные расходы. В ближайшие несколько лет внутренние частные облачные архитектуры получат широкое распространение повсеместно и будут применяться для поддержки многих операционно-аналитических процессов.
Что же касается общедоступных облаков и аналитики в качестве предложений сервиса, то они в основном будут привлекать малый и средний бизнес, а также крупные организации для исследований на начальных этапах.
Подведем итоги
Наиболее важные положения этой главы:
• Превращение традиционной аналитики в операционную – это не технологическая проблема для большинства организаций. Проблемы с технологиями являются симптомами фундаментальных проблем с корпоративной политикой или культурой.
• Новые технологии, например Hadoop, не заменяют ранее существовавшие технологии, такие как реляционные базы данных, а дополняют их.
• Аналитическое окружение развивается, объединяя много платформ разной мощности, каждая их которых предназначена для решения разных задач.
• Не откладывайте решение об инвестициях в ожидании выхода новых продуктов с новыми функциями, если только эти функции не имеют для вас крайне важного значения.
• Компьютинг на основе текстуры ведет к созданию единого аналитического окружения, которое включает множество взаимосвязанных, масштабируемых и интегрированных компонентов.
• Современное единое аналитическое окружение покоится на трех основных опорах и ряде вспомогательных технологий. Цель его – позволить осуществлять любой тип анализа с использованием любых данных любого типа и объема в любое время.
• Реляционная опора является основой для развертывания операционной аналитики и обеспечивает масштабируемость по всем ключевым для организации параметрам.
• Опора для обнаружения данных предназначена для исследования всех видов данных при помощи любых аналитических методов и призвана быстро обеспечивать нахождение новых инсайтов, а не максимальную скорость обработки.
• Нереляционная опора (как правило, Hadoop) превосходно подходит для работы с нетрадиционными форматами данных, для хранения малоценных и редко используемых данных, а также для целей архивирования.
• Вспомогательные технологии, позволяющие применять специфические типы обработки, включают технологии аналитики в памяти, технологии на основе графических процессоров, встроенные аналитические библиотеки и технологии обработки сложных событий.
• Пользователи не желают знать, где физически находятся данные или что именно их обрабатывает. Единое аналитическое окружение развивается, так что пользователям не придется больше беспокоиться насчет этих вопросов.
• Облачные архитектуры могут быть использованы в едином аналитическом окружении. Для большинства крупных организаций частные облака будут предпочтительнее публичных.
Глава 6 Управление и конфиденциальность
Подобно тому как правительство может подавлять граждан чрезмерно ревностным принятием и применением законов, так и организация может подавлять своих сотрудников чрезмерным упором на управление. В то же время отсутствие правил обычно ведет к анархии и хаосу, что не лучше угнетающих правил. Управление становится тяжким бременем только тогда, когда организация сама делает его таковым.
Лично мне, как и многим, не нравится слово «управление», но реальность такова, что у нас нет более подходящего термина для наименования того, что нам необходимо обсудить в этой главе. Многие читатели могут даже засомневаться, стоит ли им вообще читать ее. Ведь управление – это сухая, скучная и преходящая тема, верно? Необязательно так. Большинство людей согласятся с тем, что операционная аналитика требует текущего контроля качества и гарантии надежности. Кроме того, должны существовать правила, прописывающие место для осуществления обработки в едином аналитическом окружении, устанавливающие протоколы безопасности и направляющие политику конфиденциальности. Все эти темы подпадают под категорию «управление».
Эта глава посвящена тому, как правильно управлять единым аналитическим окружением, чтобы обеспечить пользователей и приложения доступом и ресурсами, необходимыми для успешного превращения традиционной аналитики в операционную. Мы поговорим о том, чем принципы управления, затрагивающие анализ больших данных и операционную аналитику, отличаются от традиционных подходов. Также сделаем некоторые выводы касательно конфиденциальности, поскольку ее защита должна быть ключевым компонентом любого плана управления.
Закладываем основу управления
Давайте начнем с обсуждения того, почему управление может быть непопулярной темой, а затем представим основные концепции, которые следует применять при создании структуры управления операционной аналитикой. Также необходимо отметить, что характер взаимодействий и отношений между сотрудниками может играть такую же важную роль, как и формальные правила.
Урок от «1984»
Недавно я перечитал роман Джорджа Оруэлла «1984»{47}. Одна из увлекательных нитей повествования связана с новоязом – официальным языком тоталитарного общества. Правительство Большого Брата намеренно «развивало» язык таким образом, чтобы максимально сократить в нем количество слов. Это делалось с целью усиления контроля над людьми. Предполагалось, что, если удалить из языка слова, позволяющие людям формировать новые мысли, у людей не будет возникать новых мыслей. Правительство Большого Брата планировало довести развитие новояза до такой степени, чтобы люди полностью лишились способности формировать новые, а также нежелательные мысли, опасные для тоталитарного режима.
В некоторых отношениях производственное окружение в крупной организации очень даже может походить на новояз. Если аналитическое окружение чрезмерно регламентировано, это ограничивает способность пользователей задавать новые вопросы о содержащейся в нем информации и распознавать новые инсайты. Разница лишь в том, что в «1984» правительство Большого Брата намеренно стремилось лишить людей способности формировать новые мысли, тогда как в бизнес-организациях никто, как правило, не стремится умышленно ограничивать способность людей задавать новые вопросы. Однако корпоративная политика иногда приводит как раз к этому эффекту. Нижеследующие примеры объясняют, почему тема управления так непопулярна среди пользователей. Многие из них никогда не сталкивались с поддерживающим и дружественным управлением в аналитических окружениях, поэтому когда речь идет об управлении, сразу вспоминают об ограничивающих и обременительных правилах.
Модель допуска
Главное препятствие при управлении, с которым сталкиваются многие пользователи, связано с правилами разграничения доступа к данным. Правила безопасности в отношении данных могут оказывать гораздо большее влияние на способность обнаруживать новые инсайты, чем любые другие факторы. В конце концов, если данные недоступны, они не могут быть проанализированы. К счастью, существует возможность создать такую систему безопасности, которая позволяет создавать операционную аналитику без ущерба для безопасности данных. Но создание такой системы требует некоторого изменения мышления.
Мне нравится проводить параллель между протоколами безопасности в аналитическом окружении и многообразными уровнями допуска в правительстве. Есть информация, которую может увидеть практически каждый, но есть и сверхсекретная информация, доступ к которой имеет очень ограниченный круг лиц. Уровень доступа зависит от занимаемой должности и степени доверия, заработанного человеком с течением времени. Аналогичный подход может быть применен и в аналитическом окружении.
Члены аналитической команды, отвечающие за поиск новых инсайтов и изучение инновационных аналитических процессов, должны пользоваться высоким уровнем доверия у организации. Они должны иметь доступ к более широкому спектру данных, чем основная масса сотрудников, и возможность комбинировать этими данными более широким спектром способов. Другими словами, должны иметь высший уровень допуска. В частности, в процессе поиска данных им следует позволить использовать данные такими способами, которые могут быть неприемлемы в операционном или производственном окружении. Например, они могут комбинировать уязвимые данные о клиентах из разных частей организации. Это не означает, что им должно быть позволено нарушать корпоративные правила и процедуры, когда настанет время переводить процесс из поискового режима в операционное окружение. Это означает, что они нуждаются прежде всего в гибкости, чтобы находить нечто, достойное перевода в операционный режим.
Подчеркиваю: нужно следить за тем, чтобы при смягчении корпоративных правил строго соблюдались все действующие законы. Например, существуют юридические ограничения на обращение с данными медицинских и кредитных карт. Обеспечьте пространство для маневра в рамках корпоративной политики, но не уполномочивайте своих сотрудников на нарушение законов. Кроме того, как мы увидим далее, касаясь конфиденциальности, важно позаботиться о том, чтобы не создавать аналитику, заставляющую ваших клиентов чувствовать себя некомфортно, вне зависимости от того, насколько она легальна.
После того как ценный процесс обнаружен, пользующиеся доверием специалисты-аналитики могут вернуться к работе в рамках стандартного режима безопасности, чтобы реализовать процесс в приемлемой для операционного применения форме. Однако если они будут изначально работать в условиях жестких ограничений, это существенно затруднит или даже сделает невозможным открытие новых эффективных инсайтов для нужд организации.
Установите категории допуска
Организации могут последовать примеру правительства и внедрить систему разноуровневого допуска. Доверенные лица, занимающиеся обнаружением данных, должны иметь максимальную свободу действий, чтобы способствовать инсайтам, включая комбинирование данных способами, обычно не дозволяемыми в организации.
Работа в едином окружении, которое включает как поиск, так и размещение данных, существенно облегчает переход от одного режима к другому. Вот почему так важно создание единого аналитического окружения, о чем мы говорили в пятой главе. В этом случае сотрудники, даже если они имеют больше свободы в рамках поискового окружения, будут понимать и учитывать ограничения в производственном окружении. Если поисковое и производственное окружения совместимы, то перенос данных из поиска в производство будет происходить гораздо проще, чем при значительной разнице между окружениями. Когда специалисты-аналитики знают об ограничениях, существующих в производственном окружении, они могут с самого начала действовать одним из двух способов: либо проявить гибкость при планировании, либо определить, какие правила должны быть изменены. В обоих случаях все будет соответствовать существующим правилам.
Еще один хороший подход можно позаимствовать у домашних систем безопасности. Они могут иметь детекторы движения, датчики сохранности стекол, видеокамеры и т. п. При организации большой вечеринки вы отключаете систему. Поскольку люди придут к вам в дом на законных основаниях, строгий контроль не нужен. Но, когда гости уходят, вам не составит труда снова включить охранную систему. Аналогичный подход можно использовать и в поисковом окружении. Речь идет не о том, чтобы отказаться от правил безопасности как таковых, а о том, чтобы намеренно отключать некоторые защитные функции для доверенных лиц в установленное время.
Требуется сотрудничество
К сожалению, во многих организациях аналитический отдел и ИТ-отдел находятся в состоянии постоянных распрей. Я много раз сталкивался с ситуациями, когда отношения между ними были далеко не дружественными. Но если организация собирается превратить традиционную аналитику в операционную, абсолютно необходимо решить данную проблему. Когда мы вместе с клиентом пытаемся ее устранить, сотрудники моей компании называют это «консультированием по проблемам брака». Как правило, мы сажаем с одной стороны стола ИТ-команду, а с другой стороны – аналитическую команду. Поначалу все сидят с угрюмыми лицами и скрещенными на груди руками. На предварительных встречах каждая команда изливает на нас поток жалоб на то, насколько неразумна другая команда и как трудно с ней работать. Причем для конфликтных отношений существуют вполне объективные причины.
Если вы потрудитесь заглянуть в должностные инструкции этих сотрудников, то увидите, что каждый из них просто выполняет свои обязанности, из-за чего и происходят конфликты. IT-команда отвечает за стабильную и без сбоев работу своих систем, а также за то, чтобы пользователи находились под контролем и не выходили за установленные рамки. Аналитическая команда отвечает за создание инновационных ресурсоемких процессов и за корректировку правил, если это нужно для обнаружения новых инсайтов. Для того чтобы превратить традиционную аналитику в операционную, необходимо, чтобы команды работали совместно, а припарками конфликт не излечишь.
Может потребоваться и принуждение к сотрудничеству
ИТ-команда и аналитическая команда должны работать в организации совместно, чтобы успешно превратить традиционную аналитику в операционную. В идеале команды должны сотрудничать добровольно. Если же этого не происходит, высшее руководство должно обязать их сотрудничать в приказном порядке. Принудительное сотрудничество лучше, чем отсутствие всякого сотрудничества.
Операционная аналитика, разработанная аналитической командой, должна встраиваться в операционно-производственные системы, поэтому специалисты-аналитики не могут продолжать работать по старинке – вытаскивая данные в автономное аналитическое окружение. Это означает, что аналитическая команда не сможет выполнить операционную аналитику без участия и поддержки ИТ-команды. С другой стороны, ИТ-команда не может сама разрабатывать аналитические процессы, поскольку это не ее область знаний. Ей необходима помощь аналитической команды для построения и осуществления процессов. Кроме того, запросы на аналитику от бизнес-партнеров достаточно важны для того, чтобы ИТ-команда и аналитики могли их игнорировать. Для успешного выполнения операционной аналитики придется заставить «айтишников» и аналитиков пойти на сотрудничество. Также заметьте, что конфликт может возникать даже в тех случаях, когда аналитики являются частью ИТ-команды.
К счастью, благодаря тому, что сегодня аналитическая функциональность интегрируется с операционными системами и встраивается в них, стало возможным наладить тесное сотрудничество между аналитиками и ИТ-командой путем корректировки традиционных принципов управления с учетом сегодняшних технологий и требований. На рис. 6.1 представлены некоторые идеи насчет того, как к этому приступить.
Если ваша организация еще этого не сделала, ей придется принудить команды сотрудничать в приказном порядке. Поначалу им будет трудно, но со временем они научатся работать вместе. Такое случается и в жизни, когда вы знакомитесь с кем-то, кто поначалу вам не нравится. Но весьма часто по прошествии некоторого времени вы лучше узнаёте этого человека и понимаете, что он вовсе не такой уж и неприятный. Возможно, вы не будете проводить с ним отпуск каждый год, но зато будете спокойно с ним общаться, когда потребуется. Вот этого минимума и должны достичь «айтишники» с аналитиками. Совместная работа не покажется скверной, когда обе команды будут ей привержены и узнают, что могут предложить им партнеры.
Управление Интернетом вещей
Об Интернете вещей мы с вами говорили во второй главе. В подавляющем большинстве те невообразимые объемы данных, которые он генерирует, являются абсолютно бесполезными. Проиллюстрируем это на примере. Через несколько лет появится много умных домов с умными кухнями. Там датчики будут повсюду: в холодильнике, на полках в кладовке и даже на отдельной таре. Бутылка кетчупа в холодильнике сможет сообщать о своем состоянии программе инвентаризации продуктов питания, в чью задачу входит составление списков необходимых покупок. Так, посредством своих датчиков бутылка сообщит, что ее емкость заполнена наполовину, что на протяжении всего времени кетчуп хранился при правильной температуре и что срок его годности заканчивается через три месяца. Это значит, что пока новый кетчуп покупать не нужно. То же самое делают сотни других продуктов питания на вашей кухне, создавая множество данных.
Информация, поступающая от продуктов, является ценной для централизованной программы инвентаризации и генератора списка покупок. Однако в долгосрочном плане эти данные не имеют никакой ценности. Единственное, что нам нужно, – это список необходимых покупок перед посещением магазина. Нам совершенно неинтересны детали коммуникации между вещами на кухне, в результате чего был составлен список{48}. За исключением этих данных здесь не происходит ничего такого, что бы отличалось от наших повседневных дел. Разве семейные пары запоминают в мельчайших подробностях, как они составляли список покупок перед походом в магазин? Нет. Они запоминают только то, что им действительно важно, – окончательно составленный список покупок.
Игнорируйте безумолчную болтовню
Интернет вещей будет создавать невообразимые объемы данных. Однако бо́льшая их часть лишена смысла за пределами текущего момента. Точно так же как вы запоминаете только несколько важных обменов данными в повседневных разговорах, так нет и необходимости сохранять подавляющее большинство коммуникаций между вещами.
Наш мозг превосходно умеет отфильтровывать ненужную информацию. Мы можем хранить яркие воспоминания о важных событиях, произошедших много лет назад, и с трудом вспоминать малозначимые разговоры, состоявшиеся только вчера. Это происходит потому, что мы, эффективно сортируя информацию, запоминаем наиболее значимую для нас. Аналогичный подход нужно применять и к данным от Интернета вещей. Хотя в совокупности генерируемые им объемы данных колоссальны, но каждый датчик по отдельности генерирует не так уж и много информации. Коммуникация датчиков состоит из передачи очень маленьких и легко управляемых пакетов информации. Ни один датчик сам по себе не представляет проблемы с точки зрения объема данных. Проблемы возникают, когда речь идет о совокупности датчиков и их коммуникации. Например, авиакомпания может отслеживать показания только определенных ключевых датчиков во время полета самолета, поскольку отслеживать показания всех датчиков в режиме реального времени окажется невозможным или ненужным.
Еще одно последствие развития Интернета вещей состоит в необходимости введения глобальных стандартов и принципов управления в отношении генерации и использования данных. Например, все приборы и вещи в вашем доме должны использовать один и тот же протокол. Но, если ваши соседи используют другие бренды с другими протоколами, это не создаст проблемы. Однако в других случаях использование разных протоколов является непозволительным. Например, если каждый бренд беспилотного автомобиля будет использовать свой патентованный метод передачи и сбора данных, то аварии станут неизбежными, поскольку автомобили не смогут эффективно взаимодействовать друг с другом. Кроме того, большое значение имеет принятие правовых и этических стандартов в отношении использования данных. Например, каким образом и кто будет отслеживать и анализировать водительскую историю владельцев автомобилей?
Для того чтобы беспилотные автомобили стали реальностью, все они должны использовать одинаковые стандарты. Каждый автомобиль должен быть в состоянии правильно отправлять и получать информацию о скорости, местоположении и намерении изменить траекторию движения. Разумеется, введение глобальных стандартов поначалу вызовет затруднения, но они необходимы и в долгосрочной перспективе окупят себя. К счастью, в настоящее время уже ведется разработка таких стандартов. В частности, компании, заинтересованные в развитии Интернета вещей, начали внедрять стандарты управления. От введения стандартов выиграет каждая организация, которая планирует использовать данные, поставляемые Интернетом вещей, для целей операционной аналитики.
Определите, где потребуется аналитика
Нередко проблема с управлением возникает при определении того, в какой части единого аналитического окружения следует выполнять каждый этап аналитического процесса. В конце концов ключевая задача управления – установить стандарты по использованию существующих активов. Между тем на вопрос, где должна осуществляться та или иная обработка, ответить непросто, поскольку это зависит от множества факторов. Они в значительной степени пересекаются с теми факторами, которые следует рассматривать при создании бизнес-кейса, о чем мы подробно говорили в четвертой главе. Это имеет смысл, поскольку решение о том, где и какую часть процесса следует реализовывать, должно быть основано на такой же объективной оценке различных вариантов с точки зрения затрат и доходов. Вы должны ответить на следующие вопросы:
• Какой из компонентов окружения может справиться с обработкой?
• Какие инструменты обладают необходимой функциональностью?
• Какими навыками, имеющимися и доступными, обладает команда?
• Где в настоящее время хранятся необходимые данные?
• Существуют ли какие-либо уже известные процессы, у которых можно позаимствовать код?
• Цель заключается в поиске нового инсайта или применении уже имеющегося?
• Какие вам требуются аналитические методы?
Все эти и многие другие факторы помогут определять, где лучше всего реализовать данный процесс или его часть. Но потребуются и усилия, чтобы выяснить, как наилучшим образом выполнить процесс в рамках сложного единого аналитического окружения. Давайте рассмотрим несколько соображений, которые при этом стоит иметь в виду.
Никогда не говорите, что это невозможно!
Один из уроков, которые я выучил за годы работы, состоит в том, что, если у вас есть опытный пользователь любых аналитических инструмента или технологии, значит, есть шансы, что, потратив достаточно времени и сил, он сможет выстроить практически все что угодно. В прошлом лично я разрабатывал аналитические процессы неидеальным образом. Знал только, что при помощи хорошо знакомых мне инструментов могу уложиться в сроки. При этом существовали куда более оптимальные способы реализации процессов. С традиционной пакетной аналитикой подобное обычно сходит с рук. Однако для операционной аналитики с ее степенью зависимости от фактора времени и с ее требованиями к масштабированию такой подход – когда для разработки решения выбираются не оптимальные, а хорошо знакомые подручные инструменты – вряд ли будет успешным.
Если вы спросите у первоклассного программиста, использующего язык SQL, сможет ли он выполнить предложенный ему набор логических задач, в большинстве случаев он ответит: «Да». Если вы спросите у специалистов по SAS или R, смогут ли они выстроить требуемую логику, они также ответят: «Да». Если вы спросите у программистов, специализирующихся на Python или Java, смогут ли они выстроить эту логику на Hadoop, они тоже ответят: «Да». Вот что вам нужно понять: все опытные специалисты смогут реализовать требуемую вам аналитическую логику. Проблема в том, что есть более или менее эффективные способы.
Никогда не говорите специалисту, что данный аналитический процесс не может быть реализован в предпочитаемом им компоненте единого аналитического окружения при помощи предпочитаемого им набора инструментов. Заявлять сразу: «Не сможете!» – значит обострять отношения. Когда вы говорите специалисту: «Это невозможно сделать в том окружении и теми инструментами, которые вы предпочитаете», его немедленной реакцией будет: «Возможно!» И он действительно сделает все возможное, чтобы доказать вашу неправоту. Но такой подход контрпродуктивен.
Не обостряйте отношения без необходимости
Специалисты-аналитики бывают очень упрямыми. Если скажешь, что некая задача им не по силам, они первым делом постараются доказать вашу неправоту, вместо того чтобы тут же решить проблему. Но такой подход контрпродуктивен. Лучше признайте, что каждый волен поступать как хочет, а затем предложите команде найти лучший способ решения данной проблемы.
Лучше использовать более продуманный подход к этой проблеме и рассмотреть ее под разными углами. Переключите внимание каждого специалиста на поиск наилучшего способа построения процесса. Какие технологии позволят с максимальной эффективностью реализовать аналитический процесс и развернуть его в операционном масштабе? Когда задача формулируется таким, менее грозным, образом, специалисты, как правило, с большей готовностью признáют недостатки в предпочитаемых ими подходах. Например, при одном подходе процесс программирования может растянуться надолго, тогда как при другом подходе сложно масштабировать.
Попросите каждого специалиста оценить совокупные трудозатраты на реализацию процесса тем способом, который он предпочитает. Затем команда может сравнить результаты и принять обоснованное решение. В едином аналитическом окружении гораздо проще, чем в традиционном, переместить обработку из одного компонента в другой для достижения максимальной производительности. Все, что нужно, так это реализовать сжатую версию создания бизнес-кейса.
Выберите то, что работает лучше всего
Предыдущий раздел оставляет без решения открытую проблему, а именно изначальную неопределенность насчет того, какой из вариантов эффективнее другого. Возможно, сработают несколько вариантов. Несколько лет назад на одной конференции одновременно обсуждались два подхода к анализу социальных сетей. В конференц-зале № 1 проходила презентация проекта по реализации анализа социальных сетей в реляционном окружении. В конференц-зале № 2 обсуждались возможности анализа социальных сетей в нереляционном окружении. Я присутствовал во втором конференц-зале и обнаружил, что бо́льшая часть обсуждения была сосредоточена не на аналитике или ценностях, создаваемых ею, а на утверждении о том, что анализ социальных сетей не может быть выполнен в реляционном окружении. Парадоксально, но в конференц-зале № 1 в это время говорили о том, как наладить такой анализ в реляционном окружении и почему оно является единственно пригодным для этого местом.
Эти дискуссии доказали, что существуют по крайней мере два способа анализа социальных сетей. Но, если копнуть глубже и посмотреть, сколько времени и сил требует написание программ для того и другого вида анализа, мы увидим различия. Скорее всего, увидим различия и в производительности процессов. Вполне естественным было для выступающих в каждом из конференц-залов описывать преимущества своего подхода. Однако им следовало бы воздержаться от заявлений о том, что предлагаемый ими способ является единственно возможным для данного вида анализа. Ведь они ничего не доказали, поскольку в соседнем помещении в это время как раз обсуждался альтернативный подход.
Сосредоточьтесь на оптимальных комбинациях
Для того чтобы максимизировать эффективность и отдачу от аналитики, необходимо обеспечить, чтобы каждый компонент единого аналитического окружения – и каждый член аналитической команды – делал то, что он может делать лучше всего. Потратьте время на поиск компромиссного соотношения требуемых навыков, вычислительных мощностей и аналитических методов. Для создания оптимального процесса может понадобиться не один, а несколько компонентов единого аналитического окружения. Если это звучит как прописная истина, пусть будет так. Тот же принцип применим и ко многим другим ситуациям.
Для иллюстрации рассмотрим пример с незастроенным земельным участком. Если вы обратитесь к девелоперу, строящему дома на одну семью, то он предложит вам оптимальный план постройки именно такого дома. Если обратитесь к девелоперу, который специализируется на кондоминиумах, таунхаусах или апартаментах, он предложит вам оптимальный способ максимизировать стоимость земли за счет указанных структур. Наконец, если обратитесь к девелоперу, работающему с коммерческой недвижимостью, он предложит вам оптимальный способ постройки торгового центра, медицинского комплекса или бизнес-парка. Важно, что каждый девелопер окажется прав в рамках своей компетенции. Это очень похоже на то, как в группе специалистов-аналитиков каждый предложит оптимальный способ построения аналитического процесса с использованием только предпочитаемого им компонента аналитического окружения и с помощью предпочитаемых им аналитических инструментов.
Оптимизируйте целое, а не части
Вы должны поставить цель оптимизировать эффективность аналитического процесса в целом за счет наилучшего использования компонентов единого аналитического окружения. Попытки оптимизировать процесс в рамках одного компонента могут привести к гораздо менее эффективным решениям, чем многокомпонентный подход.
Что должен сделать владелец участка, так это найти наилучшее использование земли в целом. План застройки вполне может представлять собой комбинацию нескольких домов на одну семью, одного-двух небольших многоквартирных дома и также небольшого торгового центра. Владельцу же участка следует увидеть картину целиком, под разными углами. Ему нужно проконсультироваться с разными экспертами и найти наилучшую комбинацию подходов для удовлетворения своих потребностей. Окончательный вариант может сочетать компоненты рекомендаций каждого эксперта. Такой же подход следует применять и к аналитическим процессам. Необходимое условие для этого – наличие людей, которые способны охватить картину целиком и найти компромиссное соотношение компонентов.
Управление операционной аналитикой
Отчасти по причине непопулярности этой темы организации часто думают об управлении в последнюю очередь, когда вступают в эпоху Аналитики 3.0, о которой мы говорили в первой главе, и начинают превращать традиционную аналитику в операционную. Только после того как произойдут серьезные отключения, многие компании начинают задумываться об управлении операционной аналитикой. Разработка встроенной, автоматизированной и высокомасштабированной операционной аналитики и текущее управление ею требуют других подходов к управлению в отличие от тех, что традиционно применялись к аналитическим процессам. При пакетной аналитике ошибка влияет только на обработку одного пакета, и у специалистов, как правило, есть достаточно времени, чтобы выявить и устранить эту ошибку до следующего сеанса пакетной обработки. В случае операционной аналитики ошибка будет быстро распространяться, пока не будет устранена.
Итак, мы рассмотрели некоторые соображения, которые следует принимать во внимание при внедрении операционно-аналитических процессов. Теперь давайте рассмотрим пару сценариев из реальной жизни, наглядно иллюстрирующих необходимость компромиссного соотношения различных компонентов единого аналитического окружения для достижения эффективности.
Разнообразные требования
С точки зрения управления реальную проблему для операционной аналитики представляет наличие двух разных и даже противоречащих друг другу наборов требований, которые должны быть удовлетворены. Первый набор относится к процессу обнаружения данных, когда организация пытается найти новые инсайты и определить аналитические процессы, способные оказать наибольшее влияние. В этом случае требуются максимальная гибкость и минимальные ограничения. Второй набор требований относится к развертыванию процесса на операционном уровне. В этом случае главным приоритетом становится обеспечение высокой скорости, надежности и стабильности. Эти два набора требований приведены в табл. 6.1. Хотя они существуют сами по себе и даже, кажется, противоречат друг другу, но оба вполне выполнимы в рамках соответственно конфигурированного аналитического окружения.
После того как операционно-аналитический процесс разработан и внедрен, он должен управляться иным образом, нежели традиционные аналитические процессы. Одно из отличий заключается в управлении результатами каждого процесса. Операционная аналитика должна выполняться достаточно эффективно и быстро для того, чтобы удовлетворять операционным требованиям. Целью является улучшение, необязательно до совершенства, миллионов и миллионов ежедневно принимаемых решений. Если существует возможность дополнительно улучшить этот процесс, это замечательно, но только не за счет требуемых скорости и масштаба. Поначалу вам может быть некомфортно от мысли о том, что вы сознательно не реализуете всех предлагаемых аналитикой возможностей, но это вполне нормально, если наглядная отдача от аналитики, проистекающая из улучшения решений, превышает затраты на нее. При наихудшем сценарии, возможно, придется отказаться от использования на практике ценного открытия, если затраты на его операционализацию будут намного превышать ожидаемую отдачу.
Другое отличие операционной аналитики состоит в том, что принимаемые решения должны постоянно контролироваться, чтобы отслеживать, как выполняется процесс. При операционной аналитике решения проверяются после того, как они были реализованы; при традиционной решения должны утверждаться до своей реализации. Поскольку решения в операционной аналитике принимаются автоматически, то при возникновении подозрений на ошибки придется проверить, скажем, последние 10 000 принятых решений. А при обнаружении аномалии может потребоваться остановить аналитический процесс и заняться расследованием.
Приготовьтесь чертыхаться
Точно так же, как с производственных линий иногда сходят дефектные продукты, так и операционно-аналитические процессы иногда генерируют дефектные решения. Порой проблема может быть настолько серьезной, что потребуется остановить процесс и «отремонтировать» его. Если частота ошибок достаточно низкая, это следует рассматривать как приемлемые издержки ведения бизнеса. Принять этот факт может оказаться достаточно затруднительным, зачастую приходится вносить изменения в корпоративную культуру.
В свете вышеуказанных различий организация должна быть готова к тому, что иногда операционно-аналитические процессы будут давать сбои. Возьмите такой крайний случай, как «мгновенный обвал» фондового рынка 6 мая 2010 г., о котором мы говорили в третьей главе{49}. Все началось с небольшой ошибки в одном торговом алгоритме. Многие другие алгоритмы раскрутили его действие и, подобно леммингам, разом бросающимся со скалы, устроили огромную заваруху. В автоматических процессах всегда будут возникать сбои, поэтому здесь действия проверяются после их реализации, а не рекомендации выдаются перед совершением действий.
Поначалу с этим трудно будет смириться, и вы можете столкнуться с сопротивлением на уровне корпоративной культуры. Однако если организация ответственно подходит к созданию, тестированию и мониторингу операционно-аналитических процессов, проблемы будут выявляться до того, как они причинят весомый ущерб. Здесь стоит подчеркнуть следующий важный момент: процесс обнаружения данных должен вестись на постоянной основе. С течением времени во всякий аналитический процесс следует вносить необходимые корректировки с учетом новых данных, новых реалий бизнеса или других значимых изменений.
Периодически возникающие проблемы – это неотъемлемые издержки ведения бизнеса. Организация должна спокойно к ним относиться и устранять их в рабочем порядке. Даже «мгновенный обвал» не обанкротил всех трейдеров, использующих автоматические торговые программы. На обычных производственных линиях также время от времени производятся бракованные изделия, разбиваются бутылки и подгорают продукты питания. Это нормальные производственные издержки. Если частота ошибок достаточно низкая, а средний уровень качества остается высоким, производитель будет процветать в долгосрочной перспективе благодаря достигнутому масштабу производства. То же самое верно и в случае операционной аналитики.
Или возьмите подходы, которые используются банками для выявления случаев мошенничества с кредитными картами или используются поставщиками услуг электронной почты для фильтрации спама. Ни одна из этих процедур не работает идеально. Мы по-прежнему получаем спам по электронной почте или можем стать жертвами мошенничества с банковскими картами. Иногда случается, что в папку со спамом отправляются нормальные письма или банк ошибочно блокирует кредитную карту. Тем не менее в целом ситуация намного лучше той, что была бы в отсутствие аналитики.
Организации не должны позволять своим сотрудникам фокусироваться на таких исключениях и пытаться обесценить подход целиком только лишь потому, что в одном-двух случаях аналитический процесс выдал неправильное или неоптимальное решение. Вопрос должен состоять в том, позволяет ли аналитика снизить, например, общий уровень мошенничества, поскольку никакой аналитический процесс не может исключить его полностью. Неизбежно проскальзывающие ошибки не должны затмевать собой весомых преимуществ операционно-аналитических процессов.
Когда сотрудники обнаруживают ошибочные решения, организация должна отстаивать процесс в целом и помочь сотрудникам понять, что определенная доля ошибок неизбежна. Работники на производственных линиях регулярно отбраковывают продукты, которые не соответствуют стандартам качества, но при этом не ставят под сомнение необходимость самой производственной линии. Точно так же операционная аналитика иногда будет генерировать плохие решения, однако это не должно восприниматься как повод ставить под сомнение необходимость процесса в целом.
Мониторинг операционной аналитики
Хотя операционная аналитика встроена в бизнес-процессы, сотрудники все равно должны активно отслеживать результаты принимаемых решений. Как никогда важное значение приобретает предоставление отчетов, сводной статистики, информации с панелей мониторинга и зрительных образов, позволяющих всем заинтересованным лицам в организации отслеживать эффективность операционной аналитики на постоянной основе. Причем, как то было принято и в традиционной аналитике, уровень детализации или агрегирования данных должен зависеть от уровня и роли заинтересованного лица. Это означает, что классические принципы бизнес-аналитики во многом применимы и к операционной аналитике, о чем мы подробнее поговорим дальше.
Как и в случае традиционной аналитики, в отношении операционной должны быть введены четкие правила, прописывающие последующие действия. Кто должен быть извещен и имеет право остановить процесс при обнаружении аномалии? Кто несет ответственность за мониторинг аналитических процессов, за их корректировку и обновление? Какова приемлемая частота ошибок? Какие еще показатели должны отслеживаться помимо частоты ошибок? Контекст операционной аналитики требует решения точно такого же комплекса вопросов, как и любой другой операционный контекст.
Давайте рассмотрим пример с промышленным предприятием, где операционная аналитика активно используется для регулировки оборудования на сборочной линии. Директор завода должен иметь доступ к детальной информации по регулировкам, произведенным на каждой единице оборудования. Он также должен иметь доступ к последним сенсорным данным и к информации о том, работает ли каждый станок согласно спецификации. Региональному же директору может быть достаточно подтверждения того, что в целом все заводы в регионе работают нормально. Наконец, генеральному директору компании нужна только сводная отчетность с указанием основных тенденций по регионам.
Многие старые правила применимы по-прежнему
Важная часть операционной аналитики – текущий контроль за правильностью и эффективностью миллионов решений, принимаемых в автоматическом режиме. При этом сами данные и метрики, которые хотят видеть люди, остаются фактическими теми же, что и в прошлом. Меняется только способ принятия решений, которые ведут к генерации тех же данных и метрик.
Суть в том, что традиционные правила фильтрации, агрегирования данных и составления по ним сводной отчетности для различных заинтересованных лиц полностью применимы и к операционной аналитике. Более того, во многих случаях существующая стандартная отчетность может не потребовать никаких изменений, поскольку сами данные и метрики, которые нужно видеть сотрудникам, остаются прежними. Меняется только метод принятия решений, ведущих к генерации данных и метрик. Несмотря на то что принятие решений отныне осуществляет автоматический процесс, сам характер решений и их цель могут оставаться такими же, что и в прошлом. Например, операционно-аналитический процесс, предлагающий оптимальные решения для сотрудников колл-центров, делает то же самое, что раньше сотрудники делали сами. Успешность решений с точки зрения содействия дополнительным продажам может отслеживаться традиционным способом, поскольку прежней осталась суть решений – делать предложения, вызывающие или не вызывающие отклик.
Физическая платформа и логическое окружение
Однажды ко мне обратился клиент, который осуществил очень успешный проект по обнаружению данных. (Проект был конфиденциальным, поэтому я не могу назвать имя клиента.) Он нашел ряд ценных инсайтов и захотел применить их на практике и внедрить в операционные процессы. Однако возникла проблема. Корпоративная политика компании, где он работал, предписывала, что любой компонент инфраструктуры, ставший частью даже одного технологического процесса, должен полностью соответствовать всей технологической политике. Другими словами, если бы мой клиент использовал платформу для обнаружения данных в составе любого технологического процесса, то он лишился бы той гибкости, которая необходима для обнаружения дополнительных инсайтов. К сожалению, одну из частей нового процесса имело смысл реализовать только на поисковой платформе. Клиент спросил у меня, как можно решить эту проблему.
Мы начали с изучения того, можно ли закодировать завершающий процесс иначе, чтобы выполнить его на технологической платформе. Часто такое можно сделать после того, как определена точная логика процесса. В данном случае это было невозможно, поскольку на поисковой платформе использовался собственный алгоритм, недоступный для использования где-либо еще, а дублировать его на других платформах оказалось бы слишком накладно. Клиент также справедливо заметил, что даже если бы удалось придать необходимую функциональность технологической платформе на сей раз, то в дальнейшем обязательно возникнут ситуации, когда сделать это будет невозможно. Таким образом, нам предстояло найти более универсальный подход к решению проблемы.
Ключом к решению стало признание различия между физической платформой для обнаружения данных и логическим окружением для обнаружения данных. При этом платформе для поиска инсайта отнюдь не нужно быть одновременно платформой, используемой в технологическом процессе. Мы решили, что самым быстрым и дешевым решением будет создать уменьшенную копию поисковой платформы в технологическом окружении. Единственной задачей новой платформы должна была стать поддержка операционно-аналитических процессов в технологическом окружении. Это решение позволило сохранить процесс поиска данных и одновременно их развертывания в рамках модели, нечасто применяемой к другим платформам. Потребовалось лишь провести различие между физической платформой и логическим окружением.
Время инсайта и время выполнения
Наконец, последняя важная тема, которую следует рассмотреть в контексте управления, связана с тем, какие критерии следует применять для оценки успешности каждого этапа разработки и внедрения аналитического процесса. К сожалению, операционная аналитика может потребовать больше трудозатрат по сравнению с традиционной. В классическом аналитическом окружении процессы выполняются почти исключительно в режиме пакетной обработки, и то же самое окружение используется как для разработки, так и для реализации. В этом случае наибольшее значение имеет время выполнения или скорость обработки. А в едином аналитическом окружении, используемом для операционной аналитики, на разных этапах процесса в игру вступают два совершенно разных критерия.
Это время выполнения процесса, или аналогичная классическая метрика производительности, и время инсайта (о нем мы говорили в четвертой главе). При размещении в операционном окружении аналитические процессы должны выполняться как можно проще и быстрее. В фазе поиска новых инсайтов и определения потребностей, которые нужно сделать операционными, первостепенное значение приобретает время инсайта, а не скорость обработки. Разные требования могут заставить организацию принять другие подходы, отличающиеся от тех, что она использовала традиционно.
Для иллюстрации возьмем ранние фазы обнаружения, когда нужно просто проверить, работоспособна ли идея или нет. На данной стадии не нужно постоянно повторять процесс – просто нужно как можно быстрее получить ответ. Если на написание программы уходит всего один час и еще три часа на выполнение процесса, то это нормально. Ответ будет получен достаточно быстро для того, чтобы понять, имеет ли смысл двигаться дальше в этом направлении или нет. В то же время глупо тратить на написание программы 12 часов, чтобы разработать более эффективный процесс, который будет выполнен всего за несколько минут, поскольку на данный момент неизвестно, потребуется ли повторять этот процесс больше одного раза.
Операционная аналитика требует другого подхода
При поиске новых инсайтов самое главное – обнаружить их как можно быстрее, и поэтому долгое время выполнения процесса не имеет значения. Но при превращении нового инсайта в операционный необходимы максимальные скорость и масштабируемость. Упрощение процесса поиска для превращения его в операционный может потребовать дополнительных усилий.
После обнаружения инсайта, достойного превращения его в операционный, процесс операционализации будет повторяться тысячи или миллионы раз в день. В этом случае на счету будет каждая секунда, если не миллисекунда. Следовательно, имеет смысл потратить дополнительные часы, дни и даже недели на отладку и оптимизацию этого процесса, чтобы добиться максимальной скорости и кратчайшего времени выполнения. Дополнительные усилия позволят повысить производительность миллионов операций и поэтому потребуют очень малых затрат, если распределить их между всеми случаями выполнения процесса. Однако такие действия должны выполняться только тогда, когда подтверждена их окупаемость.
Из вышеуказанных обстоятельств проистекает потенциально раздражающее следствие, которое необходимо принимать во внимание. В некоторых случаях процесс, использованный для обнаружения инсайта, невозможно напрямую перенести в операционный контекст. В процессе поиска только и нужно как можно быстрее добраться до инсайта и доказать его ценность. Иногда те же самые программа, логика и процесс могут быть применены непосредственно в операционном контексте, но в большинстве случаев такое невозможно, что обусловливает применение двухфазного процесса. В первой фазе требуется как можно быстрее доказать ценность инсайта. Во второй фазе – видоизменить программу и архитектуру процесса, использованного для поиска инсайта, таким образом, чтобы он стал достаточно эффективным для операционного окружения.
В действительности на протяжении многих лет для организаций вполне обычным было перепрограммирование аналитических процессов при их переносе с поисковой платформы на операционную. Например, аналитические процессы часто перепрограммировались на язык Cobol для мейнфреймов. Операцию по перемещению процессов можно значительно упростить, если выполнять аналитику в рамках автономного единого аналитического окружения, обеспечивающего совместимость между этапами поиска и операционализации. Вместо того чтобы полностью перепрограммировать все для совершенно другого окружения, можно только упростить процесс с использованием того же набора технологий и инструментов. Это облегчает внедрение по сравнению с прошлой практикой.
Конфиденциальность
Конфиденциальность является одним из важнейших вопросов, связанных с использованием больших данных и операционной аналитики, а также ключевым аспектом управления. Любая организация, имеющая дело с клиентами и особенно с их данными, должна относиться к конфиденциальности предельно серьезно. В то же время конфиденциальности требует и другая уязвимая информация. Сегодня не только количество данных о каждом из нас увеличивается стремительными темпами, но и появляется все больше возможностей сочетать и сопоставить эти данные.
Хотя их использование потенциально может принести огромные преимущества, оно представляет и огромные риски для отдельных людей и общества в целом. Ненадлежащее обращение с данными способно причинить реальный ущерб. Давайте рассмотрим некоторые соображения, которые важно учесть при разработке процессов управления.
Большие данные становятся Большим Братом?
Ваш оператор сотовой связи точно знает, где вы были. Если вы регулярно пользуетесь приложениями с функцией геолокации на вашем смартфоне, то поставщики этих приложений также знают, где вы побывали. Ваш провайдер электронной почты, возможно, хранит копии всех полученных и отправленных вами писем. Ваш провайдер кабельного или спутникового телевидения знает, что вы смотрели, какие рекламные ролики пропустили и когда нажимали на паузу. Ваша кредитная история в файлах у многих организаций, и ваша история болезни оцифровывается все чаще. Теперь вы представляете себе общую картину: все больше и больше третьих лиц узнают о вас все больше и больше, чем когда-либо прежде.
В последние годы резко возросла озабоченность в связи с тем, как многие известные компании и правительственные структуры относятся к вопросам соблюдения конфиденциальности. Google, Yahoo! Facebook, правительство США и многие другие были уличены в реальном или предполагаемом нарушении неприкосновенности частной жизни{50}. Существующая стандартная политика конфиденциальности совершенно неработоспособна, поскольку среднестатистическому человеку невозможно в ней разобраться; вдобавок в ней масса лазеек и она может быть изменена в любой момент. По сути, мы вынуждены доверять компаниям и правительству в том, что они будут обращаться с нашими данными надлежащим образом. К сожалению, наше понимание надлежащего обращения с данными и понимание оного организациями могут не совпадать. Хуже того, многие данные, которые вы считаете своей собственностью, фактически принадлежат не вам, а компаниям, обеспечивающим их создание. Зачастую записи звонков в колл-центр, твиты, выложенные в сетях фотографии и т. п. принадлежат не человеку, который это осуществляет, а владельцу того сервиса, где они были созданы. Создавать данные еще не значит владеть ими.
Большинство людей не имеют представления о том, до какой степени их поведение может отслеживаться (и отслеживается!). Особенно это касается активности в Интернете и использования подключенных устройств. Даже производитель вашего телевизора может шпионить за вами такими способами, о которых вы даже не подозревали{51}. На момент написания этой книги продолжает разгораться скандал, связанный с разоблачением деятельности Агентства национальной безопасности США (АНБ) по сбору данных о людях. Будь то прослушивание телефонных звонков, перехват электронных писем или слежка за коммуникациями иностранных лидеров, АНБ явно зашло гораздо дальше, чем представляет себе большинство людей. И это лишь то, что известно нам{52}. А те немногие, кто знает о том, что еще происходит, молчат. На рис. 6.2 приведены некоторые ключевые вопросы, требующие разъяснения.
По мере того как в городах по всему миру расширяется установка камер с возможностью распознавания лиц, становится возможным отслеживать передвижения людей. Изображения с камер уже используются для поиска преступников, позволяя проследить за ними от места преступления до их убежища. Однако, хотя становится все труднее сохранить свои действия и местоположение в тайне, многие люди не видят в этом большой проблемы. Они говорят, что личная жизнь у большинства из нас скучна и ничем не примечательна. Если вы не совершаете ничего из ряда вон выходящего или противозаконного, то как вам может повредить информация, попавшая в чужие руки?
Аргумент звучит замечательно, пока кто-то во власти не решит использовать эти данные против вас. Например, правительство США было уличено в использовании данных федеральной Службы внутренних доходов для воздействия на политические группы и отдельных лиц, чьи политические взгляды расходились со взглядами администрации{53}. Как вы отнесетесь к тому, что некто захочет повлиять на ваши взгляды или на ваше участие в абсолютно законной деятельности? Информация и данные – это валюта современного мира, поэтому защищайте свои активы. Сегодня для банка важны не только сами деньги, лежащие в его хранилище, но и информация, связанная с этими деньгами.
Где провести границы?
Каждый из нас проводит зыбкие границы, обозначающие комфортную зону, где наша частная жизнь неприкосновенна. Хотя мнения о том, где именно должны проходить эти границы, могут разниться, но самое главное – такие границы должны быть проведены. Сегодня они в лучшем случае размыты, а в худшем и вовсе отсутствуют.
Законы, определяющие конфиденциальность, меняются и совершенствуются. Две обсуждаемые в последнее время темы требуют особого упоминания вследствие их важности и противоречивости связанных с ними судебных решений. Первая сопряжена с дебатами о том, являются ли данные о местоположении абонентов сотовой связи или данные автомобильной телематики личными и подлежащими защите, или же правоохранительные органы могут получать к ним доступ без ордера. Вторая горячая тема относится к шпионской программе АНБ. Давайте рассмотрим обе темы подробнее.
Что касается первого вопроса, то правительство США утверждает, что данные о местоположении абонентов сотовой связи и данные автомобильной телематики не являются частными. Правительство заявляет: когда люди включают сотовый телефон или садятся в машину, они заведомо знают о том, что все их перемещения могут быть отслежены, и, таким образом, отказываются от своего права на защиту конфиденциальности данных. Частично логика рассуждений правительства основывается на том, что данные фактически уже собираются компаниями, а поэтому не принадлежат людям и не подпадают под защиту законов. В сентябре 2013 г. было вынесено два судебных решения. В первом случае суд постановил, что для доступа к информации о местоположении абонента правоохранительные органы должны были получить судебный ордер{54}. Во втором случае суд вынес решение, что такой ордер не требовался{55}. Этот вопрос в конечном итоге станет рассматривать Верховный суд, и его окончательное решение будет иметь далеко идущие последствия.
Что касается второго вопроса, то АНБ утверждает, что оно имеет право собирать широкий спектр информации о гражданах, даже если они не подозреваются в правонарушениях. Широта охвата подобной деятельности АНБ стала неприятной неожиданностью для большинства людей. Как и в вышеописанной ситуации с данными о местоположении сотовых абонентов, мнения судов по этому вопросу разделились. Один суд вынес решение, что деятельность АНБ является совершенно законной, тогда как другой суд через несколько недель счел такую деятельность незаконной{56}. Этот вопрос также будет рассматриваться в Верховном суде для вынесения окончательного решения.
Напоследок стоит упомянуть еще один удивительный факт. В Соединенных Штатах 87 % населения может быть однозначно идентифицировано только на основе имени, даты рождения и почтового индекса{57}. Если такой минимальной информации достаточно для точного определения того, кто вы есть, представьте, как легко идентифицировать вас при помощи всех прочих данных, которые собираются сегодня. Хотя мнения о том, где именно должны быть проведены зыбкие границы, могут разниться, несомненно одно – мы должны где-то провести эти границы.
Но довольно пессимизма. Теперь давайте рассмотрим некоторые практические примеры соблюдения конфиденциальности. После этого обсудим, что конкретно должна делать ваша организация, чтобы поддерживать правильный баланс в этой важной области.
Установите стандарты конфиденциальности
Как создать такие стандарты конфиденциальности, чтобы ваша организация не оказалась в центре громкого скандала в связи с нарушением неприкосновенности частной жизни? Я рекомендую организациям принимать во внимание три критерия, чтобы гарантировать, что они не нарушают доверие своих клиентов и широкой общественности{58}:
1. Что является законным?
2. Что является этичным?
3. Что является приемлемым для клиентов и широкой общественности?
В идеальном мире эти три критерия должны полностью совпадать. Но сегодня они не совпадают совсем. Постепенно регулирование должно охватить все аспекты конфиденциальности, а люди должны стать более осведомленными. К сожалению, сейчас рамки законного выходят далеко за рамки этичного, а рамки этичного могут выходить за рамки приемлемого для людей.
Крупная компания розничной торговли Target демонстрирует нам наглядный пример того, как можно успешно пройти два первых теста и с треском провалиться на третьем. У Target есть программа лояльности, которая по всем меркам соответствует действующим законам. Когда потребители регистрируются в этой программе, они соглашаются с тем, что им будут делаться целевые предложения на основе их покупательского поведения. Поскольку такие предложения оговариваются в соглашении, Target не выходит за рамки этики, когда использует данные о потребителях для изучения их покупательских привычек и предложения им товаров. Ошибка Target состояла в том, что в своем использовании аналитики она вышла за пределы комфортной зоны покупателей, хотя ее действия оставались законными и этичными.
Применяйте трехуровневый тест
При оценке приемлемости анализа с точки зрения конфиденциальности убедитесь в том, что он проходит три разных теста. Анализ должен быть: (1) законным, (2) этичным и (3) приемлемым для клиентов. Последнее условие часто является самым строгим.
Target научилась выявлять беременность на очень ранних стадиях – настолько ранних, что компания могла узнать о беременности еще до того, как сама покупательница сообщала о ней другим. В результате это привело к истории, описанной в New York Times, когда отец 17-летней дочери получил адресованное ей письмо с предложением товаров для беременных{59}. Отец отправился к директору местного магазина Target и обрушился на него с обвинениями в том, что такие неподобающие товары предлагаются девушке-подростку. Через неделю отец вернулся и извинился перед директором магазина за свои нападки. Оказалось, что его дочь действительно была беременна. Однако широкая общественность склонилось не на сторону Target. Люди посчитали подобное использование аналитики недопустимым.
Всегда помните: недостаточно определить, что законно и что этично. Нужно задуматься и о том, что подумают о ваших действиях клиенты и широкая общественность.
«Уловки-22»[4] применительно к конфиденциальности
На частном мероприятии, где я присутствовал, генеральный директор больничной сети поведал историю о том, в каком рискованном положении может оказаться организация из-за неоднозначности сегодняшних законов и этических норм касательно использования данных{60}. Речь шла о сборе и хранении генетических данных, а также о грузе обязательств, которые несет с собой эта деятельность.
Предположим, что клиника сохраняет результаты анализа вашей ДНК у себя в файле. Но что если спустя три года будет сделано важное открытие, которое свяжет определенные генетические признаки с серьезным заболеванием? Обязана ли клиника по закону или с точки зрения медицинской этики провести анализ всей своей базы данных о ДНК с целью выявления пациентов, находящихся в зоне риска? Как часто необходимо проводить такой ретроспективный анализ и каковы будут связанные с ним затраты?
Неоднозначность создает риски
Неоднозначность правовых и этических норм, прописывающих, что приемлемо или надлежит делать в тех или иных ситуациях, только увеличивает риски, связанные со сбором данных. Организация вполне может оказаться в ситуации, когда она проиграет судебный иск, какое бы решение до этого ни приняла. Будьте предельны осторожны в таких ситуациях, которые могут закончиться «уловкой-22».
Невозможно спрогнозировать затраты на выполнение неизвестного количества анализов неизвестной сложности для всего объема данных, хранимых в базе данных клиники. Будущие затраты на хранение данных нельзя в полной мере оценить сейчас, поскольку невозможно заранее предсказать, сколько корреляций может быть открыто учеными и насколько трудно будет осуществить анализ, чтобы определить риски. Это также создает ситуацию в духе «уловки-22». Кое-кто может подать на клинику в суд, если она проанализирует персональные данные и проведет новые тесты без разрешения. Они предпочли бы не знать о плохих новостях, особенно в тех случаях, когда помочь невозможно. Другие подадут в суд, если у клиники была возможность выявить проблему посредством такого анализа, но она этого не сделала. Вполне вероятно, что в обоих случаях суд признает клинику виновной. Кроме того, существуют риски, связанные с кражей или ненадлежащим использованием данных ДНК. Все эти неопределенные факторы, сопряженные с хранением генетических данных, вызывали у генерального директора серьезную обеспокоенность.
Он рассказал нам об удивительном решении этой проблемы. Больничная сеть планирует отказаться от хранения данных ДНК за пределами того срока, который требуется для проведения неотложных тестов. Учитывая многочисленные неопределенные факторы, связанные с юридическими и финансовыми последствиями хранения генетических данных, больничная сеть не хочет хранить их дольше, чем необходимо. Пока эти факторы не будут четко определены, компания решила, что возможные риски намного перевешивают возможные выгоды.
Жаль, что сегодняшние законы ставят организации в положение, когда они вынуждены принимать подобные неожиданные решения. Тем не менее я хорошо понимаю генерального директора. Если бы я руководил этой компанией, то, скорее всего, принял бы точно такое же решение. Пока законы не будут прояснены, сохранятся риски и ответственность, сопряженные со сбором и хранением данных, связанных с конфиденциальностью.
Будущее политики конфиденциальности
Политика конфиденциальности должна развиваться и совершенствоваться, чтобы соответствовать сегодняшним реалиям. Ваша организация должна располагать не только подготовленным юристами 100-страничным документом с изложением политики конфиденциальности, но и ее гораздо более сжатым и доступным для понимания резюме, в котором доходчиво и четко излагается, что ваша организация собирается делать с уязвимыми данными и какие границы она не будет переступать{61}.
Политика конфиденциальности должна стать гораздо более гибкой с тем, чтобы позволить клиентам выражать свои предпочтения. Сегодня уже недостаточно иметь простой перечень, озаглавленный «Не звонить» или «Не отправлять имейлы». Возможно, я не хочу получать звонки или письма с предложением не интересующих меня продуктов, но хотел бы получать информацию о возможностях обновления продуктов, которыми уже владею. Например, мой банк может звонить мне, чтобы предложить более выгодную схему ипотечного кредита по сравнению с той, что у меня уже есть, но я не хочу, чтобы мне звонили по поводу сберегательного счета.
Сегодняшние реалии требуют совершенно новых уровней конфиденциальности. Например, если взять данные о местоположении абонентов, собираемые операторами сотовой связи, то одни абоненты могут быть категорически против того, чтобы отслеживались их передвижения, и не важно по каким причинам. Другие могут хорошо относиться к тому, что оператор посылает им маркетинговые предложения на основе их текущего местонахождения, при условии что он немедленно удаляет эту информацию и не будет использовать ее в будущем. Наконец, третьи не возражают, если оператор будет хранить информацию об их передвижениях на протяжении длительного времени и использовать ее для различных аналитических целей. Это означает, что организации, чтобы соответствовать растущим ожиданиям клиентов в отношении соблюдения конфиденциальности, должны разработать широкий набор детализированных настроек, с помощью которых клиенты смогут управлять всеми типами собираемых данных.
Гибкость и прозрачность политики конфиденциальности – залог доверия
Хотя этим и сложнее управлять, но предоставление клиентам возможности устанавливать детализированные ограничения касательно конфиденциальности поможет организации защититься от проблем. Кроме того, поскольку сегодня очень немногие организации пользуются высоким доверием в отношении соблюдения конфиденциальности, такой подход может стать конкурентным преимуществом.
Должно стать обычным делом в понятной форме уведомлять клиентов об изменениях в своей политике конфиденциальности и задолго до того, как они вступят в силу. Действовать по умолчанию должны самые консервативные пользовательские настройки. Например, хорошая практика – использовать всплывающее окно, которое заставляет пользователя при первом посещении сайта после введения изменений подтвердить свое знание новой политики и выбрать персональные настройки. Сделанный им выбор следует осуществить как можно быстрее. Причем пользователь должен иметь возможность сделать активный и сознательный выбор, а не просто прочитать где-то в закоулках сайта расплывчатое уведомление об автоматическом изменении параметров конфиденциальности.
Разумеется, управлять политикой конфиденциальности таким образом гораздо сложнее, однако это абсолютно необходимо, если организация хочет предоставить клиентам ту степень контроля над персональной информацией, которую они хотят и которой заслуживают. Усилия, направленные на то, чтобы позволить клиентам чувствовать себя комфортно в отношении способов хранения, анализа и использования их персональных данных, окупятся. Предоставление людям бóльшего контроля не только защитит организацию с юридической точки зрения, но и повысит удовлетворенность ее клиентов, поскольку организация пойдет навстречу их пожеланиям. Надежная и гибкая политика конфиденциальности может обеспечить организации весомое преимущество перед ее конкурентом, попавшим в новости из-за очередного скандала, вызванного нарушением конфиденциальности.
Подведем итоги
Наиболее важные положения этой главы:
• Как и в случае новояза в романе «1984», чрезмерно ограничительные правила могут пресечь новые вопросы относительно данных. Введите различные категории допуска, чтобы обеспечить доверенным профессионалам необходимую гибкость действий.
• Для достижения успеха с операционной аналитикой ИТ-команда и аналитическая команда должны работать совместно. Если команды не идут на сотрудничество добровольно, руководство должно принудить их к сотрудничеству.
• Интернет вещей будет создавать высокое отношение шумов к сигналам. Хотя он и станет генерировать один из крупнейших пулов необработанных данных, но лишь очень небольшая их часть будет иметь ценность за пределами текущего момента.
• Выбор наилучшего способа выполнения аналитического процесса может оказаться нелегким. Не обостряйте отношения, утверждая, что тот или иной подход не будет работать; вместо этого сосредоточьтесь на поиске лучшего подхода из всех возможных.
• Оптимизируйте аналитический процесс в масштабах всего аналитического окружения, а не отдельного компонента. Чтобы максимизировать получаемую ценность, задействуйте все доступные возможности.
• Операционная аналитика предъявляет два различных набора требований. На этапе обнаружения данных требуется максимум гибкости и минимум ограничений. На этапе внедрения приоритет следует отдавать обеспечению скорости, надежности и стабильности.
• Ввиду автоматического характера операционной аналитики иногда она будет давать сбои, как и любая автоматизированная производственная линия. Главное – действовать быстро, чтобы минимизировать ущерб, поскольку на устранение проблем приходится меньшая часть издержек при ведении бизнеса.
• Операционно-аналитические процессы требуют мониторинга и контроля, как и любые другие процессы. К ним применимы и классические стандарты бизнес-аналитики.
• Различные метрики достижений, такие как время инсайта, необходимо применять для обнаружения данных, а традиционные метрики, такие как время выполнения процесса, по-прежнему пригодны для операционных процессов.
• Конфиденциальность представляет сегодня огромную проблему для больших данных и аналитики. Хотя мнения о том, какими именно должны быть границы конфиденциальности, разнятся, несомненно одно – мы отчаянно нуждаемся в таких границах, чтобы избежать эпохи Большого Брата.
• Любое действие, влияющее на конфиденциальность, должно быть законным, этичным и приемлемым для общественности. Будьте предельно осторожны, поскольку эти три критерия не всегда совпадают и могут привести к ситуации в духе «уловки-22».
• Политика конфиденциальности и ее настройки должны совершенствоваться, чтобы отражать устойчивые данные и усложнившиеся требования современного мира. Это не только позволит свести к минимуму юридические риски, но и станет конкурентным преимуществом для организации.
Часть III Превращаем традиционную аналитику в операционную
Глава 7 Аналитика
В этой главе мы сосредоточимся на аналитических концепциях, позволяющих организации превратить аналитику в операционную. Как мы увидим, далеко не все ново под луной в мире операционной аналитики, но возникают и новые уникальные проблемы, которые важно понимать и учитывать.
Не забывайте о том, что превращение традиционной аналитики в операционную происходит эволюционно, поэтому многие уроки и принципы из прошлого, связанные с разработкой аналитических процессов, точно так же применимы и в настоящем, но с некоторыми изменениями. Организации, уже хорошо освоившие использование аналитики и располагающие в штате крепкими командами аналитиков-специалистов, вправе рассчитывать на успех.
Создание операционно-аналитических процессов
Мы дали определение операционной аналитики в первой главе. Здесь же начнем с рассмотрения ряда тем касательно создания и внедрения операционной аналитики. Как вы увидите, она имеет много общего с традиционной пакетной аналитикой, поэтому вам не придется начинать с нуля. Но в то же время это означает, что организации не могут прыгнуть сразу же на уровень операционной аналитики, если у них нет никакого опыта работы с традиционной пакетной аналитикой.
Постоянство аналитического процесса
Когда появились большие данные и в мир аналитики начали приходить люди с разной подготовкой, начались дебаты о том, не потребуется ли для аналитики новый рабочий процесс. Нет, не потребуется. На фундаментальном уровне рабочий процесс является одинаковым для всех типов данных и аналитики. Подобное постоянство замечательно, поскольку избавляет нас от необходимости каждый раз заново изобретать колесо, когда нам нужно применить аналитику новым способом или использовать новые источники данных.
Я был свидетелем споров по поводу того, представляет ли анализ больших данных нечто новое. Помню, как в ходе жарких дебатов утверждал, что в обнаружении больших данных нет ничего нового. Чтобы положить конец спорам, я показал своим оппонентам модель межотраслевого стандартного процесса анализа данных (Cross Industry Standard Process for Data Mining, CRISP‐DM), разработанную в 1990-х гг. Модель CRISP-DM описывает основные шаги в классическом процессе анализа данных. Я поместил схему процесса CRISP-DM рядом с предложенной схемой процесса обнаружения больших данных. Также нарисовал таблицу, где сопоставил отдельные этапы каждого процесса. Один из моих оппонентов, ранее утверждавший, что это были разные процессы, воскликнул: «Постой, Билл, но это практически то же самое!» Наконец-то они поняли мою точку зрения. Да, слегка были изменены термины и семантика, но фундаментально «новый» процесс ничем не отличался от «старого». В таблице 7.1 показано сходство фаз этих двух моделей, тогда как на рис. 7.1 представлена схема типового аналитического рабочего процесса.
Еще одна популярная парадигма – модель SEMMA, разработанная компанией SAS Institute{62}. Аббревиатура SEMMA расшифровывается как sample (отобрать), explore (исследовать), modify (модифицировать), model (моделировать) и assess (оценить). На веб-странице SEMMA говорится: модель предполагает, что бизнес-задача уже определена, а внедрение рассматривается как дополнение завершающей фазы. И снова обратите внимание на то, что эта модель мало чем отличается от модели CRISP-DM и модели обнаружения больших данных, как это можно увидеть в таблице 7.1.
Тот факт, что разные модели аналитических рабочих процессов, разработанные в разные годы и с использованием разных подходов, столь схожи между собой, свидетельствует о том, что, перефразируя слова великого Шекспира, в аналитическом безумии есть свой метод. Переход к аналитике больших данных, операционной аналитике или к следующему феномену будет опираться на знания, которыми уже обладают организация и ее команды.
От пакетной аналитики к операционной
Давайте начнем с рассмотрения сходства и несходства между традиционной пакетной аналитикой и операционной аналитикой. Во-первых, и операционная, и пакетная аналитика требуют значительных усилий по подготовке и проверке качества данных. Например, если требуется оценить риск ухода клиента, вероятность продажи продукта или риск отказа двигателя в течение нескольких следующих минут, то нужно будет получить необходимые данные, проверить их качество и подготовить правильные метрики для поддержки требуемого анализа.
Операционная аналитика сосредоточена на обработке данных и принятии решений в режиме реального времени и, как правило, применяется к конкретному клиенту, продукту или двигателю именно в тот момент, когда это необходимо. Тем самым она отличается от пакетной аналитики, где данные по всем клиентам, продуктам или двигателям анализируются одновременно в виде единого пакета и в произвольное время. Во многих случаях аналитические методы, используемые при операционном вводе данных, идентичны тем, что используются при традиционной пакетной обработке. Разница состоит лишь в том, как выполняются и применяются эти процессы.
Например, те же самые алгоритмы, что использовались с целью прогнозирования следующего лучшего предложения для всех клиентов при пакетном анализе, могут использоваться и с целью прогнозирования следующего лучшего предложения для конкретного клиента, который прямо сейчас просматривает веб-сайт. Разница в том, что процесс генерации предложения для клиента в режиме реального времени опирается на самые свежие данные. Разумеется, в некоторых случаях операционно-аналитические процессы потребуют абсолютно новую аналитику, у которой не существует исторических аналогов. Возьмите, например, процессы, регулирующие угол наклона лопастей ветряных турбин с целью увеличения их мощности в зависимости от окружающих условий, о чем мы говорили в третьей главе.
Операционная аналитика стоит на прочном фундаменте
Вы не можете наладить производство миллионов штук печенья с шоколадной крошкой без рецепта и налаженного производственного процесса. Рецепт можно будет разработать, а процесс наладить путем тестирования на мелких партиях. Аналогичный подход применяется и в операционной аналитике. Сначала нужно создать работающий базовый процесс, а уже затем превращать его в операционный.
Ключевой момент – во многих случаях операционно-аналитический процесс представляет собой просто более интегрированную, сдвинутую к режиму реального времени версию пакетного аналитического процесса. Вот почему, прежде чем внедрять операционную аналитику, организация должна достичь мастерства в применении традиционной аналитики. Это ничем не отличается от ситуации на промышленном производстве, когда сначала изготавливаются формы и прототипы изделия, которое потом будет изготовляться на сборочной линии. Подобно тому как производство новой модели мобильного телефона начинается с создания опытных образцов и тестирования производственного процесса на небольших партиях изделий, точно так же абсолютно необходимо сначала разработать прототип аналитического процесса и протестировать его в небольшом масштабе, прежде чем его автоматизировать. Для того чтобы наладить производство чего угодно, от мобильных телефонов до замороженной пиццы, вы должны пройти ключевые этапы дизайна, производства опытных образцов и утверждения процесса. Вы не сможете запустить массовое производство миллионов штук печенья с шоколадной крошкой, пока у вас не будет проверенного рецепта и отлаженного производственного процесса, которые позволят вам изготовить пробную партию с десяток вкусняшек.
Как говорилось в шестой главе, операционно-аналитические процессы тоже требуют постоянного контроля и регулярной модернизации. Я рекомендую прочитать вам хорошую статью на эту тему – «Одержимость качеством в Western Digital Corporation» Ричарда Хакаторна из компании Bolder Technology{63}. В статье рассматриваются конкретные примеры касательно качества данных, управления, реализации и мониторинга операционной аналитики.
Операционная аналитика – это…
Еще один важный угол зрения, под которым следует рассматривать действия по превращению аналитики в операционную, заключается в том, что операционная аналитика – это… подождите, подождите… просто аналитика! Я уже писал о том, что аналитика больших данных – это просто аналитика{64}. Теперь повторю то же самое: операционная аналитика – это просто аналитика.
Тем самым я вовсе не хочу сказать, что внедрение больших данных или операционной аналитики требует минимальных усилий. То и другое представляет собой довольно трудную задачу и нуждается в новых инструментах, технологиях и навыках. Просто я хочу подчеркнуть, что необходимые действия не являются чем-то абсолютно новым и неизвестным. Скорее, они представляют собой естественное продолжение стремлений организаций и специалистов-аналитиков увеличить количество и разнообразие источников данных и аналитических методов, с тем чтобы усовершенствовать принятие бизнес-решений.
Операционная аналитика – это…
… просто аналитика! Не упускайте из виду сей простой факт.
Если вы сами являетесь специалистом-аналитиком или у вас есть в штате такие классные профессионалы, вам нечего бояться операционной аналитики. Специалисты обеспечивали эволюцию аналитических процессов в прошлом, и точно так же они обеспечат эволюцию этих процессов для выведения их на операционный уровень. Определят бизнес-проблему и требуемые для ее решения источники данных. Затем исследуют эти данные, подготовят их и проанализируют. Включат данные в аналитический процесс, который протестируют, прежде чем масштабируют его на операционном уровне. Маршрут во многом останется тем же, что и в прошлом. В конце концов цель превращения традиционной аналитики в операционную состоит в увеличении числа аналитических процессов для поддержки бизнеса.
Новые аналитические дисциплины
Как говорилось во второй главе, большие данные часто представляют собой особый тип данных с принципиально иной структурой. Новые структуры данных могут потребовать других способов обработки для включения этих данных в аналитический процесс. Соответственно организации придется осваивать новые аналитические дисциплины. В этом разделе мы дадим им определение, расскажем о том, как их можно сочетать и как это сочетание способно создать ценности.
Определение аналитических дисциплин
Современная деловая среда требует все более широкого спектра аналитики. Когда я только начинал заниматься аналитикой, большинство аналитических процессов, используемых крупными компаниями, относилось к одной из двух ключевых дисциплин. Первая – это статистика, включающая в себя что угодно – от дисперсионного и регрессионного анализа до проверки статистической значимости. Вторая – это прогнозирование, включающее в себя классические временные ряды и проекционные способы. Однако в современном мире эти две аналитические дисциплины больше не в состоянии удовлетворить всех потребностей бизнеса, нуждающегося в выходе за пределы статистических и прогностических методов. Давайте рассмотрим несколько новых аналитических дисциплин.
В последнее время все более широкое применение находит моделирование. В частности, особенно популярно моделирование по методу Монте-Карло. В основе его лежит очень простая концепция и, если вы прибегали к пенсионному планированию, то, скорее всего, применяли этот метод. Для того чтобы спрогнозировать пенсионные накопления, необходимо учесть множество допущений, например:
• Какова будет средняя годовая доходность инвестиций?
• Насколько волатильной будет доходность на протяжении рассматриваемого периода времени?
• Каким будет темп инфляции?
При моделировании по методу Монте-Карло исследуется широкий спектр комбинаций допущений по всему диапазону возможных значений. Какие сценарии приведут к хорошим результатам, позволив достичь намеченных финансовых показателей, а какие к плохим? Смоделировав тысячи или даже миллионы сценариев, процесс Монте-Карло обозначает распределение успехов и неудач. В идеале широкий диапазон разумных допущений должен привести к положительному исходу. Если этого не произойдет, то намеченная цель может быть попросту нереалистичной.
Также широкое распространение получает такая дисциплина, как оптимизация. На протяжении многих лет она активно использовалась в аналитике ценообразования, а сегодня сфера ее применения начинает раздвигаться. Оптимизация нацелена на поиск вариантов, которые позволяют наилучшим образом достичь поставленной цели с учетом широкого разнообразия факторов и ограничений. Если моделирование по методу Монте-Карло позволяет исследовать и количественно оценить множество различных вариантов, то цель оптимизации – найти оптимальный вариант. Как правило, оптимизация используется в тех случаях, когда можно управлять факторами, оказывающими значительное влияние на результат. Например, организация может управлять ценами на свою продукцию для достижения оптимальных результатов, а вот в случае пенсионного планирования у человека нет возможности управлять, скажем, уровнем инфляции.
Оптимизация часто опирается на традиционную предсказательную аналитику. Например, какое предложение лучше всего показать клиенту, когда он посещает веб-сайт? Даже при создании списка предложений для электронной рассылки в пакетном режиме оптимизация помогает качественно повысить общий уровень откликов с учетом различных ограничений, скажем, количества предложений и бюджета, выделенного на скидки. Два типичных подхода к оптимизации – это линейное и нелинейное программирование. Информация об этих методах широко доступна, и заинтересованные читатели могут глубже их изучить.
Расширение аналитических компетенций
Классические методы статистики и прогнозирования больше не могут удовлетворять аналитические потребности организаций. Обработка новых типов данных и новые аналитические требования понуждают к овладению многочисленными новыми аналитическими дисциплинами. Будьте готовы к тому, что для этого вам придется расширить наборы используемых инструментов и навыков.
Еще одна тенденция последнего времени – увеличение количества потоковых данных, особенно в связи с развитием датчиков и Интернета вещей. Потоковые данные часто бывают структурированными и, как следует из названия, представляют собой непрерывный, быстрый и крупномасштабный поток. Для их обработки используется, в частности, такая набирающая популярность дисциплина, как обработка сложных событий (CEP). При этом подходе CEP анализирует данные по мере их поступления и часто еще до того, как они загружаются в хранилище. Идея состоит в том, чтобы анализировать данные во время их перемещения из источника к месту хранения и таким образом максимально сократить время на принятие решений. Аналитика в CEP может включать в себя большинство других аналитических дисциплин. Отличие CEP в том, что аналитика здесь применяется максимально быстро и за пределами традиционных окружений. По своей природе CEP предназначена для применения в операционных целях.
Другие аналитические дисциплины, получающие широкое распространение, включают в себя:
• Распознавание лиц и другие виды анализа изображений, находящие применение во многих областях, от социальных сетей до сферы безопасности.
• Машинное обучение, чьи алгоритмы становятся все более усложненными. Такие компании, как Google, скрытно приобретают и используют технологии машинного обучения{65}.
• Анализ графов. Хотя теории, лежащие в основе анализа графов, были разработаны много лет назад, но только после развития социальных сетей и появления всеобщего стремления проверять отношения между людьми или организациями этот вид анализа стал обыденным.
• Геопространственный анализ, который до недавнего времени использовался только крупными логистическими или картографическими компаниями. Сегодня для пользователей смартфонов геопространственный анализ стал повседневной реальностью.
• Текстовая аналитика, испытавшая взрывной рост, когда стало возможным собирать все тексты организации, а также превращать речи в текст. Большинство крупных организаций уже применяют текстовую аналитику.
Чтобы двигаться вперед, придется добавлять в существующий набор все новые аналитические дисциплины. Приготовьтесь развивать навыки обращения с этими дисциплинами у себя в организации и применять для их поддержки специализированные инструменты.
Преимущества мультидисциплинарной аналитики
Как организация может сочетать различные аналитические дисциплины и какое преимущество это создаст? Прежде всего, давайте назовем подход с использованием разных аналитических дисциплин в рамках одного процесса «мультидисциплинарной аналитикой». Далее, чтобы проиллюстрировать путь к успеху, давайте рассмотрим историческую параллель с хранением данных. Хранилища возникли в результате того, что организации собирали все больше данных, но сам сбор не был скоординирован. Как правило, в разных частях организации имелись свои платформы управления данными, а также повсюду возникали киоски данных, сосредоточенные на нуждах отделов. Если кто-то хотел осуществить анализ с использованием данных от разных частей организации, то ему приходилось выполнять невероятно трудный и зачастую в ручном режиме процесс извлечения и объединения данных из всех этих разрозненных систем.
Концепция корпоративного хранилища данных (EDW) достаточно проста. EDW стремится, по мере возможности, собрать все необходимые для анализа данные на одной платформе. Любой пользователь может увидеть данные в том же виде, в каком они хранились в традиционном киоске данных, но при этом также получить доступ к данным из других киосков. Например, финансовые данные можно легко скомбинировать с данными по продажам. На протяжении многих лет концепция EDW генерировала огромную рыночную ценность, и сегодня такие хранилища есть фактически у любой крупной организации.
Каким образом оправдание хранения данных связано с мультидисциплинарной аналитикой? Актуальная проблема аналитики состоит в том, что даже при наличии централизованного EDW каждая аналитическая дисциплина часто имеет собственное внешнее окружение. Организация размещает статистическое ПО на одном сервере, ПО текстового анализа на другом, ПО анализа графов на третьем, комплект программ для оптимизации на четвертом и т. д. При таком изобилии аналитических инструментов, когда организация хочет сочетать разные аналитические дисциплины, она сталкивается с трудностями, аналогичными тем, что существовали еще до хранения данных. Поэтому не имеет смысла иметь все эти разные наборы инструментов, предназначенные для поддержки разных аналитических дисциплин в разных местах с ограниченной интеграцией, для чего потребуется каждый раз перемещать огромные объемы данных.
Сочетайте, сопоставляйте и исследуйте
Наличие возможности сочетать различные аналитические дисциплины дает огромное преимущество. Подобно тому как источники данных набирают мощность при объединении с другими данными, так и сочетание различных аналитических дисциплин придаст дополнительную силу. Платформа для обнаружения данных обеспечивает такую возможность.
Решение заключается в создании окружения, которое позволяет удовлетворять все аналитические потребности в одном месте. Платформа для обнаружения данных, о которой мы рассказали в пятой главе, идеально подходит для этой цели, как это видно на рис. 7.2. В идеале платформа должна иметь доступ ко всем хранилищам данных и позволять проведение анализа в рамках любой аналитической дисциплины. Некоторые специалисты будут по-прежнему фокусироваться на одной дисциплине, точно так же как некоторые пользователи хранилища данных продолжат работать с данными только своего отдела. Однако сейчас стало возможным изучить, как различные аналитические дисциплины могут взаимодействовать между собой и усиливать друг друга.
Мультидисциплинарная аналитика в действии
Давайте рассмотрим несколько наглядных примеров того, как сочетание различных аналитических дисциплин может принести гораздо более значимые результаты, чем применение каждой дисциплины в отдельности.
Когда текстовый анализ применяется сам по себе, он часто используется для сиюминутных и краткосрочных целей. Организации исследуют посты в социальных сетях и оценивают их тональность по шкале от позитивной до негативной. Также они определяют, о каких продуктах идет речь. Во многих случаях эти результаты включаются в сводные отчеты по трендам, которые показывают, как изменяется общая тональность и популярность отдельных продуктов. Часто на этом и заканчивается применение текстовой аналитики и данных социальных сетей.
Однако текстовая аналитика может быть использована и в стратегическом плане. Почему бы организации не отслеживать каждый комментарий, сделанный каждым клиентом по поводу ее продуктов? Например, несколько лет назад клиент мог сказать о том, что он любит красный цвет, а месяц назад заявить, что не любит зеленый. Наличие постоянного хранилища подобных фактов об интересах и предпочтениях клиентов может иметь огромную ценность. Это позволит выделить такие метрики, как предпочитаемые цвета, продукты, выбор продуктов и т. д., чтобы составить уточненный профиль каждого клиента. Например, метрика «не любит зеленый цвет» может быть включена в модели по определению следующего лучшего предложения. Таким образом, результаты текстовой аналитики можно использовать для улучшения совершенно не связанного с ней статистического аналитического процесса. Если же эти две аналитические дисциплины не сочетать, то модель по определению следующего лучшего предложения не будет учитывать цветовые предпочтения и окажется менее действенной.
Второй пример относится к анализу социальных сетей или к анализу графов. Знание связей между клиентами способно помочь в прогнозировании продаж новых продуктов. В добавление к проецированию на перспективу начальных продаж нового продукта анализ графов позволяет определить, кто его покупает и каким влиянием обладают эти люди. Благодаря исследованию количества и качества связей ранних последователей можно уточнить прогнозы дальнейших продаж. Например, если пользующиеся большим влиянием люди первыми попробуют новый продукт и положительно его оценят, они с большой вероятностью побудят других тоже его попробовать. Если же первыми покупателями становятся люди с небольшим кругом влияния, то признание продукта замедлится. Таким образом, дополнительная информация, поставляемая анализом графов, может быть использована для уточнения прогнозов продаж. Кроме того, повысится эффективность маркетинга, поскольку при определении людей с наибольшим кругом влияния им можно будет делать целенаправленные предложения.
Третий пример связан с добавлением симуляции к обычному моделированию. С помощью симуляции по методу Монте-Карло проверяется надежность результатов прогнозирования. Традиционная прогностическая модель определяет наиболее правдоподобные диапазоны оцениваемых параметров, а также пределы ошибки, что позволяет количественно установить, сколько шума от рекламы присутствует в данных. Симуляция по методу Монте-Карло может быть использована для исследования прогнозов посредством варьирования всех параметров в рамках соответствующих пределов ошибки. Это позволяет определить стабильность прогнозов, генерируемых моделью, и снизить риск при одновременном укреплении доверия к результатам.
Наконец, последний пример касается использования алгоритмов CEP для анализа потока сенсорных данных. Чтобы улучшить процессы CEP, можно применить алгоритмы машинного обучения к историческим данным. Ретроспективный взгляд на поток и применение машинного обучения для более точного определения шаблонов, присутствующих в данных, позволят улучшить алгоритмы обработки событий. Например, алгоритм, отыскивающий проблемы с двигателем, можно усилить, чтобы он распознавал ранее пропущенный инициатор проблемы, который был определен благодаря применению метода машинного обучения к анализу исторических данных с целью выявления факторов, ведущих к отказу двигателя.
Существует множество возможных способов сочетания аналитических дисциплин. Хотя вышеприведенные примеры касались только парных комбинаций, но их вполне можно развить и дальше, когда в один процесс включаются несколько различных дисциплин.
Сосредоточение аналитических действий
Когда организация готова приступить к превращению традиционной аналитики в операционную, она должна научиться сосредоточивать свои действия на нужных направлениях. Соблюдение нескольких ключевых правил поможет обеспечить распределение ресурсов в нужном направлении, чтобы не тратить время и деньги на реализацию ошибочных идей, основанных на ложных предположениях.
Задавайте правильные вопросы и делайте обоснованные предположения
Создаваемая аналитикой ценность зависит от того, как определена задача, какие вопросы заданы, как аналитическое решение разработано и как это решение реализуется. При этом выбор вопросов способен оказывать большее влияние на ценность, создаваемую результативным аналитическим процессом, чем детали этого процесса, разработанного для ответа на заданные вопросы.
Это имеет смысл. В конце концов, способен ли оказаться точным и полезным анализ, если решаемая им задача плохо определена или нужные вопросы не заданы? Ведь запросто можно идеально выполнить абсолютно неподходящий и ненужный анализ для решения неправильно поставленного вопроса. Хуже того, задав не тот вопрос, можно не выявить и ошибку. Если же вопрос кажется разумным и анализ ему соответствует, то в адекватности этого вопроса можно больше не сомневаться.
Когда потенциальные миллионы решений будут приниматься автоматически, даже небольшая ошибка при разработке аналитического процесса может привести к серьезным последствиям. Операционная аналитика требует как никогда внимательного подхода к определению анализа и разработке процесса. И по-прежнему необходимо учитывать разнообразные технические и практические факторы. Невозможно позволить себе внедрить полностью автоматизированный операционно-аналитический процесс в требуемом масштабе, если не доверяешь его надежности.
Не обрекайте анализ на неудачу с самого начала
Способ определения задачи, постановки вопросов и разработки анализа может оказать большее влияние на полученные результаты, чем вся нелегкая работа, которая за этим последует. Ничего не стоит разработать анализ, отвечающий на неправильно поставленный вопрос для решения неправильно определенной задачи.
Это подводит нас к необходимости внедрения подхода, который пока еще не стал, но должен стать привычным. В процесс разработки анализа должно входить тестирование сделанных предположений. Для этого можно использовать дисциплину, обычно используемую в инжиниринге, под названием «анализ чувствительности»{66}.
Любой аналитический процесс опирается на конкретные предположения. Это могут быть предположения о темпах роста продаж, увеличении на рынке доли конкурента или будущих затратах на сырье. Результат аналитического процесса окажется неправильным, если неточны исходные предположения. Однако по мере того как становятся известны фактические значения, оказывается, что они отличаются от предполагаемых (в лучшем случае ненамного). Важнейший вопрос: если истинные значения в той или иной степени отклоняются от наших предположений, как это влияет на результаты анализа?
Например, сотрудники могут расходиться во мнениях о том, каким будет уровень инфляции – 3, 4 или 5 %. Здесь им на помощь придет анализ чувствительности, который позволяет показать, как изменение темпов инфляции повлияет на результаты анализа. Если независимо от того, чей прогноз окажется точнее, результаты анализа приведут к одному и тому же ответу, тогда сотрудникам не придется приводить свои прогнозы к единому показателю. Достаточно определить вероятный диапазон, скажем от 3 до 5 %, поскольку при любом из этих значений анализ приведет к одинаковому решению.
Впервые я столкнулся с такой необходимостью при разработке моделей комплексного маркетинга, которые включали данные телерекламы. Мало того, что последние были предельно обобщены, так нам к тому же нужно было сделать множество предположений в отношении этих данных, чтобы подготовить их для включения в наши модели. Например, каким будет темп затухания впечатлений от рекламы? Темп затухания – очень простая концепция. Телереклама способна повысить продажи. Однако люди действуют под влиянием рекламы, т. е. активно покупают рекламируемый товар в магазине или онлайн, всего в течение нескольких дней. При первых показах телерекламы ее влияние на покупательское поведение максимально, а затем это влияние постепенно снижается. Такое сокращение и называется темпом затухания, оказывающим заметное влияние на результаты. На рис. 7.3 показаны примеры темпа затухания.
В свое время я получил рекомендацию, которой до сих пор следуют многие специалисты-аналитики: если выдаваемые моделью оценки параметров являются статистически значимыми и модель обладает мощной объяснительной силой, значит, предположения насчет темпа затухания верны и модель является работоспособной. Но, следуя такому подходу, я столкнулся с серьезной проблемой.
Однажды я создал хорошую модель с использованием стандартного темпа затухания. Однако мне пришло в голову посмотреть, что будет, если я изменю свои предположения насчет темпа затухания и запущу модель заново. Я был поражен, когда получил по-прежнему статистически значимые оценки параметров, а у модели по-прежнему доставало объяснительной силы. Но при этом новые оценки параметров расходились с предыдущими оценками больше, чем допускали пределы ошибки. Стало понятно, что наличия хорошей модели и статистически значимых параметров было недостаточно для доказательства правильности исходных предположений. И, мало того, мои предположения о темпе затухания влияли на результаты больше, чем сама модель. Мы с моей командой приложили массу усилий, чтобы окончательно определить максимально точные, на наш взгляд, предположения. Тем не менее мне и по сию пору становится не по себе от мысли о том, что предположения способны настолько радикально повлиять на результаты анализа.
Предположения увеличивают риски; оцените риски
При создании аналитического процесса делается много предположений, причем вероятность того, что все они будут абсолютно точными, крайне низка. Полезно оценивать, как изменяются результаты, по мере того как варьируются фактические значения под влиянием предположений в правдоподобном диапазоне. Это позволяет лучше понять сопряженные с анализом риски.
Далеко не всегда все разумные предположения будут приводить к одинаковому ответу. В некоторых ситуациях один набор разумных предположений даст положительный результат, тогда как другой набор – отрицательный. В таких случаях необходимо прийти к согласию относительно заключительного предположения и оценить риски, связанные с возможной ошибкой. Когда разные предположения ведут к разным ответам, разумно использовать для подстраховки наиболее консервативные предположения. Анализ чувствительности для оценки влияния предположений не устраняет риски, а просто позволяет измерить их количественно и лучше их осознать. Хорошим инструментом для такой оценки предположений служит моделирование по методу Монте-Карло.
Делайте ваши ставки!
Как мы увидели во второй главе, хотя затраты на сбор и хранение данных снизились, но по крайней мере столь же быстро растут объемы данных и аналитические потребности организаций. Сегодня существует такое широчайшее разнообразие аналитических возможностей, что порой это приводит в замешательство. Все решения о том, где следует сделать ставки, должны быть основаны на надежном суждении. Причем в отношении больших данных и операционной аналитики оно должно быть не менее надежным, чем в прошлом. Ведь чем больше появляется данных и во все более разнообразных сочетаниях, тем проще пойти по ложному пути. Или же можно наткнуться на ложные корреляции, которые не имеют никакого отношения к реальности.
Например, при построении статистических моделей можно угодить в стандартную ловушку ввиду того, что многие модели устанавливают меру доверия к своим оценкам значений параметров. Общепринятый стандарт требует по крайней мере 99 %-ного уровня доверия к тому, что эффект действительно существует, а не является чисто случайным совпадением. Когда тестируется всего несколько факторов, шансы на успех невелики и, вполне вероятно, что некая абсолютная фальшивка будет признана статистически значимой. Но подумайте о петабайтах сенсорных данных, генерируемых современным самолетом. Возможно, появятся тысячи или даже десятки тысяч метрик, способных коррелировать с такими событиями, как перегрев двигателя. Если при исследовании 20 000 факторов устанавливается уровень доверия в 99 %, то можно ожидать, что 200 совершенно ложных факторов будут признаны статистически значимыми.
Необходимо решить, какие метрики должны быть включены в анализ, чтобы оставить из них только разумные. Но даже после такой фильтрации может остаться множество метрик, которые будут приводить к выявлению ложных эффектов. После построения модели требуется осуществить дополнительный анализ для проверки реальности обнаруженных эффектов. Оценке должен подвергаться весь процесс.
Не спешите выносить приговор
Отличный пример, хорошо иллюстрирующий затронутые в этом разделе темы, связан с компанией Boeing и ее самолетом модели 787. В 2012 г. компания попала в новости из-за проблем с аккумуляторами на 787{67}. Это дорого обошлось ей и в финансовом плане, и с точки зрения ущерба репутации. Во время моего выступления на одной из конференций меня спросили, не считаю ли я, что Boeing облажалась, не сумев исправить проблему с аккумуляторами до выпуска самолета на рынок. Задавший этот вопрос человек считал, что, получив в ходе тестирования все сенсорные данные, компания должна была обнаружить дефект. Я ответил, что не совсем справедливо рассматривать ситуацию под таким углом, поскольку не все так просто. Я предпочитаю считать людей или компании невиновными до тех пор, пока их вина не доказана. Задним числом может казаться, что выявить проблему с аккумуляторами было несложно, но давайте рассмотрим несколько соображений, которые противоречат такой точке зрения.
Во-первых, вполне возможно, что Boeing не собирала таких данных, которые позволили бы выявить конкретную проблему с аккумуляторами. Во-вторых, даже если компания собирала нужные данные во время тестирования, то скорее всего и проанализировала их, но не обнаружила вызывающих тревогу шаблонов. Возможно, проблема возникла только тогда, когда самолет начал эксплуатироваться в реальных условиях. Более того, даже если данные содержали информацию, позволяющую выявить проблему, это вовсе не означает, что компания облажалась. Позвольте мне объяснить, в чем дело.
Не становитесь жертвой суждений задним числом
Когда нужно проанализировать столь много данных по самым разным направлениям, следует, применив здравый смысл, воспользоваться возможностями, способными оказать самое сильное воздействие. Задокументируйте принятие решения с указанием, на чем были сосредоточены усилия, чтобы впоследствии защитить свои действия от суждений задним числом. Найти иголку в стоге сена почти невозможно. Но, когда она обнаружена, ее почти невозможно упустить.
С учетом тех объемов данных, которые генерируются мириадами датчиков на Boeing 787, невозможно исследовать каждую деталь, способную сломаться. На это попросту не хватит времени с точки зрения как рабочей силы, так и вычислительных мощностей. Инженерам и специалистам-аналитикам компании пришлось, исходя из предположений, выбирать, где сосредоточить свои усилия. Безусловно, они изучили области высокого риска. В самолете имеются компоненты, чей отказ может привести к катастрофе, такие как двигатель и шасси. Я уверен, что компания приложила много сил для анализа в этих областях. В то же время не столь страшно, если во время полета перестанет работать кнопка вызова стюардов. Эту поломку легко устранить, и она не несет никакого реального риска для экипажа или пассажиров. Проблема с аккумуляторами находится где-то посередине между этими двумя крайностями. Вполне возможно, что аккумуляторы не были сочтены источником высокого риска, чтобы уделить им пристальное внимание, притом с учетом ограниченности ресурсов и прошлого опыта.
Разумеется, возможно, что Boeing анализировала данные с аккумуляторов, и эти данные позволяли выявить проблему, но компания ее проглядела. Возможно, что Boeing действительно облажалась. Но без дополнительных фактов мы не можем знать об этом наверняка.
Отсюда вытекает урок: по мере того как организация собирает все больше данных и создает все больше аналитических процессов, специалисты-аналитики должны документировать свои процессы принятия решений. Это означает документировать не только то, что анализируется, но и то, что не анализируется и почему не анализируется. Найти иголку в стоге сена будет невозможно, пока кто-нибудь не укажет вам на нее. Но, когда вы узнаете, где находится иголка, то четко ее разглядите. Подобным же образом, когда возникла проблема с аккумуляторами в самолете, было естественным вообразить, что ее следовало выявить заранее. Документирование выбора места для сосредоточения аналитических усилий позволяет смягчить подобную критику задним числом. Проблемы часто не бывают очевидными до тех пор… пока вдруг не станут очевидными просто потому, что они возникли.
Сравнение аналитических подходов
Есть несколько различных способов создания аналитических процессов. Хотя на первый взгляд эти подходы могут казаться похожими, между ними существуют различия, которые важно осознать. Некоторые аналитические подходы часто понимаются неправильно и считаются намного менее логичными и высококлассными, чем они есть на самом деле. В этом разделе мы рассмотрим несколько основных подходов, призванных стать частью действий любой организации по внедрению операционной аналитики.
Обнаружение данных и подтверждающий анализ
В прошлом бо́льшая часть аналитики представляла собой то, что можно назвать «подтверждающим анализом». Он начинается с формулировки конкретной гипотезы или постановки конкретной цели. Далее выполняется анализ, чтобы подтвердить (или нет) гипотезу либо проложить путь к цели. Другими словами, анализ начинается с очень четкого определения направления и поля деятельности. Например, меня могли бы попросить ответить на вопрос, в какой степени информация о продуктах, просмотренных клиентом в сетевом журнале, повышает продвижение моделей, используемых для прогнозирования вероятности покупки. Когда поле деятельности было четко определено, я мог с самого начала уверенно оценить свои трудозатраты и назвать критерии, по которым будет оцениваться успешность моих действий. Это облегчало мою работу в рамках типичных корпоративных процессов обоснования проектов.
Мир больших данных все чаще ориентируется на то, что можно назвать исследовательской аналитикой. Такой анализ начинается не столько с постановки конкретной гипотезы или цели, сколько с попытки найти в данных ценность, которая может оказаться полезной при постановке более широких целей или набора гипотез. Наличие у специалистов-аналитиков лишь немногих заранее сложившихся идей вовсе не означает, что они изначально не имеют представления о том, что хотят узнать в ходе анализа. Это просто означает, что задачи изначально являются менее формализованными, не очень четко определенными и жестко поставленными.
Например, меня могут попросить проверить, можно ли использовать новый источник данных с целью повысить эффективность моделей, применяемых для прогнозирования вероятности покупки. Я волен сам выбирать лучшие метрики, лучшие способы тестирования этих метрик в рамках аналитического процесса и лучшие методики, которые следует использовать. Могу начать с целого ряда идей, но заранее не знаю наверняка, какие из них сработают, и не могу оценить свои трудозатраты и определить критерии успеха, пока не выполню анализ. В силу этих обстоятельств сотрудники поначалу могут испытывать дискомфорт. Между тем исследовательский анализ существует уже достаточно долгое время и всегда играл важную роль для крупных организаций. Сегодня этот тип анализа начинает приобретать все большую актуальность, поэтому на него начинает выделяться больше ресурсов, чем в прошлом. Исследовательский анализ также можно назвать пробным анализом.
Исследование данных не является случайным или бесцельным процессом
Иногда к исследовательскому анализу относятся скептически, считая, что специалисты-аналитики просто играют с данными в попытке найти нечто стоящее. Это не так. Просто исследование данных начинается с постановки более широкой цели и специалистам предоставляется больше времени для достижения этой цели.
По мере того как организации увеличивают использование аналитики и, следовательно, пул талантливых аналитиков и аналитические обрабатывающие мощности, им становится гораздо проще выделять пусть даже небольшую долю ресурсов на исследовательскую аналитику. Если команда аналитиков небольшая, возможно, будет трудно высвободить сотрудника, который будет заниматься конкретно такими исследованиями, поскольку команда едва справляется с потребностями организации в подтверждающей аналитике. Но если команда большая, то будет гораздо легче высвободить время и для исследовательских действий.
Исследовательский анализ начинается с постановки более широкой цели, но при этом на момент начала проекта остается неизвестным наилучший способ ее достижения. Здесь нет четко очерченного плана анализа в отличие от проекта с использованием подтверждающей аналитики. Например, подробный план по созданию нового механизма рекомендаций станет непременной частью подтверждающего анализа. А исследовательский анализ может начаться, когда задается только основное направление, например найти возможные способы улучшения действующего механизма рекомендаций. Специалисты будут экспериментировать, чтобы найти оптимальный вариант улучшения механизма. Команда станет исследовать различные источники данных и методологии, пока не найдет наилучший вариант. В этот момент может быть принят более жесткий план, с тем чтобы запустить в работу подтверждающий анализ.
Чтобы наглядно проиллюстрировать различия между подтверждающим и исследовательским анализом, можно провести параллель с ситуацией в энергетической отрасли. Нефтегазовые компании тратят массу денег на определение мест для бурения скважин. Эта деятельность сходна с исследовательским анализом, поскольку компании изучают широкий спектр нетестированных вариантов, чтобы выбрать из них наиболее подходящие для бурения. После того как находится площадка, обладающая потенциалом, приступают к бурению. Начинается этап с подтверждающего анализа. Компания знает точно, где бурить и что она ищет. В процессе бурения она либо находит нефть, либо нет. Другими словами, гипотеза о том, что в данном месте залегает нефть, либо подтверждается, либо нет.
Исследования и разработки или хакерство?
Люди часто ошибочно воспринимают исследовательский анализ как бездумное хакерство и бесполезное экспериментирование. Такое отношение абсолютно несправедливо, если исследовательский анализ осуществляется надлежащим образом. Исследовательскую аналитику следует рассматривать как один из видов исследований и разработок (НИОКР) с вытекающим отсюда намерением впоследствии монетизировать результаты. Разумеется, чтобы найти способы монетизации (или определить отсутствие таковых), могут потребоваться дополнительные эксперименты.
Крупные сети ресторанов и производители продуктов питания имеют специальные тест-кухни, где они экспериментируют с десятками или сотнями рецептов в поисках интересных новинок, которые можно включить в меню или производимый ассортимент. Сходным образом аналитической команде может потребоваться испытать ряд аналитических процессов, прежде чем она найдет заслуживающий его превращения в операционный.
Например, перед тест-кухней может быть поставлена такая неопределенная задача, как «создать новый рецепт сэндвича с курицей». Повара получают широкую свободу в изучении трендов и вкусов, популярных сегодня на рынке. Например, какие приправы входят в моду? Недавний тому пример – сэндвичи на фигурных булках (брецелях), появившиеся в 2013 г. Эта новинка стала настолько популярной, что многие сети быстрого питания включили брецель-сэндвичи в свое меню. Итак, тест-кухня получила некие общие указания. Хотя повара и понимали, что им нужно создать новый рецепт сэндвича с курицей, но каким именно должен быть окончательный рецепт, в указаниях не сообщалось. После того как повара узнали о том, что в моду вошел брецель, они сосредоточились на поиске рецепта вкусного брецеля и рецепта сэндвича, который приобретет вкус в сочетании с брецелем. Именно так и должен проходить исследовательский анализ, а рассматривать его следует как деятельность с широкой целью в рамках НИОКР.
Организация должна обеспечить в своей корпоративной культуре место для исследовательской аналитики, чтобы она расценивалась не как бесцельное хакерство, а как научное начинание. Такое небольшое изменение привычного образа мыслей может значительно ускорить поиск организацией новой аналитики, способной к превращению в операционную. Постановка более широких, но обоснованных задач позволяет сфокусировать внимание аналитической команды на реальных потребностях бизнеса, а не на любопытных идеях, не способных к воздействию. Специалисты-аналитики могут легко сбиться с пути, следуя интересным, но несущественным трендам, если они будут просто предаваться хакерству, а не начнут официально работать в рамках НИОКР. Каждая исследуемая ими идея должна оцениваться с точки зрения ее полезности для бизнеса. А хакерством они могут заняться в качестве хобби по выходным дням.
Как уже говорилось в шестой главе, даже на этапе НИОКР специалисты должны учитывать те ограничения, с которыми они столкнутся при внедрении процесса в производство. Например, тест-кухня не будет придумывать такой рецепт сэндвича, приготовление которого потребует нового дорогостоящего оборудования – разумеется, если только повара не сумеют доказать, что установка такого оборудования в каждом заведении сети для поддержки свежеиспеченного продукта окупит себя. Аналогичным образом учет ограничений в ходе НИОКР позволит аналитикам избежать путей, непригодных для превращения их в операционные. Например, все знают о знаменитом конкурсе Netflix Prize[5]. Однако многие победившие в нем решения так и не были претворены в жизнь, поскольку прирост точности прогнозов не оправдывал огромных затрат, требуемых для улучшения алгоритма фирмы Netflix{68}.
Укрепление процессов для внедрения в операционном масштабе
Есть аспект в операционной аналитике, с которым трудно смириться профессионалам. Он заключается в том, что при операционализации аналитики часто бывает необходимо отказаться от некоторой точности или сложности аналитических процессов. Операционная аналитика требует смириться с использованием хороших (а не идеальных) данных, с получением хороших (а не идеальных) результатов и с изменением критериев для оценки успеха. Теоретическая точность и продвижение аналитического процесса не так важны, как фактическое влияние генерируемых им решений и рекомендаций. Например, если водители будут игнорировать предлагаемые им оптимальные маршруты, то воздействие аналитических процессов будет нулевым независимо от того, насколько они хороши.
Как об этом говорилось в шестой главе, когда аналитика выполняется в качестве кастомизации или в индивидуальном порядке, процессам может быть присуща известная хрупкость. В такую «ручную работу» вполне можно добавить немного элегантности и усложненности, чтобы сделать анализ подлинно уникальным и максимально ценным, поскольку он будет использоваться в небольших масштабах.
Точно так же вы способны с легкостью украсить свой дом в соответствии с вашими потребностями и вкусами. Декор может включать множество очень красивых и хрупких вещей. Однако вы бы никогда не использовали их для украшения общественных мест, таких как торговый центр или офисное здание. В тех редких случаях, когда ценные и хрупкие вещи выставляются в общественных местах, например музеях, требуются дополнительные меры безопасности, включая толстые органические стекла и поглощающие вибрацию витрины. Подобно тому как необходимо применять разные стандарты оформления интерьера для дома и общественных мест, так же необходимо применять и разные стандарты для аналитических процессов, когда они переводятся из разряда «ручных» в разряд операционных.
Производство любого продукта в количестве миллионов штук за день в промышленном масштабе требует некоторых компромиссов. При разработке дизайна продукта производители вынуждены идти на компромиссы постоянно. Очень изысканный дизайн бокала для вина может сделать его слишком хрупким для частого использования, например, в ресторанах. В таком случае можно частично пожертвовать изысканностью дизайна ради обеспечения большей прочности.
Организации должны сосредоточиться на оптимизации общего воздействия своих операционно-аналитических процессов, а не на достижении изощренности или абсолютной точности каждого отдельного решения в рамках процессов. Иногда, немного пожертвовав изощренностью и точностью, можно превратить нулевое воздействие в очень значительное. От небольшого дополнительного повышения точности будет мало толку, если решение не может быть реализовано в операционном масштабе.
Оптимизируйте совокупное качество решений
В операционной аналитике цель – максимизировать не качество каждого отдельного решения, а совокупное воздействие процесса на все решения. Это может потребовать отказа от некоторой аналитической мощности, чтобы сделать процесс достаточно устойчивым для внедрения его в промышленном масштабе.
Не поймите меня неправильно! Я не ратую за отказ от всяких стандартов. Даже если при разработке продукта делались некоторые уступки, промышленная производственная линия всегда подчинена строжайшим процедурам контроля качества. Когда небольшое повышение точности аналитического процесса достигается за счет удвоения времени на его выполнение, это не сработает. Если применяемый аналитический метод высокочувствителен к выбросам данных, будет слишком рискованно применять его в окружении, где нет возможности осуществлять проверку данных перед их использованием. Остается надеяться, что абсолютно лучшее решение и решение, наиболее пригодное для операционного внедрения, не будут слишком сильно расходиться между собой. Тем не менее необходимо делать между ними различие.
Давайте на минутку обратимся к контрольным процессам на производственных линиях. Производители используют процедуры статистического контроля, выдающие постоянные сводки о работе производственного процесса. Статистический контроль процессов предоставляет информацию о том, находятся ли различные показатели в ожидаемом диапазоне и в каком направлении они изменяются. Когда какой-либо показатель выходит за пределы допустимого диапазона, применяется корректирующие действие. Например, если температура изделий по выходу из печи становится слишком высокой или слишком низкой, производственная линия может быть остановлена с целью регулировки печи.
Процедуры статистического контроля процессов могут применяться и к операционно-аналитическим процессам. Организация способна отслеживать решения, принимаемые аналитическим процессом, а также данные, на основе которых решения принимаются. Принимаются ли решения в тех же пропорциях, что и раньше? Показывают ли вводимые данные то же ожидаемое распределение, что и раньше? Когда один из показателей начинает отклоняться от установленных параметров, кто-то должен вмешаться, остановить процесс и устранить неполадку точно так же, как это происходит на производственных линиях. Для контроля за операционно-аналитическими процессами могут использоваться методы традиционной аналитики.
Успех операционной аналитики зависит не только от мощности и эффективности собственно аналитики, но и от того, как люди и организационные процессы фактически используют рекомендации и следуют решениям. Поведение сотрудников должно измениться под воздействием аналитики, иначе она не принесет искомой отдачи. Вот почему изменение организационной культуры является ключом к успеху операционной аналитики, о чем мы подробнее поговорим в девятой главе.
Уроки прошлого
На протяжении всей книги я делаю акцент на том, что многие уроки прошлого применимы и в мире больших данных и операционной аналитики. Существуют классические аналитические концепции, от которых не следует отказываться, несмотря на шумные призывы к отказу. Давайте рассмотрим несколько областей, где шумиха могла затмить реальность.
Статистические методы по-прежнему актуальны
Сегодня можно наткнуться на мнение, кто классические методы статистики – это устаревшие концепции, предназначенные только для малых данных. Это абсолютно ошибочная точка зрения. Разумеется, аналитика развивается и добавляет все новые аналитические дисциплины, поэтому организации должны расширять свои аналитические компетенции за пределы классических методов статистики. Некоторые аналитические методы и алгоритмы, такие как алгоритмы поиска и обработки естественного языка, не основаны непосредственно на методах классической статистики. Это нормально. Однако подобно тому как добавление нереляционного окружения к реляционному не означает, что потребности в реляционной обработке канули в лету, так и добавление дополнительных аналитических дисциплин к классической статистике не говорит о том, что последняя потеряла свое значение{69}.
Независимо от того, насколько большим является источник данных, ему все равно присущи вариативность и неопределенность. Данные никогда не бывают идеальными, и в изучаемых нами совокупностях данных всегда будет присутствовать естественная вариативность. Сколько бы данных у нас ни имелось, невозможно с идеальной точностью предсказать поведение каждого конкретного человека или поломку каждого конкретного двигателя, поскольку нам всегда будет недоставать некоторой информации и всегда будут присутствовать неучтенные факторы{70}. Статистика позволяет количественно оценить и учесть риски, сопряженные с этими пробелами. Давайте рассмотрим следующий пример.
В последнее время большую популярность приобретает такой нестатистический метод, как пат-анализ (он же анализ троп). Как правило, он используется для идентификации серии действий каждого клиента и соотнесения путей, которыми он следует, с проявлениями его интереса. Эти действия могут включать снятие средств через банкомат, звонки в колл-центр, внесение средств на счет, клики на веб-страницах, твиты и любые другие, прямо или косвенно затрагивающие организацию. В путь могут быть включены десятки возможных действий. На протяжении многих лет пат-анализ применялся к веб-трафику, позволяя определять, как пользователи передвигаются по сайту и какие пути с наибольшей вероятностью ведут к продажам. Сегодня этот аналитический метод начинает выходить за рамки веб-трафика.
Статистика умерла… Да здравствует статистика!
Идея о том, что статистика потеряла свою актуальность, – заблуждение. Тогда как сегодня действительно существует необходимость выходить за рамки только классических статистических методов, сами по себе эти методы остаются крайне важным компонентом операционной аналитики.
Установление ключевых фактов о типичных путях позволяет повысить мощность прогностических моделей благодаря включению в них уникальной информации. Рассмотрим сценарий с четырьмя конкретными взаимодействиями: снятием средств через банкомат (А), звонком в колл-центр (B), визитом в филиал банка (C) и подачей жалобы (D). Свой путь я обозначу как ABCD: сначала снял деньги в банкомате, потом позвонил в колл-центр, далее нанес визит в филиал банка и, наконец, подал жалобу. После идентификации пути каждого клиента можно легко определить, какие из путей являются наиболее типичными и к каким, положительным или отрицательным, исходам относительно интересующих организацию метрик они ведут, например к открытию нового счета или закрытию существующего. Использование статистики может повысить точность пат-анализа и расширить его применение. Создав набор вспомогательных метрик, отражающих ключевые особенности каждого пути, можно более глубоко исследовать, какие аспекты путей влияют на интересующие организацию метрики. Резюме может включать следующие метрики:
• Повышает ли звонок в колл-центр риск ухода клиента в любой ситуации?
• Подача жалобы имеет значение только в том случае, если она является первой или последней в серии действий?
• Такие действия, как визит в филиал и подача жалобы, имеют значение только в сочетании, но не по отдельности?
• Подача жалобы после звонка клиента в колл-центр приобретает большее значение, чем когда предшествует звонку?
• Подача жалобы сразу по трем каналам коммуникации в любом сочетании существенно увеличивает риск ухода клиента?
На эти вопросы можно ответить, если маркировать путь каждого клиента при помощи серии числовых переменных, определяющих наличие или отсутствие ключевых характеристик пути. Например, одна переменная будет иметь значение 1, если путь включает комбинацию визита в филиал и звонка в колл-центр, и 0, если не включает. После создания широкого спектра переменных можно использовать классический корреляционный или регрессионный анализ для определения того, какие характеристики пути в наибольшей степени связаны с интересующей организацию метрикой. В рассматриваемом нами сценарии нестатистическая функция пути используется для поиска новой информации, которая затем может быть проанализирована строгими статистическими методами. Таким образом, статистика усиливает эффективность пат-анализа. Это еще один пример воздействия мультидисциплинарной аналитики, о чем мы уже говорили ранее в данной главе. Статистика живет и процветает.
Не пренебрегайте выборками
Концепция использования выборок в аналитических процессах родилась практически вместе с самой аналитикой{71}. В прошлом необходимость работы с выборками, а не со всей совокупностью данных диктовалась ограниченными возможностями обработки. В последние годы во многих случаях стало возможным собирать и анализировать всю совокупность интересующих нас данных, поэтому начались разговоры о том, что эпоха выборочных исследований подошла к концу.
Давайте начнем с признания того, что есть случаи, когда выборочный метод просто не будет работать. Если вам нужно найти 100 клиентов, обеспечивающих самые большие объемы продаж, это нельзя сделать на основе выборки. Вы должны рассмотреть каждого клиента, чтобы найти 100 лучших. Однако такие задачи, хотя и являются довольно типичными, не превалируют среди аналитических потребностей. Кроме того, существуют случаи, когда модель, даже если она построена на основе выборки, должна быть применена ко всей совокупности данных. Другими словами, когда дело доходит до практического применения модели, вариант с выборками отпадает.
Но давайте обратимся к типичной задаче, когда необходимо установить среднее значение или получить оценки параметров прогностической модели. С точки зрения статистики правильная выборка, которая адекватно отражает всю совокупность и имеет достаточный размер, даст такой же ответ, как и вся совокупность данных. В таких обычных ситуациях практически не будет разницы между ответом, полученным на выборке, и ответом, полученным на всей совокупности. Более высокая стоимость обработки массы дополнительных данных не принесет дополнительных доходов. Даже если модель в конечном итоге будет использована для обработки всех данных, нет смысла создавать модель на основе всей совокупности. Вместо этого необходимо разделить все данные на две части и использовать одну для построения, а другую для последующей валидации модели. Угадайте, что представляют собой наборы данных, предназначенные для построения и проверки модели? Это выборки! Таким образом, использования выборок данных во многих случаях попросту нельзя избежать.
Некоторые специалисты с пеной у рта утверждают, что в тех случаях, когда можно обойтись без выборки, нужно обходиться без нее. Другие считают, что использование более чем минимальной выборки – это пустая трата времени и ресурсов. Лично моя позиция такова: если некто выполняет для меня проект и хочет использовать выборку, я соглашаюсь при условии, что выборка является правильной и достаточного размера. Если же мне предлагают использовать всю совокупность данных, я соглашаюсь и на это при условии, что привлечение дополнительных ресурсов окажется незначительным. Я уверен, что получу такие же результаты, поэтому меня не беспокоит, какой именно путь будет избран. При разработке аналитического процесса существует масса спорных вопросов, поэтому не тратьте время на споры о том, использовать выборку или нет.
Не переусложняйте анализ
Впервые столкнувшись с этой проблемой, я был поражен: оказывается, чересчур изощренная аналитика иногда дает худший результат, чем простая. Это может быть верно даже в тех случаях, когда чисто теоретически более сложный метод должен работать лучше. Убежден, причина в том, что данные всегда содержат некоторую неопределенность, зачастую являются разреженными и никогда не бывают абсолютно полными. Когда аналитика усложняется, возникает риск увеличения в данных ошибок и неопределенностей наряду со снижением контроля и ухудшением их расчета. Вдобавок можно перестараться с настройкой модели, т. е. настолько ее усложнить, что она начнет отражать случайные вариации, присутствующие в конкретном наборе данных, на котором модель создавалась, а не реально существующие эффекты. Переусложненная настройка становится очевидной, когда модель плохо работает при применении к проверочной выборке.
Несколько лет назад моя команда разрабатывала модели прогнозирования продаж на уровне отдельных магазинов для крупного ретейлера. Анализ должен был охватывать сотни миллионов комбинаций магазин/товар. Многие виды товаров продавались часто и стабильно, что соответствовало предположениям, на которые опираются широко используемые алгоритмы для такого типа прогнозов. Однако также было много товаров, что не вписывались в стандартные шаблоны продаж. Клиент нанял мою команду, чтобы разработать индивидуальные решения, применимые к таким исключениям. Однако, с учетом масштабов организации, исключения все равно составляли миллионы комбинаций магазин/товар.
Не слишком изощряйтесь!
При создании аналитических процессов в операционном масштабе упрощенные решения могут оказаться лучше причудливых. Операционная аналитика часто работает с данными низкого качества, которые могут быть разреженными и неполными. Чрезмерная изощренность модели может привести к нарастанию в данных проблем, вместо того чтобы контролировать их.
Мы с самого начала знали, что клиент нанял еще одну консалтинговую фирму для реализации того же проекта и что команда, предложившая лучшее решение, будет выбрана для дальнейшей работы. Поскольку другая фирма бросила на проект больше людей, чем наша, победить за счет грубой силы мы не могли. У меня был опыт сотрудничества с этой фирмой в прошлом, и я знал, что ее сотрудники любят использовать наборы сложных алгоритмов для повышения точности прогностических моделей. Однако в этом конкретном случае существовала вероятность того, что такой подход не сработает в требуемом масштабе. Я попросил свою команду начать с простых алгоритмов и постепенно увеличивать их сложность, пока не будет достигнут такой порог, когда начнет страдать их масштабируемость.
Когда проект только начался, я предположил, что другая команда превзойдет нас в абсолютной прогностической точности, однако для масштабирования разработанного ею решения потребуются настолько значительные усилия, что это будет признано нецелесообразным. В то же время наши пусть и менее точные модели должны были лучше работать на практике. Я был приятно удивлен, когда оказалось, что наши модели оказались и более точными. Учитывая неполную и разреженную природу данных, изощренные многоступенчатые алгоритмы усиливали помехи, вместо того чтобы их контролировать. Моя команда думала, что мы отказываемся частично от аналитической мощности ради операционной масштабируемости (об этой концепции уже несколько раз говорилось в книге). Однако в итоге вышло так, что в данном случае простой подход сработал лучше и нам не пришлось ничем жертвовать. Вот почему не следует думать, что всегда лучше делать выбор в пользу изощренности. Пробуйте и простые варианты.
Операционная аналитика должна обеспечивать решения
В свете нашего разговора об аналитике легко впасть в заблуждение и решить, что сотрудников среднего звена в организациях интересует аналитика. Она их не интересует! Большинство сотрудников интересует возможность решения тех проблем, которые у них есть. Если аналитика может предложить такое решение, они ее принимают, но сама по себе она им неинтересна. Запомните: их интересует не аналитика, а решение проблемы!
Разумеется, во многих случаях мои заказчики проектов в определенной степени интересуются аналитикой. Например, сотрудники, отвечающие за базу маркетинговых данных, охотно обсуждают со мной аналитические тонкости и решения. Руководители подобных отделов понимают и приветствуют аналитику и, кроме того, часто имеют подготовку в этой области. Что же касается операционной аналитики, то многих моих клиентов заботит только решение проблемы. Это может быть снижение уровня мошенничества, повышение эффективности в цепочке поставок или сокращение затрат на техническое обслуживание, но за пределами воздействия на проблему аналитика их не интересует. Более того, основными пользователями операционной аналитики обычно выступают рядовые сотрудники, которые не имеют необходимого образования для понимания аналитики. Но они должны иметь возможность использовать аналитику, даже если не разбираются в ее деталях.
Вот почему я рекомендую делать акцент на решении проблемы. Покажите, что процесс работает, но не сосредоточивайтесь на самой аналитике при демонстрации ее результатов. Если ваши клиенты или непосредственные пользователи процессов не понимают нюансов и сложностей, лежащих в основе аналитических процессов, нет смысла перегружать их подробностями. Иначе они могут вообще отказаться от внедрения аналитических процессов. Просто продемонстрируйте, что процесс работает, опишите все преимущества и на этом остановитесь – если только вас не попросят о дополнительной информации.
Обеспечьте решения, а не лекции по теории аналитики
Многие заказчики и пользователи операционной аналитики не понимают аналитики или не испытывают к ней интереса. Их заботит только возможность решения проблемы. Убедите их в том, что аналитика поможет решить их проблему, но не углубляйтесь в технические подробности. Если же людей перегрузить информацией, они могут вообще отказаться от выполнения предложенного им решения.
Многие из нас не желают вникать в детали непонятного нам явления. Например, большинство людей не хотят вникать в то, как работает двигатель автомобиля и почему после нажатия на педаль газа топливо подается в карбюратор. Обычно человек просто хочет знать, что, если он нажмет на педаль газа, автомобиль поедет вперед. С операционной аналитикой дела обстоят точно так же, когда ее пользователями становятся люди, не желающие вникать в принципы ее работы.
Операционная аналитика просто должна быть частью предлагаемого вами решения проблемы. Если вы продемонстрируете, что найденное решение приносит нужные результаты, то уже осчастливите заказчиков и пользователей. Им не понадобится вникать в детали. А будут ли конечные пользователи полностью разбираться в стоящей за решением аналитике или принимать ее, это действительно не важно. Если вы помните, в первой главе мы рассматривали пример с логистической компанией, которая решила уменьшить ежедневный километраж для своих водителей службы доставки. Многие водители с пренебрежением отнеслись к компьютерным рекомендациям, поскольку оказалось, что при более вдумчивом подходе они смогли найти способы сократить километраж еще больше и превзойти компьютерную программу. Таким образом, рекомендации бросили вызов водителям – и заставили их изменить свое поведение. Даже если водители не поняли, что именно аналитика инициировала изменения, главное, что изменения произошли.
Подведем итоги
Наиболее важные положения этой главы:
• Операционная аналитика должна опираться на прочный фундамент пакетной аналитики. По-прежнему применим и традиционный аналитический процесс.
• Организация должна иметь возможность применять и сочетать различные аналитические дисциплины, чтобы, помогая друг другу, они позволяли улучшать результаты.
• Платформа для обнаружения данных – лучшее место для применения к проблеме мультидисциплинарного подхода.
• Постановка правильных вопросов в начале построения аналитического процесса сильнее воздействует на результаты, чем вся последующая работа.
• Если фактические значения могут отличаться от исходных предположений, примените анализ чувствительности для оценки потенциального воздействия такого расхождения на результаты.
• Невозможно проанализировать все и вся. Однако если упускается что-то важное, критика задним числом неизбежна. Всегда документируйте процесс принятия решений с указанием того, почему были выбраны одни пути для анализа и не выбраны другие.
• Исследовательский анализ направлен на поиск ответа на более общие вопросы в условиях широкой свободы действий, тогда как подтверждающий анализ с самого начала носит конкретный и жестко заданный характер.
• Аналогично тому, как тест-кухни ищут новые рецепты, организации должны использовать аналитические НИОКР для поиска новых аналитических процессов. Эти усилия должны рассматриваться не как бездумное хакерство, а как продуманное размещение ставок.
• Выведение аналитики на операционный уровень иногда требует частичного отказа от аналитической мощности в обмен на требуемую масштабируемость. Необходимо оптимизировать не каждое отдельное решение, а влияние процесса на все решения.
• Методы классической статистики, включая выборки, по-прежнему сохраняют свою актуальность. Россказни о том, что они устарели, будут опровергнуты.
• Изощренные решения могут усиливать, а не контролировать проблемы с данными, особенно когда они применяются к низкокачественным – разреженным и неполным – данным. В действительности простые решения способны работать лучше, одновременно обеспечивая необходимую масштабируемость.
• Заказчики и пользователи операционной аналитики часто не разбираются в аналитике и не интересуются ею. Главное для них – получить решение проблемы. Вдаваясь в технические подробности, когда вас об этом не просят, вы рискуете отпугнуть людей от аналитики.
Глава 8 Аналитическая команда
Если организация хочет поставить операционную аналитику себе на службу и получать от нее весомую отдачу, ей надо для этого подобрать нужных людей. Кроме того, надо правильно их организовать и обеспечить им условия для успешной работы. В большинстве случаев – за исключением разве что некоторых развитых в плане использования аналитики компаний – придется изменить и существующие организационные структуры. Тематику, связанную со специалистами-аналитиками и аналитическими командами, я рассмотрел в своей книге «Укрощение больших данных». В этой главе я хочу добавить еще несколько важных соображений и новую информацию. Итак, давайте рассмотрим некоторые ключевые действия по набору, организации и управлению аналитической командой, способной обеспечить успешное применение операционной аналитики.
Произошел серьезный сдвиг
Сегодня я с удивлением наблюдаю за тем, как расширяются карьерные возможности для профессиональных аналитиков. Более 20 лет назад, после окончания аспирантуры, я отчетливо понимал, что моя профессиональная судьба – оставаться «ботаником», обитающим в дальних закоулках офисов. Время от времени меня будут выпускать из подвала, но бóльшую часть времени я буду сочинять в кулуарах умнейшие аналитические отчеты. Такова была участь специалистов по аналитике в те времена, и я с ней смирился.
С улыбкой вспоминаю, как на моей первой работе мне приходилось разговаривать с кем-то, кто мог поговорить с кем-то, кто мог поговорить с кем-то, кто принимал решения. Я находился на приличном удалении и от лиц, принимающих бизнес-решения, и от ИТ-отдела. Ввиду места, которое моя команда занимала в организации, и наших условий для работы наше влияние было весьма ограниченным. Например, разработанный мной анализ для прогнозирования ухода клиентов осуществлялся в режиме пакетной обработки и только для немногих конкретных точек принятия решений. Аналитика не была интегрированным компонентом деятельности организации (впрочем, как и я со своей командой) и тем более не была операционной.
Сегодня специалисты по аналитике постоянно сидят за одним столом вместе с принимающими решения лицами. И, более того, зачастую сами являются такими лицами. Какая огромная перемена по сравнению со стартом моей карьеры! Я пришел в аналитику по одной простой причине: она мне нравилась. Хотелось бы заявить, что я с самого начала предвидел будущее, но не могу себе этого позволить. Мне просто повезло, что я выбрал одну из самых востребованных сегодня профессий.
Аналитика не только воскресла из небытия, но и впала в противоположную крайность. Такие авторитетные издания, как Harvard Business Review, CNNMoney и Forbes, сегодня пишут о профессии аналитика как не только о востребованной, но и привлекательной{72}. После того как годами я пытался объяснить людям на вечерниках, чем зарабатываю себе на жизнь, не особо пугая их подробностями, мне забавно, что меня, благодаря моему роду занятий, стали считать умным, пусть и непривлекательным.
Вследствие этой вновь обретенной (и, возможно, мимолетной) популярности появилось упражнение, которое я хотел бы порекомендовать моим коллегам. Вечером, перед тем как лечь в постель, остановитесь на мгновение перед зеркалом, посмотрите на себя и скажите: «Я специалист-аналитик, и я привлекателен». Впервые в вашей жизни другие люди могут согласиться с этим утверждением.
Еще совсем недавно, в 2012-м, когда мы обсуждали с организациями их аналитические стратегии, они обычно упирались в вопрос, а нужно ли им вообще нанимать специалистов-аналитиков. Это всегда обескураживало меня, поскольку мне как профессионалу хотелось, чтобы все остальные считали нашу профессию ценной и не ставили под сомнение необходимость нашего найма.
Аналитические организации никуда не денутся
В последние годы произошел серьезный сдвиг. Вместо того чтобы задавать вопрос, нужны ли им вообще аналитические таланты, сегодня организации озабочены тем, как из имеющихся у них талантов создать команды и расширить их влияние. Это говорит о том, что в настоящее время ценность профессиональных аналитиков осознана, а их роли расширяются.
С тех пор ситуация примечательным образом изменилась. Начиная с 2013 г. многие организации стали обращаться ко мне и спрашивать не о том, нужно ли им нанимать специалистов-аналитиков, а о том, как создать команду из имеющихся профессионалов. В этом виден большой прогресс, поскольку он отражает два важных факта. Во-первых, во многих компаниях сегодня достаточно много аналитических талантов, вследствие чего приходится задумываться о том, как их организовать. Во-вторых, и это столь же важно, упор на создание аналитических команд говорит о том, что они никуда уже не денутся. Вот в чем состоит серьезный сдвиг и воодушевляющая тенденция.
Аналитические команды теперь широко распространены. Если в вашей организации такой команды нет, вы должны ее создать. Если уже есть, вам нужно ее укомплектовать, сорганизовать и управлять ею правильно, если вы хотите добиться успеха в операционной аналитике. Именно этому и посвящена остальная часть данной главы.
Подбор и расстановка кадров
Все начинается с кадров. Невозможно управлять организацией без соответствующих ей людей. Кто должен входить в вашу аналитическую команду и какими чертами должны обладать эти люди? Как создать всесторонне подготовленную команду? Как обеспечить сотрудникам комфортный микроклимат в долгосрочной перспективе? Давайте рассмотрим эти вопросы.
Кто такие специалисты по аналитике?
Для начала давайте определимся с термином «специалист-аналитик». На протяжении многих лет какие только наименования не давались этой профессии. Аналитиков называли «статистиками», «разработчиками прогностических моделей», «добытчиками данных», а совсем недавно стали называть «исследователями данных». Я использую общий термин «специалист-аналитик», который включает в себя все вышеперечисленные, а также другие, им сопутствующие.
Кого-то может удивить, почему я включил сюда термин «исследователь данных», поскольку в свете поднявшегося вокруг него ажиотажа он представляется как новый. Но если вы изучите, что пишут о деятельности исследователей данных, о том, чем они руководствуются и об их методах, то увидите, что это не сильно отличается от того, чем занимались выдающиеся специалисты-аналитики на протяжении многих лет. Основное практическое отличие между исследователями данных и другими аналитиками состоит в том, что первые чаще имеют образование в области компьютерных наук и предпочитают работать с Hadoop и языками наподобие Python или R. Традиционные же специалисты-аналитики чаще имеют образование в области статистики, математики или исследования операций и предпочитают работают с серверами реляционного и аналитического окружения, а программируют на языках SAS и SQL. Однако какие бы платформы или языки ни использовались, фундаментальный набор навыков и склад ума, которые необходимы для успеха на данном поприще, остаются неизменными. По сути, все эти профессионалы используют одну и ту же аналитику в одних и тех же целях для крупных компаний, использующих инновационную аналитику.
В нынешней популярности термина «исследователь данных» есть свои плюсы. Годами, нанимая специалистов-аналитиков, я говорил: «Мне нужен статистик, который при этом также…» Ключевой частью фразы было «который при этом также…» Дело в том, что людей со специальностью «статистик» находится в избытке. Многие из них не работают на крупные компании и не создают инновационную аналитику. Например, могут заниматься статистическими исследованиями или научной деятельностью. Поэтому только часть тех, кого именуют «статистиками» или «добытчиками данных», специализируется на внедрении аналитики в бизнес-процессы и занимается деятельностью, ассоциируемой с исследователями данных.
Однако термин «исследователь данных» нов настолько, что та небольшая группа людей, претендующих на этот титул на законных основаниях, в основном отвечает той матрице, которую я всегда искал{73}. Имидж и мыслительные процессы, ассоциируемые с термином «исследователь данных», соответствуют сути искомых мною всегда качеств «статистика, который при этом также…» Мне нравится, что у нас наконец-то появился термин, точно передающий ключевые требования при найме специалистов-аналитиков (даже если сам по себе термин мне не нравится).
Вместе с компанией Talent Analytics и Международным институтом аналитики мы провели опрос среди большого числа специалистов-аналитиков, чтобы определить, что делает их уникальными{74}. Это количественное исследование было призвано ответить на два вопроса:
1. Обладают ли специалисты-аналитики неким уникальным, поддающимся количественной оценке складом ума и представляют ли они собой прирожденные таланты?
2. Как специалисты-аналитики расходуют свое время в рамках рабочего процесса?
Результаты исследования показали, что специалисты-аналитики обладают четкими и измеримыми характерными признаками прирожденных талантов. Среди 11 измеренных характеристик первое место заняли любопытство и креативность. Talent Analytics использует эту информацию для помощи компаниям в оценке существующих аналитических кадров и кандидатов при найме. Исследование также показало, что специалисты-аналитики значительную часть своего рабочего времени расходовали на подготовку данных и программирование и гораздо меньше времени на управление процессами и интерпретацию, визуализацию и представление результатов. Этот вывод отражает реальное положение дел. Нередко можно слышать, что у аналитиков 80 % и более усилий тратится на подготовку к анализу.
Старая и новая школы приходят к согласию
Возможно, услышав мое заявление о том, что исследователи данных не отличаются от выдающихся специалистов-аналитиков прошлого, вы сочли меня «парнем-статистиком из старой школы». Однако «исследователи данных из новой школы», такие как Саймон Чжан из LinkedIn, со мной согласны. Мы с ним выступали на конференции Big Analytics в Бостоне в 2012 г.{75} В ходе своего доклада он рассказал о том, как его аналитическая команда в LinkedIn нанимает новых сотрудников и на какие характеристики при этом смотрит. Я был поражен, поскольку Саймон сказал фактически то же самое, что собирался сказать я, только немного другими словами. Он тоже получил удовольствие от моего доклада.
Специалисты-аналитики в качестве творцов
Как бы специалисты-аналитики ни назывались, их успешность зависит от факторов, выходящих за пределы технических знаний и навыков. Наиболее ценные специалисты сочетают в себе ученого и творца. Нанимайте аналитиков-творцов, обладающих необходимыми техническими навыками, и вы создадите команду, способную преуспеть в операционной аналитике.
В ходе дальнейшего разговора мы выяснили, что каждый из нас ожидал от собеседника неких других идей, особенно в свете шумихи на рынке о разнице между аналитиками «старой» и «новой» школы. Но вместо этого мы просто подтвердили общность подходов и воззрений друг друга. Это было важным осознанием, поскольку мы поняли, что нам не нужно заново изобретать аналитическое колесо только лишь потому, что надо соответствовать новым данным и новым технологиям. Другими словами, у прошлого можно много чего позаимствовать, о чем я не устаю твердить на протяжении книги.
Я всегда говорю, что лучшие специалисты-аналитики совмещают в себе ученых и творцов{76}. Два художника могут совершенно по-разному нарисовать одну и ту же сцену, используя разные краски и стили. Обе картины могут впечатлять, но при этом быть абсолютно разными. Аналогичным образом два талантливых аналитика могут использовать разные подходы к решению одной и той же проблемы и получить убедительные результаты. Дело в том, что создание аналитического процесса на всем протяжении требует творчества. Творчество проявляется в том, как именно определена задача, как построена аналитическая модель и как представлены результаты. Разумеется, поощрение творчества вовсе не означает, что приемлемыми можно будет считать любые результаты. Как правило, существует только один наилучший ответ. Творчество присутствует в методе, при помощи которого находится этот ответ.
Представители как старой, так и новой школы согласны с тем, что сегодня компаниям требуются люди, обладающие не только техническими навыками. Им нужны люди, способные создать при помощи данных убедительную картину. Им нужны творцы.
Как разрешить кадровый кризис
У нарастающей востребованности специалистов-аналитиков есть и оборотная сторона. А именно – спрос слишком высок, а предложение ограниченно. Найти и удержать талантливых аналитиков нелегко. Их зарплаты растут, и каждый хороший специалист регулярно получает предложения новой работы{77}. Многие источники, от McKinsey до Wall Street Journal, предсказывают, что в ближайшем будущем этот дефицит только возрастет{78}.
Что же касается приходящих в эту область новичков, то должно пройти время, прежде чем они окажут заметное влияние на рынок труда. Будь то выпускник вуза или переквалифицировавшийся специалист, им еще предстоит набраться необходимого опыта, чтобы стать настоящим профессионалом. Давайте рассмотрим несколько способов поиска талантов.
Поищите у себя
Меня часто спрашивают, можно ли просто переместить людей с их нынешних должностей на должности аналитиков. Например, взять специалистов по бизнес-разведке или уверенных корпоративных пользователей и переквалифицировать их в специалистов-аналитиков? Разумеется, вы должны поискать таких людей в своей организации, потому что это ничего не будет стоить, но доля успешных попыток будет низкой. Перемещение сотрудников способно стать частью плана, но не единственным планом.
Не пришей кобыле хвост
Многие организации делают ставку на переквалификацию своих сотрудников в специалистов-аналитиков. Такой подход может сработать с небольшой долей сотрудников, но не сможет заменить жизнеспособный целенаправленный план. Вам придется поискать профессионалов с необходимым опытом и набором навыков за пределами организации.
Даже в крупной организации довольно трудно найти людей со складом ума и навыками, которые позволят им стать специалистами-аналитиками. Многие, кто обладает подходящими характеристиками, уже являются профессиональными аналитиками. Например, если в организации 20 кандидатов на переквалификацию, то, возможно, всего лишь несколько из них сумеют овладеть профессией аналитика. Но даже им потребуется время, чтобы стать по-настоящему эффективными. При реалистичном подходе пополнение аналитической команды будет происходить в основном за счет специалистов, пришедших извне с уже имеющимся профессиональным багажом.
Сертификация аналитиков
В настоящее время доступны сертификаты специалистов-аналитиков. Наиболее известной является программа «Сертифицированные профессиональные аналитики» (Certified Analytics Professional, CAP), предлагаемая Институтом исследования операций и менеджмента (Institute for Operations Research and the Management Sciences, INFORMS){79}. Программа CAP фокусируется на пяти E:
1. Экзамен (Exam). Сертификация предусматривает сдачу экзамена. В силу необходимости экзамен делает упор на технических навыках.
2. Опыт (Experience). Чтобы стать сертифицированным аналитиком, требуется наличие профессионального опыта. Работодатели хотят знать, что они нанимают специалиста с портфолио успешно реализованных проектов.
3. Этика (Ethics). Многие профессии, от врачей до аудиторов, имеют свои кодексы профессиональной этики. Специалисты-аналитики нуждаются в руководящих принципах применения аналитики и ее результатов с соблюдением этических норм.
4. Образование (Education). Соответствующее профессиональное образование создает очевидное преимущество.
5. Эффективность (Effectiveness). Это требование относится к личным качествам и устанавливает, что сертифицированные профессионалы должны иметь нечто большее, чем технические навыки и диплом.
Именно критерий эффективности подвигнул меня согласиться стать членом консультативного комитета CAP на добровольных началах. Как мы уже убедились выше, настоящий профессионализм требует обладания не только техническими навыками. Требуются и социальные навыки, скажем, общения и убеждения. Чтобы пройти сертификацию, кандидаты должны доказать, что они способны эффективно представить свою позицию и результаты. Разумеется, методика оценки по критерию эффективности со временем будет развиваться, однако уже само по себе включение этого критерия в программу CAP является замечательным фактом. Когда сертификация аналитиков станет обычной, работодатели получат еще один способ идентифицировать надежных кандидатов.
Программы высшего образования в области аналитики
Еще одним недавним трендом стало введение программ обучения в области аналитики на уровне бакалавриата и магистратуры в крупных университетах. В 2008-м или 2009 г. я услышал о такой программе впервые. В начале 2014 г. я увидел список уже из нескольких десятков университетов, причем список был далеко не полным. Данный тренд свидетельствует о том, что в академических кругах признали растущий спрос на людей, разбирающихся в аналитике. Со временем эти программы помогут решить проблему с дефицитом кадров. Современные программы отличаются тем, что они сосредоточены на несколько ином наборе компетенций, чем программы в области традиционной статистики, исследования операций или делового администрирования.
В мои времена, когда я изучал статистику в университете, первостепенное внимание уделялось обучению специальным навыкам, тогда как практическому применению статистики, особенно в сфере бизнеса, не уделялось никакого внимания. Единственным упоминанием о бизнесе в нашей учебной программе были примеры в учебнике, в которых рассматривалась возможность использования искусственно созданных достоверных данных для решения бизнес-проблемы. Однако при этом от нас требовалось повернуть матрицу или выполнить иную формальную задачу. Так что бизнес в этом случае был не более чем тематической историей. С другой стороны, традиционные программы образования в области бизнеса были полностью сосредоточены на бизнес-тематике и, возможно, лишь на десятую часть уделяли внимание специализированным знаниям. Иногда программа MBA (магистр делового администрирования) могла включать вводный курс статистики, но большинство традиционных бизнес-программ полностью опускали технические навыки, требующиеся профессиональным аналитикам.
Сбалансированные образовательные программы
В настоящее время быстро распространяется новый тип университетского образования, где сочетаются бизнес-дисциплины со специализированными. По этим гибридным программам выпускаются хорошо подготовленные аналитики с правильным набором навыков. Если в ближайшем к вам университете есть такая программа, вы можете нанять там молодых специалистов.
Преимущество новых программ подготовки специалистов по аналитике состоит в том, что они обеспечивают достаточно глубокое образование как в области аналитики, так и в области бизнеса. По таким программам готовят всесторонне развитых специалистов с уровнем компетенций в аналитике и бизнесе примерно 7 из 10. Лично я предпочел бы нанять именно таких людей и постарался бы развить аналитические и деловые компетенции до уровня 10, а не людей с техническими компетенциями на уровне 10 из 10 и компетенциями в области бизнеса 0 из 10, или наоборот (см. рис. 8.1). Например, сам я начинал с хорошим уровнем технической подготовки и с нулевыми навыками в области бизнеса, и мне потребовалась масса времени и сил, чтобы развить навыки в бизнесе до нужного уровня.
Я изучал статистику по одной из самых уважаемых программ в стране – в Университете штата Северная Каролина (North Carolina State University, NCSU). Он одним из первых открыл программу подготовки магистров в области аналитики. Однако, чтобы подчеркнуть мое уважение к новым программам подготовки аналитиков, хочу заявить, что если бы мне потребовались новые сотрудники в мою аналитическую команду, то я бы в первую очередь поискал их среди выпускников нового отделения NCSU. Несмотря на мои теплые воспоминания о факультете статистики, нацеленность новой программы аналитического образования на насущные нужды бизнеса подкупает меня сильнее. Судя по всему, другие работодатели согласны со мной, поскольку начальная зарплата выпускников NCSU по специальности «аналитика» в последние годы сопоставима с начальными зарплатами выпускников ведущих национальных бизнес-школ или даже превосходит их.
Как закрыть все потребности
По мере нарастающего спроса на различные аналитические дисциплины, типы данных и инструменты сегодня специалисту становится все труднее быть сведущим сразу во всех областях. Поэтому нужно сосредоточиться на создании команды, которая закроет все потребности, хотя каждый ее участник этого сделать не в силах. Представьте себе аналитический «пирог», состоящий из нескольких «кусков», как показано на рис. 8.2. Один человек может охватить три-четыре «куска», другой – еще три-четыре. Когда же они объединятся в команду для реализации проекта, то совместно охватят всё.
В моей компании аналитическая команда использовала именно такой подход. Команда начала получать множество запросов на поддержку поисковой оптимизации. Поскольку ни у кого в команде не было такого опыта, они решили нанять нового человека, хорошо разбирающегося именно в этой области. Разумеется, новый сотрудник обладал и другими аналитическими навыками, наняли же его прежде всего для того, чтобы заполнить указанный пробел в командных компетенциях.
Нет необходимости в том, чтобы каждый член команды был универсален. Возьмите любые командные соревнования, такие как Супербоул в американском футболе, чемпионат мира по соккеру (который называют футболом повсюду за пределами США!) и чемпионат Национальной ассоциации студенческого спорта по баскетболу. В каждой команде-победительнице найдется всего один-два игрока, выбранных в «команду звезд», а в некоторых победивших командах и вовсе не было таких игроков. Дело в том, что в этих видах спорта слаженная командная игра гораздо важнее, чем действия каждого игрока в отдельности. Действительно, если вывести на поле 11 лучших футболистов мира, они могут показать далеко не лучшую игру, поскольку каждый из них будет пытаться брать на себя роль лидера.
Тем самым я вовсе не хочу сказать, что аналитические команды должны применять при найме новых сотрудников более низкие стандарты, чем ведущая спортивная команда, если она собирает свой состав не только из одних звезд. В чемпионской команде все игроки способны выступать на звездном уровне, иначе они не оказались бы в ее составе. Однако большинство игроков команды-победительницы вполне могли бы играть и в команде среднего уровня, а большинство игроков команды-середнячка вполне могли бы выступать и за чемпионскую команду. Аналогичным образом, если организации нужна команда, состоящая из первоклассных аналитиков-профессионалов, то всем им вовсе не обязательно входить в сборную мира «всех звезд».
Приложите все силы, чтобы удержать специалистов
С учетом того, как трудно сегодня найти хороших специалистов-аналитиков, организации, безусловно, хотели бы удержать тех, кого они уже наняли. Текучесть кадров стала жизненной реальностью, поскольку профессиональные аналитики пользуются высоким спросом. Ключ к снижению текучести кроется в понимании того, что мотивирует этих специалистов и повышает их удовлетворенность работой.
Я беседовал со многими своими коллегами на предмет того, что заставило их оставить предыдущее место работы, и вышеупомянутая Talent Analytics также провела опрос на эту тему{80}. Одна из основных причин смены работы, по признанию самих аналитиков, состоит в том, что им становится скучно, поскольку перед ними не ставят интересных задач. Мне знакома эта ситуация. Однажды я сам уволился из компании, где мне нравилось все – и сама компания, и люди, и атмосфера – за исключением скучной работы. Легко привлечь лучших специалистов, пообещав им один-два интересных проекта, но что будет дальше, по завершении проектов? Например, вы можете время от времени перемещать аналитиков между разными бизнес-подразделениями, чтобы избавить их от скуки и дать им возможность поработать в разных частях организации над разными типами задач.
Кроме того, крайне важно развивать и соотносить траектории повышения. Одно из главных преимуществ наличия официально оформленной аналитической команды состоит в той критической массе, которую она создает. Чем больше команда, тем больше вариантов профессионального роста она предлагает. Начиная с первого собеседования убедите нанимаемых вами новых сотрудников в доступности для них долгосрочных возможностей. Также помогите им увидеть, какой вклад они могут внести в организацию. Каждый человек хочет вносить значимый вклад, а не просто перерабатывать горы данных.
В конце 2013 г. клиент от отчаяния пожаловался мне на то, что его организация за последние два месяца не смогла нанять трех специалистов. А ведь им были предложены конкурентоспособная зарплата и интересные начальные проекты. Однако специалисты заявили, что компания не объяснила им, какую роль они будут играть в долгосрочной перспективе, и не представила траектории повышения. Если их наняли за хорошую зарплату выполнять значимые проекты, то чем они займутся по завершении проектов? Другие компании нарисовали им более привлекательную долгосрочную картину и выиграли битву за кандидатов.
Хотя зарплата для специалистов-аналитиков не является главным мотивирующим фактором, но все равно играет важную роль. Невозможно платить аналитикам на 30 % ниже рыночных ставок и ожидать, что они останутся с вами надолго. Исследование агентства Burtch Works выявило средние ставки зарплаты специалистов разного уровня и в разных отраслях{81}. Поищите такую информацию, прежде чем начинать процесс найма, чтобы предложить кандидатам конкурентоспособные условия. Отдел кадров должен понимать, что высококвалифицированный специалист-аналитик может потребовать более высокой зарплаты, чем типичный сотрудник с таким же уровнем опыта. Организациям нужно подстраиваться под рынок, чтобы попусту не тратить время.
Не только зарплата имеет значение
Специалисты-аналитики, безусловно, хотят достойной оплаты труда, однако зарплата зачастую не является для них главным мотивирующим фактором. Ничто не отвратит их от вашей компании быстрее, чем скучная работа и отсутствие долгосрочных перспектив профессионального роста. Они также хотят, чтобы их ценили, и хотят чувствовать, что оказывают воздействие на работу организации.
Организация команды
После того как специалисты-аналитики стали частью компании, их необходимо организовать таким образом, чтобы позволить им оказывать оптимальное влияние. Невозможно внедрить операционно-аналитические процессы по всей компании без наличия организованной аналитической команды для поддержки таких инициатив. В этом разделе мы рассмотрим некоторые проблемы и рекомендации, связанные со структурированием и организацией аналитической команды. Каждый раз, когда я обсуждаю эту тему со своими клиентами, делаю акцент на том, что первым делом нужно подобрать подходящих людей. От аналитической команды не будет толку, если в ней нет хороших специалистов.
Какова стандартная структура?
По состоянию на 2014 г. не существует стандартной структуры аналитической команды. Разные компании подходят к этому совершенно по-разному. Для тех, кто не изучал данный вопрос, это может показаться удивительным, но это так. Клиенты часто спрашивают меня, что делают другие компании. Я видел такое количество различных структур, что запомнить всех их попросту невозможно, но это вовсе не означает, что не существует более или менее эффективных способов организовать аналитическую команду.
Отсутствие стандартной структуры у аналитической команды вполне объяснимо. Возьмем, например, кадровую службу (HR-службу), существующую практически в каждой компании на протяжении многих десятилетий, в результате чего и успели развиться стандартные HR-структуры. Почти в каждой средней или крупной компании в любой отрасли есть вице-президент по HR. В подчинении у него находятся менеджер по найму, менеджер по оплате труда и т. д. Точно так же начальник финансовой службы руководит в основном стандартизированными организациями – отделом нормативно-правового соответствия, ревизионным отделом, отделом по работе с кредиторскими задолженностями и т. д. Другими словами, существующие стандарты являются следствием зрелости и повсеместного распространения HR-служб и финансовых служб. В отличие от них аналитические службы в компаниях начали появляться совсем недавно и поэтому пока не были стандартизированы.
Рекомендуемая структура
Я рекомендую компаниям со временем закрепить специалистов-аналитиков за отдельными функциональными или бизнес-подразделениями и обеспечить им поддержку в виде централизованной аналитической команды на корпоративном уровне. Такая комбинация централизованной и децентрализованной моделей часто называется «гибридной моделью» или «моделью центра компетенций» (рис. 8.3). У подобного подхода есть свои преимущества и недостатки, но в целом эта структура будет удовлетворять аналитические потребности компании.
Преимущества гибридной модели состоят в том, что каждое функциональное или бизнес-подразделение будет иметь собственные аналитические ресурсы, специально выделенные под его непосредственные нужды, а также дополнительные ресурсы, что позволяет реализовывать корпоративные инициативы, обеспечивать дополнительную поддержку бизнес-подразделений и гарантировать постоянство подхода. Гибридная модель обеспечит экономию от повышения масштаба как в отношении затрат, так и в отношении перспектив карьерного роста. Например, компания может приобрести общую лицензию на ПО для всех команд по оптовой цене, вместо того чтобы каждая команда приобретала лицензии по отдельности. К недостаткам можно отнести тот факт, что гибридная структура добавляет сложности и потенциально создает условия для интриг между центральной командой и командами на уровне бизнес-подразделений. Важно сделать так, чтобы специалисты в любой команде не чувствовали себя изолированными. Каждый должен иметь возможность представить свои идеи и получить необходимую помощь.
Не все структуры одинаково хороши
Отсутствие у аналитической службы стандартной, общепринятой организационной структуры вовсе не означает, что все варианты одинаково хороши. Гибридная модель показала себя наиболее эффективной для широкого круга организаций.
Что серьезно заботит сотрудников, так это организация подотчетности аналитических команд в гибридной структуре. Команды на уровне бизнес-подразделений могут отчитываться либо напрямую перед центральной аналитической командой, либо перед руководством своих бизнес-подразделений. Тогда как некоторые предпочитают централизованную структуру подотчетности, я считаю, что вопрос о том, перед кем отчитываются аналитические команды, не так уж и важен{82}. Какая система будет работать лучше, зависит от корпоративной политики и культуры каждой организации. Кто бы ни отвечал за официальную оценку эффективности, важно, чтобы бизнес-подразделения воспринимали аналитиков как часть своей команды. А сами аналитики должны понимать, что они также являются частью большой корпоративной команды, выходящей за рамки их бизнес-подразделения. При наличии такого образа мышления формальная система подотчетности не имеет большого значения.
Путь к гибридной модели
Хотя гибридная модель аналитических команд лучше всего подходит для зрелых компаний, практически никто сразу с нее не начинает. Дело в том, что организация должна накопить определенную критическую массу профессиональных аналитиков, прежде чем появится смысл – если вообще это будет возможно – выстроить гибридную модель. Как правило, все начинается с того, что какое-то бизнес-подразделение решит, что ему необходима аналитическая поддержка. В результате оно нанимает своего первого (и первого в компании) специалиста-аналитика. По прошествии времени подразделение нанимает еще нескольких аналитиков и получает первые успешные результаты. Затем и другие подразделения, узнав о том, какие замечательные вещи делает при помощи аналитики первое подразделение, создают свои собственные аналитические команды. Так постепенно возникает децентрализованная структура.
Таким образом, компании почти всегда начинают с децентрализованной модели. Постепенно, когда в разных частях компании начинают работать достаточно много специалистов-аналитиков, становится очевидным, что если организовать их работу по-другому, то можно будет окупить бóльшую часть вложенных в них инвестиций. Чем раньше компания озаботится своей аналитической структурой, тем быстрее разработает продуманную стратегию введения аналитики в прочные организационные рамки.
Перед кем должна отчитываться центральная команда?
Структурирование аналитической службы связано в том числе и с определением подотчетности центральной команды. Как правило, ответственным за аналитику назначается руководитель, чья сфера компетенций распространяется на все бизнес-подразделения, например директор по стратегическому развитию, операционный директор или финансовый директор.
Наконец, вопрос с подотчетностью центральной команды аналитической службы. За многие годы я видел разные схемы, иногда директор по аналитике отчитывался напрямую перед генеральным директором. Сегодня такое практикуется редко. Недавно меня увлекла идея размещения аналитиков под крылом корпоративной команды по стратегическому развитию, поскольку последняя похожа на Швейцарию. Стратегическая команда занимает нейтральную позицию, работает со всеми бизнес-подразделениями и является признанной частью любой другой команды – точно так же должна поступать и аналитическая команда. В равной степени важен и тот факт, что аналитика носит стратегический характер и должна рассматриваться именно под таким углом. Если же основное внимание организации сосредоточено на операционной аналитике, то аналитическую службу можно поместить в ведение операционного директора. Еще один нейтральный вариант – финансовый директор.
Одно из важнейших преимуществ гибридной модели состоит в том, что она позволяет создавать ценности. Для иллюстрации давайте рассмотрим пример с гостиничной компанией, имеющей четыре разных гостиничных бренда. Каждый бренд будет финансировать и поддерживать только ту аналитику, что окупается в его рамках. Помимо того можно выполнять аналитику по всем брендам, которая может приобрести огромную ценность на корпоративном уровне. Возможна и аналитика, способная помочь каждому отдельному бренду, но ее осуществление на уровне отдельных брендов себя не окупит. В таких ситуациях на помощь может прийти центральная аналитическая команда. Например, если на уровне отдельного бренда доходность от нового аналитического процесса составляет всего половину от стоимости его внедрения, то ни один бренд не станет это оплачивать. Но если корпоративная команда спонсирует данный процесс и внедрит его во всех четырех брендах, то при той же 50 %-ной доходности, но увеличенной в четыре раза, процесс однозначно станет рентабельным.
Нужен ли вам директор по аналитике?
Если компания создает аналитическую службу, кто-то должен ею руководить. Хороший вариант – создать должность директора по аналитике или похожую руководящую должность, например вице-президента по аналитике{83}. В компании обязательно должен быть руководитель высшего уровня, который непосредственно отвечает за всю аналитику. Спросите у людей в любой компании, кто отвечает за финансы, и вам сразу же укажут на финансового директора. Спросите, кто отвечает за маркетинг, и вам укажут на директора по маркетингу. Но спросите, кто отвечает за аналитику, и на вас посмотрят с недоумением, либо дадут самые разные ответы. Так не должно быть.
Централизуйте затраты, распределяйте выгоды
Одно из преимуществ выведения аналитической команды на корпоративный уровень заключается в способности финансировать стратегически важные проекты, которые не смогли бы потянуть отдельные бизнес-подразделения. Разработка процесса в центре и затем развертывание его в масштабах всей организации позволит каждому бизнес-подразделению воспользоваться его плодами.
Помню, когда я только начинал свою карьеру, велись споры о том, нужна ли в компаниях должность директора по информационным технологиям. Сегодня почти во всех компаниях такая должность имеется. Очевидно, что ИТ-директора доказали свою необходимость. Теперь люди задаются вопросом, нужна ли в компаниях должность директора по аналитике. В ближайшие годы мы увидим, как она будет все более распространяться и, возможно, станет такой же типичной, как и должность ИТ-директора. Первое мероприятие, предназначенное специально для директоров по аналитике, о котором я знаю, было организовано летом 2013 г. Международным институтом аналитики. Оно собрало более 200 участников! Хотя не все они были директорами по аналитике, но всех их интересовала эта концепция. И я, и мои коллеги по институту были приятно удивлены таким возросшим интересом.
Кто отвечает за аналитику в вашей компании?
Если в вашей компании нет директора по аналитике, то велики шансы, что никто не отвечает за эту деятельность или не имеет на то надлежащих полномочий. Введение соответствующей должности официально установит аналитику в качестве корпоративного приоритета, а также определит главного борца за ее дело.
В идеале руководители аналитической команды любого звена должны разбираться в аналитике и иметь практический опыт работы в этой области. В частности, менеджеры на одном или двух первых уровнях руководящие работой рядовых аналитиков, должны хорошо понимать, как действует аналитика и как создаются аналитические процессы. Без такого багажа знаний и опыта менеджеры не смогут эффективно руководить аналитической командой и задавать ей правильное направление. Это особенно верно при вступлении в новые области, такие как операционная аналитика.
На более высоких уровнях управленческой цепочки руководители могут не быть хорошо обученными профессионалами, но должны хорошо разбираться хотя бы в основах аналитики. Не менее важно, чтобы руководители высшего уровня были способны успешно разрешать вопросы, связанные с ведомственной политикой и корпоративной культурой, которые неизменно возникают при внедрении операционной аналитики. Более подробно мы обсудим такие вопросы в девятой главе. Для того чтобы необходимые изменения позволили аналитикам привносить ценности в любую организацию, необходима поддержка не только от директора по аналитике, но и от генерального директора и всей руководящей команды. Директор по аналитике должен воплощать в своем лице аналитику для всей компании и принимать участие в разработке всех важных инициатив. Такое позиционирование ознаменует принятие аналитики в качестве коренного стратегического компонента деятельности компании.
А как насчет директора по данным?
Еще одна должность, приобретающая сегодня все большее значение, – это директор по данным. Меня часто спрашивают, чем отличается директор по аналитике от директора по данным. Это одно и то же? Нет. Однако, исходя из тех должностных инструкций, которые я видел, многие компании по невнимательности объединяют эти две должности в одну и используют для ее наименования любое из двух названий.
Как видно из таблицы 8.1, директор по данным связан со сферой информационных технологий и, как правило, отчитывается перед ИТ-директором. Директор по данным отвечает за сбор данных, управление данными и обеспечение доступности данных для анализа посредством инфраструктуры и инструментов. Директор же по аналитике обычно отчитывается перед руководителями бизнеса. При наличии доступных для анализа данных он сосредоточивается на том, какой следует провести анализ, как его можно развернуть и превратить в операционный и как при помощи аналитики извлечь ценности для бизнеса. Функции директора по аналитике и директора по данным сходятся в точке доступности данных.
Очевидно, что эти два руководителя должны работать в очень тесном сотрудничестве друг с другом, и их судьбы крепко переплетены. Именно они обеспечивают наиболее прочную связь между ИТ-сектором и бизнес-сектором компании, и тем самым обречены на партнерство. Теоретически возможно, особенно в небольших организациях, совмещение должностей директора по аналитике и директора по данным. Однако важно понимать различия между их обязанностями. Как я уже говорил, мне доводилось видеть должностные инструкции, где путались названия этих должностей и вменяемые им обязанности. Компании же должны четко понимать, кто именно им нужен, поскольку на эти должности, как правило, претендуют люди с разным образованием и разным опытом работы.
Кросс-функциональные команды
До сих пор мы обсуждали аналитическую команду так, как если бы она состояла только из штатных специалистов-аналитиков. Однако существуют и другие варианты организации команд, которые стоят того, чтобы их рассмотреть. Например, для оказания максимального воздействия аналитической команде могут потребоваться дополнительные наборы навыков. Руководствуясь этим соображением, некоторые компании существенно расширяют поле деятельности своих аналитических команд. В 2012 г. я посетил крупного европейского оператора мобильной связи. Эта компания пришла к выводу, что для поддержки ее действий в области маркетинга и обслуживания клиентов требуется много аналитики, начиная с глубокого анализа данных и заканчивая отчетностью. В результате она решила создать кросс-функциональную аналитическую команду.
Команда подчинялась одному из топ-менеджеров, а входили в нее не только аналитики, но и другие специалисты, необходимые для обеспечения требуемых аналитических процессов. В частности, бизнес-аналитики, отвечавшие за создание отчетности на основе аналитических процессов. А поскольку команде передали базовые системы, используемые для аналитики, то в нее также входили администраторы баз данных и системные администраторы, которые обычно относятся к ИТ-отделам.
Идея заключалась в том, чтобы предоставить команде контроль над всеми ресурсами, необходимыми ей для успеха, и наделить ее не только ответственностью, но и полномочиями. В дополнение к ответственности за выполнение аналитики команда получила полное право производить любые операции в рамках всего аналитического цикла. Это позволило полностью устранить бюрократические препоны и внутриведомственные дрязги и сосредоточить все усилия на удовлетворении аналитических потребностей организации.
Таким образом, многопрофильная, кросс-функциональная команда может быть очень перспективной моделью. Со временем такая модель станет более распространенной, чем сегодня. Однако по сравнению с командой, составленной в основном из специалистов-аналитиков, такая модель является более сложной для реализации и требует более зрелого подхода. Поэтому большинство компаний начинают с создания базовой аналитической команды и затем расширяют сферу ее компетенций.
Как добиться успеха
После того как аналитическая команда укомплектована специалистами и организована, необходимо наладить ее работу таким образом, чтобы она оказывала максимальное влияние. Это связано как непосредственно с аналитическим процессом, так и с тактическими и организационными моментами. В этом разделе мы рассмотрим несколько ключевых подходов, которые помогут обеспечить эффективность аналитической команды.
Используйте с умом внешние ресурсы
У меня часто спрашивают, можно ли передать аналитику на аутсорсинг, если у организации нет аналитических компетенций. И если можно, то как следует использовать внешние ресурсы. Действительно, привлечение внешних ресурсов может повысить эффективность, поскольку сторонние специалисты способны привнести с собой новые перспективы и экспертные знания в те области, где позиции организации непрочны. Тем не менее, хотя внешние ресурсы могут закрыть пробелы на краткий срок, передача на аутсорсинг всех аспектов аналитики не должна превращаться в долгосрочный план.
Организация может надолго передать на аутсорсинг непосредственное выполнение аналитики, однако за стратегии, разработку и планирование своих аналитических инициатив должна отвечать сама. На старте вполне допустимо привлечь внешних консультантов, чтобы они помогли с разработкой первоначальной стратегии и нескольких начальных аналитических процессов. Главное, чтобы контракт с консультантами четко прописывал, что все знания, аналитические алгоритмы и коды будут полностью переданы заказчику. По мере выстраивания процессов организация должна вникать во все, что и почему делают консультанты, должна владеть всеми созданными аналитическими процессами и в конечном итоге принять на себя руководство ими.
Ваша аналитическая стратегия должна принадлежать вам
Вы можете передать на аутсорсинг тактическое выполнение аналитики, но ни при каких обстоятельствах не передавайте на аутсорсинг разработку аналитической стратегии и процессов, за исключением, возможно, самого начального периода. Производители никогда не отдают на сторону разработку стратегий и продуктов – они передают на аутсорсинг только сам производственный процесс.
Контроль над аналитической стратегией и разработкой процессов крайне важен. Если аналитика призвана стать коренным стратегическим компонентом деятельности компании, последняя должна понимать, что происходит и почему. Производители хай-тека никогда не передают на аутсорсинг планирование и разработку новых продуктов, поскольку это имеет слишком большое стратегическое значение для их бизнеса. Во многих случаях они передают на аутсорсинг непосредственно производственный процесс, но это легко сделать, когда у вас есть стратегия и дизайн. Например, хотя Apple перевела производство своих iPhone за рубеж, но разработка новых моделей осуществляется в стенах корпоративной штаб-квартиры. На любом iPhone или iPad указано: «Разработано в Apple, Калифорния, собрано в Китае». Точно так же вся аналитика должна разрабатываться внутри организации.
Еще одна хорошая аналогия – проектирование и строительство дома. Вы же хотите непосредственно участвовать в разработке проекта своего дома. Хотите сами принимать решения о том, где какие комнаты будут расположены, как будет организовано освещение и т. д. После того как все эти детали определены, любой опытный подрядчик сможет повесить гипсокартон или уложить черепицу. Аналогичным образом вы должны разработать схему операционно-аналитического процесса, определить, как он станет работать, как будет интегрирован с другими приложениями и какие именно аналитические методы будут использоваться. После этого вы можете нанять внешнего подрядчика для выполнения программирования и тестирования. Насколько вы разбираетесь в том, что и почему он будет программировать, настолько вы сможете гарантировать, что все делается правильно.
Чтобы добиться успеха, доводите проекты до конца
Если аналитическая команда хочет увеличить свое влияние и авторитет, она должна понимать, что завершение анализа – всего лишь первый шаг на пути к успеху. Вы можете положить на стол генеральному директору отчет об обнаружении возможности заработать миллиард долларов, но если не будет не предпринято никаких дальнейших действий, не прибавится и ценности. Аналитики обычно стремятся сразу же переключиться на новый интересный проект вместо того, чтобы довести до конца те проекты, которые они считают «завершенными». А вот успешная аналитическая команда ведет рабочий процесс до полного завершения проектов и своим сотрудникам даст четко понять, что они должны довести дело до конца. Далее мы рассмотрим несколько задач, обязательных для решения, помимо получения результатов анализа.
Во-первых, это маркетинг и связи с общественностью (PR). Весомым компонентом работы аналитической команды являются действия в сфере маркетинга и PR с целью влиться в коллектив организации и довести до сведения прочих ее сотрудников полученные результаты и возможности применения этих результатов. Команда должна всем дать понять, что обнаружила потрясающую возможность, и объяснить, почему эта возможность так важна для бизнеса и какое воздействие способен оказать проведенный анализ.
В некоторых случаях маркетинг и PR могут выходить за рамки организации в публичное пространство. Возьмем такие популярные веб-сайты, как Amazon или Netflix. В этих компаниях пропагандируют значимость новых механизмов рекомендации не только в своих стенах, но и выходят на публику, приглашая пользователей зайти на сайты и убедиться, как усовершенствованные механизмы рекомендаций улучшают восприятие. Когда аналитика является ключевым компонентом бизнеса и конкурентоспособным дифференциатором, клиенты будут ожидать появления следующих новшеств.
Вторая область, которая требует внимания, – это разработка плана текущей поддержки процесса. В традиционной пакетной аналитике поддержка аналитического процесса была довольно простым делом. Если я разрабатывал процесс, то и пользовался им. Если он ломался, я его исправлял. Если мне задавали вопрос, я на него отвечал. Поскольку процесс запускался нерегулярно, такая модель поддержки была вполне работоспособной, хотя и неидеальной. С операционной аналитикой такая модель не сработает, поскольку в этом случае аналитический процесс глубоко внедрен в операционные системы и используется широким кругом приложений и сотрудников, обслуживающих клиентов.
Придется попотеть
Многие специалисты-аналитики не любят заниматься тем, что отвлекает их от анализа. К сожалению, успех в этом деле зависит от ряда факторов, которые никак не связаны с качеством или ценностью аналитики. Первоочередное внимание следует уделять таким действиям, как маркетинг выявленных возможностей и разработка модели их поддержки, с тем чтобы реализовать их потенциал. Все это осознает успешная аналитическая команда.
Следовательно, необходимо разработать модель поддержки для того, чтобы определить, кто будет контролировать процесс, а кто поддерживать его программу. Также необходимо определить, что делать в тех случаях, когда люди будут обращаться с вопросами, например, о том, как интерпретировать основанные на аналитике решения, или о других возможных способах использования в бизнесе результатов аналитического процесса. Кто-то должен быть доступен для ответа на такие вопросы. Если заранее со всем этим не разобраться, впоследствии может не хватить ресурсов.
Третья область, требующая проверки исполнения, – это планирование и контроль за внедрением аналитического процесса. После того как была выявлена перспективная возможность, требуется проделать массу работы, чтобы довести эту возможность до практической реализации. Аналитическая команда должна помочь в разработке плана реализации проекта, в исполнении этого плана и в тестировании и валидации, призванных убедить в правильной работе процесса, прежде чем он будет запущен в операционном режиме.
Внедрение процессов не относится к числу любимых занятий специалистов-аналитиков, однако им придется этим заниматься, если они хотят добиться успеха в операционной аналитике. Может оказаться полезным поставить во главе профессионального менеджера проектов с хорошими навыками в области внедрения. Однако даже в этом случае аналитической команде придется поддерживать его действия с начала и до конца.
Последняя область, требующая внимания, это управление изменениями и подстройка под корпоративную культуру, обусловленные операционной аналитикой. Эта тема подробно рассматривается в девятой главе. А из данного раздела вытекает следующий важный вывод: без проверки, призванной удостоверить, что аналитическое открытие будет реализовано, это открытие окажется бесполезным.
Эффективно управляйте ожиданиями
Эффективное управление ожиданиями – важный навык, которым должна обладать аналитическая команда. Разумеется, он требуется и во многих других областях, но для аналитики имеет особое значение. Как-то клиент пожаловался мне на то, что его команда подверглась серьезным нападкам после реализации проекта. Причина была не в плохих результатах. На самом деле они были очень хорошими. Проблема заключалась в том, что команда пообещала потрясающие результаты, а получила… всего лишь очень хорошие. Руководство компании было разочаровано.
Эта ситуация очень похожа на то, как сегодня работает фондовый рынок. Если рынок ожидает от компании удвоения прибыли на акцию, но прибыль увеличивается «всего» на 80 %, то акции компании могут значительно рухнуть в цене. Все дело в ожиданиях. Раздавать щедрые обещания особенно рискованно при поиске с помощью аналитики новых инновационных открытий. Поскольку успех вовсе не гарантирован, необходимо убедиться в том, что заказчики проекта полностью осознают все риски, а также вероятность успеха.
Когда аналитическую команду просят начать процесс обнаружения, чтобы исследовать новую идею, не нужно обещать, что работоспособность идеи будет успешно доказана. Надо пообещать, что идея подвергнется тщательному исследованию и будет вынесено обоснованное заключение о ее работоспособности. Да и как можно гарантировать работоспособность идеи, если она еще не была изучена, однако можно гарантировать подготовку заключения. Хорошо документированное резюме с выводами о том, почему идея оказалась неработоспособной (в тех случаях, когда это так), пополнит растущий массив знаний касательно аналитики, которую могут или не могут поддерживать собираемые организацией данные.
Самое же лучшее: всегда обещать меньше, а делать больше. Следование этому правилу чрезвычайно помогает мне на протяжении всей карьеры. Я стараюсь быть предельно реалистичным с самого начала и в то же время оставлять задел, чтобы порадовать заказчиков проектов. Если заказчик ожидает 100 %-ной рентабельности, а получает всего 90 %, он будет разочарован. Если же я нацелю его на планку рентабельности в 80 %, а обеспечу 90 %, он будет счастлив. Когда заказчики согласны на реализацию проекта только при условии грандиозных гарантий, вы должны быть либо полностью уверены в том, что сможете обеспечить такие грандиозные гарантии, либо вообще не браться за проект. В этом случае риск не оправдать ожидания слишком велик, а вероятность превысить их слишком мала. Поскольку никто не любит, когда его ожидания не оправдываются, всегда оставляйте задел для того, чтобы порадовать заказчиков проекта.
Не просто удовлетворяйте – восхищайте!
Независимо от объективных результатов аналитических действий успех в значительной степени зависит от того, как эти результаты соотносятся с ожиданиями. Всегда оставляйте задел для того, чтобы порадовать заказчиков проекта. Если аналитическая команда постоянно обещает больше, а делает меньше, это серьезно подорвет ее авторитет.
Позвольте мне привести пример из реальной жизни. Несколько лет назад мою команду наняла крупная компания, чтобы создать модель сегментации покупателей. Когда я представил заказчику техническое задание, он сказал мне, что хотел бы договориться о фиксированной сумме оплаты за реализацию проекта вместо почасовой. Из-за бюджетных ограничений он хотел точно знать, каковы будут затраты на проект, поскольку не мог позволить себе перерасход. Я сказал, что мы можем установить фиксированную плату, однако добавим к нашим сметным оценкам еще 20 % для покрытия дополнительных рисков, с которыми столкнется моя компания. Заказчик согласился, и мы запустили проект.
Мы завершили проект в рамках первоначального бюджета, поскольку тщательно его изучили, и получили дополнительные 20 % прибыли. После чего захотели порадовать заказчика дополнительно выполненной работой. Посовещавшись, решили потратить половину надбавки за риск на дополнительную аналитику, которая не была включена в техническое задание и, следовательно, не ожидалась заказчиком. Нам все равно досталось 10 % дополнительной прибыли, а заказчик пришел в полный восторг – и привлек нас к новым проектам. Мы оставили задел для того, чтобы порадовать заказчика, и это окупилось. В итоге все оказались в выигрыше.
Станьте консультантами, наставниками и инструкторами
Для того чтобы аналитическая команда играла в компании значимую стратегическую роль, ей необходим соответствующий образ мышления. Когда я начинал свою карьеру, на меня порой оказывали сильное давление, с тем чтобы я выполнял функции приемщика заказов. Я был всего лишь «ботаником», сидевшим в стеклянном отсеке на цокольном этаже, и заказчики время от времени считали возможным указывать мне, что нужно делать и притом делать немедленно. Причем в аналитике они совершенно не разбирались. И меня угнетало, когда посторонние люди говорили мне, что и как нужно делать.
Эффективная аналитическая команда должна рассматривать себя как команду консультантов, наставников и инструкторов, а не приемщиков заказов. Когда бизнес-партнер просит ее выполнить конкретные действия, команда должна задуматься над тем, что именно она должна сделать и с какой целью. Как этот запрос соответствует реальным потребностям бизнеса? Как он соотносится с доступными данными и инструментами? Является ли запрос в той форме, в которой он представлен, лучшим способом оценить лежащую в его основе проблему? В общем, вам надо посмотреть на запрос как бы со стороны. Возможно, придется объясниться с заказчиком: «Я понимаю, что вы просите сделать A, B и C. Но для того чтобы решить интересующую вас проблему, мы рекомендуем вам сделать D, E и F, поскольку это верный путь к успеху. Позвольте нам объяснить почему».
Специалисты-аналитики должны взять на себя ответственность за разработку решений, которые помогут компании в достижении ее бизнес-целей. Консультируйте членов бизнес-команды, чтобы понять их потребности и объяснить им предлагаемые решения. В качестве наставников помогите руководителям понять, как надо применять аналитику. Инструктируйте их на предмет того, какие детали необходимо указывать в запросах, чтобы получать более эффективные ответы. Такой подход приведет к тому, что бизнес-команда начнет доверять аналитической команде, ценить ее вклад и со временем перестанет отдавать приказы. В итоге члены бизнес-команды будут приходить к аналитической команде, излагать свою проблему, а поиск ее решения оставлять на усмотрение специалистов.
Мыслите как рефери
Я играл в футбол в течение 30 лет. Когда мои колени отказались выдерживать нагрузки, перешел в судьи. Во время подготовки к сертификации преподававший в нашем классе старший судья дал нам важнейший урок. Этот урок помог мне повысить свою квалификацию не только в качестве футбольного рефери, но и в качестве аналитика.
Инструктор внушал классу, что, собираясь дать свисток, мы должны это делать быстро и уверенно. Хороший рефери доверяет собственным суждениям и поступает решительно. Он должен быть уверен в правильности своего решения почти в 100 % случаев. Игроки, тренеры и зрители очень быстро распознáют, компетентен и уверен в себе судья либо нет. Если болельщики видят, что судья действительно уверен в себе и свистит по делу, они с большей вероятностью простят ему редкие ошибки, поскольку те станут очевидным исключением. Если же судья будет каждый раз сомневаться и медлить со свистком, то люди сочтут свои протесты обоснованными. Промедление со свистком свидетельствует о неуверенности и нерешительности, а с таким поведением трудно завоевать уважение людей.
Дайте свисток!
Чтобы преуспеть, аналитическая команда должна быть готова занять твердую позицию и «дать свисток». Подобно рефери на футбольном поле, специалисты-аналитики должны с уверенностью выдавать надежные рекомендации и отстаивать полученные результаты. Если вы сами не уверены в своих открытиях, то как в них может быть уверен кто-то другой?
Этим же советом может воспользоваться и аналитическая команда. Когда ее просят решить проблему, команда должна с уверенностью рекомендовать путь, ведущий к решению. Когда получены результаты, она должна с уверенностью представить и объяснить их, а также выявить их значение. И, наконец, команда должна занять твердую позицию и представить конкретные рекомендации в отношении дальнейших действий. Благодаря такому подходу аналитическая команда завоюет уважение и доверие к себе со стороны заказчиков.
Заказчики проектов не всегда соглашаются с рекомендациями аналитической команды и иногда решают выбрать другое направление. Они ведут себя как болельщики, которые считают, что рефери неправильно дал свисток. Однако аналитическая команда должна отстаивать свою точку зрения, ведь у заказчика голова и без того занята множеством разных вопросов. Чем доказательнее аналитическая команда сможет убедить заказчика в том, чтобы он перестал интерпретировать данные и результаты анализа, а доверил это ей, тем будет лучше.
Ложные стимулы обходятся дорого
Стимулы важны всегда. Когда организация превращает традиционную аналитику в операционную, стимулы, привязанные к правильным целям, приобретают еще более важное значение, поскольку при интеграции аналитики в операционный процесс неточное определение стимулов может сказаться на результате. Какова главная цель при создании аналитического процесса? Легкая интегрируемость? Или высокая производительность? Или стабильность? Или что-то еще?
Важно определять четкие цели для специалистов-аналитиков как в годовом исчислении, так и на уровне конкретных проектов. У проектов, направленных на обнаружение, иные цели и критерии успеха, чем у проектов по операционному внедрению сделанных открытий. Например, в первом случае для сотрудников требуются стимулы, поощряющие экспериментирование и поиск новых явлений. Делать это нужно эффективно и быстро выполнять прототипы. Тем же, кто занят операционализацией, требуются другие стимулы, поощряющие тщательную работу по оптимизации скорости и производительности процесса, а также по тестированию процесса для гарантии его стабильности. Разумеется, постановка правильных целей напрямую связана с темой управления, которую мы обсуждали в шестой главе.
Есть примеры реальных ситуаций, когда неправильные организационные стимулы в отношении аналитики ведут к огромным издержкам. Например, налоговое мошенничество является серьезной проблемой в Соединенных Штатах. Один из его самых распространенных видов состоит в том, что мошенники крадут чужой номер социального страхования, подают декларацию от имени этого человека и получают большой возврат налогов{84}. Сегодня это превратилось в многомиллиардный бизнес (если здесь применимо слово «бизнес»){85}. К сожалению, предлагаемые Службой внутренних доходов (Internal Revenue Service, IRS) стимулы скорее усугубляют проблему, чем решают ее{86}.
То, что я сейчас расскажу, уже является достоянием широкой общественности, поэтому я не разглашу никакой конфиденциальной информации. Встречаясь с сотрудниками IRS, я поинтересовался у них, каким образом мошенникам удается подавать совершенно фиктивные налоговые декларации, если у IRS имеются данные о доходах и налоговых платежах по каждому человеку, которые предоставляются работодателями, финансовыми учреждениями и другими источниками доходов. Если цифры в налоговой декларации не совпадают с этими сведениями, то фальшивые декларации легко выявить для проверки, разве нет? Оказывается, нет. Хотя сведения о доходах поступают от работодателей в начале года, они становятся доступными для анализа лишь спустя несколько месяцев, т. е. уже после проверки налоговых деклараций. По сути, на протяжении всего сезона налоговой отчетности IRS не может соотнести сведения о доходах и налоговых выплатах, предоставленные работодателями и самими налогоплательщиками, чтобы проверить декларации перед утверждением возврата налогов. Звучит дико, не так ли?
Хуже того, у IRS есть стимулы осуществлять возврат налогов в максимально сжатые сроки. Когда некто просит IRS вернуть деньги, она старается сделать это как можно быстрее. Ситуация не меняется даже несмотря на всеобщее понимание того, что мошенничество на миллиарды долларов происходит вследствие невыполнения углубленного анализа его причин. Главное – быстрее обслужить клиентов, и IRS достигает этой цели, что обходится налогоплательщикам в миллиарды долларов.
Усугубляет ситуацию то, что вполне надежный анализ с целью выявления мошенничества можно осуществить даже без наличия данных за текущий год. Например, возьмем мой случай: я работаю в одной и той же компании несколько лет, получаю примерно одинаковый годовой доход и живу в одном и том же штате. Если налоговая декларация от моего имени подается в другом штате с указанием другого работодателя и суммы доходов, которая существенно отличается от суммы доходов в прошлом, то это должно рассматриваться как предупреждающий знак. Существует масса исторических данных, позволяющих выявить потенциально мошеннические декларации, но эти данные либо мало, либо вообще не используются для анализа. Вместо этого быстрый возврат налогов имеет для IRS первостепенное значение.
Если бы IRS изменила свои стимулы и сбалансировала скорость выплат со временем, требуемым для элементарных проверок на предмет мошенничества, она бы уберегла массу денег. Поскольку процедура возврата налогов обычно занимает несколько дней, этого времени более чем достаточно для того, чтобы осуществить любой необходимый анализ до выплаты денег. Вместо этого аналитика сосредоточена на выявлении фиктивных деклараций уже после того, как выплаты были сделаны. Поэтому еще раз повторю: стимулы должны поощрять разумное использование аналитики, а не отказ от нее.
Подведем итоги
Наиболее важные положения этой главы:
• Сегодня ценность специалистов-аналитиков получила широкое признание. Вместо того чтобы спрашивать, нужны ли им вообще аналитические таланты, организации сейчас сосредоточиваются на том, как сорганизовать имеющихся у них аналитиков и распространить их влияние.
• Все специалисты-аналитики, как бы ни называлась их профессия, обладают одними и теми же основными чертами, многие из которых не имеют ничего общего с техническими умениями.
• Переквалифицирование сотрудников в аналитиков, как правило, не является выигрышной стратегией. Лучше привлечь со стороны специалистов-аналитиков с необходимым образованием и опытом.
• Ни один специалист не может быть компетентным во всех аналитических дисциплинах. Объединение в команде специалистов с разными специализациями позволяет создать универсальную команду с полным набором аналитических компетенций.
• Зарплата, безусловно, важна для специалистов-аналитиков, но, чтобы их удержать, надо прежде всего обеспечить их интересными задачами и возможностями для долгосрочного профессионального роста.
• Хотя стандартной структуры аналитической организации пока не существует, но со временем должна возобладать гибридная модель, предусматривающая как централизованную поддержку, так и поддержку на уровне отдельных бизнес-подразделений.
• Наличие центральной команды позволяет осуществлять аналитику, которая имеет большую ценность на корпоративном уровне, но не окупается на уровне отдельных бизнес-подразделений.
• Сегодня должности директора по аналитике и директора по данным становятся все более распространенными. Между тем важно различать эти две должности, даже если их совмещает одно лицо.
• Организации могут передавать на аутсорсинг реализацию аналитических процессов, однако в долгосрочном плане важно, чтобы организации сами разрабатывали свою аналитическую стратегию и свои аналитические процессы и управляли ими.
• Работа аналитиков не заканчивается по завершении анализа. Для достижения максимального воздействия они должны также завершить маркетинг результатов и разработку модели поддержки операционных процессов.
• Необходимо правильно управлять ожиданиями, следуя принципу «обещать меньше, а делать больше». Даже успешный проект может быть оценен негативно, если изначально были установлены, а впоследствии не реализованы нереалистичные ожидания.
• Специалисты-аналитики должны быть консультантами, наставниками и инструкторами, а не приемщиками заказов и, когда нужно, твердо отстаивать свою позицию. Если они не будут вести себя как эксперты, то их и не будут воспринимать как экспертов.
Глава 9 Аналитическая культура
Корпоративная культура находится в процессе постоянного изменения и развития. Применение аналитики уже заставило многие организации изменить свою культуру, перейдя от решений, основанных на интуиции, к решениям, основанным на фактах. Переход же к операционной аналитике потребует еще больше культурных изменений, поскольку она гораздо более интегрирована и автоматизирована, чем аналитика прошлого.
В этой главе мы рассмотрим ключевые аспекты корпоративной культуры, которые организация должна принять во внимание при переходе к операционной аналитике. Многие из этих аспектов широко применяются как в рамках, так и за рамками аналитического контекста и в своем большинстве не являются для читателей новыми. Тем не менее, если организация хочет преуспеть с внедрением операционной аналитики, она должна обратить на эти аспекты внимание. Итак, чтобы создать аналитическую культуру, включающую операционную аналитику, требуются четыре составляющие:
1. Надлежащий образ мыслей.
2. Эффективные методы.
3. Обеспечение успеха.
4. Допущение неудач и управление ими.
Привитие надлежащего образа мыслей
Поощряя людей думать определенным образом, организация задает тон всей своей деятельности. Со временем прививаемый образ мышления распространяется по всей организации, и большинство людей подстраиваются к нему, потому что он считается ожидаемым и приемлемым независимо от того, хорош он или плох. Между тем необходимо время от время встряхивать статус-кво и внедрять иные способы мышления, чтобы избежать самоуспокоенности. Признание такой потребности является важным шагом, но нужно быть к нему подготовленным, чтобы вступить в битву. Давайте рассмотрим, какой образ мышления требуется организации, когда она берет курс на операционную аналитику.
Урок от блох
Позвольте мне начать с рассказа о блохах, который очень нравится моим клиентам. Да-да, вы не ошиблись – о блохах! Читайте дальше, и вы поймете, что блохи тоже могут преподать нам ценный урок. Этот видеоролик я увидел на YouTube, хотя и не могу сказать наверняка, так ли было на самом деле или же нас разыграли{87}. В любом случае эта история позволяет проиллюстрировать важную мысль.
Итак, представьте, что вы вместе с семьей садитесь за кухонный стол, ставите на стол пустую банку из-под детского питания и затем сажаете туда пригоршню блох. Разумеется, вы спросите, а с чего бы вдруг? Пока просто представьте, что сделали именно так. Знаете ли вы, что блохи могут прыгать с места очень высоко? По человеческим меркам, метров на 150. Конечно же, близкие на вас заорут и потребуют убрать блох. И, конечно же, спросят, что заставило вас совершить этот безумный поступок. Валите всё на меня!
Чтобы не пугать свою семью, после того как посадите блох в банку, немедленно накройте ее крышкой. Блохи будут прыгать внутри банки, ударяться головой о крышку и падать вниз. Потом снова прыгать, ударяться головой и падать. Так будет происходить снова и снова. Но даже блохи достаточно умны для того, чтобы понять, что все время биться головой – это глупо, и в конце концов начнут прыгать чуть ниже уровня крышки. Вот здесь-то и начинается самое поразительное.
Если через какое-то время вы снимете крышку, блохи все равно останутся в банке. Они помнят, где была крышка, и продолжат прыгать ниже заданного уровня. Если бы блохи прыгнули чуть выше, то оказались бы на свободе. Однако они так больше и не попытаются проверить, на месте ли крышка. Говорят, что, если посадить в банку детеныша-блоху, то он научится прыгать на том же уровне, что и взрослые особи, и тоже навсегда останется в банке. Так блохи попадают в ловушку собственных благоприобретенных и устаревших представлений.
Не будьте блохой!
Блохи не могут выпрыгнуть из открытой банки, поскольку продолжают слепо верить в то, что крышка на месте, и не замечают, что она убрана. Пестуйте культуру, которая будет постоянно поощрять специалистов-аналитиков подвергать проверке существующие предположения и не попадать в ловушку устаревших взглядов.
Корпоративная культура может делать людей во многом похожими на тех блох. Узнав, где в компании установлены границы и как здесь принято делать дела, мы уже больше не пытаемся это оспаривать. Поэтому устаревшие предположения способны вынуждать нас упускать возможности, которые находятся прямо перед носом. Хуже того, когда нанимаются новые сотрудники, их подгоняют под принятый в компании образ мышления. Инструктаж и тренинги в основном направлены на вдалбливание новичкам того, что в компании можно и что нельзя делать. Мы усиленно внушаем им, что крышка находится на месте, чтобы они остались в банке вместе с нами, подобно народившимся блохам.
При переходе к новому способу работы, такому как операционная аналитика, организация должна поощрить сотрудников на переосмысление и переоценку давнишних предположений. Вероятно, несколько лет назад нельзя было делать то, что требуется и возможно сегодня. Поэтому время от времени осматривайтесь вокруг и проверяйте, по-прежнему ли существуют усвоенные вами ограничения, чтобы не уподобиться блохам в открытой банке.
Внедряйте аналитику сверху по всей вертикали управления
Культура, воспринимающая аналитику, должна начинаться сверху. Мы уже не раз говорили об этом на протяжении книги, но здесь стоит повторить несколько важных моментов.
Со многими традиционными аналитическими процессами можно было добиться успеха при наличии, скажем так, карманных денег. На протяжении многих лет, если отдел маркетинга правильно воспринимал аналитику, этого вполне хватало ему для ее успешного применения, даже если другие подразделения совершенно ею не интересовались. Например, когда в свое время я разрабатывал пакетные аналитические процессы для поддержки кампаний прямой почтовой рассылки, нашей команде всего лишь раз в месяц приходилось обновлять модели и составлять список идентификаторов клиентов. Если руководитель, отвечавший за кампании рассылки, поддерживал аналитику, то мы спокойно выполняли свою работу. Мало кто еще в организации был в курсе наших дел или поддерживал их.
Операционная аналитика не может быть реализована в изолированном пространстве, поскольку она встроена в бизнес-процессы и влияет на действия широкого круга заинтересованных лиц по всей организации. В силу того, что она оказывает воздействие на столь многих людей во многих частях организации, операционную аналитику невозможно использовать в скрытом режиме.
Следовательно, в первую очередь необходимо добиться согласия и готовности всех заинтересованных лиц перейти к более интенсивному использованию аналитики. Ее должны поддерживать все, начиная с генерального директора, иначе добиться прогресса будет невероятно трудно. Корпоративной культуре следует воспринимать аналитику в качестве ключевого приоритета.
Признайте ценность специалистов-аналитиков
В восьмой главе мы говорили о важности того, чтобы специалисты-аналитики рассматривали себя как консультантов, наставников и инструкторов, а не приемщиков заказов. У этой темы есть и обратная сторона. Организация должна создать такую культуру, где ценится вклад специалистов-аналитиков и в которой их поощряют выступать в качестве консультантов, наставников и инструкторов. Однако аналитическая команда не сможет выполнить взятую на себя роль консультанта, если никто не прислушивается к ее рекомендациям и не придает им того значения, которого они заслуживают.
Руководители структурных подразделений компании не должны рассматривать аналитику и, шире, специалистов-аналитиков как явление, подрывающее их авторитет и независимость. Напротив, они должны рассматривать их как ценные инструменты, способствующие успеху компании. Если специалисты-аналитики помогут руководителям добиться успеха, это только повысит авторитет и независимость последних, поскольку успешным людям дают больше свободы действий.
Всем нужно немного любви
Создайте такую культуру, в которой ценятся аналитика и создающие ее специалисты. Специалисты-аналитики преуспеют в среде, где они чувствуют, что их ценят по достоинству, а их мнения и предложения воспринимаются всерьез.
Невозможно предоставить ценные консультацию и инструктаж тому, кто вас не слушает и не ценит ваш вклад. В этом случае советы подобны рекламному шоу, показываемому в пустой комнате. Организация должна четко установить, что аналитика и специалисты-аналитики являются ценным компонентом ее деятельности и, следовательно, должны быть частью всех важных процессов принятия решений.
Принимающие решения лица нуждаются в круге людей, которым они доверяют и которые, в свою очередь, помогают им в принятии решений. В этот круг следует пригласить и специалистов-аналитиков. Создание официально оформленной аналитической команды и назначение директора по аналитике, о чем мы говорили в восьмой главе, – два шага, способные продемонстрировать приверженность этому подходу.
Добейтесь изменения поведения
Как мы выяснили в восьмой главе, недостаточно получить правильную рекомендацию, поскольку если рекомендация не выполняется, то и толку от нее не будет никакого. Если организация хочет добиться успеха с операционной аналитикой, она должна изменить поведение людей, с тем чтобы они выполняли рекомендации и решения, генерируемые операционной аналитикой. Когда сотрудникам позволяется игнорировать рекомендации или менять их по своему усмотрению, полученная аналитическая ценность очень быстро сократится. Разумеется, если в аналитическом процессе обнаруживаются ошибки, они должны быть устранены. Но людям не должно быть позволено обращаться с аналитическими рекомендациями так, как им вздумается.
Вспомните пример из первой главы касательно логистической компании, которая вкладывала много средств в уточнение своей картографической базы данных с целью крайне изощренной аналитической оптимизации ежедневных маршрутов для водителей службы доставки. Естественно, это вызвало сопротивление со стороны водителей, поскольку их действия взяли под контроль. Чтобы преодолеть это сопротивление, компания прибегла к методу игрофикации{88}. Другими словами, она превратила соблюдение рекомендаций в игру.
Вместо приказания: «Вы обязаны ехать по этому маршруту, потому что так сказал компьютер!», компания использовала более мягкий подход и придумала игру, которая апеллировала к самолюбию водителя. Его спрашивали: «Вы можете победить компьютер?» Поначалу водителям разрешалось отклоняться от рекомендаций, если они считали, что знают лучший маршрут. Данные о том, как срабатывали корректировки, затем включались в алгоритмы оптимизации.
Мой знакомый из этой компании по секрету рассказал мне об одном водителе, который проезжал в среднем 240 километров в день, в то время как первоначально компьютер рекомендовал 225 километров в день. Тогда водитель заявил, что компьютер ничего не понимает, а сам он сможет сократить свой пробег до 215 километров в день. Затем компьютер обновил свои рекомендации до 210 километров в день. Тогда водитель снова обвинил компьютер в некомпетентности и уменьшил свой пробег до 200 километров в день. В конце концов, водитель торжествовал, поскольку компьютер всякий раз ему проигрывал. Как бы там ни было, дневной пробег сократился со 240 до 200 километров в день.
Для компании совершенно не важно, понимал ли водитель, что действует под влиянием аналитики, или не понимал. Главное, что он изменил свое поведение, а пробег сократился. Польстив самолюбию водителя и превратив аналитический процесс в игру, компания сумела обернуть сопротивление себе на благо.
Люди сопротивляются изменениям? Превратите аналитику в игру!
Убедить людей изменить привычное поведение трудно. Один из способов содействия такому изменению – превратить признание операционной аналитики в игру. Рядовые сотрудники могут смутно представлять, как работает аналитика, и воспринимать ее как угрозу. Попробуйте найти способы представить изменения в виде игровых задач для сотрудников.
Преодолейте сопротивление и несогласие
Как показывает предыдущий пример, организация должна быть готова к тому, что люди, на которых будет воздействовать операционная аналитика, проявят недовольство предполагаемым покушением на их авторитет и независимость. Разумеется, так отреагируют не все, но безопаснее предположить, что многие, естественно, взбунтуются против системы, подразумевающей, что они все время принимают неправильные решения. Организация должна дать четко понять, что операционная аналитика внедряется вовсе не потому, что люди поступают неправильно, а для того чтобы помочь им выполнять свои обязанности лучше и эффективнее. Такое отношение должно стать частью корпоративной культуры. Правильный подход, например с использованием игрофикации, поможет привести сопротивление к позитивному исходу.
Давайте посмотрим правде в глаза. Если компания успешна, это означает, что ее сотрудники принимают правильные решения, видимо, гораздо чаще, чем неправильные. Операционная же аналитика имеет дело с исключениями, когда кажущееся правильным решение на деле таковым не является. Если она поможет организации хотя бы ненамного повысить эффективность на уровне всех своих сотрудников, всех бизнес-единиц и всех продуктов, то в совокупности это выльется в значительную финансовую отдачу.
Объясните сотрудникам, что операционно-аналитический процесс, принимающий за них некоторые решения, позволяет высвободить время для того, чтобы они сосредоточились на тех решениях и видах деятельности, которые не так просто автоматизировать. Операционная аналитика дает возможность сотрудникам заняться более сложными, требующими интенсивных размышлений задачами, вместо того чтобы тратить время на рутинные вопросы. Это позволит сделать их работу менее утомительной и значительно ускорить принятие многих решений благодаря автоматизированным операционным процессам.
Помогите, а не обвиняйте
Сотрудникам не понравится, если аналитика будет использоваться как перст, указующий им на их ошибки. Не зацикливайтесь на неправильных действиях сотрудников. Покажите, как операционная аналитика поможет им успешнее достигать своих целей.
Давайте рассмотрим несколько примеров, когда аналитика преодолела сопротивление сотрудников. Однажды я присутствовал на закрытом мероприятии, где генеральный директор региональной больничной сети рассказал, как его команда проанализировала факторы, повышающие вероятность того, что новорожденный ребенок будет отправлен в отделение неонатальной интенсивной терапии (Neonatal Intensive Care Unit, NICU). Отправка в NICU означает, что жизнь ребенка находится в опасности и ему требуется дорогостоящая медицинская помощь. Анализ показал существование корреляции между помещением в NICU и добровольной стимуляцией родов до наступления определенной недели беременности. К добровольной стимуляции родов прибегают по разным причинам, начиная с чувства дискомфорта и заканчивая желанием родить ребенка в определенную дату, но эта процедура не является необходимой, поскольку для ее проведения нет настоятельных медицинских показаний. Повышенный риск терапии в NICU присутствовал даже в том случае, когда стимуляция родов осуществлялась на таком сроке беременности, который считался уже безопасным.
Все врачи в больнице были согласны с тем, что преждевременная стимуляция родов несет с собой высокие риски, но утверждали, что к добровольной стимуляции прибегали крайне редко. Хотя сами врачи не считали это проблемой, аналитическая команда установила, что преждевременная стимуляция родов использовалась гораздо чаще, чем считали врачи, а это соответственно увеличивало количество пациенток в NICU. Некоторые врачи использовали добровольную стимуляцию довольно часто, но были удивлены, когда им сообщили об этом. Через врачей проходило много пациенток, и хотя доля тех, кому назначалась эта добровольная процедура, действительно была невелика, но за год составляла значительное количество.
После того как врачи узнали об этой проблеме, они изменили свое поведение, что привело к уменьшению доли преждевременной стимуляции родов и, как следствие, к снижению доли новорожденных, которые имели проблемы со здоровьем и нуждались в помещении в NICU. Таким образом, использование аналитики и данных позволило преодолеть сопротивление и привело к ситуации, выигрышной для всех сторон. К счастью, в этом случае врачи ставили под сомнение не достоверность самого анализа, а свою вину в осуществлении практики, которую анализ признал рискованной. Поэтому оказалось достаточно легко преодолеть их сопротивление при помощи фактических данных, основанных на результатах анализа.
В транспортной компании, осуществляющей перевозки на дальнее расстояние, мне конфиденциально рассказали о том, что решили завоевать конкурентное преимущество благодаря использованию данных с телематических устройств, установленных на грузовых автомобилях, для выявления водителей с наиболее рискованной манерой вождения, которая более всего ассоциировалась с ДТП. Риск ДТП оценивался путем изучения таких факторов, как частое резкое ускорение или резкое торможение и других. Компания выявляла рискованных водителей и предоставляла им дополнительное обучение, чтобы изменить дурные привычки вождения и повысить безопасность и производительность их работы.
Компания использовала аналитику не для того, чтобы указать водителям на опасную манеру вождения. Аналитические результаты представлялись как полезные рекомендации. Когда компания выявляла, что манера вождения ассоциировалась с увеличением ДТП, то в последующем разговоре с водителем упор делался на безопасность самого водителя. Также компания стимулировала водителей, которые доставляли грузы в срок и в хорошем состоянии, повышенной оплатой. Избегая ДТП, водители улучшали свой послужной список. Таким образом, представляя аналитические результаты как способ повышения личных доходов, компания смогла преодолеть сопротивление водителей и убедить их изменить свое поведение к лучшему. Ведь большинство людей охотно прислушиваются к советам о том, как увеличить свои доходы.
Основная причина сопротивления часто кроется в чувстве потери контроля. Люди чувствуют себя некомфортно оттого, что приходится передать алгоритмам контроль над многими повседневными решениями. Взгляд на ситуацию под другим углом позволяет избавиться от такого негативного восприятия. Объясните сотрудникам, что использование операционной аналитики следует рассматривать не как лишение контроля, а как делегирование полномочий по принятию решений надежным алгоритмам. Это не сильно отличается от обычной практики делегирования полномочий другим доверенным лицам. После создания структуры, в рамках которой будут созданы, протестированы и запущены в работу эффективные аналитические процессы, люди постепенно убедятся в надежности алгоритмов и начнут им доверять. Подобно тому как люди доверяют тем, кто правильно использует делегированные им полномочия, так же они проникнутся доверием и к алгоритмам.
Делегирование полномочий – это не потеря контроля
Операционная аналитика должна позиционироваться как делегирование полномочий, а не как отказ от контроля. Люди охотно делегируют принятие решений тем, кому они доверяют. Делегирование решений надежным алгоритмам немногим отличается от этого.
Применение эффективных методов действий
Методы действий, применяемые организацией, являются отражением ее культуры и ценностей. Непродуманные методы могут лишить организацию способности внедрить и использовать операционную аналитику. Во многих случаях небольшие изменения образа мыслей и методов действий могут привести к потрясающим результатам. Давайте рассмотрим несколько таких примеров.
Небольшие изменения образа мыслей могут принести большие дивиденды
Для внедрения операционной аналитики обычно не требуются массивные инвестиции в новые технологии и инструменты – бывает достаточно лишь несколько иначе использовать то, что уже имеется. Один из моих любимых примеров на тему небольших изменений, создающих сильное воздействие, связан с торговлей замороженными йогуртами. Эта история очень впечатляет многих моих клиентов. Не поленитесь ее прочитать и к концу рассказа вы поймете, как она связана с операционной аналитикой.
Года два назад на расстоянии примерно полутора километров от моего дома находился магазин замороженных йогуртов. Это был типичный во всех отношениях магазин. Если я просил среднюю порцию ванильного йогурта, продавец за прилавком наполнял йогуртом из аппарата стаканчик среднего размера, а затем спрашивал у меня, хочу ли я какой-нибудь топпинг. Порция стоила примерно $3,50, а каждый из набора топпингов – $0,89. Поскольку я считал возмутительным платить $0,89 за несколько брызнутых капель, то никогда не покупал больше одного топпинга, а то и вообще отказывался от него в порядке личного протеста. Как следствие, посещение магазина не доставляло мне особого удовольствия, и я был там нечастым гостем.
Но затем произошло интересное событие. На протяжении примерно полугода в пределах метров 400 от этого магазина открылось три новых магазина замороженных йогуртов. Через полгода старый магазин закрылся. Что же касается трех новых, то все они работают по сей день. Судя по всему, спрос на замороженные йогурты в нашем районе существенно вырос, но почему же старый магазин не смог этим воспользоваться?
Дело в том, что новые магазины используют другую бизнес-модель, которую я считаю современной. Здесь аппараты с йогуртами не спрятаны за прилавком, а расположены вдоль стены в свободном доступе для покупателей. Покупатели сами могут смешивать йогурты с любым вкусом в любых пропорциях. Также в магазинах имеется бар с богатым выбором топпингов – от традиционных фруктов и сиропов до «Мишек Гамми» и японских мо́чи. Покупатели могут добавить любые топпинги в любых сочетаниях и любых количествах. В завершение стаканчик взвешивается и покупатель платит в зависимости от общего веса.
Между двумя описанными бизнес-моделями существуют относительно небольшие различия, которые кратко суммированы в таблице 9.1. В классической модели продавец сам накладывает йогурт и берет плату отдельно за него и каждый топпинг. В современной модели покупатели самостоятельно готовят смеси из йогуртов и топпингов и платят за все вместе по весу. Несмотря на сходство двух бизнес-моделей, в новых магазинах я всегда потребляю изрядную порцию йогурта, покрытого множеством топпингов, потому что мне нравится пробовать всевозможные сочетания вкусов. После взвешивания моего стакана я неизменно трачу от $6,5 до $7. Другими словами, я не только трачу в современных магазинах больше денег, но и делаю это с удовольствием. Мне не терпится вернуться туда, потому что я получаю именно то, что хочу. Теперь уже я зову детей сходить со мной за йогуртами, а не наоборот, как раньше.
Давайте подробнее рассмотрим бизнес-модели двух типов магазинов замороженных йогуртов, поскольку сходство между ними удивительно. Когда инвесторы решают открыть новый магазин, они могут выбрать либо классическую, либо современную бизнес-модель. Разница в затратах незначительна. Современный магазин может обойтись дороже, поскольку он потребует дополнительное количество аппаратов и более широкий выбор топпингов. Все остальное – витрина, кассовый аппарат, система расчетных терминалов, отопление, электроэнергия и т. д. – стóит одинаково. Модели практически равны по себестоимости, но современная поощряет покупателей чаще посещать магазин и каждый раз тратить больше денег да и больше приходится им по вкусу. Такое сочетание трудно превзойти.
Простое изменение всего лишь двух малозначимых аспектов полностью преобразило йогуртовый бизнес – благодаря переходу от обслуживания продавцом к самообслуживанию и от оплаты за каждый компонент в отдельности к комплексной оплате. Эти незначительные новшества качественно изменили восприятие покупателей и поток доходности. Но как это связано с ИТ и аналитикой?
Подавляющее большинство ИТ-служб используют классическую бизнес-модель торговли йогуртами. В нашем случае йогуртом являются данные. По запросу пользователей ИТ-служба выделяет им данные в соответствии с установленными правилами, однако держит их на расстоянии от данных. Далее представим, что топпинг – это инструменты. Теоретически пользователи могут иметь столько инструментов для анализа данных, сколько пожелают. Но на практике приобретение нового инструмента, получившего одобрение ИТ-службы, – обычно настолько сложная и дорогостоящая процедура, что пользователи обходятся одним-двумя инструментами. В итоге они никогда не бывают полностью удовлетворены и всегда ощущают, что их потраченные деньги окупаются не полностью, – так же как и я при посещении классического магазина замороженных йогуртов.
Изменив способы применения базовой инфраструктуры и технологий в окружении данных, можно обеспечить пользователям прямой доступ к данным. Он должен быть таким же свободным, как доступ к аппаратам с йогуртом. Позвольте пользователям по их усмотрению смешивать и сопоставлять данные и производить анализ. Позвольте им применять любые инструменты. Прежде чем находка будет внедрена в производство, ИТ-служба может отладить процесс так, как это описано в шестой главе, и может потребовать использовать только утвержденные инструменты. Тем не менее предоставление пользователям возможности экспериментировать с различными инструментами в ходе обнаружения данных не принесет никакого вреда и способно значительно ускорить развитие новой аналитики.
Помните о том, что три современных магазина йогуртов успешно работают в моем районе, где раньше едва выживал один классический магазин. Если бы раньше у меня спросили, хочу ли я платить за йогурт больше, то я бы ответил отказом. Но теперь, распробовав альтернативу, я с удовольствием плачу больше, потому что получаю больше ценности. Аналогичным образом, когда бизнесмены получат доступ к более открытому аналитическому окружению, они будут рады выделять больше средств на ИТ-поддержку, как только обнаружат, что получают дополнительную ценность и наслаждаются возросшей свободой действий. Небольшие изменения в методах действий и культуре могут открыть двери для гораздо более здоровых и продуктивных отношений между ИТ-службами и бизнесом.
ИТ: от обслуживания к содействию
В моей статье для блога Harvard Business Review я подчеркивал необходимость преобразования ИТ-службы наподобие современных магазинов йогуртов{89}. Она должна перевести пользователей на самообслуживание данными, а не выполнять роль посредника. Самое главное, нужно изменить способ, посредством которого пользователи получают доступ к данным и инструментам обработки данных и платят за доступ.
Переход к современной бизнес-модели вовсе не означает, что организации придется полностью отказаться от имеющихся инфраструктуры и технологий. Надо лишь по-иному использовать существующие ресурсы и дать пользователям больше свободы. Чтобы стать современным, классическому магазину йогуртов достаточно переставить оборудование. Аналогичным образом концепции аналитической «песочницы» и платформы для обнаружения данных позволяют ИТ-службе перенастроить конфигурацию окружения корпоративных данных.
Когда пользователи получают больше свободы, они могут чаще обнаруживать данные – и чаще ошибаться. Здесь всегда присутствует компромисс. Родители так же постепенно предоставляют детям все больше свободы и не мешают им принимать собственные, пусть иногда и неправильные решения. Если не позволить детям делать ошибки, то, повзрослев, они окажутся неподготовленными к жизни в реальном мире.
Однажды мне задали вопрос о примере с магазинами йогуртов: что если некий покупатель смешает йогурты с разными вкусами и на выходе получит ужасную гадость? Другими словами, что если некий пользователь скомбинирует данные таким образом, что они окажутся непригодными ни для какого анализа? Я отвечаю, что в этих случаях виноваты не магазин йогуртов и не ИТ-служба, а сами люди, которые сделали плохую смесь. Хорошо, что при этом люди распознают непригодность приготовленной смеси и не совершат эту ошибку снова. Важнее же всего следующее соображение: лишая людей возможности создавать плохие сочетания вкусов или данных, вы также лишаете их возможности находить изумительные сочетания, которые понравятся всем. Вновь созданные ароматические смеси постоянно переходят в разряд стандартных.
Суть в том, что принимать очень плохие решения можно и без использования данных или аналитики. Организацию не должно парализовать вследствие опасений, что ее сотрудники могут поступить неправильно, если дать им больше свободы в доступе к данным и их анализе (разумеется, в рамках своих навыков и опыта). Пользователи способны совершать ошибки независимо от уровня доступа к данным. Многие ИТ-службы с трудом воспринимают необходимость таких перемен. Тем не менее небольшие изменения в подходе организации к использованию данных и аналитики могут принести крупные дивиденды.
Предоставьте свободу выбора, а не создавайте ограничения
Позвольте пользователям свободно исследовать данные и экспериментировать с новой аналитикой. Не все, но многие действия будут успешными. Произведите изменения в корпоративной культуре, отказавшись от контроля над данными в пользу свободы действий, и вы увидите, как положительно отреагируют на это пользователи.
Обеспечьте грамотное планирование
В седьмой главе мы говорили о необходимости избегать ускоренных методов при определении задач и планировании анализа. Несмотря на то что это не самые сложные виды деятельности, они требуют времени и сил, и потому можно легко поддаться искушению сократить или полностью пропустить эти два этапа. К счастью, они включены во все стандартные схемы аналитических процессов. Для того чтобы преуспеть с операционной аналитикой, организациям требуется утвердить культуру, в которой надлежащее определение проблем и планирование не только поощряются, но и предусматриваются. Если потратить вначале чуть больше времени, чтобы все правильно распланировать, то можно будет сэкономить массу времени впоследствии.
Гораздо лучше начать рассчитанный на месяц проект на день позже, чтобы более тщательно все продумать, чем потерять несколько дней или недель в процессе его реализации из-за того, что оставшийся непродуманным вопрос вызвал серьезную проблему. Чтобы не погрязнуть на месяцы в бюрократической волоките, не нужно составлять 100-страничный подробный план проекта, который потребует утверждения у 20 человек. Соберите компетентных исполнителей, чтобы они обсудили, какая и для чего понадобится аналитика и каким должен быть поэтапный план действий.
Даже когда поджимают сроки, надо найти время сесть, перевести дыхание и все спокойно обдумать. Если каждый возьмет это себе за привычку, дела быстрее пойдут на лад. Однако во многих организациях принято в периоды кризисов максимально сокращать этап планирования, чтобы как можно быстрее приступить к работе. Если каждый занят делом, это хорошо, не так ли? Не совсем. При таком подходе произвольная деятельность и видимость прогресса ставятся выше, чем достижение требуемых результатов.
Обеспечьте успех
В то время как текущую деятельность осуществляют в основном отдельные люди, организация может в своих пределах установить правила и породить ожидания, способствующие успеху. В этом разделе мы обсудим три конкретных способа повысить вероятность того, что организация добьется успеха во внедрении и эффективном использовании операционной аналитики.
Ищите нежданные ценности
Организация всегда должна искать новые способы обнаружения нежданных ценностей в данных и новые способы применения аналитики. В 11-й главе моей книги «Укрощение больших данных» я рассказываю о том, как одно открытие часто ведет к другому, совершенно непредвиденному, но зависящему из первого. По мере того как организация будет увеличивать способы использования данных и разрабатывать всё новые аналитические процессы, она может обнаружить новые возможности, которые на момент начала работы даже не были в зоне видимости. Но если не пытаться выйти за рамки первоначальной идеи, то невозможно будет определить последующие неожиданные возможности, а они могут оказаться более ценными.
Позвольте мне привести потрясающий пример применения этого принципа к большим данным и аналитическому пространству. У меня состоялся очень интересный разговор с Энтони Голдблумом, генеральным директором компании Kaggle{90}. Она начинала и ныне продолжает действовать как конкурсный веб-сайт, который предоставляет компаниям возможность разместить требующую решения задачу вместе с набором данных, а затем позволяет любому пользователю попробовать свои силы в решении этой задачи. Предложивший лучшую модель (например, для прогнозирования заболевания) выигрывает конкурс, а иногда и денежный приз. Со временем Kaggle провела много конкурсов и собрала базу данных о более чем 100 000 конкурсантах. Все они были хорошо подкованы в аналитике и сильно увлечены ею.
Изначально Kaggle создавала базу данных о конкурсантах в целях управления конкурсами, благодаря чему всегда знала, где найти победителей, чтобы вручить призы. Но со временем Kaggle осознала, что эта база данных содержит не только основную демографическую и контактную информацию о специалистах-аналитиках, но и информацию об их специализациях с учетом того, в каких конкурсах они участвуют. Результаты, показанные участниками в конкурсах, также служили очень хорошим индикатором уровня их компетентности. Осознание уникальной ценности данных привело Kaggle к значимому инсайту.
Один анализ ведет к другому
Вы никогда не узнаете, что скрывается за углом, пока за него не зайдете. Аналогичным образом новые способы применения данных и аналитики часто бывают не видны до завершения первоначальной работы. Будьте внимательны, чтобы не пропустить нежданные ценности, которые вы даже и не думали обнаружить в имеющихся у вас данных.
Kaggle начала превращаться в поставщика услуг. Ведь она владеет базой данных о более чем 100 000 профессиональных аналитиках – и это когда в них отчаянно нуждается рынок. Kaggle поняла, что, возможно, имеет доступ к большему количеству аналитических талантов, чем кто-либо еще в мире, и что эту информацию можно монетизировать. Однако без организации конкурсов Kaggle никогда бы не создала свою базу данных. Реализация первой инновационной идеи привела к рождению второй. И эта вторая идея, состоящая в предоставлении профессионалам возможности реализации их способностей, может оказаться гораздо более ценной в долгосрочной перспективе.
Теперь давайте вернемся к примеру с браслетами FuelBand компании Nike, рассмотренному нами в первой главе. Мы говорили о том, что этот новый продукт бросает вызов традиционной бизнес-модели компании. Со временем такие персональные носимые устройства станут собирать еще больше информации, чем сегодня, включая частоту пульса, уровень кислорода в крови, температуру тела и множество других показателей. Тем самым будет генерироваться огромное количество данных о состоянии здоровья и ежедневных биологических циклах пользователей, что может представлять чрезвычайную ценность с медицинской точки зрения. Другими словами, хотя данные изначально собирались с целью помочь пользователям следить за своей ежедневной физической активностью, в конечном итоге они смогут представлять ценность далеко не только для медицины (разумеется, на условиях строгой конфиденциальности).
Также вспомним пример с датчиками, установленными на тракторах для отслеживания работы оборудования. Производитель тракторов может предоставить полученную аналитику фермеру, с тем чтобы тот изменил свои технологии и повысил урожайность своей земли. Такие сведения представляют очень большую ценность для фермеров, поскольку могут способствовать повышению лояльности клиентов и укреплению отношений с ними. Однако, пока производитель не начал бы собирать сенсорные данные для контроля за работой оборудования, получить дополнительную аналитику с целью увеличения урожайности было бы невозможно.
Найдите ранних последователей и влиятельных лиц
Изменение корпоративной культуры, необходимое для успеха операционной аналитики, может оказаться труднее технических аспектов. Создать аналитический процесс – это лишь полдела. Как мы убедились в восьмой главе, важно, чтобы сотрудники приняли аналитику и использовали ее результаты. Существующие бизнес-процессы и модели поведения необходимо изменить под воздействием аналитики. Однако если сотрудники посчитают, что свобода, с которой они выполняют свою работу, окажется под угрозой, преодолеть их сопротивление будет еще тяжелее. Ввиду этого следует находить и использовать ранних последователей, которые к тому же являются влиятельными лицами.
Вместо полного развертывания нового процесса начните с ограниченного. Это не только способ безопасно протестировать новый аналитический процесс, но и решить культурные проблемы. В любой организации можно найти людей, которые открыты для перемен и готовы пробовать новые методы работы. Эти же люди часто пользуются большим авторитетом среди коллег. Привлеките таких людей к тестированию нового аналитического процесса. Когда ранние последователи запустят его в работу, они увлекут своим примером и коллег.
Мультинациональная корпорация, с которой я сотрудничаю, имеет в каждой стране отдельное торговое подразделение. Как и следовало ожидать, эти подразделения значительно различаются между собой по уровню зрелости и успешности использования аналитики. Недавно компания собралась внедрить новый аналитический процесс, направленный на поддержку торговых команд, но по прошлому опыту она знала, что может столкнуться с серьезным сопротивлением. Чтобы свести к минимуму это сопротивление, мои клиенты отобрали в группу тестирования пару региональных менеджеров, которые уже имели достаточный опыт использования аналитики и были готовы пробовать новые методы. Внедрение процесса в ограниченном масштабе прошло успешно, а региональные менеджеры из группы тестирования полностью поддержали новый аналитический процесс.
Поддержите своих лидеров
Чтобы обеспечить поддержку новому аналитическому процессу, протестируйте его на группе ранних последователей, которые готовы первыми опробовать все новшества. Если ранние последователи добьются успеха, они смогут повлиять на тех, кто более склонен к сопротивлению.
Далее мои клиенты сделали очень сильный ход. Раз в году региональные менеджеры со всего мира собираются на общей встрече в рамках процесса годового планирования, чтобы обсудить результаты деятельности за предыдущий год. На очередном собрании ранние последователи рассказали об успехах, которых они достигли при помощи нового аналитического процесса. Эти пользующиеся авторитетом руководители выступили перед своими коллегами в защиту аналитики и подтвердили, что она действует на практике, а не только в теории. Влияние группы тестирования было использовано в полной мере. Как следствие, мои клиенты сумели заручиться поддержкой большинства других региональных менеджеров в пользу развертывания нового аналитического процесса в глобальном масштабе.
Люди всегда готовы следовать за лидером, который добился успеха, поскольку они хотят повторить это достижение. Внедрение операционной аналитики и, что важнее, ее признание можно облегчить, если начать с адресного пилотного проекта подобно вышеописанному. Ключевые влиятельные фигуры, когда настанет их черед включиться в процесс, будут способны увлечь своим примером других коллег.
Подготовьте маркетинговую кампанию
Как говорилось в восьмой главе, для того чтобы заручиться поддержкой нового аналитического процесса, необходимо провести маркетинговую и PR-кампанию. Необходимость и ценность аналитики должны быть объяснены широкому кругу влиятельных лиц. Акцент следует делать на безопасности использования операционной аналитики и на ее способности улучшить результаты деятельности.
В рамках существующей в аналитической команде культуры должна получить приоритет и признание такая «легковесная», не связанная с аналитикой деятельность, как маркетинг. Руководитель аналитической команды обязан убедиться в том, что его команда понимает необходимость маркетинга и считает его неотъемлемой частью своей работы. Для этого нужно ответить на следующие вопросы:
• На кого в организации необходимо оказать влияние?
• Какое позиционирование поможет убедить этих людей?
• Какие имеются факты для того, чтобы убедить каждого сотрудника?
• Кто способен изложить суть дела каждому заинтересованному лицу?
• Каких возражений можно ожидать и как их можно преодолеть?
Для того чтобы перетянуть на свою сторону всех заинтересованных лиц, могут потребоваться значительные усилия, вот почему так важно уделять внимание маркетингу как части культуры аналитической команды. Не менее важно на уровне общекорпоративной культуры внушить руководству, что ему следует прислушиваться к предложениям аналитической команды и выделять время на их вдумчивую оценку.
Один из моих самых любимых примеров, связанных с маркетингом аналитики и приспособлением ее к нуждам организации, касается действий телекоммуникационных компаний, которые полностью изменили свой подход к принятию решений при обращении клиентов с запросом на закрытие счета{91}. В начале 2000-х гг. компании сотовой связи пришли в восторг от появившейся у них возможности с точностью рассчитать рентабельность каждого абонента. При этом они могли учитывать, например, какой вышкой сотовой связи – с низкой или высокой арендной стоимостью – пользуется абонент. Когда в компанию звонил невыгодный абонент с просьбой закрыть счет, то оператор зачастую не только не пытался остановить его, но даже поощрял уйти к конкурентам. Компании гордились тем, что могут «избавляться» от невыгодных клиентов, и поступали правильно, исходя из имевшихся у них данных.
Однако со временем компании обнаружили, что совокупное влияние абонента важнее его непосредственной рентабельности. Они принялись изучать, с кем взаимодействовал каждый абонент, и выяснили, что невыгодный абонент мог взаимодействовать с очень прибыльными абонентами, которые, в свою очередь, взаимодействуют с массой других очень прибыльных абонентов. Кроме того, анализ социальных сетей показал, что, когда один человек из сообщества закрывает свой счет, вероятность ухода других членов сообщества от этого же оператора возрастает. А переход к другому оператору сразу нескольких человек резко повышает вероятность ухода за ними и всех остальных.
Сегодня большинство операторов сотовой связи оценивают совокупное влияние абонента. Если компанию собирается покинуть невыгодный абонент, представляющий очень прибыльное сообщество, она, возможно, предпочтет потерять деньги, чтобы не потерять сообщество. Таким образом, акцент сместился с индивидуальной рентабельности на сетевую.
Теперь давайте осмыслим этот пример в контексте данной главы. Представьте себе, что некто в телекоммуникационной компании первым предложил использовать анализ социальных сетей для того, чтобы не просто улучшить, а полностью изменить подход к принятию решений при обращении клиентов с запросом на закрытие счета. Представьте себе, что он предложил компании потерять еще больше денег на и без того уже невыгодном абоненте. Можно держать пари, что обсуждение этой идеи не только не выльется в решение о ее немедленной реализации, но и, скорее всего, предложившего ее специалиста-аналитика воспримут как ненормального.
Все это маркетинг
Для того чтобы люди поддержали новую идею, бросающую вызов статус-кво, их необходимо убедить в ее полезности. Будьте готовы потратить много времени и сил на продвижение новой идеи и разъяснение ее для всех заинтересованных лиц. Без этого многие аналитические идеи никогда не будут внедрены и восприняты, а их потенциал останется нереализованным.
Но человек продолжил продвигать свою идею, приводя доказательства и разъясняя бизнес-кейс, пока, в конце концов, не убедил кого-то из руководства провести тестирование. Начальный тест дал хорошие результаты, и постепенно этот процесс был внедрен по всей компании. Вероятно, точно такая же картина постепенного преодоления сопротивления наблюдалась и в других компаниях, первыми принявших новый подход. После того как эта аналитическая концепция доказала свою эффективность и результаты были преданы огласке, другие операторы связи быстро присоединились к лидерам. Сегодня применение анализа социальных сетей для оценки абонента является общепринятой практикой бизнес-аналитики, но так было не всегда. Если бы не готовность специалистов-аналитиков осуществить масштабную маркетинговую кампанию, чтобы привлечь внимание к казавшейся безумной идее, ее ни за что бы не приняли.
Другой пример связан с анализом данных из социальных сетей. Легко забыть, что в 2014 г. большинству платформ социальных медиа не исполнилось даже и 10 лет. Традиционно организации использовали строгий научный формат опросных исследований и очень тщательно отобранные фокусные группы, которые обеспечивали надежную, управляемую обратную связь касательно маркетинговых инициатив, продуктов и имиджа бренда.
Теперь представьте, что некто первым предложил использовать данные из социальных сетей в качестве дополнения к опросным исследованиям и фокусным группам, а также в качестве способа узнать, как люди воспринимают компанию. Комментарии в социальных сетях исходят от случайных людей со всего мира, и обычно невозможно узнать, кто эти люди, каков их демографический профиль и имеют ли они вообще какое-либо отношение к компании. Но если выборка из социальных сетей может быть ужасающе пристрастной, то можно ли по таким данным определить тренды?
И эту идею поначалу восприняли со скептицизмом. Но со временем было установлено, что в некоторых ситуациях анализ зараженных информационным шумом, неконтролируемых данных из социальных сетей может добавить ценности. Безусловно, пионерам, применившим такой тип анализа, пришлось провести длительную маркетинговую кампанию, чтобы заручиться необходимой поддержкой. Каждая аналитическая команда должна быть готова сделать то же самое, когда она обнаруживает новые аналитические процессы, которые могут оказать сильное воздействие.
Правильно относитесь к неудачам
Не каждый операционно-аналитический процесс будет работать так хорошо, как ожидалось. На каждую найденную в стоге сена иголку придется несколько неудачных попыток. Выход за установленные рамки в поиске новых способов применения данных и приложения аналитики к бизнесу сопряжен с определенными рисками. И многие аналитические инициативы, особенно на этапе исследований, не принесут желаемых результатов. Нужно быть готовым к неудачам, а вместе с тем и адекватно управлять ими. Другими словами, необходимо создать культуру правильного отношения к неудачам. Давайте посмотрим, как это сделать.
Идея не является плохой… если ее можно протестировать
Популярная поговорка гласит, что плохих идей не бывает. На деле же плохие идеи бывают, и наша задача – их избежать. К счастью, аналитика позволяет довольно легко проверить, является ли данная идея хорошей или плохой. Насколько бы безумной ни казалась идея, но, если она может быть протестирована, ее следует протестировать. Объективные результаты, основанные на аналитике, покажут, работоспособна она или нет.
Сегодня во многих случаях разработать и провести такие тесты можно быстро и дешево. Интернет-компании по максимуму задействуют эту возможность с упором на так называемый метод постоянного апробирования. На современном сайте электронной коммерции в любой момент могут тестироваться десятки, если не сотни или тысячи новых идей. Эти тесты могут варьироваться от крупных экспериментов, таких как тестирование совершенно нового облика сайта, до совсем незначительных, таких как изменение шрифта в описании товара. Сайты в случайном порядке показывают пользователям либо стандартный, либо тестовый контент, после чего при помощи аналитики оценивается, как нововведение повлияло на поведение пользователей. Подобное экспериментирование должно стать частью любой корпоративной культуры, а не только компаний электронной коммерции.
Тестируйте, тестируйте, тестируйте!
Концепции тестирования и экспериментального дизайна получили широкое распространение и были полностью доказаны. Благодаря доступным сегодня инструментам использовать эти методы стало гораздо проще, чем когда-либо в прошлом. Многие современные операционные системы позволяют легко протестировать новую аналитическую логику. Следовательно, нет оправданий для того, чтобы этого не делать.
Ранее мы уже говорили о том, что сначала надо создать базовый аналитический процесс, а затем уже масштабировать его до операционного уровня. Перед запуском аналитической производственной линии необходимо провести в небольшом масштабе тесты на подмножестве решений. Это позволяет проверить, как будет работать процесс в реальных условиях. Когда речь идет о физических сборочных линиях, например по производству потребительской электроники, внесение изменений может обойтись весьма дорого, поскольку потребует тщательной переналадки большого количества очень чувствительного и тяжелого оборудования. В случае же операционной аналитики, как правило, это не так. Все, что требуется, – просто ввести и протестировать новую аналитическую логику в операционных системах. Изменить строки кода в виртуальной «производственной линии» гораздо легче, чем переналадить тяжелое оборудование на реальной производственной линии. Простота тестирования новой логики практически не оставляет оправданий для отказа от тестирования новых идей.
Из всего вышесказанного вытекает одно важное следствие, а именно необходимость изменения модели финансирования аналитических проектов, когда дело касается обнаружения данных. Вместо того чтобы финансировать каждый проект в отдельности на основе надежно прогнозируемой рентабельности инвестиций в него, проектами следует управлять на портфельной основе. Другими словами, в конце года отдача, полученная от ресурсов, которые были потрачены на обнаружение данных, должна продемонстрировать, что предпринятые на протяжении года действия обеспечили хорошую совокупную доходность. Важно не то, сколько проектов в портфеле оказались неудачными, а то, что успешные проекты с лихвой компенсировали все неудачи.
Это потребует изменения подхода к бюджетированию, однако может значительно повысить продуктивность. Прежде всего, аналитическая команда должна составить список исследовательских проектов. Она должна быть уверена в том, что некоторые идеи обязательно окажутся работоспособными, хотя может и не знать наверняка, какие именно. Подобно тому как бэттер в бейсболе не станет связывать себя обязательством, сколько именно мячей он отобьет, так и аналитики не могут гарантировать успех отдельных исследовательских проектов. Главное для них – получить хороший средний показатель по итогам года. Таким же образом работает и венчурный капитал. Даже самые опытные венчурные капиталисты теряют все свои инвестиции в большинство стартапов. Однако оставшиеся в портфеле успешные стартапы оправдывают риски.
Не принимайте неудачи на свой счет
Если организация хочет разрабатывать и внедрять инновационные операционно-аналитические процессы, она должна уметь преодолевать неудачи. Они не являются злом, а если происходят быстро, то могут и обернуться благом. Когда же проваливаешься медленно и при этом не используешь аналитику, то обрекаешь себя на очень серьезные потери. Избежать их легко, если организация будет действовать только наверняка, но тогда она не сможет развивать свой бизнес. Скорее всего, такая организация проиграет своим конкурентам, которые научатся применять аналитику для ускоренного внедрения инноваций (и ускоренного преодоления неудач).
Говоря о том, что неудача допустима, я вовсе не утверждаю, что никто не должен за нее отвечать или что к ней нужно стремиться. Это означает, что попытки применить действительно новую и инновационную аналитику не могут быть успешными на все 100 %. Например, в бейсболе даже 30 % удачных попыток считается большим успехом. Когда главное внимание уделяется поиску причин провала аналитического процесса, а внедренные системы позволяют быстро тестировать результаты поиска, издержки неизбежных неудач будут сведены к минимуму. Кроме того, извлеченные из неудач уроки могут положительно отразиться на будущих действиях, поскольку это позволит в дальнейшем избежать ведущих к провалу факторов.
Корпоративная культура организации призвана поощрять людей, с тем чтобы они не принимали аналитические результаты на свой счет. Вполне возможно, анализ выявит, что блестящая, по вашему мнению, идея на самом деле абсолютно неработоспособна. Но это вовсе не означает, что вы идиот и не отдаете отчета в своих действиях. Просто аналитика выявила, что вам следует поискать другую идею. Разумеется, придется постараться, чтобы убедить людей в том, что они могут свободно предлагать идеи, пусть те потом и окажутся неработоспособными. Во многих организациях люди стараются предлагать только те идеи, в которых они более чем уверены, поскольку опасаются негативного к себе отношения, если их будут ассоциировать с провалившимися идеями. Корпоративная культура не должна такого допускать. Лучше поощрять людей рисковать и вносить свою лепту в общее дело, чем позволять организации безопасно стагнировать.
Неудачи по незнанию неприемлемы
Наконец, еще один важный аспект аналитической культуры, связанный с преодолением неудач, заключается в понимании людьми того, как правильно использовать любые результаты аналитики. Неверное истолкование и неправильное применение аналитических результатов неприемлемы. Старая поговорка гласит: недоученный хуже неученого. Когда недостает знаний о том, как использовать результаты аналитического процесса, это тоже плохо.
В одной из популярных статей в моем блоге обсуждается тревожный пример, который наглядно иллюстрирует опасности использования аналитики без надлежащего понимания или обучения{92}. Руководство находящейся недалеко от моего дома школы решило использовать для оценки курсовых работ учащихся специальную программу проверки на плагиат. Так вот, беспроблемный прежде класс с углубленным изучением школьной программы и со множеством отличников программа уличила в обмане. Всем учащимся завернули курсовую работу, что негативно отразилось на их годовых оценках. Когда мне сообщили детали, я понял, что причина была в неправильном использовании ПО. Например, совпадение фраз из трех слов в двух работах маркировалось как тревожный сигнал. Скажем, если двое учащихся написали фразу: «Автор предполагает, что…», их работы отмечались как подозрительные. При таких нестрогих критериях можно ожидать множество случайных совпадений. Если работа набирала определенное количество красных флажков, она считалась плагиатом. Преподаватели, не имевшие опыта в использовании такого рода анализа, отстаивали оценки «экспертного» ПО, даже если видели явно нелогичные и несправедливые выводы. Все это больно ударило по репутации учащихся, негативно повлияло на их годовые оценки и потенциально на возможность поступить в колледжи по их выбору.
Как и любой другой инструмент, аналитика может быть мощной и полезной при правильном применении, но может и причинить серьезный вред, если используется людьми, которые не умеют правильно ее применять. Все мы сталкивались в бизнесе с ситуациями, когда статистика или показатели предоставляются руководителям вне полного контекста и без необходимых пояснений. Увидев показатели вне контекста, руководитель может принять непродуктивное или ошибочное решение. Крайне необходимо подготовить сотрудников к правильному использованию аналитики в рамках своих рабочих обязанностей. Как уже говорилось выше, рядовым сотрудникам не нужно разбираться в работе алгоритмов. Но они должны в точности знать, как правильно обращаться с результатами анализа, проведенного алгоритмами.
Неправильное использование аналитики может принести больше вреда, чем ее полное отсутствие
Убедитесь, что каждый человек в вашей организации обучен правильному использованию аналитики на том уровне, который требуется для его работы. Неправильное применение аналитических инструментов, методик или результатов может принести больше вреда, чем пользы.
Давайте рассмотрим несколько действий, которые должны стать стандартными при создании и использовании аналитики. В свою очередь, корпоративная культура призвана требовать соблюдения этих стандартов:
• Кто-то из сотрудников должен полностью разбираться в каждом анализе, знать его сильные и слабые стороны. Не всем сотрудникам надо разбираться в таких тонкостях, но кто-то обязательно должен.
• Параметры и опции, используемые в процессе, должны выбираться с обоснованием. Не стоит предполагать, что настройки по умолчанию подходят для любого случая.
• При появлении неожиданных результатов необходимо провести дополнительное исследование и поставить необходимые вопросы, прежде чем делать выводы. Ни один алгоритм или пакет программ не является всеведущим. Неожиданные результаты могут привести к значимым инсайтам в аналитическом процессе и в поддерживающих его данных.
• Если обнаруживаются дополнительные факты или данные, которые противоречат первоначальным выводам, необходимо уделить им серьезное внимание. Главное – найти правильный ответ, а не защищать исходные предположения.
• Разрешите сотрудникам выполнять и использовать только те виды анализа, для правильного применения которых они подготовлены. Иначе сотрудники могут забраться в темный лес, сами того не осознавая.
Возвращаясь к вышеописанному примеру с плагиатом, можно сказать, что желание учителей использовать аналитику, безусловно, достойно похвалы. Однако они совершили серьезную ошибку, начав использовать ее без должного понимания того, что делают. Учителя не знали, как правильно настроить алгоритмы и как интерпретировать результаты. Этот пример наглядно иллюстрирует, как неправильное использование аналитики может принести больше вреда, чем пользы, если применять ее вне контекста или вне обозначенного масштаба. Вот почему так важно, чтобы организация предоставила своим сотрудникам надлежащие обучение и поддержку. Неудача по незнанию неприемлема ни при каких условиях.
Подведем итоги
Наиболее важные положения этой главы:
• Не застревайте в ловушке сделанных вслепую предположений, как блоха в банке. Регулярно подвергайте предположения сомнению, чтобы проверить, по-прежнему ли они актуальны.
• Поддержка аналитики и специалистов-аналитиков должна начинаться с уровня генерального директора. Никто не захочет оставаться в организации, где не ценят его работу.
• Когда люди чувствуют угрозу со стороны операционной аналитики и сопротивляются ей, используйте метод игрофикации. Придумайте игру, где победа достигается за счет эффективного использования нового аналитического процесса.
• Улучшения, предлагаемые аналитикой, не должны служить обвинением в том, что прежние решения принимались неправильно. Дайте сотрудникам понять, каким образом использование аналитики поможет им лучше выполнять свою работу.
• Операционная аналитика предполагает делегирование полномочий, а не их потерю. Делегирование полномочий по принятию решений надежному алгоритму мало чем отличается от делегирования полномочий доверенным людям.
• Небольшие изменения могут существенно повысить аналитическую эффективность организации. Успешная бизнес-модель современных магазинов йогуртов построена на небольших, но трансформационных изменениях по сравнению со старой моделью. ИТ-службы точно так же должны перейти от режима обслуживания к режиму содействия.
• Без свободного испытания аналитических процессов, которые впоследствии не заработают, невозможен свободный поиск процессов, которые впоследствии заработают. Не зацикливайтесь на предотвращении появления плохих идей; лучше сосредоточьтесь на содействии появлению хороших.
• Поощряйте людей искать новые неожиданные способы использования существующих данных и аналитических процессов.
• Протестируйте новый аналитический процесс на группе ранних последователей, которые вместе с тем оказывают сильное влияние на коллег. После того как ранние последователи приобретут успешный опыт, они увлекут своим примером и других людей.
• Для того чтобы люди поддержали идею, изменяющую их статус-кво, их нужно убедить в ее полезности. Будьте готовы потратить много времени на продвижение новой аналитической идеи и на ее принятие организацией.
• С учетом низкой стоимости и простоты тестирования новых аналитических процессов будет разумным протестировать даже кажущиеся безумными идеи. Если идея может быть протестирована, дайте ей шанс.
• Неправильное использование аналитики может принести больше вреда, чем пользы. Все сотрудники должны быть обучены ее применению на том уровне, который требуется для выполнения их работы.
Заключение Присоединяйтесь к революции!
Да, революция началась! Теперь вы должны понимать всю важность промышленной революции в аналитике, и, я надеюсь, готовы присоединиться к этой революции сами. Аналитика слишком значима, чтобы оставлять ее на уровне ручного, кустарного производства. Если организация хочет полностью извлечь выгоды, скрытые в данных и аналитике, она должна перейти к операционной аналитике. Сегодня аналитические процессы трансформируются лидерами отрасли в интегрированные, встроенные, автоматизированные, предписывающие компоненты как операционных систем, так и поддерживаемых этими системами бизнес-процессов.
Моя книга охватывает широкий круг вопросов. Давайте окончательно суммируем наиболее важные принципы и рекомендации, соблюдение которых позволит вам и вашей организации присоединиться к революции:
• Необходимо понимать и учитывать разницу между встроенной, автоматизированной, предписывающей операционной аналитикой и операционным применением традиционной пакетной аналитики. В том и другом случае создаются ценности, но это не одно и то же.
• Операционная аналитика должна опираться на прочный фундамент. Не думайте, что вам удастся впрыгнуть в операционную аналитику, не располагая надежными аналитическими возможностями.
• Сегодня аналитика все чаще выступает главным фактором при принятии решений о покупке, а внедрение аналитики в продукты размывает традиционные границы между отраслями. Ищите возможности использовать операционную аналитику для дифференциации и преобразования своей бизнес-модели.
• «Различность» больших данных может создавать проблемы посерьезнее, чем их «огромность», а анализ больших данных требует масштабирования по многим параметрам. Однако большие данные содержат настолько ценную новую информацию, что все усилия по их «укрощению» себя оправдывают. Начните использовать большие данные уже сегодня.
• Сегодня многие примеры применения операционной аналитики включают очень простые алгоритмы и правила, но со временем это изменится. Без колебаний начинайте с простых подходов – постепенно вы сможете их усложнить.
• Серьезно подойдите к разработке бизнес-кейса для операционной аналитики. Убедитесь, что вы учли все затраты, включая затраты на оплату труда, в течение всего инвестиционного цикла.
• В условиях сегодняшнего сложного технологического ландшафта, вам, возможно, придется встраивать несколько разных компонентов в единое аналитическое окружение, призванное поддерживать операционную аналитику. Это нужно, чтобы избавить пользователей от беспокойства по поводу того, где именно хранятся и обрабатываются данные.
• В будущем Интернет вещей станет важным компонентом операционной аналитики. Учитесь пользоваться им уже сейчас и задумайтесь над тем, как включить его в планирование своей деятельности.
• Убедитесь, что ваша организация понимает и учитывает различные требования, предъявляемые к процессу обнаружения данных и к процессу их операционного внедрения. Процесс обнаружения затормозится, если будет происходить в рамках операционных ограничений.
• Не пренебрегайте управлением. Автоматизированный аналитический процесс должен тщательно контролироваться. Подобно реальной производственной линии, операционно-аналитический процесс со временем будет давать сбои. Надлежащее управление позволяет уменьшить частоту ошибок и их воздействие до приемлемого уровня издержек при ведении бизнеса.
• Соблюдение конфиденциальности – серьезная проблема. Убедитесь, что вся аналитика, используемая вашей организацией, является законной, этичной и приемлемой для широкой общественности. Кроме того, необходимо разработать гораздо более гибкие и детализированные правила и параметры конфиденциальности.
• Способность применять и сочетать многочисленные аналитические дисциплины – необходимое условие успеха. Позвольте различным дисциплинам усиливать друг друга.
• Будьте готовы пожертвовать некоторой аналитической мощностью ради требуемого операционного масштаба. Сосредоточьтесь на оптимизации воздействия процесса на принятие всех решений, а не на оптимизации принятия каждого решения по отдельности.
• Наем нужных людей имеет первостепенное значение. Поставьте директора по аналитике во главе аналитической команды с гибридной структурой. Затем убедите членов команды взять на себя роли консультантов, наставников и инструкторов.
• Для того чтобы преодолеть сопротивление переменам со стороны корпоративной культуры, необходима поддержка по всей вертикали управления начиная с генерального директора. Сделайте акцент на преимуществах операционной аналитики для каждого заинтересованного лица и позиционируйте аналитику как ведущую к делегированию полномочий, а не к их потере.
Благодаря непрерывному росту вычислительных мощностей, постепенному совершенствованию алгоритмов и постоянно увеличивающемуся пулу данных с каждым днем расширяются возможности аналитики. В прошлом операционная аналитика не занимала много места в портфелях большинства организаций, но теперь эта ситуация быстро меняется. Настало время и для вашей организации войти в мир операционной аналитики.
Если в вашей организации аналитика все еще опирается на ручные, кустарные, разовые процессы, то такой подход необходимо оставить в прошлом. Подобно тому как промышленная революция преобразила индустриальное производство, так и операционная аналитика преобразит способы разработки, внедрения и применения аналитики. Промышленная революция в аналитике уже идет. Готовы ли вы к ней присоединиться?
Об авторе
Билл Фрэнкс – директор по аналитике в компании Teradata, где он занимается изучением трендов в аналитике и пространстве больших данных, а также разработкой корпоративной стратегии компании в этих областях. Фрэнкс консультирует клиентов, объясняя им, как Teradata и ее специалисты могут поддержать их деятельность. Он уделяет много внимания переводу сложных аналитических концепций на язык, понятный для бизнес-пользователей, и помогает организациям наладить эффективное использование аналитики. Его работа охватывает многие отрасли и компании, начиная с крупнейших из списка Fortune 100 и заканчивая мелкими некоммерческими организациями.
Фрэнкс является автором книги «Укрощение больших данных» (John Wiley & Sons, 2012). В ней он опирается на свой 20-летний опыт работы с клиентами по реализации крупных аналитических проектов, чтобы вывести закономерности достижения успеха в современном мире больших данных и аналитики. В 2014 г. книга вошла в список «Обязательных к прочтению» Тома Питерса и в Топ-10 самых влиятельных переводных книг в области технологий по версии сети для программистов CSDN в Китае.
Он преподает в Международном институте аналитики, основанном ведущим экспертом по аналитике Томасом Дэвенпортом, а также является востребованным лектором – только за последние несколько лет он был приглашен в качестве основного докладчика на десятки мероприятий. Его блог «Аналитика имеет значение» (Analytics Matters) посвящен преобразованиям, необходимым для трансформации аналитики в ключевой компонент принятия бизнес-решений.
Фрэнкс получил степень бакалавра в области прикладной статистики в Политехническом университете Виргинии и степень магистра в области прикладной статистики в Университете штата Северная Каролина. Подробнее о нем можно узнать на сайте: ‐franks.com
Сноски
1
Фрэнкс Б. Укрощение больших данных: Как извлекать знания из массивов информации с помощью глубокой аналитики. – М.: Манн, Иванов и Фербер, 2014.
(обратно)2
На российском телевидении выходила под названием «Цена удачи». – Прим. ред.
(обратно)3
Ариели Д. Предсказуемая иррациональность: скрытые силы, определяющие наши решения. – М.: Манн, Иванов и Фербер, 2010.
(обратно)4
«Уловка-22» (Catch-22) – название романа Джозефа Хеллера. Выражение “Catch-22” вошло в лексикон американцев, обозначая всякое затруднительное положение. – Прим. ред.
(обратно)5
Netflix Prize – открытый конкурс на лучший алгоритм предсказания оценки, которую зритель поставит фильму на основе предыдущих своих оценок и оценок других зрителей. – Прим. ред.
(обратно)(обратно)Комментарии
1
Как было сказано в предисловии, мы не будем тратить место на определение общераспространенных терминов вроде аналитики. Предполагается, что читатели знакомы с основными концепциями.
(обратно)2
Более подробную информацию об Аналитике 3.0, включая бесплатную электронную книгу, вы можете найти на сайте: /
(обратно)3
Подробнее об этом вы можете прочитать в моей книге «Укрощение больших данных» (Bill Franks, Taming the Big Data Tidal Wave, Hoboken, NJ: John Wiley & Sons, 2012).
(обратно)4
См.: Xavier Amatriain and Justin Basilico, “Netflix Recommendations: Beyond the 5 Stars (Part 1)”, Netflix Tech Blog, 6 апреля 2012 г., на: ‐recommendations‐beyond‐5‐stars.html
(обратно)5
См.: Dawn C. Chmielewski, “Meet Max: The New Voice of Netflix Recommendations”, Los Angeles Times, 28 июня 2013 г., на: ‐et‐ct‐meet‐max‐new‐voice‐of‐netflix‐recommendations‐2013062
(обратно)6
На основе статьи в моем блоге для Международного института аналитики: «Изменяют ли большие данные ваш бизнес без того, чтобы вы это осознали?» (“Is Big Data Changing the Business You Are In Without You Realizing It?”), 8 августа 2013 г., ‐big‐data‐changing‐the‐business‐you‐are‐in‐withoutyou‐realizing‐it/
(обратно)7
См.: -fuelband
(обратно)8
См.: / и /
(обратно)9
На основе статьи в моем блоге для Международного института аналитики от 14 июня 2012 г., озаглавленной «Определение больших данных? Не нужно!» (“What’s the Definition of Big Data? Who Cares?”). См. ‐the‐definition‐big‐data‐who‐cares/
(обратно)10
См.: “Gartner IT Glossary”, -glossary/big-data/. Также см.: Svetlana Sicular, “Gartner’s Big Data Definition Consists of Three Parts, Not to Be Confused with Three ‘V’s,” Forbes, 27 марта 2013 г., на ‐big‐data‐definition‐consists‐of‐three‐partsnot‐to‐be‐confused‐with‐three‐vs/
(обратно)11
См. мою статью «Определение больших данных: пропущенное “V” (“Defining Big Data: The Missing ‘V’”), IT Briefcase, 2 августа 2012 г., -big-data-the-missing-v
(обратно)12
На основе статьи в моем блоге для Международного института аналитики от 12 декабря 2012 г., озаглавленной «Лопнет ли пузырь больших данных в 2013 году?» (“Will the Big Data Bubble Burst in 2013?”). См. ‐the‐big‐data‐bubble‐burst‐in‐2013/
(обратно)13
См.: Svetlana Sicular, “Big Data Is Falling into the Trough of Disillusionment,” Gartner, 22 января 2013 г., на ‐sicular/bigdata‐is‐falling‐into‐the‐trough‐of‐disillusionment/
(обратно)14
Bill Franks, Taming the Big Data Tidal Wave (Hoboken, NJ: John Wiley & Sons, 2012).
(обратно)15
На основе статьи в моем блоге для Международного института аналитики от 11 января 2013 г., озаглавленной «Извлечение аналитической ценности из новых данных» (“Driving Analytic Value from New Data”). См. ‐analytic‐value‐from‐new‐data/. Эта тема также рассматривается в моей книге «Укрощение больших данных».
(обратно)16
На основе статьи в моем блоге для Международного института аналитики от 14 марта 2013 г., озаглавленной «Думайте иначе, чтобы максимизировать ценность аналитики больших данных» (“Think Differently to Maximize Value from Big Data Analytics”). См. ‐differently‐to‐maximize‐value‐from‐bigdata‐analytics/
(обратно)17
Jeff Tanner, Dynamic Customer Strategy: Big Profits from Big Data (Hoboken, NJ: John Wiley & Sons, 2014).
(обратно)18
См.: “Pfizer Study Finds that Celebrex May Increase the Risk of Heart Attack”, 10 августа 2010 г, на
(обратно)19
На основе статьи в моем блоге для Международного института аналитики от 9 августа 2012 г., озаглавленной «Стратегическая ошибка касательно больших данных» (“A Strategic Mistake with Big Data”). См. /a‐strategic‐mistake‐with‐big‐data/. Эта тема также рассматривается в моей книге «Укрощение больших данных».
(обратно)20
Lisa Arthur, Big Data Marketing: Engage Your Customers More Effectively and Drive Value (Hoboken, NJ: John Wiley & Sons, 2013).
(обратно)21
На основе статьи в моем блоге для Международного института аналитики от 11 июля 2013 г., озаглавленной «Аналитика больших данных не должна быть Диким Западом» (“Big Data Analytics Doesn’t Have to Be the Wild West”). См. ‐data‐analytics‐doesnt‐have‐to‐be‐the‐wild‐west/
(обратно)22
На основе статьи в моем блоге для Международного института аналитики от 11 июля 2013 г., озаглавленной «Глобальная природа больших данных и аналитики» (“The Global Nature of Big Data and Analytics”). См. ‐global‐nature‐of‐big‐data‐and‐analytics/
(обратно)23
См.: “Unlock the Magic with Your MagicBand or Card” на -disney-experience/bands-cards/
(обратно)24
См.:
(обратно)25
См.: “Smart Security”, -security.aspx
(обратно)26
Christopher Steiner, Automate This: How Algorithms Came to Rule Our World (New York: Penguin, 2013).
(обратно)27
См.: Steven Goldberg, “Could Computerized Trading Cause Another Market Crash?” Kiplinger, 24 августа 2011 г., на ‐C007‐S001‐could‐computerized‐trading‐cause‐another‐market‐cr.html
(обратно)28
См.: Ben Rooney, “Trading Program Sparked May ‘Flash Crash’”, CNNMoney, 1 октября 2010 г., на
(обратно)29
В качестве замечательного введения в тему см.: Zach Friend, “Predictive Policing: Using Technology to Reduce Crime”, FBI Law Enforcement Bulletin, 9 апреля 2013 г., на ‐services/publications/law‐enforcement‐bulletin/2013/April/predictive‐policing‐using‐technology‐to‐reduce‐crime
(обратно)30
См.: “The Los Angeles Police Department Predicts and Fights Crime with Big Data”, Big Data Startups, 14 апреля 2014 г., на ‐startups.com/BigData‐startup/los‐angeles‐police‐department‐predicts‐fights‐crime‐big‐data/
(обратно)31
См.: Susan Perry, “People Tend to Read a Lot into Voices, Including Accents”, MINNPOST, 22 июля 2013 г., на ‐opinion/2013/07/people‐tend‐read‐lot‐voices‐including‐accents
(обратно)32
См.: “Fasten Your Seatbelts: Google’s Driverless Car Is Worth Trillions (Part 1)”, Forbes, 22 января 2013 г., на ‐your‐seatbelts‐googles‐driverless‐car‐is‐worth‐trillions/
(обратно)33
См. Medtronic MiniMed, 2014 на -and-products/continuous-glucose-monitoring
(обратно)34
См.: Deborah Rudacille, “Home Sweet Home Care”, DOME57, no. 3, апрель 2006 г., на
(обратно)35
Richard Winter, “Big Data: What Does It Really Cost?”, WinterCorp (август 2013 г.). См.: -report
(обратно)36
На основе статьи в моем блоге для Международного института аналитики под названием «Во что действительно обходится укрощение больших данных» (“What Does Taming Big Data Really Cost?o), 12 сентября 2013 г. См.: ‐does‐taming‐big‐data‐really‐cost/
(обратно)37
“The Price Is Right Winners Reveal Battle with High Taxes”, INQUISITR, 19 августа 2013 г., на ‐price‐is‐right‐winners‐reveal‐battlewith‐high‐taxes/ или Alan Farnham, “‘The Price Is Right’ – but the Taxes Are Wrong”, ABC News, 9 августа 2012 г., на /
(обратно)38
См.: “The Price of Gold: Taking First Place in Olympics Could Cost US Stars as Much as $10G in Taxes”, Fox News, 8 февраля 2014 г., на ‐gold‐taking‐first‐place‐in‐olympics‐could‐cost‐usstars‐as‐much‐as‐10g‐in/
(обратно)39
См. мою книгу «Укрощение больших данных» (Taming the Big Data Tidal Wave (Hoboken, NJ: John Wiley & Sons, 2012). Также см. мои статьи: «Вам не нужно “становиться большим”, чтобы начать работать с большими данными» (“You Don’t Have to ‘Go Big’ to Get Started with Big Data”), 11 октября 2012 г., на ‐dont‐have‐to‐go‐bigto‐get‐started‐with‐big‐data/; «Чтобы преуспеть с большими данными, начните с малого» (“To Succeed with Big Data, Start Small”), Harvard Business Review, 3 октября 2012 г., на ‐succeed‐with‐big‐data‐start/
(обратно)40
Dan Ariely, Predictably Irrational (New York: Harper Collins, 2008).
(обратно)41
Изучите концепцию инновационного центра в 10-й главе моей книги «Укрощение больших данных», чтобы поразмыслить над хорошим способом внедрения такого подхода.
(обратно)42
На основе статьи в моем блоге для Международного института аналитики: «Укрощение больших данных не является технологической проблемой» (“Taming Big Data Is Not a Technology Issue”), 12 ноября 2012 г. См.: ‐big‐data‐is‐not‐a‐technology‐issue/
(обратно)43
См.: Stephen Swoyer, “Inside Facebook’s Relational Platform”, TWDI, 6 мая 2013 г., на ‐relational‐platform.aspx; Chris Kanaracus, “Hadoop Is Not Enough for ‘Big Data,’ Says FacebookAnalytics Chief”, PCWorld, 29 октября 2013 г., на ‐is‐not‐enough‐for‐big‐data‐says‐facebook‐analyticschief.html
(обратно)44
См. дополнительную информацию: /
(обратно)45
См. дополнительную информацию: Bill Franks, Taming the Big Data Tidal Wave (Hoboken, NJ: John Wiley & Sons, 2012), Chapter 10.
(обратно)46
На основе статьи в моем блоге для Международного института аналитики: «Единое окружение для аналитики больших данных» (“A Unified Environment for Big Data Analytics”), 10 апреля 2013 г. См.: /a‐unified‐environment‐for‐big‐data‐analytics/
(обратно)47
George Orwell, 1984 (в New York: Signet Classic, 1950).
(обратно)48
На основе статьи в моем блоге для Cisco под названием «Когда датчики ведут себя как подростки» (“When Sensors Act Like Teenagers”), 16 сентября 2013 г. См.: ‐act‐like‐teenagers/
(обратно)49
См.: Matt Phillips, “Nasdaq: Here’s Our Timeline of the Flash Crash”, Wall Street Journal Market Beat Blog, 11 мая 2010 г., на ‐heres‐our‐timeline‐of‐the‐flash‐crash/
(обратно)50
См.: ABC News, “How to Opt Out of Google Policy That Displays Your Photo Beside Ads”, 14 октября 2013 г., на ‐privacy‐terms‐conditions‐opt/story?id=20563128. См.: John P. Mello Jr., “Yahoo Mail Redesign Becomes Permanent, Privacy Issues Surface,” TechHive, 3 июня 2013 г., на ‐mail‐redesign‐becomespermanent‐privacy‐issues‐surface.html. См.: Heather Kelly, “Facebook Home, Privacy and You”, CNN Tech, 5 апреля 2013 г., ‐media/facebook‐home‐privacy/index.html; “Newly Declassified Documents Show Range of Potential Access to NSA Phone Records”, Fox News, 31 июля 2013 г., на ‐declassified‐documents‐showrange‐potential‐access‐to‐nsa‐phone‐records/
(обратно)51
См.: Pam Baker, “LG Caught Red‐Handed Spying on Viewers via Smart TVs”, Fierce Big Data, 25 ноября 2013 г., на ‐caught‐red‐handed‐spying‐viewers‐smart‐tvs/2013‐11‐25
(обратно)52
См.: Associated Press, “NSA Chief Sidesteps Questions on Cell Phone Tracking at Senate Hearing”, Fox News, 2 сентября 2013 г., на ‐intelligence‐official‐sidesteps‐questions‐on‐cellphone‐tracking/; “NSA Secretly Tapped Google, Yahoo data Centers Worldwide, New Report Claims”, Fox News, 30 октября 2013 г., ‐secretly‐tapped‐google‐yahoo‐data‐centers‐worldwide‐newreport‐claims/
(обратно)53
См.: Jay Sekulow, “Lois Lerner Retires – Courtesy of the American Taxpayer”, Fox News, 23 сентября 2013 г., на ‐lerner‐retires‐courtesy‐american‐taxpayer/; “Holder Launches Probe into IRS Targeting of Tea Party Groups”, Fox News, 14 мая 2013 г., на ‐timeline‐shows‐dc‐officials‐in‐loop‐on‐tea‐partytargeting/
(обратно)54
См.: “Warrant Needed for Metadata Tracking,” Big Data Republic, 24 июля 2013 г.
(обратно)55
См.: David Kravets, “Cops Can Track Cellphones Without Warrants, Appeals Court Rules,” Wired, 30 июля 2013 г., на ‐cell‐tracking/
(обратно)56
См.: David Kravets, “Judge Rules NSA Bulk Telephone Metadata Spying Is Lawful,” Wired, 27 декабря 2013 г., на ‐upholds‐nsa‐spying/; и David Kravets, “Court Says NSA Bulk Telephone Spying Is Unconstitutional,” Wired, 16 декабря 2013 г., на ‐telephone‐metada‐ruling/
(обратно)57
См.: Nate Anderson, “Anonymized” Data Really Isn’t – and Here’s Why Not,” Ars Technica, 8 сентября 2009 г., на ‐policy/2009/09/your‐secrets‐live‐online‐in‐databases‐of‐ruin/
(обратно)58
На основе статьи в моем блоге для Международного института аналитики: «Полезные или страшные? Обращайтесь осторожно с большими данными» (“Helpful or Creepy? Avoid Crossing the Line with Big Data”), 7 мая 2013 г., на ‐or‐creepy‐avoid‐crossing‐the‐line‐with‐big‐data/
(обратно)59
См.: Charles Duhigg, “How Companies Learn Your Secrets,” New York Times, 16 февраля 2012 г., на ‐habits.html?pagewanted=all&_r=2&
(обратно)60
На основе статьи в моем блоге для Big Data Republic под названием «Юридические и этические условия использования больших данных» (“The Legal & Ethical implications of Big Data”), 24 мая 2013 г.
(обратно)61
На основе статьи в моем блоге для Big Data Republic под названием «Условия соблюдения конфиденциальности имеют значение» (“Privacy Implications Matter”), 30 ноября 2012 г.
(обратно)62
См.: “Semma”, SAS Enterprise Miner,
(обратно)63
См.: BTI Case Study, “Obsession with Quality at Western Digital Corporation,” август 2010 г., на ‐study/Obsession‐with‐Quality‐at‐Western‐Digital‐Corporation‐EB‐6334
(обратно)64
На основе статьи в моем блоге для Big Data Republic, озаглавленной «Аналитика для больших данных это… просто аналитика» (“Analytics with Big‐Data Is… Just Analytics”), 1 ноября 2012 г.
(обратно)65
См.: Thomas Claburn, “Google Buys Machine Learning Startup,” Information-Week, 13 марта 2013 г., на ‐buys‐machine‐learning‐startup/d/d‐id/1109068
(обратно)66
См.: Joint Research Centre for Sensitivity Analysis на . Рассуждения основаны на моем блоге для Международного института аналитики, озаглавленного «В мире больших данных предположения могут оказаться рискованными» (“Assumptions Can Be Risky in a Big Data World”), 13 июня 2012 г. См.: ‐can‐be‐risky‐in‐a‐big‐data‐world
(обратно)67
См.: Tim Kelly and Alwyn Scott, “Japan Air Grounds Boeing 787 after Battery Problem,” Reuter’s, 14 января 2012 г., на ‐japanairlines‐787‐battery‐idUSBREA0D11820140114
(обратно)68
См.: Xavier Amatriain, “Mining Large Streams of User Data for Personalized Recommendations,” SIGKDD Explorations 14, no 2 (декабрь 2012 г.), на ‐2‐2012‐12/V14‐02‐05‐Amatriain.pdf
(обратно)69
См.: Kirk Borne, “Statistical Truisms in the Age of Big Data,” 19 июня 2013 г., на ‐Truisms‐in‐the‐Ageof‐Big‐Data.html и Marie Davidian, “Aren’t We Data Science?” AMSTATNEWS, 1 июля 2013 г., на /
(обратно)70
Более подробное обсуждение этой концепции см. в статье в моем блоге для Международного института аналитики, озаглавленной «Идеальная информация не соответствует идеальным предсказаниям» (“Perfect Information Doesn’t Equal Perfect Predictions”), 12 декабря 2013 г., на ‐information‐doesnt‐equalperfect‐predictions/
(обратно)71
На основе статьи в моем блоге для Международного института аналитики: «Производить выборку или не производить… Разве это имеет значение?» (“To Sample or Not to Sample… Does It Even Matter?”), 5 апреля 2013 г. См.: ‐sample‐or‐not‐to‐sample‐does‐it‐even‐matter/
(обратно)72
См.: Thomas H. Davenport and D. J. Patil, “Data Scientist: The Sexiest Job of the 21st Century”, Harvard Business Review (октябрь 2012 г.), на ‐scientist‐the‐sexiest‐job‐of‐the‐21st‐century/ar/1; Jessi Hempel, “The Hot Tech Gig of 2022: Data Scientist”, CNNMoney, 6 января 2012 г., на ‐scientist‐jobs/; Gil Press, “Data Scientists: The Definition of Sexy”, Forbes, 27 сентября 2012 г., на ‐scientists‐the‐definition‐of‐sexy/
(обратно)73
Я подробно описал качества, отличающие лучших специалистов-аналитиков, в восьмой главе моей книги «Укрощение больших данных» (Taming the Big Data Tidal Wave, Hoboken, NJ: John Wiley & Sons, 2012). Вместо того чтобы здесь повторяться, я рекомендую заинтересовавшимся данным вопросом читателям обратиться к этой книге.
(обратно)74
См.: Talent Analytics “Four Functional Clusters of Analytics Professionals,” июль 2013 г.; также см.: International Institute for Analytics, “Quantifying Analytical Talent”, январь 2013 г.
(обратно)75
Повестку дня см. на:
(обратно)76
На основе статьи в моем блоге для Международного института аналитики: «Держитесь за своего исследователя данных… Пришлите мне творца!» (“Keep Your Data Scientist… Send Me a Data Artist!”), 6 февраля 2012 г. См.: ‐your‐data‐scientistsend‐me‐a‐data‐artist/
(обратно)77
См.: Burtch Works “The Burtch Works Study: Salaries for Big Data Professionals”, июль 2013 г., на .
(обратно)78
См.: McKinsey & Company, “Big Data: The Next Frontier for Competition” на ; см. также: Ben Rooney, “Big Data’s Big Problem: Little Talent”, Wall Street Journal, 29 апреля 2012 г., на 424052702304723304577365700368073674
(обратно)79
Для полного раскрытия: я член консультативного комитета этой программы. Информацию о ней см.: ‐Continuing‐Ed/Analytics‐Certification
(обратно)80
Как уже говорилось, я подробно описал качества, отличающие лучших специалистов-аналитиков, в восьмой главе моей книги «Укрощение больших данных» (Taming the Big Data Tidal Wave, Hoboken, NJ: John Wiley & Sons, 2012). Вместо того чтобы здесь повторяться, я рекомендую заинтересовавшимся данным вопросом читателям обратиться к этой книге.
(обратно)81
См.: Burtch Works, “The Burtch Works Study”.
(обратно)82
См.: Tom H. Davenport, “Organizing Analytics and Big Data”, блог Международного института аналитики, 23 сентября 2013 г., на ‐analytics‐and‐big‐data/
(обратно)83
См.: Brad Brown, David Court, and Paul Willmott, “Mobilizing Your C‐Suite for Big Data Analytics”, McKinsey Quarterly, ноябрь 2012 г., на
(обратно)84
См.: David Adams, “Florida Hit by ‘Tsunami’ of Tax Identity Fraud”, Reuters, 17 февраля 2013 г., на ‐usa‐taxfraud‐idUSBRE91G05M20130217
(обратно)85
См.: Tax Policy Center, “The Tax Gap: What Is the Tax Gap?”, на ‐book/background/tax‐gap/what‐is.cfm
(обратно)86
См.: Scott Zamost and Randi Kaye, “IRS Policies Help Fuel Tax Refund Fraud, Officials Say”, CNN, 20 марта 2012 г., на ‐refund‐scam/index.html
(обратно)87
См: /v‐Dn2KEjPuc. Или наберите в любом поисковике запрос «блохи в банке».
(обратно)88
См. обзор концепции игрофикации:
(обратно)89
См. мою статью «Не просто обслуживайте – содействуйте: новая модель для ИТ-организаций» (Bill Franks, “Don’t Just Serve – Enable: A New Model for IT Organizations”), Harvard Business Review, 28 августа 2013 г., на ‐just‐serveenable‐a‐new‐mo/
(обратно)90
См.: Big Data Republic, “Finding Unexpected Value in Data”, 31 июля 2013 г.
(обратно)91
Эта тема также обсуждается в моей книге «Укрощение больших данных» (Bill Franks, Taming the Big Data Tidal Wave, Hoboken, NJ: John Wiley & Sons, 2012).
(обратно)92
См. статью в моем блоге для Международного института аналитики: «Аналитика вышла из строя с неприятными последствиями для детей» (“Analytics Gone Wrong: Dire Consequences for Kids”), 9 ноября 2011 г., на ‐dire‐consequences‐of‐analytics‐gone‐wrong‐ruining‐kids%E2%80%99‐futures/
(обратно)(обратно)
Комментарии к книге «Революция в аналитике. Как в эпоху Big Data улучшить ваш бизнес с помощью операционной аналитики», Билл Фрэнкс
Всего 0 комментариев