Рассказываем, почему без наведения порядка в данных инновации не будут работать, в чем разница между Data Governance и Data Management, а также о принципах формирования стратегии управления данными.
Какую технологию можно считать самой перспективной и полезной для бизнеса? Искусственный интеллект, «Интернет вещей», big data? Зависит от отраслевой специфики конкретной компании и процессов, которые необходимо улучшить, скажете вы. И будете правы. Но не все ли равно, какие инновации внедрять в бизнес для его трансформации, если данные, с которыми будут работать ИТ-решения, никак не обрабатываются и находятся в состоянии хаоса? В любом случае компания получит совсем не те результаты, на которые рассчитывала: неудовлетворенность клиентов, неэффективное распределение ресурсов, неспособность заметить угрозы. Мусор на входе – мусор на выходе, как сказал Джордж Фьючел (George Fuechsel), использовавший GIGO в качестве обучающего метода.
О том, что данные – один из ценнейших активов бизнеса, сказано уже немало. Они поступают снаружи и собираются внутри почти каждой компании: это информация о клиентах, партнерах и конкурентах, сведения о работе внутренних процессов, о проблемах и достижениях. Однако результаты опроса Veritas показали, что 33% данных, которые хранят компании, являются безнадежно устаревшими или избыточными.
Одним словом, данными нужно эффективно управлять – только в таком случае они станут активом, приносящим бизнесу реальную пользу и прибыль. Но что означает «управлять»? В открытых источниках много противоречивой информации, странных схем, которые скорее путают, чем объясняют. По факту же управление данными – это совокупность различных принципов и инструментов: первые помогают повысить качество данных компании, вторые – оценить их качество, обрабатывать и извлекать инсайты.
Стратегическое управление данными (оценка качества) получило название Data Governance (DG), практическое (повышение качества) – Data Management (DM). О том, что эти понятия не являются взаимозаменяемыми (несмотря на то, что оба фактически переводятся как «управление данными»), одной из первых заговорилаглавный аналитик Forrester Мишель Гетц (Michele Goetz). Чтобы аудитории было проще почувствовать разницу между ними, специалисты одного из зарубежных ИТ-провайдеров сравнили работу с данными и приготовление пищи. Так вот Data Management – это кухонные шкафы, в которых хранятся продукты и вся бытовая техника, а Data Governance – рецепты/инструкции, которые помогают грамотно распорядиться большим количеством ингредиентов и с помощью оборудования приготовить из них вкусное блюдо.
Иначе говоря, грамотный Data Management невозможен без продуманной стратегии управления данными. Инструменты для DM (например, системы ETL или MDM-решения) стандартизированы: их можно настроить для работы с конкретными данными и процессами. DG же – наоборот, представляет собой уникальный план, учитывающий особенности конкретной компании (хотя еще каких-то 10 лет назад Data Governance была неразрывно связана с индустриальными моделями, будь то IBM BDW или Sybase IWS).
У каждой компании должна быть своя Data Governance. По словам Вимала Вела (Vimal Vel), вице-президента компании Dun & Bradstreet (поставщик решений для работы с данными), многие из их клиентов вдохновляются идеей Data Governance и сразу приступают к разработке стратегии, не уделяя внимания предварительной стадии – подготовке. Между тем без нее не обойтись: сначала нужно понять, на каком этапе бизнес находится сейчас и к чему хотелось бы прийти через определенное время – большинство данных, с которыми ведется работа в рамках стратегии, должны быть связаны с показателями бизнеса.
Результаты опросов показывают: у многих компаний нет четкого понимания, что необходимо учитывать при стратегическом управлении данными. В частности, лишь у 48% участников опроса, проведенного First San Francisco Partners, была программа работы со своей информацией. Между тем есть несколько понятных принципов, на которых базируется стратегия Data Governance.
1. Обеспечьте доступность ваших данных
Ни одна «умная» система не будет работать в полную силу, если у нее нет доступа к необходимой информации. Но здесь нельзя забывать о конфиденциальности: уже при составлении стратегии DG важно понять, что и как могут исследовать конкретные специалисты компании, а какие данные видеть в качестве структуры или «звездочек».
Например, если речь идет о банке, то HR-отделу и руководству, конечно, нужно предоставить доступ к кадровой информации, например данным о зарплатах и командировочных. Однако карточную систему, в которой содержится информация о доходах и тратах специалистов, следует хорошо защитить – она вряд ли нужна для работы со стратегией управления данными компании.
2. Пользователи должны работать с согласованными данными
Ситуация, когда сотрудники коммерческого отдела работают с одними данными, а специалисты отдела продаж – с другими, может привести к тому, что в результате выводы по поводу похожих процессов будут совершенно разными. Получив такие противоречивые результаты, руководству бизнеса будет сложно понять, кто прав и чьим рекомендациям стоит следовать.
Таким образом, важно, чтобы сотрудники работали с согласованными данными, полученными из одного источника. Сейчас у компаний есть два варианта. Первый – настроить прозрачный процесс обмена данными между разными хранилищами. Второй – разместить всю информацию в едином хранилище, например озере данных (Data Lake): это позволяет хранить как структурированные, так и неструктурированные данные разных форматов, что облегчает работу тем, кто, например, взаимодействует не только с документами, но и файлами в аудио- или видеоформате (под ними мы подразумеваем метаданные этих файлов и транскрибирование).
Пользу от создания централизованных DWH/DataLake почувствовали все те же банки. Например, не у всех из них была так называемая матрица коммуникации со своими клиентами, благодаря которой можно понять: сколько и кому отправлено СМС или электронных писем, звонки с какими предложениями уже были сделаны и какой был отклик. После размещения всей информации в едином хранилище и построения сквозной матрицы коммуникации банкам удалось уменьшить количество дублирующих или неинтересных для тех или иных клиентов сообщений.
3. Поймите, что собирать, а что выбросить
Не собирайте бесполезный «мусор»: использование нерелевантных или безнадежно устаревших данных для принятия управленческих решений вряд ли позволит повысить конкурентоспособность компании.
Стратегия управления данными предполагает, что место под солнцем – в хранилище – должны получить только свежие и актуальные сведения. Как мы помним, план всегда индивидуален, поэтому для каждой компании критерии соответствия будут разными. Не превращайте ваше озеро данных в болото и настройте процессы, позволяющие вовремя избавляться от ненужной информации.
Конечно, навсегда удалять данные, несоответствующие критериям, необязательно. Можно поместить их в архив, но предварительно важно все тщательно описать. Если архивная информация когда-нибудь понадобится, найти ее без подробного описания будет трудно.
4. Обеспечьте сохранность ваших данных
Любая система когда-нибудь может выйти из строя, и вся накопленная в ней информация исчезнет. На ИТ надейся, но о резервном копировании не забывай – еще один важный принцип.
5. Позаботьтесь о безопасности
В последние годы правила обращения с данными, в том числе персональными, стали строже – несоблюдение может привести к штрафам и ударит по репутации компании. Data Governance предполагает, что у бизнеса есть четкие инструкции, как защитить информацию от кражи или несанкционированного использования. Даже если компания совсем небольшая, не стоит думать, что она неинтересна для киберпреступников – наоборот, взломать ее систему будет проще, чем пробраться в хранилище крупной корпорации.
Еще один важный вопрос: как действовать компании, если работой над Data Governance занимается подрядчик, например системный интегратор? Составлять регламенты по выдаче данных, подписывать NDA? Наш опыт показывает, что еще на этапе создания учетной системы компании стоит промаркировать данные, чтобы избежать путаницы и недопонимания. Руководству важно понять, какая информация является закрытой и в каких случаях. В результате при выборе ПО для построения стратегии работы с данными и команде заказчика, и специалистам подрядчика будет проще: какие-то данные они получат в неизменном виде, а какие – в виде тех же «звездочек».
* * *
Иными словами, стратегию работы с данными можно сравнить с управлением финансами: последние необходимо держать в порядке и поддерживать с помощью аудита и различных инструментов контроля. Не менее важно обеспечить сохранность денежных средств. По факту данные – это такой же актив, а в современном мире иногда даже более ценный, поэтому к нему применимы все те же правила: как и грамотное управление финансами, Data Governance помогает уменьшить количество ошибок, повысить эффективность бизнеса и ясно понимать – каких результатов можно достичь в дальнейшем.
Статья опубликована на сайте журнала IT-Expert.