В современном мире организации производят и хранят колоссальные объёмы данных, однако лишь часть из них явно помечена или классифицирована. Классификация данных – это процесс присвоения данным меток (категорий) в зависимости от их типа, чувствительности и ценности. Такие метки присваиваются данным (например, публичные, внутренние, конфиденциальные, секретные) и затем позволяют управлять доступом к ним. Несмотря на очевидные преимущества, классификация охватывает далеко не все корпоративные данные.
В данном отчёте рассмотрены сведения о доле классифицированных данных в общем объёме, с акцентом на финансовый и промышленный сектора, а также типичные категории данных, барьеры на пути классификации и примеры из практики.
Доля классифицированных данных в организациях
Глобальный масштаб. В среднем около половины корпоративных данных имеют какую-либо метку классификации, остальная часть остаётся «тёмными данными» без явного статуса. Примерно 48% данных удаётся идентифицировать и отсортировать по категориям. Только 5% компаний классифицировали все свои данные в публичном облаке, и лишь 6% — все данные на мобильных устройствах. Большинство компаний признаёт, что классифицировали менее половины данных в этих средах.
Финансовый сектор. В финансовых организациях (банки, страховые, финтех) данные априори чувствительны — персональные сведения о клиентах, банковская тайна, платёжная информация. Финансовые компании являются одними из лидеров по использованию систем классификации. Жёсткие нормативы (например, PCI DSS) вынуждают их маркировать данные по уровням конфиденциальности. В РФ согласно ФЗ-152 все информационные системы персональных данных должны быть классифицированы по уровням защищённости (1–4).
Промышленный сектор. В традиционных отраслях (машиностроение, производство, энергетика) ситуация хуже: только около 27% предприятий считают защиту данных приоритетной задачей. В индустрии процент классифицированных данных часто минимален.
Географические различия. В развитых странах (Северная Америка, Европа) благодаря GDPR и аналогичным законам процент классифицированных данных выше, чем в странах с низким уровнем регулирования.
Основные категории классифицируемых данных
-
Персональные данные (PII): ФИО, паспорта, контактная информация клиентов и сотрудников.
-
Финансовая и платёжная информация: номера счетов, карты, транзакции.
-
Интеллектуальная собственность: чертежи, формулы, исходные коды, проектная документация.
-
Учетные данные: логины/пароли, ключи API.
-
Регулируемые данные: медицинские записи (PHI), данные критической инфраструктуры.
Проблемы и барьеры при классификации данных
-
Недостаток ресурсов и экспертизы: нехватка специалистов и координации между отделами.
-
Огромные объемы и неструктурированность данных: до 90% данных — неструктурированные (файлы, почта, изображения, логи и т.д.)
-
Ручные процессы: долгое и трудоёмкое сканирование хранилищ.
-
Трудности поддержания актуальности: данные устаревают, появляются новые типы данных.
-
Опасения бизнеса: страх юридических последствий и затрат.
Примеры из практики и тенденции
-
Быстрое обнаружение инцидентов: Отчет Netwrix показывает разительный эффект классификации в финансовой отрасли: 75% финансовых организаций, которые классифицируют данные, способны обнаружить злоупотребление данными в течение минут. Напротив, среди организаций без классификации лишь немногие реагируют так быстро – 43% признают, что на обнаружение уходит дни, а у 29% инцидент и вовсе выявляется через месяцы
-
Сокращение расходов: компании экономят сотни тысяч долларов в год за счёт удаления ненужных данных. Разметка позволяет понять, какие файлы не имеют ценности, и безопасно их архивировать или удалить
-
Отраслевой сдвиг: промышленные гиганты начинают защищать интеллектуальную собственность.
-
Регуляторные требования: В банковском секторе России при проверках Центробанка по стандарту СТО БР ИББС банки должны предъявить классификацию своих активов информации (включая данные). Те, кто подготовился и внедрил системы data discovery & classification, проходят аудит успешнее.
-
Повышение киберустойчивости: По данным Microsoft, у клиентов, внедривших Microsoft Information Protection (MIP) для классификации, количество утечек данных снизилось до 60% благодаря лучшей видимости и контролю. Знание о своих данных = лучшая защита.
Таблица 1. Примеры и показатели классификации данных
Показатель/кейс | Финансы (банки/страхование) | Промышленность (производство/энергетика) |
---|---|---|
Доля классифицированных данных | >50% в среднем | <25% в среднем |
Основные категории | Персональные данные, платёжные данные, финансовая отчетность, коммерческая тайна | Чертежи, технологические процессы, ноу-хау, R&D, IoT-данные |
Барьеры | Интеграция в legacy-системы, большие объемы данных | Отсутствие культуры ИБ, разнообразие форматов данных |
Практический эффект | Быстрое обнаружение инцидентов, оптимизация хранения данных | Защита интеллектуальной собственности, соответствие требованиям по КИИ |
Заключение
Тренды последнего времени указывают на рост внимания к классификации данных как в финансовом, так и в промышленном секторах. Финансовые организации классифицируют значительно больший процент своих данных. Основные препятствия — нехватка ресурсов, масштаб данных и сложность процессов — постепенно преодолеваются. Классификация данных превращается в необходимый элемент кибергигиены, усиливая безопасность, оптимизируя затраты и повышая управляемость активами информации.