Институт развития информационного общества
   

В России утвержден первый национальный стандарт в области больших данных, разработанный с участием ИРИО

Газета «Ведомости» сообщает: Росстандарт утвердил терминологические нормативы, которым должны следовать участники рынка больших данных, следует из приказа ведомства, с которым ознакомились «Ведомости». Такой стандарт вводится впервые, следует из его описания

ГОСТ «Информационные технологии. Большие данные. Обзор и словарь» идентичен международному стандарту Information technology – Big data – Overview and vocabulary, подчеркивают его разработчики из Национального центра цифровой экономики МГУ и Института развития информационного общества. Разработка стандарта осуществлена в рамках бюджетной программы государственной поддержки центра компетенций «Национальной технологической инициативы» (НТИ) по технологиям хранения и анализа больших данных МГУ, отмечает представитель АНО «Платформа НТИ».

«Термины, установленные настоящим стандартом, обязательны для применения во всех видах документации и литературы по данной научно-технической отрасли, входящих в сферу работ по стандартизации и (или) использующих результаты этих работ», – отмечено в описании стандарта.

В ГОСТе приведены переводы англоязычных терминов, относящихся к большим данным, на русский язык и расшифровка их значений. Например, «аналитика данных» (data analytics) – это «составное понятие, охватывающее получение, сбор, проверку и обработку данных, включая их количественную оценку, визуализацию и интерпретацию». А, к примеру, «вариативность данных» (data variability) – «изменения в скорости передачи, формате или структуре, семантике или качестве массива данных». Ниже приводятся ключевые характеристики больших данных (объем, скорость обработки, разнообразие и вариативность) с объяснением их значения.

«Принятие первого национального стандарта задает вектор совместных действий власти, бизнеса, научно-образовательного сообщества по развитию экономики данных в России, – отмечает председатель совета директоров Института развития информационного общества Юрий Хохлов. – Мы ставим перед собой задачу сократить отставание в стандартизации больших данных». Первыми в IT-отрасли вводятся терминологические стандарты, а затем к ним добавляются все остальные, объясняет он.

По словам Хохлова, предстоит принять еще восемь национальных стандартов в сфере больших данных, касающихся их эталонной архитектуры, безопасности, методов анализа, сценариев использования и др.: «Часть из них уже разработана, прошла общественное обсуждение, часть будет разрабатываться одновременно с международными стандартами».

По состоянию на конец 2019 г. Boston Consulting Group оценивала объем российского рынка больших данных в 45 млрд руб. с темпом прироста 12% в течение последних пяти лет. Согласно подсчетам Ассоциации больших данных, объем рынка больших данных в России составляет 10–30 млрд руб. При этом, по усредненным прогнозам российских и иностранных экспертов, к 2024 г. ожидается рост этого показателя до 300 млрд руб.

Терминологический стандарт действительно необходим, считает председатель технического комитета «Кибер-физические системы» при Росстандарте Никита Уткин: «Он должен позволить участникам рынка больших данных общаться на одном языке – терминологическое единообразие нужно, например, для составления закупочной документации, технических заданий и техдокументации».

«На этот терминологический аппарат можно будет опираться при создании регуляторных документов», – отмечает руководитель направления Big Data КРОК Кристина Проскурнина.

Представитель Mail.ru Group считает, что стандартизация терминов – полезное дело, так как она уменьшает недопонимание между участниками рынка: «Если предложенная терминология поможет в структурировании общения на заданную тему, это неплохо. Особенно для тех компаний, которые только начинают работать с большими данными».

В мире уже существует несколько международных стандартов для больших данных, определяющих понятия и термины, говорит директор Института исследований интернета Карен Казарян: «Поэтому действия Росстандарта вполне логичны. Но для бизнеса этот стандарт ничего не меняет, это, по сути, лишь словарь терминов, с которыми участники рынка больших данных и так прекрасно знакомы».

Скорее это словарь для чиновников, зачастую довольно смутно представляющих, что такое big data, – компаниям он поможет разве что при госзакупках, резюмировал Казарян.

Хотелось бы, чтобы в разработку стандартов больших данных бизнес был вовлечен глубже, заключает Уткин.

Источник: газета «Ведомости» от 15 июля 2021 г.