Но хотя объем производства данных вырос на 22 процента, объем хранения данных в прошлом году увеличился всего на 0,95 ЗБ – менее 3 процентов от объема данных, созданных за тот же период, говорится в исследовании.
Исследование признало, что коэффициент преобразования генерации и хранения данных в Китае все еще остается низким и что «потенциальная ценность данных требует дальнейшего изучения».
Он также отметил, что использование хранимых данных остается низким – почти 40 процентов данных, хранящихся компаниями в прошлом году, не были прочитаны или повторно использовались после хранения.
«Недостаток возможностей обработки данных приводит к недооценке и трудностям в обнаружении и повторном использовании большого количества данных», — говорится в отчете.
Профессор Энди Чун из Колледжа бизнеса Городского университета Гонконга заявил, что 3-процентный показатель Китая по хранению данных соответствует глобальным показателям, которые показали, что сохраняется только часть сгенерированных данных.
По данным немецкого статистического портала Statista, 2 процента данных, созданных и использованных в 2020 году, были сохранены для использования в 2021 году.
«Есть много причин для такого выборочного хранения, при этом конфиденциальность и безопасность данных имеют первостепенное значение. Большинство стран применяют правила, которые ограничивают хранение данных тем, что необходимо для определенных целей, и требуют их удаления, как только они больше не служат этим целям», — сказал Чун.
«Хранение огромных объемов данных не только создает уязвимости в системе безопасности, но также влечет за собой значительные затраты и технологические проблемы.
«Инфраструктура, необходимая для хранения таких объемов данных в реальном времени, требует постоянного совершенствования решений для хранения данных, что может оказаться непомерно дорогостоящим», — сказал Чун, советник группы специалистов по искусственному интеллекту Гонконгского компьютерного общества.
Чун сказал, что он ожидает неизбежного и существенного роста показателей хранения данных в Китае в ближайшее время, чему будет способствовать внедрение генеративных технологий искусственного интеллекта во всем мире.
По его словам, успешные результаты ИИ зависят как от объема, так и от качества базовых данных, добавив, что, поскольку тенденция смещается в сторону более персонализированных генеративных приложений ИИ, вполне вероятно, что больше личных данных будет храниться для обучения моделей ИИ.
«Чтобы приспособиться к этому росту, Китаю было бы разумно направить инвестиции в развитие технологий хранения данных с целью увеличения емкости и снижения затрат. Этот стратегический фокус может поддержать растущие потребности в области искусственного интеллекта, одновременно способствуя инновациям во всей отрасли», — сказал Чун.
Отчет о национальном исследовании ресурсов данных за 2023 год также призвал крупные предприятия Китая инвестировать в цифровую трансформацию. Около 22 процентов опрошенных компаний заявили, что у них до сих пор нет системы управления данными. Среди тех, кто подвергся цифровой трансформации, только 8 процентов повторно использовали свои данные и получили от этого дополнительную выгоду.
«Предстоит еще пройти долгий путь, чтобы изучить полную ценность данных», — говорится в исследовании.
Но он также отметил, что спрос Китая на качественную информационную продукцию остается очень высоким: согласно результатам опроса, касающегося центров обмена данными Китая, спрос в 1,75 раза превышает предложение.
Чун сказал, что, хотя сопоставимого американского исследования не было, исходя из численности населения, он пришел к выводу, что объем данных, генерируемых в США, был значительно меньше, чем в Китае.
Ожидается, что спрос на вычислительную мощность для обучения крупных моделей ИИ останется высоким, а спрос на вычислительную мощность со стороны научных учреждений, государственных учреждений, финансов и других отраслей также соответственно увеличится. Он рекомендовал Китаю ускорить строительство своей национальной интегрированной вычислительной системы для удовлетворения спроса.
Цзян Янь, директор Национального исследовательского центра по развитию промышленной информационной безопасности, который отвечал за исследование, сказал, что Китай изначально имел преимущество в масштабе своих ресурсов данных.
«Но необходимо сделать больше, чтобы раскрыть потенциал огромных данных, поскольку управление и использование ресурсов данных в Китае в целом находится на начальной стадии», — цитирует Цзяна газета China’s Daily Economic News.
Чун из CityU предупредил, что расширением хранилища персональных данных «необходимо тщательно управлять, неукоснительно соблюдая правила конфиденциальности, этические стандарты и надежные протоколы защиты данных».
Он добавил, что для устойчивого роста объемов данных Китай должен участвовать в стратегических инвестициях, помимо простого увеличения емкости хранения.