Реклама Forbes Club

Машинное обучение и озера: как компании будут работать с данными в 2024 году

За первые 11 месяцев 2023 года во всем мире было произведено 120 зеттабайт данных, что на 23,71% больше, чем за аналогичный период 2022 года. Один зеттабайт — это примерно 10 млрд фильмов в разрешении 4K. Постоянно увеличивающийся объем информации вынуждает компании разрабатывать новые инструменты сбора и аналитики, а также диктует критерии качества данных

«Без анализа больших данных компании слепы и глухи, они блуждают в сети как олени на автостраде», — отмечает  Джеффри Мур, американский консультант по менеджменту, известный своей книгой «Преодоление пропасти: маркетинг и продажа высокотехнологичных продуктов основным клиентам».

Аналитика помогает бизнесу расти и трансформироваться, а это, в свою очередь, возможно только при наличии качественных больших данных.  редактор портала The HCM Consultant Хайсам Абдель Малак выделяет 11 тенденций, которые будут главными в сфере больших данных в 2024 году:

1. Защитить любой ценой

Согласно данным аналитического портала Statista, только в первом квартале 2023 года в результате утечек данных были раскрыты более шести миллионов записей данных по всему миру.

Раскрытие конфиденциальных данных клиентов влечет за собой не только крупные репутационные потери,но и наносит вред всей системе безопасности организации. 

2. Данные предсказывают будущее 

Организации все чаще используют прогнозную аналитику, чтобы понять, например, как клиенты будут реагировать на конкретное событие, продукт или услугу.

Системы с инструментами прогнозной аналитики могут использоваться в самых разных областях для решения таких задач как выявление мошенничества с кредитными картами или составление кредитной надежности клиента банка. 

3. Когнитивные технологии привлекают деньги

Чтобы увелисить пользу от больших данных, организации внедряют все новые и новые инструменты на основе когнитивных технологий — искусственного интеллекта и машинного обучения. Этот рынок быстро растет, а инвестиции в подобные инструменты увеличиваются на фоне интереса крупных компаний к этим инструментам. 

Наиболее удачные из таких инноваций могут изменить способы обработки больших данных и демократизировать такие инструменты для среднего и малого бизнеса.

4. Машинное обучение круче ИИ

Машинное обучение — наиболее важная часть анализа больших данных, поскольку оно позволяет обрабатывать и анализировать информацию за короткое время, выявлять из этого анализа закономерности и использовать их для построения прогнозов. 

Речь идет уже не только об искусственном интеллекте, но и о том, как компьютеры могут учиться на собственном опыте и самостоятельно делать прогнозы.

5. UX-дизайн делает инструменты массовыми

Одним из основных достижений в области больших данных является сокращение использования стандартных информационных панелей. Современные настраиваемые панели предоставляют намного больше инструментов и разрезов для анализа. 

Другой плюс настраиваемых панелей управления — доступный UX-дизайн. Он позволяет самостоятельно анализировать данные даже тем специалистам, которые не имеют технических навыков. 

6. Облака помогают экономить

Облачные хранилища позволяют сократить расходы на сервера, повысить скорость и эффективность сбора данных, решить некоторые проблемы безопасности. Поэтому важная тенденция в сфере больших данных — миграция в облако и снижение зависимости от локальных центров обработки данных. 

Эксперты The HCM Consultant советуют следить за тем, будут ли компании, работающие с чрезвычайно конфиденциальными данными, больше доверять облаку. Если же такие организации увидят риски в работе с облаками, это будет знаком для всей сферы переосмыслить безопасность таких хранилищ.

7. Перейти из баз в озера 

Исторически организации хранили свои данные в структурированных базах данных с четким разделением внутри этих баз на типы данных, например, изображения, аудиофайлы, видеофайлы и другое. 

Озера данных — это новый тип архитектуры, который меняет способы хранения и анализа данных компаниями. Они позволяют организациям хранить все типы данных в одном месте.

8. Фабрики — данным

Фабрики данных — это наборы сервисов, которые стандартизируют работу с данными и обеспечивают возможность совместного использования данных между различными платформами и приложениями.

Их можно использовать в качестве альтернативы традиционным кластерам данных или в качестве дополнительного инструмента для хранения больших объемов неструктурированных данных в легкодоступной форме.

9. Важно не количество, а качество

Чем качественнее данные, тем выше точность прогноза на их основе. Инструменты ИИ или машинного обучения будут выдавать ошибочные решения, если они учатся на ошибочных или неточных данных.

Существует много подходов к вопросу качества данных, но есть стандартизированные критерии — это полнота, достоверность, точность, согласованность, доступность и своевременность.

10. Легко собирать, трудно управлять

Сегодня существует множество различных источников данных, включая датчики, платформы социальных сетей и даже интеллектуальные устройства.

С каждым внедрением новой технологии на массовый рынок будет генерироваться больше данных. Это усложнит управление большими данными из новых источников. 

11. Власть в одни руки

Если пользоваться данными могут сотрудники разных отделов, то вопросы управления лучше оставить ограниченному кругу обученных специалистов. Это продиктовано вопросами защиты данных и их конфиденциальностью, проблемами прозрачности данных, а также законодательными нормами сбора и использования данных.