Пять самых важных характеристик больших данных

Создайте необходимую архитектуру больших данных

Сегодня, когда хранилища данных выполняют десятки миллионов запросов в день и поддерживают особо важные операции, технологические проблемы выходят далеко за рамки аппаратного обеспечения. Чтобы идти в ногу с растущим объемом и разнообразием данных, предприятиям требуется архитектура больших данных, обеспечивающая потоки данных для нужных пользователей с помощью правильных инструментов.

Топ-5 важнейших характеристик больших данных

Удовлетворение запросов предприятий на технологии Big Data стало основной причиной основания компании Teradata. На самом деле, название компании происходит от нашей способности управлять терабайтами данных. (Сегодня это число выросло до многих петабайт данных!). В то время хранение и анализ больших объемов данных были ограничены имеющимся тогда оборудованием. Мы создали базу данных Teradata для эффективного управления данными в масштабе, чтобы обеспечить корпоративную аналитику, решение технических проблем и демонстрацию возможностей интеграции данных в модель отношений.

Сегодня, когда хранилища данных выполняют десятки миллионов запросов в день и поддерживают особо важные операции, технологические проблемы выходят далеко за рамки аппаратного обеспечения. Чтобы идти в ногу с растущим объемом и разнообразием данных, предприятиям требуется архитектура больших данных, обеспечивающая потоки данных для нужных пользователей с помощью правильных инструментов.

Вопросы по архитектуре больших данных

Проектирование нужной архитектуры часто начинается с постановки правильных вопросов:

  • Как ваша стратегия в области больших данных будет формировать ваши технологические потребности в области больших данных? Другими словами, какие проблемы бизнеса необходимо решить, какие операции необходимо улучшить и какие цели должны быть достигнуты за счет использования больших данных?
  • Какие из существующих источников данных и систем можно «подключить» к интегрированной архитектуре?
  • Как вы будете учитывать новые наборы данных (например, данные с датчиков или данные из Интернета вещей)?
  • Как ваш подход может помочь поставить образ мышления, основанный на данных и аналитике, в центр вашего бизнеса?
  • Каковы необходимые компоненты для «ввода в эксплуатацию» или масштабирования вашей программы больших данных и аналитики за пределами пилотных этапов?

Необходимые технологии больших данных

В нашей работе с тысячами предприятий со всего мира мы определили пять особо важных обязательных условий, необходимых для создания успешно работающих платформ больших данных. На наш взгляд, архитектура Вig Data должна иметь следующие характеристики:

1. Интегрированность

Объединение хранилищ данных, озер данных и аналитики в единую платформу устраняет разрыв между необработанными источниками данных, конкретными инструментами бизнес-аналитики и стандартными приложениями CRM. Это значительно снижает сложность традиционных «гибридных» сред и позволяет компаниям принимать наборы данных, движущиеся чрезвычайно быстро. Здесь также пользователям предлагается межплатформенный доступ к данным и аналитическим движкам.

2. Масштабируемость

Согласно недавнему опросу IDC, 56% респондентов заявили, что они отвергли бы поставщика ИТ-инфраструктуры или поставщика облачных ИТ-услуг, если бы поставщик не предлагал гибкие варианты потребления ИТ. В ответ на запросы наших собственных клиентов компания Teradata разработала продукт Vantage, программную платформу для анализа данных, которую можно использовать любым способом, подходящим для этих данных лучше всего, будь то в облаке, в гибриде или локально. Мы знаем, что клиенты, возможно, не в состоянии предсказывать масштаб аналитических возможностей, которые им понадобятся в следующем месяце, не говоря уже о следующем годе, поэтому мы даем им возможность гибко корректировать свои рабочие нагрузки по аналитике по мере изменения стратегий развертывания.

3. Функция прогнозирования

Многие аналитики и эксперты говорят, что сегодня способность вашего предприятия собирать и управлять большими данными уже нечто само собой разумеющееся — теперь уже важна ваша способность прогнозировать и действовать на основе больших данных. Здесь вступают в дело искусственный интеллект и его составная дисциплина - машинное обучение. Машинное обучение дает компьютерам возможность учиться без ручного программирования, позволяя видеть шаблоны и строить модели на основе учёта данных, предсказывающие будущие сценарии. Это может быть чрезвычайно полезно для определения склонности клиента к приобретению вашего продукта, оптимизации производительности каждого станка на вашем заводе или улучшения вашей системы безопасности.

При разработке продукта Vantage, мы обеспечили поддержку этой платформой широкого спектра передовых аналитических функций. Например, движок машинного обучения предоставляет более 100 готовых аналитических функций для анализа маршрутов, шаблонов, статистики и текста для широкого спектра аналитических задач. Аналогичным образом, графический движок предоставляет набор функций, выявляющих взаимоотношения между людьми, продуктами и процессами в сети.

4. Доступность

Вы можете уменьшить степень разрозненности данных и повысить скорость инноваций на своем предприятии с помощью технологий и политики, поддерживающих самостоятельную аналитику. В идеале сотрудники вашей организации должны иметь доступ к правильному набору инструментов и данных, необходимых им для эффективного выполнения своей работы, без необходимости запрашивать разрешения у отдела ИТ. Это позволит вашим сотрудникам тратить меньше времени на объединение различных решений и больше времени на поиск и применение эффективных решений наиболее важных стратегических вопросов бизнеса.

Ваша технология должна также поддерживать любые языки и инструменты, которые предпочитают ваши пользователи. С помощью продукта Vantage исследователи в области обработки и анализа данных и бизнес-аналитики смогут работать с одинаковыми данными, даже если они используют разные инструменты и языки. Vantage интегрируется с предпочтительными инструментами и языками клиентов, включая SQL, R, Python, Tableau, Qlik и Teradata AppCenter, Jupyter и RStudio.

5. Открытость для инноваций

Новые варианты использования расширенной аналитики и взрывное развитие различных типов и источников данных заставили ученых по обработке и анализу данных использовать различные методы обработки и анализа данных. Ваша технология должна быть всеобъемлющей и способной решать проблемы бизнеса как сегодня, так и завтра, поэтому вам понадобится архитектура, совместимая с любыми новыми инструментами и технологиями, которые появятся в будущем. Вот почему мы разработали Vantage, соединяющий как открытые, так и коммерческие аналитические технологии.

Технологии, поддерживающие аналитику больших данных, быстро меняются. Чтобы создать долгосрочную, устойчивую технологическую стратегию Big Data, крайне важно создать архитектуру, которая объединяет различные потоки данных, инструменты и приложения; масштабируется в зависимости от потребностей бизнеса; поддерживает расширенные возможности прогнозной аналитики; доступна для всех сотрудников вашей организации, независимо от их функционала; и открыта для будущих инноваций, которые неизбежно будут появляться. Соответствуя этим критериям, вы будете хорошо подготовлены и получите конкурентные преимущества в условиях продолжающегося расширения глобальной экономики данных.

Хотите узнать, как Teradata Vantage может вам помочь?