Что такое активное хранилище данных?

Активное хранилище данных — это сочетание продуктов, функций, сервисов и деловых партнерств, поддерживающих бизнес-стратегию Active Enterprise Intelligence. Этот термин был введен в обращение компанией Teradata в 2001 году.

Узнать больше

Что такое алгоритм?

В контексте больших данных алгоритмы являются основным средством выявления идей и обнаружения закономерностей. Таким образом, алгоритмы необходимы для реализации бизнес-кейса больших данных.

Узнать больше

Что такое аналитическая платформа?

Аналитическая платформа – это полнофункциональное технологическое решение, предназначенное для удовлетворения потребностей крупных предприятий. Как правило, в ней объединяются различные инструменты и аналитические системы вместе с механизмом для выполнения, с базой данных или репозиторием для хранения и управления данными, с процессами интеллектуального анализа данных, а также с методами и механизмами получения и подготовки данных, которые не хранятся.

Узнать больше

Что такое Apache Hive?

Apache Hive — это инфраструктура хранилища данных с открытым исходным кодом, в которой предоставляются инструменты для запроса данных, их обобщения и анализа. Она была специально разработана для поддержки анализа больших наборов данных, хранящихся в файлах Hadoop и совместимых файловых системах, таких как Amazon S3. Apache Hive был первоначально разработан инженерами в области данных компании Facebook в 2008 году, но в настоящее время используется многими другими компаниями.

Узнать больше

Что такое поведенческая аналитика?

Поведенческая аналитика измеряет, как пользователи взаимодействуют с цифровыми приложениями (веб, мобильные, IoT) и как, казалось бы, несвязанные точки данных могут объяснить или предсказать результаты.

Узнать больше

Что такое большие данные?

Большие данные — это сложные и объемные группы данных, представленные в «сыром виде» и требующие предварительной обработки, чтобы получить из них ценные сведения, которые могут принести пользу предприятиям и организациям.

Узнать больше

Что такое аналитика больших данных?

Аналитика больших данных относится к стратегии анализа больших объемов данных, собранных из самых разных источников, включая социальные сети, видео, цифровые изображения, датчики и отчетную документацию по продажам.

Узнать больше

Что такое план обеспечения непрерывности бизнеса?

План обеспечения непрерывности бизнеса (BCP) представляет собой подробный документ, в котором описывается, как организация будет продолжать работать в условиях незапланированных сбоев в обслуживании. BCP является не просто нормативным требованием во многих отраслях, но и должен рассматриваться как руководство по сокращению времени, необходимого для возвращения рабочих операций в нормальное русло. Он играет решающую роль в операционной устойчивости организации.

Узнать больше

Что такое бизнес-аналитика?

Бизнес-аналитика (BI) анализирует бизнес-данные, обрабатывая большие наборы данных из нескольких источников и представляет результаты в удобных для понимания и распространения форматах для принятия стратегических бизнес-решений.

Узнать больше

Что такое каскадирование?

Каскадирование (Cascading) — это платформа для разработки приложений больших данных на Hadoop. Она предлагает вычислительный механизм, структуру системной интеграции и возможности обработки данных и планирования.

Узнать больше

Что такое CDP?

Платформа данных клиентов (CDP) - это тип пакетного программного обеспечения, которое создает постоянную, унифицированную базу данных клиентов, доступную из других систем.

Узнать больше

Что такое облачные вычисления?

Термин "облачные вычисления" означает практику использования сети удаленных серверов для хранения, управления и обработки данных (а не локального сервера или персонального компьютера) с доступом к таким данным, предоставляемым через Интернет (облако).

Узнать больше

Что такое кластерный анализ?

Кластерный анализ или кластеризация — это метод статистической классификации или деятельность, которая включает в себя группирование набора объектов или данных таким образом, чтобы находящиеся в одной группе (называемой кластером), были похожи друг на друга, но отличались от объектов в других кластерах.

Узнать больше

Что такое сравнительный анализ?

Темин "сравнительный анализ" означает сравнение двух и более процессов, документов, наборов данных или других объектов. Формами сравнительного анализа являются анализ шаблонов, фильтрация и анализ дерева решений.

Узнать больше

Что такое параллелизм/параллельные вычисления?

Термины "параллелизм" или "параллельные вычисления" означают такую форму вычислений, при которой несколько вычислительных задач выполняются одновременно или в перекрывающиеся отрезки времени. Эти задачи могут выполняться отдельными компьютерами, конкретными приложениями или в разных сетях.

Узнать больше

Что такое аналитика подключений?

Аналитика соединений — это новая дисциплина, которая помогает обнаруживать взаимосвязанные соединения и точки влияния между людьми, продуктами, процессами, машинами и системами в сети путем отображения этих связей и постоянного мониторинга взаимодействий между ними.

Узнать больше

Что такое корреляционный анализ?

Термин "корреляционный анализ" означает применение статистического анализа и других математических методов для оценки или измерения отношений между переменными.

Узнать больше

Кто такой аналитик данных?

Аналитики данных служат важнейшей цели, помогая "ввести большие данные в эксплуатацию" в рамках конкретных функций и процессов, уделяя особое внимание тенденциям производительности и оперативной информации.

Узнать больше

Что такое аналитика данных?

Аналитика данных, также известная как расширенная аналитика или аналитика больших данных, представляет собой автономную или полуавтономную проверку данных или контента с использованием сложных методов и инструментов, выходящих за рамки традиционной бизнес-аналитики (BI), для выявления более глубоких идей, прогнозирования или выработки рекомендаций. Методы включают интеллектуальный анализ данных/текста, машинное обучение, сопоставление шаблонов, прогнозирование, визуализацию, семантический анализ, анализ тональности, сетевой и кластерный анализ, многомерную статистику, анализ графиков, моделирование, обработку сложных событий, нейронные сети.

Узнать больше

Что такое архитектура данных?

Унифицированная архитектура данных компании Teradata — это первая комплексная архитектура больших данных. В этой платформе используются реляционные и нереляционные репозитории с помощью аналитики типов SQL и не-SQL

Узнать больше

Что такое очистка данных?

Очистка данных или "вычищение" данных — это процесс обнаружения и исправления или удаления неточных данных или записей из базы данных.

Узнать больше

Что такое гравитация данных?

Гравитация данных появляется, когда в репозитории объем данных увеличивается, а также увеличивается и число применений. В какой-то момент способность копирования или переноса данных становится обременительной и дорогостоящей.

Узнать больше

Что такое озеро данных?

Озера данных дополняют хранилища данных шаблоном проектирования, в котором упор сделан на точность исходных необработанных данных и долгосрочное хранение при низких затратах, и при этом обеспечивается новая форма аналитической гибкости.

Узнать больше

Что такое задержка данных?

Задержка данных — это возможность загружать и обновлять данные практически в режиме реального времени, одновременно поддерживая рабочие нагрузки запросов.

Узнать больше

Что такое витрина данных?

Витрина данных — это субъектно-ориентированный фрагмент логической модели хранилища данных, обслуживающий узкую группу пользователей.

Узнать больше

Что такое интеллектуальный анализ данных?

Интеллектуальный анализ данных — представляет собой процесс обнаружения пригодных к использованию сведений в крупных наборах данных посредством анализа скрытых шаблонов данных в соответствии с различными перспективами для категоризации полезной информации, которая собирается и сводится воедино в общих областях, таких как хранилища данных.

Узнать больше

Что такое моделирование данных?

Модели данных, специально адаптированные к конкретным отраслям или бизнес-функциям, могут обеспечить прочную основу или «толчок» для программ и инвестиций в большие данные.

Узнать больше

Что такое объем данных?

Объем данных — это хранение и обработка многих петабайтов данных в изначальном и в объектном хранилище.

Узнать больше

Что такое хранилище данных?

В вычислительной технике хранилище данных (DW или DWH), также известное как корпоративное хранилище данных (EDW), представляет собой систему, используемую для отчетности и анализа данных.

Узнать больше

Что такое глубокое обучение?

Глубокое обучение, также известное как глубокое нейронное обучение или глубокая нейронная сеть, представляет собой функцию искусственного интеллекта (ИИ), которая имитирует то, как работает человеческий мозг в процессе обработки данных и создания шаблонов, облегчающих принятие решений.

Узнать больше

Что такое описательная аналитика?

Описательная аналитика — это анализ исторических данных для определения того, что произошло, что изменилось и какие можно выявить закономерности.

Узнать больше

Что такое ETL?

Извлечение, преобразование и загрузка (ETL) - это процесс в хранилищах данных, при котором одновременно считывются (или извлекаются) данные из исходных систем; преобразуются (или трансформируются) данные в надлежащий формат для запросов и анализа; и данные загружаются в хранилище данных, оперативное хранилище данных или витрину данных.

Узнать больше

Что такое эксабайт?

Чрезвычайно большая единица цифровых данных, один эксабайт (ЭБ) равен 1000 петабайтам или одному миллиарду гигабайт (ГБ). Технологи подсчитали, что объём всех слов, когда-либо сказанных человечеством, будет равен пяти эксабайтам.

Узнать больше

Что такое финансовая аналитика?

Финансовая аналитика, также известная как аналитика финансов, предоставляет различные точки зрения на финансовые данные конкретного бизнеса и дает понимание, которое может облегчить принятие стратегических решений и действий, улучшающих общие показатели бизнеса.

Узнать больше

Что такое Hadoop?

Hadoop — это распределенная платформа управления данными или программная платформа с открытым исходным кодом для хранения и обработки больших данных. Иногда её описывают как урезанную распределенную операционную систему.

Узнать больше

Что такое гибридное облако?

Гибридное облако — это сочетание локального и облачного развертывания. Независимо от того, использует ли организация локальные, частные, общедоступные или мультиоблачные ресурсы, гибридная облачная экосистема может собрать воедино всё лучшее из этих вариантов: локальное развёртывание, когда это необходимо, и облачное, когда оно предпочтительней.

Узнать больше

Что такое Интернет вещей (IoT)?

Интернет вещей, также известный как IoT, представляет собой концепцию, описывающую подключение повседневных физических объектов и продуктов к Интернету, чтобы сделать их узнаваемыми (через уникальные идентификаторы) и соотнести их с другими устройствами

Узнать больше

Что такое машинное обучение?

Машинное обучение — это тип искусственного интеллекта (ИИ), который предоставляет компьютерам возможность учиться без явного их программирования. В машинном обучении упор сделан на разработку компьютерных программ, которые под воздействием новых данных могут научиться расти и изменяться.

Узнать больше

Что такое управление основными данными (MDM)?

Управление основными данными (MDM) обеспечивает унифицированное представление данных в нескольких системах для удовлетворения аналитических потребностей глобального бизнеса. MDM создает единичные представления основных и справочных данных, независимо от того, описывает ли он клиентов, продукты, поставщиков, местоположения или любой другой важный атрибут.

Узнать больше

Что такое метаданные?

Метаданные — это данные, которые описывают другие данные структурированным, согласованным образом, так, что с течением времени большие объемы данных могут быть собраны, сохранены и проанализированы.

Узнать больше

Что такое смешанная рабочая нагрузка?

Смешанная рабочая нагрузка — это возможность поддержки нескольких приложений с различными соглашениями по уровню обслуживания (SLA) в одной среде.

Узнать больше

Что такое MongoDB?

MongoDB — это межплатформенная база данных с открытым исходным кодом, использующая документоориентированную модель данных, а не традиционную табличную структуру реляционной базы данных. Этот тип модели упрощает и ускоряет интеграцию структурированных и неструктурированных данных.

Узнать больше

Что такое обработка естественного языка?

Будучи подвидом искусственного интеллекта, обработка естественного языка (NLP), занимается тем, что делает человеческий язык (как в письменной, так и в устной формах) понятным для компьютеров.

Узнать больше

Что такое эксплуатационная устойчивость?

Операционная, или эксплуатационная, устойчивость относится к способности организации продолжать функционировать в случае сбоев. Соображения по операционной устойчивости многогранны. Они включают в себя следующее (но не ограничиваются этим): процессы, возможности, поведение и системы. Например, операционная устойчивость — это способность организации по-прежнему предоставлять свои продукты в случае непредвиденных сбоев в цепочках поставок. Точно так же возможность для компании перемещать свои данные локально, в случае если её основной поставщик облачных услуг пострадал от серьезного сбоя, будет влиять на уровень операционной устойчивости этой компании.

Узнать больше

Что такое распознавание шаблонов?

Распознавание шаблонов происходит, когда алгоритм находит повторения или закономерности в больших наборах данных или в разрозненных наборах данных. Оно даже считается синонимом машинного обучения и интеллектуального анализа данных и тесно связано с ним.

Узнать больше

Что такое петабайт?

Будучи чрезвычайно большой единицей цифровых данных, один петабайт равен 1000 терабайтам. По некоторым оценкам, один в одном петабайте содержится информация, эквивалентная 20 миллионам заполненнных шкафов или 500 миллиардам страниц стандартного печатного текста.

Узнать больше

Что такое прогнозная аналитика?

Прогнозная, или предиктивная, аналитика относится к анализу больших данных для прогнозирования и определения вероятности будущих результатов, тенденций или событий.

Узнать больше

Что такое предписывающая аналитика?

Будучи подвидом или продолжением прогнозной аналитики, предписывающая аналитика используется для рекомендации или предписания конкретных действий при достижении определенных состояний информации или гаступлении условий.

Узнать больше

Что такое Python?

Python — интерпретируемый, объектно-ориентированный высокоуровневый язык программирования с динамической семантикой. Python имеет репутацию языка, удобного для начинающих, заменяя язык Java в качестве наиболее широко используемого вводного языка, потому что большую часть сложности для пользователя он берёт на себя, позволяя новичкам сосредоточиться на полном понимании концепций программирования, а не на мельчайших деталях.

Узнать больше

Что такое R?

R — язык программирования с открытым исходным кодом для статистического анализа. Он включает в себя интерфейс командной строки и несколько графических интерфейсов. Популярные типы алгоритмов включают линейное и нелинейное моделирование, анализ временных рядов, классификацию и кластеризацию.

Узнать больше

Что такое розничная аналитика?

Аналитика розничной торговли - это анализ данных, генерируемых операциями в розничной торговле, с целью принятия бизнес-решений, повышающих прибыльность. Использование аналитики розницы развивалось как ответ на трансформацию розничной торговли, обусловленную беспрецедентными изменениями в поведении потребителей, усилением давления на размер маржи, изменением роли магазинов и усилением конкуренции как на онлайн-, так и на офлайн-каналах продаж.

Узнать больше

Что такое управление рисками?

Управление рисками, иногда называемое смягчением рисков, представляет собой процесс расчета максимально приемлемого уровня общего риска для деятельности и от нее, затем с использованием методов оценки риска для точного определения первоначального уровня риска и, если будет установлено, что он является чрезмерным, разработки стратегии смягчения конкретных индивидуальных рисков до тех пор, пока коллективный уровень риска не будет снижен до приемлемого уровня.

Узнать больше

Что такое RTIM?

RTIM, также известный как Real Time Interaction Manager или Management (управление взаимодействием в реальном времени), использует взаимодействие с клиентами в режиме реального времени, прогнозное моделирование и машинное обучение для обеспечения согласованного, персонализированного взаимодействия с клиентами по всем каналам.

Узнать больше

Что такое полуструктурированные данные?

Полуструктурированные данные не соответствуют формату табличной модели данных или реляционных баз данных, поскольку не имеют фиксированной схемы. Однако таки данные не являются полностью необработанными или неструктурированными и содержат некоторые структурные элементы, такие как теги и организационные метаданные, которые облегчают их анализ.

Узнать больше

Что такое анализ настроений?

Анализ настроений - это выяснение и отслеживание мнений, эмоций или чувств, выраженных потребителями, участвующими в различных типах взаимодействий, таких как сообщения в социальных сетях, звонки в службу поддержки клиентов и опросы.

Узнать больше

Что такое стрессовый выход?

Стрессовый выход означает выход из соглашения об аутсорсинге после банкротства или несостоятельности поставщика услуг. Нестрессовый выход — это отход от соглашения более продуманным и управляемым образом по стратегическим, коммерческим или эксплуатационным причинам.

Узнать больше

Что такое структурированные данные?

Термин "структурированные данные" означает наборы данных с сильной и последовательной организацией. Структурированные данные управляются языком структурированных запросов (SQL), с помощью которого пользователи могут легко находить данные и оперировать ими.

Узнать больше

Что такое терабайт?

Один терабайт (ТБ)- это относительно большая единица цифровых данных, он равен 1000 гигабайтам. Было подсчитано, что в 10 терабайт можно вместить всю печатную коллекцию Библиотеки Конгресса США, в то время как в один ТБ можно поместить 1000 экземпляров Британской энциклопедии.

Узнать больше

Что такое неструктурированные данные?

Термин "неструктурированные данные" означает нефильтрованную информацию без фиксированного организующего принципа. Их еще часто называют необработанными данными. Распространенными примерами являются веб-журналы, XML, JSON, текстовые документы, изображения, видео и аудиофайлы

Узнать больше

Что такое 5 "V" в больших данных?

Большие данные представляют собой совокупность данных из множества различных источников и часто описываются пятью характеристиками на "V": объемом (Volume), стоимостью (Value), разнообразием (Variety), скоростью (Velocity) и достоверностью (Veracity).

Узнать больше

Что такое VPC?

Термин VPC (virtual private cloud) означает виртуальное частное облако. VPC — это личное и частное виртуальное сетевое пространство, размещенное в общедоступной облачной среде. Каждое VPC безопасно и логически изолировано от других виртуальных сетей в том же общедоступном облаке.

Узнать больше

Want to see these concepts in action?

Explore Vantage