Что такое система Hadoop?

Прошло более 15 лет с тех пор, как на сцену ИТ-бизнеса ворвался продукт Hadoop. Одно время казалось, что все только и говорят о этом фреймворке с открытым исходным кодом с распределенной файловой системой, которая могла бы обеспечить недорогие массовое хранение и обработку данных. А что же с ним сейчас? Ну, вообще-то, теперь он представляет из себя не так уж и много.

Hadoop против хранилища собственных объектов

Системе Hadoop (High-availability distributed object-oriented platform, распределенная файловая система) приписывают рождение десятков стартапов и прирост капитальных инвестиций на сотни миллионов долларов. Основным преимуществом Hadoop является ее способность недорого хранить структурированные, полуструктурированные и неструктурированные данные. Поскольку данные хранятся в распределенной между кластерами компьютеров среде, для получения более быстрых результатов эти данные обрабатываются параллельно. Hadoop также упрощает для пользователей извлечение данных.

Когда более десяти лет назад термин «большие данные» вошел в моду, Hadoop предоставил решение для экономически эффективного хранения и обработки постоянно развивающихся типов данных. Это позволило организациям быстрее определять ценность этих данных и принимать решения о желательности проведения их более глубокого анализа. Но, как объясняется в блоге, недостатком системы является то, что Hadoop плохо справляется с управлением основными данными для предприятия.

«В вопросе управления данными с целью наилучшего распределения по всему предприятию, ничто не сравнится с базой данных, а Hadoop — это не база данных. Он не дает безопасности типов данных и не осуществляет никакого управления рабочей загрузкой», — говорится в блоге.

Современный подход - это хранилище собственных объектов

Технологические инновации иногда происходят очень быстро. Иногда невероятно быстро, поэтому по мере появления новых решений некогда популярный Hadoop "впал в немилость" . Одной из таких технологий является объектное хранение. Объектное хранилище предлагает то, что есть замечательного в Hadoop — недорогую возможность хранения наряду с поддержкой гибких типов данных. Более того, объектное хранилище выходит за рамки преимуществ, предоставляемых Hadoop, — хранение в нем в три раза дешевле, при этом объектное хранилище поддерживает такие типы данных, которые используются искусственным интеллектом., такие как аудио, видео и файлы изображений.

Многие организации отходят от своих устаревающих систем Hadoop и обращаются к технологиям объектного хранения данных, с тем, чтобы снизить затраты и модернизировать свои среды больших данных. Эта эволюция в озерах данных и в хранении данных приводит к тому, что хранилища объектов становятся все более предпочитаемым репозиторием для сбора, уточнения и изучения необработанных данных в любой форме.

Объектное хранилище имеет важное значение для аналитики, поскольку оно позволяет объединять для анализа огромные объемы данных. Чем больше данных анализируется, тем точнее результаты.

В продукте Teradata Vantage™ 2.0 предлагается Native Object Store (NOS). NOS — это одна из возможностей Vantage, которая позволяет пользователям выполнять поиск в режиме "только для чтения" и запрашивать наборы данных в форматах CVS, JSON и Parquet, расположенные на внешних платформах объектных хранилищ. Это позволяет пользователям применять аналитические возможности Vantage для данных в объектных хранилищах, таких как Amazon S3 и Azure Blog Storage. NOS предлагает современный и экономичный подход для компаний, которые стремятся к постепенному отказу от своей инфраструктуры Hadoop.

Переход с Hadoop обеспечивает повышение производительности и масштабируемости

Компаниям мирового класса нужны технологии, которые могут идти в ногу с растущими объемами данных, помогают ускорить цифровую трансформацию и способствуют реализации других приоритетов бизнеса. Вот почему инновационные организации переходят на подключенную мультиоблачную платформу данных для корпоративной аналитики. Этот тип платформы обеспечивает гипермасштабируемость и высокую производительность, с которыми Hadoop сравниться не может.

Организации, все еще использующие Hadoop, обнаруживают, что присущая ему сложность иногда ограничивает их способность быстро реагировать на изменяющиеся запросы бизнеса. В результате многие из этих компаний стремятся перейти на платформу, которая предлагает масштабируемость, производительность и экономическую эффективность, необходимые бизнес-пользователям и аналитикам, и при этом не обладает избыточной сложностью.

При выборе альтернативы Hadoop компаниям следует учитывать пять факторов. Это следующие соображения: простота использования, интеграция аналитической экосистемы, гибкие варианты развертывания, производительность и масштабируемость, а также накопленный опыт миграции, помогающий провести ее максимально быстро и безболезненно.

Некоторые компании переходят на Vantage, чтобы приобрести аналитическую гибкость и другие преимущества. Компания Teradata предлагает программу перехода с Hadoop на современную платформу в три простых шага. С помощью этой программы существующие данные и рабочие загрузки будут быстро и беспрепятственно перенесены из Hadoop в Vantage и в облачное объектное хранилище с использованием проверенных методологий и инструментов миграции.

Унификация всех данных с целью перехода на подключенную экосистему анализа данных

Для использования единого источника истинных данных все эти данные должны быть интегрированы. Разрозненные данные быстро устаревают и становятся сложнее для понимания. Вот почему современным предприятиям необходима возможность интегрировать все свои данные, включая данные в озерах данных на основе Hadoop, с помощью подключенной мультиоблачной платформы данных. Например, продукт Vantage объединяет все, включая озера данных, хранилища данных, аналитику и новые источники данных, что предоставляет бизнесу неограниченный интеллект.

Хотя Hadoop и обеспечивал решение проблем в первые дни эпохи больших данных, он больше не является передовым. Сегодняшним компаниям нужна платформа с присущей ей гибкостью для обработки текущих и будущих массивных рабочих загрузок данных смешанных типов. Это включает в себя возможность создания "бесшовного", эффективно интегрированного процесса приема, изучения, разработки и "ввода в эксплуатацию". Подключение и анализ всех данных в укрупненном масштабе дает компаниям полное представление о своем бизнесе в озерах данных, хранилищах объектов, облачных сервисах и любой другой части экосистемы для получения максимальной аналитической информации.

Готовы ли вы к переходу от Hadoop? Понадобится всего лишь три простых шага!