Hitachi Vantara работает с неструктурированными данными

Неструктурированные данные, как правило, представлены в форме текста, который может содержать такие данные, как даты, цифры и факты. Это приводит к трудностям анализа, особенно в случае использования традиционных программ, предназначенных для работы со структурированными данными (аннотированными или хранящимися в базах).

На сегодняшний день имеется несколько коммерческих решений, которые доступны для работы с неструктурированными данными в бизнесе. В основном, они предназначены для анализа неструктурированных данных СМИ. Некоторые решения позволяют вычленить структурированные данные из неструктурированных источников, а затем интегрировать и трансформировать их вместе со структурированными данными для бизнес-аналитики и аналитических целей.

Компания Hitachi Vantara, дочернее предприятие Hitachi, Ltd., анонсировала новое решение для распределенных файловых систем и управления хранением, которое позволит заказчикам ускорить доступ к информации и извлечь знания при работе с неструктурированными данными, такими как электронные письма, документы, медицинские карты, аудио- и видеоматериалы, изображения.

Новое решение будет предоставляться в партнерстве с компанией Weka, ведущим разработчиком инновационных высокопроизводительных и масштабируемых систем хранения файлов для информационных сред, осуществляющих обработку больших объемов данных. OEM-партнерство Hitachi с Weka позволит пополнить ассортимент продуктов Hitachi Vantara высокопроизводительными параллельными файловыми системами на базе NVMe, которые будут интегрированы с хранилищем данных HCP. Такое решение на основе сетевой системы хранения (NAS) идеально подойдет для использования в системах искусственного интеллекта, машинного обучения и аналитических приложениях в разных отраслях.

«Организации, стремящиеся в своей деятельности ориентироваться на данные, сталкиваются с необходимостью задействовать стремительно растущие массивы неструктурированной информации, чтобы получить конкурентные преимущества, – отмечает Брайан Хаусхолдер (Brian Householder), президент направления цифровых инфраструктур Hitachi Vantara. – Hitachi Vantara помогает своим заказчикам реализовать преимущества своих инфраструктур, обеспечивая повышение производительности при работе с данными и возможность быстрее принимать верные решения».

Hitachi Vantara также объявила о расширении платформы Hitachi Content Platform (HCP) – облачного программного решения для хранения объектных данных, позволяющего объединить производителей данных, пользователей, приложения и устройства в единой среде. Благодаря высокопроизводительным узлам на базе флэш-памяти платформа HCP сможет более эффективно поддерживать неструктурированные рабочие нагрузки. Новые функциональные возможности HCP обеспечат повышение пропускной способности при передаче данных по протоколу Amazon Simple Storage Service (S3) почти в 4 раза, что может привести к снижению затрат на 34%.

«Директорам по информационным технологиям и ИТ-специалистам больше не нужны объектные хранилища только для данных, хранение которых установлено нормативными требованиями, архивных данных, данных второго уровня или «холодных» данных, – считает Амита Потнис (Amita Potnis), директор по исследованиям инфраструктурных систем компании IDC. – Сейчас они рассматривают такие хранилища с точки зрения новых вариантов применения и поддержки высокопроизводительных рабочих нагрузок. Эти организации также оценивают возможность внедрения распределенных файловых решений, обеспечивающих необходимую масштабируемость и производительность для обеспечения работы требовательных вычислительных приложений, систем ИИ и аналитики реального времени».

Обновленные узлы СХД обеспечат повышение производительности операций чтения и записи в три раза, и при этом они позволят втрое увеличить емкость для стоечного пространства, по сравнению с предыдущим поколением. Это особенно важно в условиях, когда традиционные NAS, основные и облачные рабочие нагрузки постепенно переходят в объектные хранилища из-за необходимости в повышении производительности.

Новое расширение HCP позволит заказчикам быстрее превращать данные в ценные для бизнеса знания, увеличивать доходы компании, генерируемые благодаря использованию неструктурированных данных, а также повышать производительность приложений, совершенствуя цифровую среду для пользователей.

 

 

Поделиться:
Спецпроект

Напряженный трафик или Современные требования к инфраструктуре ЦОД

Подробнее
Спецпроект

Специальный проект "Групповой спутниковый канал для территориально-распределенной сети связи"

Подробнее

Подпишитесь
на нашу рассылку