Демократизация данных, или От гонки моторов к гонке идей

   Технологии больших данных давно перестали быть экзотикой даже для самых осторожных организаций. В ноябре прошлого года многие отраслевые журналисты успели похоронить этот термин. Однако, несмотря на заявления о том, что большие данные мертвы, дело их живет и бурно развивается. Рассмотрим самые значимые тенденции в развитии Big Data и попробуем сформулировать ряд прогнозов в этом сегменте.   Статус и динамика Apache Spark На мой взгляд, в 2016 г. не стоит утверждать, что «Spark – это будущее больших данных». Apache Spark – это уже давно суровое настоящее, составная часть большинства Hadoop-дистрибутивов, поскольку используется множеством компаний в качестве части продуктивной среды, а не перспективной игрушки на тестовом кластере. Начиная с версии 1.5 можно говорить о том, что Apache Spark избавился от большинства «детских болезней» – продукт стал значительно более стабильным и предсказуемым в работе. Однако не следует думать, что период бурного роста Apache Spark прошел. Одна из интересных, на мой взгляд, тенденций в развитии данного фреймворка – появление значительного количества узкоспециализированных инструментов на его основе: Apache Magellan – фреймворк, обеспечивающий возможность работы с географическими и геометрическими данными с использованием механизмов Apache Spark. Magellan позволяет решать большинство традиционных задач ГИС в высокопроизводительной распределенной среде. Поддерживается большинство характерных для подобных систем операций: определение попадания […]


Полная версия доступна только зарегистрированным пользователям !








 

ИД «Connect» © 2015-2017

Использование и копирование информации сайта www.connect-wit.ru возможно только с письменного разрешения редакции.

Техподдержка и обслуживание Роман Заргаров


Яндекс.Метрика
Яндекс.Метрика