Десять лет назад в нашу жизнь вошло понятие «большие данные» — Big Data. И действительно, объем данных, ежедневно обрабатываемых компаниями, постоянно растёт. И, что немаловажно, сведения стекаются из разнообразных источников: смартфоны, автомобили, системы видеонаблюдения и слежения, информация с датчиков геопозиции, трехмерные модели и т. д.
На примере сервера Dell PowerEdge R740xd покажем, какие характеристики нужно учитывать при выборе аппаратных решений, позволяющих решить задачу обработки информации значительных объемов.
Big Data — это массивы информации разного вида, которая поступает из множества разнообразных источников. Крупный бизнес использует такие источники, чтобы непрерывно собирать, анализировать полученную информацию и на её основе принимать необходимые и своевременные решения, например, для совершенствования продукта или прогнозирования рыночных условий. Причем «большие данные» используют не только корпорации, но и государственные учреждения.
Суть Big Data заключена в трех словах:
объем — потому что анализу подвергаются большие (начиная от 10 Тб) массивы информации; скорость — потому что информация поступает и меняется стремительно; разнообразие — потому что количество источников информации может быть неограниченно, трудно классифицируемо и подсчитываемо.
Опираясь на эти принципы, системы работы с «большими данными» собирают данные, используя стандартные протоколы и интерфейсы приложений, интегрируют их, приводя к единому формату для хранения, и проводят обработку и анализ полученной информации в режиме реального времени. Инфраструктура для Big Data должна не просто работать с большими информационными массивами, но и уметь распределять данные, параллельно обрабатывая их в многопоточном режиме. Таким образом, аппаратная составляющая — ключевой момент для организации работы с «большими данными».
Сервер, который можно выбрать для такой работы:
имеет собственное хранилище данных достаточно большого объема с высокими быстродействием и скоростью доступа; легко масштабируется, подстраиваясь под возрастающие потребности; обладает высокой производительностью; поддерживает существующие консоли управления, что позволяет применять разнообразные программные платформы; имеет возможности автоматического управления, что позволяет сократить расходы на его обслуживание; обладает системами встроенной диагностики автоматического восстановления в случае сбоев.
Это новость от журнала ММ «Машины и механизмы». Не знаете такого? Приглашаем прямо сейчас познакомиться с этим удивительным журналом.