Аппаратное решение для обработки «больших данных»
На примере сервера Dell PowerEdge R740xd покажем, какие характеристики нужно учитывать при выборе аппаратных решений, позволяющих решить задачу обработки информации значительных объемов.
Big Data — это массивы информации разного вида, которая поступает из множества разнообразных источников. Крупный бизнес использует такие источники, чтобы непрерывно собирать, анализировать полученную информацию и на её основе принимать необходимые и своевременные решения, например, для совершенствования продукта или прогнозирования рыночных условий. Причем «большие данные» используют не только корпорации, но и государственные учреждения.
Суть Big Data заключена в трех словах:
- объем — потому что анализу подвергаются большие (начиная от 10 Тб) массивы информации;
- скорость — потому что информация поступает и меняется стремительно;
- разнообразие — потому что количество источников информации может быть неограниченно, трудно классифицируемо и подсчитываемо.
Опираясь на эти принципы, системы работы с «большими данными» собирают данные, используя стандартные протоколы и интерфейсы приложений, интегрируют их, приводя к единому формату для хранения, и проводят обработку и анализ полученной информации в режиме реального времени. Инфраструктура для Big Data должна не просто работать с большими информационными массивами, но и уметь распределять данные, параллельно обрабатывая их в многопоточном режиме. Таким образом, аппаратная составляющая — ключевой момент для организации работы с «большими данными».
Сервер, который можно выбрать для такой работы:
- имеет собственное хранилище данных достаточно большого объема с высокими быстродействием и скоростью доступа;
- легко масштабируется, подстраиваясь под возрастающие потребности;
- обладает высокой производительностью;
- поддерживает существующие консоли управления, что позволяет применять разнообразные программные платформы;
- имеет возможности автоматического управления, что позволяет сократить расходы на его обслуживание;
- обладает системами встроенной диагностики автоматического восстановления в случае сбоев.
Коротко
Интернет-агентство ДримТрейд