я могу 
Все гениальное просто!
Машины и Механизмы
Все записи
текст

Аппаратное решение для обработки «больших данных»

Десять лет назад в нашу жизнь вошло понятие «большие данные» — Big Data. И действительно, объем данных, ежедневно обрабатываемых компаниями, постоянно растёт. И, что немаловажно, сведения стекаются из разнообразных источников: смартфоны, автомобили, системы видеонаблюдения и слежения, информация с датчиков геопозиции, трехмерные модели и т. д.
Аппаратное решение для обработки «больших данных»
Фото: dellparts.ru

На примере сервера Dell PowerEdge R740xd покажем, какие характеристики нужно учитывать при выборе аппаратных решений, позволяющих решить задачу обработки информации значительных объемов.

Big Data — это массивы информации разного вида, которая поступает из множества разнообразных источников. Крупный бизнес использует такие источники, чтобы непрерывно собирать, анализировать полученную информацию и на её основе принимать необходимые и своевременные решения, например, для совершенствования продукта или прогнозирования рыночных условий. Причем «большие данные» используют не только корпорации, но и государственные учреждения.

Суть Big Data заключена в трех словах:

  • объем — потому что анализу подвергаются большие (начиная от 10 Тб) массивы информации;
  • скорость — потому что информация поступает и меняется стремительно;
  • разнообразие — потому что количество источников информации может быть неограниченно, трудно классифицируемо и подсчитываемо.

Опираясь на эти принципы, системы работы с «большими данными» собирают данные, используя стандартные протоколы и интерфейсы приложений, интегрируют их, приводя к единому формату для хранения, и проводят обработку и анализ полученной информации в режиме реального времени. Инфраструктура для Big Data должна не просто работать с большими информационными массивами, но и уметь распределять данные, параллельно обрабатывая их в многопоточном режиме. Таким образом, аппаратная составляющая — ключевой момент для организации работы с «большими данными».

Сервер, который можно выбрать для такой работы:

  • имеет собственное хранилище данных достаточно большого объема с высокими быстродействием и скоростью доступа;
  • легко масштабируется, подстраиваясь под возрастающие потребности;
  • обладает высокой производительностью;
  • поддерживает существующие консоли управления, что позволяет применять разнообразные программные платформы;
  • имеет возможности автоматического управления, что позволяет сократить расходы на его обслуживание;
  • обладает системами встроенной диагностики автоматического восстановления в случае сбоев.


Коротко

Машины и Механизмы
Всего 0 комментариев
Комментарии

Рекомендуем

OK OK OK OK OK OK OK