Big Data
Big Data (Большие данные) — это термин, описывающий наборы данных такого объема и сложности, что традиционные инструменты обработки данных не могут с ними справиться. Big Data характеризуются «тремя V»: Volume (объем), Velocity (скорость поступления) и Variety (разнообразие форматов). Обработка таких данных требует технологий вроде Hadoop, Spark и облачных вычислений.
Что такое «Big Data» простыми словами
Если данные помещаются в Excel на вашем ноутбуке — это не Big Data. Big Data — это когда данных так много (петабайты), что один компьютер физически не может их сохранить. Это все лайки в Фейсбуке за год, все транзакции Visa за день, данные с адронного коллайдера. Чтобы работать с ними, нужны не мощные компьютеры, а целые кластеры из тысяч машин, которые делят задачу на кусочки и решают её сообща.