Отвечая на вопрос о том, как технология блокчейн используется с big data, правильнее говорить, как и чем эти технологии могут дополнить друг друга. Чтобы это понять, важно проанализировать проблемы, с которыми сталкиваются большие данные и которые можно попытаться решить с помощью блокчейна.
Big data имеет дело с огромным объемом данных, который постоянно увеличивается в геометрической прогрессии. Таким образом, становится чрезвычайно сложно хранить все данные в безопасном режиме. Блокчейн же предоставляет иной в сравнении с big data подход к управлению данными и работы с ними: не в централизованной системе, где все данные должны быть сведены вместе, а в децентрализованной, когда данные могут анализироваться сразу на периферии отдельных устройств. Самым большим преимуществом блокчейна является безопасность данных, хранящихся в нем. Они защищены криптографически.
Также распределенные данные гораздо сложнее атаковать. Вся информация, которая хранится в блокчейне, не принадлежит одному узлу, поэтому возможности их украсть нет. Также блокчейн помогает избегать такого способа атаки, как инициирование сбоя транзакции, после чего токен безопасности используется несколько раз. Это является реальной проблемой при передаче данных в централизованных системах.
Поскольку объем big data велик, обнаружение мошенничества и очистка входных данных являются чрезвычайно трудоемкой задачей. Блокчейн же предоставляет проверенные данные, гарантирует их структурированность и полноту.
Еще одной проблемой больших данных является управление стоимостью. Настройка хранилищ, проверка, обеспечение надежности и живучести систем работы с данными — то, что увеличивает стоимость самих данных для потребителя. Блокчейн за счет своей распределенности и обеспечения целостности позволяет существенно снизить стоимость владения.
Надо сказать еще об одной проблеме, которую блокчейн может помочь решить в системах big data, — возникновение случайной эндогенности, для защиты от которой применяются сложные алгоритмы. Блокчейн как технология, гарантирующая целостность и, главное, структурированность данных, сможет упростить ее решение.
Если учесть все эти факторы, можно сделать вывод, что любые данные, поступающие из блокчейна, априори являются ценными. Иными словами, big data обеспечивает наличие количественных данных, а блокчейн — предобработку «сырых» данных для достижения наивысшего качества.
Остается вопрос производительности. Сегодня развитые и распространенные блокчейн-технологии не могут похвастаться высокой производительностью, которая необходима системам аналитики больших данных. Однако блокчейны 4-го и появляющегося 5-го поколения уже могут обрабатывать несколько сотен тысяч транзакций в секунду. Реальную же производительность в промышленных системах еще предстоит измерить. Но в целом один из трендов развития блокчейн-технологий как раз в повышении производительности, что сделает их еще более привлекательными для использования в системах работы с большими данными.