流式计算的三种框架：Storm、Spark和Flink

我们知道，大数据的计算模式主要分为批量计算(batch computing)、流式计算(stream computing)、交互计算(interactive computing)、图计算(graph computing)等。其中，流式计算和批量计算是两种主要的大数据计算模式，分别适用于不同的大数据应用场景。

十多年的仁寿网站建设经验，针对设计、前端、开发、售后、文案、推广等六对一服务，响应快，48小时及时工作处理。营销型网站的优势是能够根据用户设备显示端的尺寸不同，自动调整仁寿建站的显示方式，使网站能够适用不同显示终端，在浏览器中调整网站的宽度，无论在任何一种浏览器上浏览网站，都能展现优雅布局与设计，从而大程度地提升浏览体验。创新互联从事“仁寿网站设计”,“仁寿网站推广”以来，每个客户项目都认真落实执行。

目前主流的流式计算框架有Storm、Spark Streaming、Flink三种，其基本原理如下：

Apache Storm

在Storm中，需要先设计一个实时计算结构，我们称之为拓扑（topology）。之后，这个拓扑结构会被提交给集群，其中主节点（master node）负责给工作节点（worker node）分配代码，工作节点负责执行代码。在一个拓扑结构中，包含spout和bolt两种角色。数据在spouts之间传递，这些spouts将数据流以tuple元组的形式发送；而bolt则负责转换数据流。流式计算的三种框架：Storm、Spark和Flink

Apache Spark

Spark Streaming，即核心Spark API的扩展，不像Storm那样一次处理一个数据流。相反，它在处理数据流之前，会按照时间间隔对数据流进行分段切分。Spark针对连续数据流的抽象，我们称为DStream（Discretized Stream）。 DStream是小批处理的RDD（弹性分布式数据集）， RDD则是分布式数据集，可以通过任意函数和滑动数据窗口（窗口计算）进行转换，实现并行操作。
流式计算的三种框架：Storm、Spark和Flink

Apache Flink

针对流数据+批数据的计算框架。把批数据看作流数据的一种特例，延迟性较低(毫秒级)，且能够保证消息传输不丢失不重复。
流式计算的三种框架：Storm、Spark和Flink
Flink创造性地统一了流处理和批处理，作为流处理看待时输入数据流是**的，而批处理被作为一种特殊的流处理，只是它的输入数据流被定义为有界的。Flink程序由Stream和Transformation这两个基本构建块组成，其中Stream是一个中间结果数据，而Transformation是一个操作，它对一个或多个输入Stream进行计算处理，输出一个或多个结果Stream。

这三种计算框架的对比如下：

流式计算的三种框架：Storm、Spark和Flink
参考文章：

Streaming Big Data: Storm, Spark and Samza

网页标题：流式计算的三种框架：Storm、Spark和Flink
标题路径：http://chengdu.cdxwcx.cn/article/pjesep.html

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

首页

网站建设

网站制作案例

解决方案

网站设计报价

网站制作动态

关于我们

联系我们

成都网站建设设计将想法与焦点和您一起共享

流式计算的三种框架：Storm、Spark和Flink

Apache Storm

Apache Spark

Apache Flink

其他资讯

大数据分析师是干什么的

如何查看htmltoken

虚拟主机如何配置SSL证书？(虚拟主机ssl)

网络赚钱之网上秘书年薪达10万以上

江苏托管服务器价格如何控制？（江苏服务器托管bgp）

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

成都网站建设设计 将想法与焦点和您一起共享

流式计算的三种框架：Storm、Spark和Flink

Apache Storm

Apache Spark

Apache Flink

其他资讯

大数据分析师是干什么的

如何查看htmltoken

虚拟主机如何配置SSL证书？(虚拟主机ssl)

网络赚钱之网上秘书年薪达10万以上

江苏托管服务器价格如何控制？（江苏服务器托管bgp）

成都网站建设设计将想法与焦点和您一起共享