Gearpump是一个实时处理引擎，你知道吗？

3 年 ago

文, 翔

1 minute

你好，最近有人告诉我一个看起来很有趣的产品叫Gearpump，所以我想研究一下它。

请参考以下链接：
http://www.gearpump.io/
http://conferences.oreilly.com/strata/big-data-conference-sg-2015/public/schedule/detail/45109

Gearpump是什么？

这是一款由Intel推出的用于实时的大数据流处理的开源软件。它基于DAG结构的图形，并作为执行引擎。

在类似产品中有哪些选项？

作为一个层，它是执行实际处理的引擎部分，特别是用于执行流处理的产品。

作为流处理系统的产品，下面是一些产品的公开情况。实际上，ActiveMQ和Kafka是用于流动数据的基础产品，所以它们的定位稍有不同，但是下面提到的类似产品，如Yahoo S4、Storm、Spark Streaming等应该被归类为借鉴了它们的先前产品的产品。

它有哪些特点？

根据网站上显示的信息，它似乎具备以下特点。

高レベル、低レベルの両方のAPIを提供

大部分是这些流处理基础设施常常被宣称的项目，但是其中最引人注目的是流处理基础设施可以实现“仅一次”的操作。
在过去，像Storm等流处理基础设施无法实现“仅一次”的操作，而实际上通过了实现的Spark Streaming也有批处理的实质，这是其中的原因之一。
因此，对于以逐条消息方式进行实时/流处理的基础设施，我并不知道有实现“仅一次”的产品，所以对于实际上是什么样的情况很感兴趣。