3款值得关注的数据分析工具!

DT时代,物联网的发展不断推动着市场推出新型的分析工具,尤其是开源数据分析工具。物联网发展的同时,带来了众多传感器及其他设备,这些设备在源源不断地生成数据流,因此,市场需要更多更全面的完善数据分析生态系统的新工具。今天就来跟随大圣众包威客平台看看3款勇敢逆袭传统数据分析工具的数据分析新星!

一、ApacheKafka

1.起源

最初由LinkedIn开发的ApacheKafka,在2011年年初开放了源代码。而LinkedIn当初开发Kafka的那些工程师,还成立了专注于Kafka的Confluent。

2.优点

ApacheKafka具有统一、高吞吐量、低延迟等优点,它提供了处理实时数据的功能。而上文提到的Confluent及其他组织,还开发了自定义工具,以便Kafka与数据流结合使用更为方便快捷。作为一种经过加固和测试的工具,ApacheKafka项目已凭借实时数据跟踪功能,成为一颗数据分析新星。

3.影响

得益于强大的功能,使得ApacheKafka在大数据产业的地位越来越重要,现在,许多企业组织都要求员工拥有ApacheKafka方面的知识。在实际应用中,一些知名的公司如思科、网飞、贝宝、优步、Spotify等,都在使用它。

二、ApacheDrill

1.起源

Dremel是来自Google的一种用来分析大数据信息的方法,它能够帮助Google实现海量数据集的分析处理,如抓取Web文档的分析、跟踪AndroidMarket上的应用程序数据信息、分析垃圾邮件,等等。而主角ApacheDrill,正是基于Dremel而实现的开源项目。

2.优点

ApacheDrill的核心模块是Drillbit服务。Drillbit服务模块包括远程访问子模块、SQL解析器、查询优化器、任务计划执行引擎、存储插件接口(DFS、HBase、Hive等的接口)、分布式缓存模块等几部分。因此,让ApacheDrill具有了适于实时的分析和快速的应用开发、适于半结构化/嵌套数据的分析、兼容现有的SQL环境和ApacheHive等特征。ApacheDrill之所以在流数据应用程序中如此出名,是因为它是一种分布式、无模式(schema-free)的SQL引擎。

另外,为什么说ApacheDrill敢于逆袭多个传统而闻名的数据分析工具,如Hadoop和ApacheSpark?因为,ApacheDrill是一个能够对大数据进行交互分析、开源的分布式系统,它能够运行在上千个节点的服务器集群上,并且能够在几秒内处理PB级或者万亿条的数据记录。总的来说,在面对大数据时,ApacheDrill能够帮助企业用户快速、高效地进行Hadoop数据查询和企业级大数据分析。

3.影响

作为Apache的一个顶级项目,ApacheDrill与ApacheSpark一同应用于许多流数据场景。就在今年1月份召开的纽约ApacheDrill大会上,MapR的系统工程师就展示了在用于涉及数据包捕获、近实时查询及搜索的一种使用场合下,ApacheDrill和ApacheSpark是如何协同的。ApacheDrill项目在大数据领域带来了重大的影响,以至于MapR等公司甚至把它纳入到其Hadoop的发行版中。

三、Grappa

1.起源

Grappa——起源于一群基于克雷(Cray)系统运行大数据任务有丰富经验的工程师的构想。这群工程师希望有一款可与Cray系统现成商用硬件的实现分析功能一较高下的硬件,于是,Grappa开源项目华丽诞生了。

2.优点

可以在大众化集群上扩展数据密集型应用程序的Grappa,提供了一种新型的抽象机制,比经典的分布式共享内存(DSM)系统更胜一筹。Grappa还采用了BSD许可证,让其在GitHub上可以免费获取。只要在应用程序的README文件中,遵照通俗易懂的快速启动说明构建Grappa应用程序,就可以在集群上运行,可以获得Grappa的源代码,这样,你就可以亲身感受这款开源项目的魅力了。

3.影响

进入大数据时代,众多企业组织正致力研究从数据流提取宝贵信息的新方法。在这些数据流里面,包含了许多在处理集群上生成的数据,及处理商用硬件上生成的数据。这样一来,成本合理的、以数据为中心的方法便受到了重视,这也是Grappa开始被广泛使用的原因之一。

流数据分析工具,可以用来帮助新型药物的发现,甚至分析TB级的复杂的外太空无线电信号流等等,于人类,于社会,都在贡献着它独特而又强大的功能。

原文地址:http://www.dashengzb.cn/articles/a-272.html

(更多大数据与商业智能领域干货、或电子书,可添加个人微信号(dashenghuaer))

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,802评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,109评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,683评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,458评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,452评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,505评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,901评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,550评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,763评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,556评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,629评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,330评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,898评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,897评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,140评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,807评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,339评论 2 342

推荐阅读更多精彩内容