Delta Lake的横空出世,又点爆了一个新的热点。今天,就用砖厂【Databricks】的大神Michael Armbrust上周的讲座【全球巡演Boston站】来揭开它...
Delta Lake的横空出世,又点爆了一个新的热点。今天,就用砖厂【Databricks】的大神Michael Armbrust上周的讲座【全球巡演Boston站】来揭开它...
这个月,Hadoop又引爆了一轮讨论。。。原本的三个Hadoop公司Cloudera,Hortonworks和MapR遇到了他们自己的危机,引发了对整个Hadoop未来命运的...
流媒体老大Netflix在今年Spark+AI Summit分享了他们用Spark替代了Hive和Pig的经验和教训!Netflix是Amazon web service的最...
夜深了,,,顺着昨夜的结尾,今夜讲讲API。Spark的APIs就是用户和Spark交流的语言。最初,Spark的语言是RDD APIs,用户告诉Spark怎么做;后来,Sp...
白昼了三个月,夜终于又深了。。。过去三个月的连续忙碌,积攒了太多好消息和大家分享。。。Spark + AI Summit 2019胜利结束!参会人数又破历史新高!当我们宣布D...
2019年的3月28日是Strata Data @ 三藩的最后一天。一场介绍Spark 2.4和3.0的讲座,当然是满座了,并且也站满了。闲话少说,直接上Slides:htt...
继Apache Mesos和Apache Spark,MLFlow做为一个Matei大神最新的开源项目。。。社区反应相当强烈,一个月都高达42万下载量!!!欢迎大家使用和贡献代码!
当今的自主驾驶是典型的数据驱动的产业,八仙过海各显神通。无论技术多么先进,他们所有决策和算法都是来基于senor产生的数据。比如,以Udacity Lincoln MKZ为例...
今夜 [中国时间:三月七号凌晨2点,加州西岸:三月六号早上10点],Reynold讲给大家预告Spark + AI Summit! 直播注册:Spark + AI Summi...
今天分享的是当年Weather.com 的Spark团队分享使用Spark的经验。。。Weather.com在alexa排名全美也有top 35。实至名归的大数据公司。 20...
全世界有五千人将在2019年的四月来美国旧金山出席Spark + AI Summit【没有注册的同学们可以开始动手了】。有别于其它大数据和AI会议,这里的讲座和PPT上往往充...
海量数据,无论批处理还是流处理,沃尔玛认为,完美选择就是Apache Spark! - Spark Streaming从Kafka读数据存入Cassandra, - Spar...
今天,Caffe2和PyTorch突然成了热点词。。。深度计算的几个引擎:Caffe2,PyTorch,TensorFlow,Apache MXNet。这几年深度学习这么热,...
做为开发Spark的最主要公司,砖厂【Databircks】是如何开发的呢?也是用SBT?还是用Maven?其实我们用的是Bazel。可以脑补,一百多个人日以继夜地往代码库里...
Spark做为一个通用的大数据引擎,用例太多,很难说得全。。。我们也就只能随机选取几个来分享。。。今夜,分享一本微软出品的Spark经典用例电子书: Three practi...
砖厂,Nvidia,阿里巴巴,谷歌的committers和攻城狮们在Apache Spark社区联合提交了SPIP: Accelerator-aware Scheduling...
这两天Horovod 0.16.0release了!!!来看官方release blog:Horovod Adds Support for PySpark and Apach...
Dataworks Summit 2019 三月在西班牙巴塞罗那举办。。。当年的Hadoop Summit盛极一时,后来随着Hadoop的黯淡,更名为Dataworks Su...
先科普一下大名鼎鼎的Two Sigma吧。2001年创立,现在管理多达500亿美金的资产,排名对冲基金公司的全球第四!!!做为一家知名的对冲基金,为何他们给Apache Sp...
IBM 宣布将会把Watson 部署到各种云上!听起来,怎么这么奇怪。。。并且这篇新战略竟然是由做IBM AI+Data的GM Rob Thomas 来给大家宣布,意味深长。...