240 投稿
收录了7篇文章 · 9人关注
  • Resize,w 360,h 240
    Ray - 面向增强学习场景的分布式计算框架

    如果关注这个领域的同学可能知道,Ray其实在去年就已经在开源社区正式发布了,只不过后来就一直没有什么太大动静,前段时间也是因为机缘巧合,我又回头...

  • Resize,w 360,h 240
    关于服务,产品,项目开发的碎碎念

    最近有点小忙,更新得慢了,翻出一篇之前没有发在公众号的旧文,凑个数 前排提示一下:下面的内容,是一篇鸡汤文章,本质上,鸡汤这玩意,知易行难,先贤...

  • Resize,w 360,h 240
    论一个糟糕的大数据码农的自我修养

    幸福的家庭都是一样的,不幸的家庭各有各的不幸。- 论一个糟糕的大数据平台工程师的自我修养 本来想写写如何成为一名优秀的大数据平台开发工程师,但说...

  • Resize,w 360,h 240
    日志采集与用户行为链路分析

    日志采集这部分内容,其实在上一篇文章 大数据之路读书笔记 里面多多少少已经提到了一些。不过正如前文提到的,这部分内容,从技术的角度来说,未必有多...

    1.7 彩色蚂蚁 4 28 1
  • Resize,w 360,h 240
    那些年,我们迁移过的集群

    大数据集群迁移这件事,不知道有多少同学做过。我说的不是把一个集群的数据备份到另一个集群上。我指的是整个数据平台与大数据相关的所有集群及业务的迁移...

  • Resize,w 360,h 240
    数据可视化平台理论与实践

    前面说完了大数据开发平台的核心组件,作业调度系统,接下来讨论一下大数据开发平台的脸面之一,数据可视化平台。和调度系统一样,这又是一个很多公司可能...

  • Resize,w 360,h 240
    谷歌DataFlow编程模型以及Spark/Flink/StreamCQL的相关实现

    流式计算框架编程接口的标准化,傻瓜化,SQL化,自打谷歌发表Dataflow编程模型的Paper起,就有走上台面的趋势。各家计算框架都开始认真考...