IP属地:上海
有意向的学弟学妹们欢迎向 gaohangwang@gmail.com 投递简历
前言 近两年,KUDU 在大数据平台的应用越来越广泛。在阿里、小米、网易等公司的大数据架构中,KUDU 都有着不可替代的地位。本文通过分析 KU...
前言 为了提升我们的软件性能,我们有多种方法,如合理的数据结构、优秀的算法,还有非常重要的一点就是:依据软件所依附的硬件自身特性,设计能最大限度...
前言 TensorFlow 是谷歌开源的深度学习工具包,它将深度学习复杂的计算过程抽象成了数据流图(Data Flow Graph),并提供简介...
前言 在上文中我们介绍了 Kafka 的网络通信,本文打算详细分析 Kafka 的核心 — 队列的设计和实现,来对 Kafka 进行更深一步的了...
前言 Kafka 是 LinkedIn 开发的一个分布式的消息中间件。由于其高吞吐量、可水平扩展等特性,目前被广泛使用,已经是目前大数据生态系统...
前言 互联网发展至今,搜索引擎仍然是获取信息最重要的途径之一,而搜索结果的排序是搜索引擎的核心技术之一,常见的排序算法有 PageRank、向量...
前言 决策树是一种简单高效并且具有强解释性的模型,广泛应用于数据分析领域。其本质是一颗由多个判断节点组成的树,如: 在使用模型进行预测时,根据输...
前言 目前主流的搜索引擎实时性一般都不是很高。对于一般的网站内容,延迟一段时间问题不大,但对于 twitter 这种网站,热点信息会被迅速地发布...