240 发简信
IP属地:上海
  • 120
    spark之shuffle原理及性能优化

    1.spark的shuffleManager是负责shuffle过程的执行、计算和处理的组件。shuffleManager是trait,主要实现类有两个:HashShuffl...

  • 120
    一图胜千言--设计规则篇:学会这4点人人都是设计师

    提高信息传播效率是人类一直的追求,原始人在石壁上绘制图画记录信息,到文字与纸张的发明,今天大数据是最热门的话题,而数据可视化是其重要一环。所谓一图胜千言,一页PPT抵得上10...

  • 120
    【特征工程】特征选择与特征学习

    特征选择与特征学习 在机器学习的具体实践任务中,选择一组具有代表性的特征用于构建模型是非常重要的问题。特征选择通常选择与类别相关性强、且特征彼此间相关性弱的特征子集,具体特征...