
1.spark的shuffleManager是负责shuffle过程的执行、计算和处理的组件。shuffleManager是trait,主要实现类有两个:HashShuffl...
提高信息传播效率是人类一直的追求,原始人在石壁上绘制图画记录信息,到文字与纸张的发明,今天大数据是最热门的话题,而数据可视化是其重要一环。所谓一图胜千言,一页PPT抵得上10...
特征选择与特征学习 在机器学习的具体实践任务中,选择一组具有代表性的特征用于构建模型是非常重要的问题。特征选择通常选择与类别相关性强、且特征彼此间相关性弱的特征子集,具体特征...