Avatar notebook default
10篇文章 · 4527字 · 1人关注
  • Catboost-在线预测

    生产环境很多时候是需要实时对数据进行预测的,即离线训练好模型后将模型保存为模型文件,然后在线服务将模型加载到内存 引入pom.xml 样例代码 ...

  • Catboost-算法原理

    总结一下catboost关键的知识点 Target Statistics 常规处理类别特征的方法是one-hot,但是也可以将类别特征转化为和l...

  • 社区发现算法-标签传播

    简介 基本的标签传播算法(LPA)[1]的思想非常简单,就是让每个结点与它的大多数邻居在同一个社区中。具体算法流程为:初始化,每个结点携带一个唯...

  • Resize,w 360,h 240
    社区发现算法-局部拓展

    简介 局部拓展的方法是社区发现中的一大类方法,并且现在也比较活跃。这些方法的一个基本的假设就是社区是围绕着一些中心结点形成的,它们一般都是向当前...

  • Resize,w 360,h 240
    社区发现算法-GN

    社区发现 GN算法 参考文献 Community structure in social and biological networks Fin...

  • 社区发现算法-团渗透

    简介 k-团渗透算法(CPM)[1]是第一个能够发现重叠社区的算法,重叠社区指的是结点可以同时属于多个社区。重叠社区在社交网络中是十分常见的,因...

  • Resize,w 360,h 240
    频繁模式挖掘

    简介 关于频繁模式挖掘的一个经典例子应该就是"啤酒和尿布"了,虽然看到很多人都说这个是编造的,但是也不妨碍用它来说明频繁模式挖掘到底是干什么的。...

  • 聚类算法-kmeans

    简介 优化目标: 算法过程 首先随机选出k个数据作为类别中心 然后将其他数据分配到距离他们最近的类别中 将类别中心更新为所有这个类别中的数据的均...

  • 聚类算法-DBSCAN

    简介 相关定义 Eps近邻:数据p的Eps近邻指的是那些与其距离小于Eps的数据 核心数据点:那些Eps近邻数量大于MinPts的数据点 直接密...

文集作者