240 发简信
IP属地:北京
  • Resize,w 360,h 240
    不同切词方法对短文本多类别分类的影响研究

    背景:商品智能赋码是利用大数据+算法,对不同商品按照国家税率分类表做分类的工作,其难点在于: 国家税率分类有3000多个类别 训练样本基于 10...

  • Resize,w 360,h 240
    基于阿里云的税务大数据架构

    数据源包括原始发票数据,企业注册数据,开票助手数据,各种log数据,爬虫数据等; 原始数据层:使用阿里云RDS,DRDS为主,MongoDB,H...

  • Resize,w 360,h 240
    利用逻辑回归进行图片分类

    逻辑回归,又称logistic回归分析,是一种广义的线性回归分析模型。下面是回归分析的分类思维导图: 逻辑回归是很多分类算法的基础组件,它的好处...

  • Resize,w 360,h 240
    Python 为什么是数据科学首选语言?

    目前适用数据科学计算的语言有不少,包括:SAS,R,JAVA,C/C++,Python等| 总之,Python 虽然也有不少缺点,但优点完胜其它...

  • 一张图说数据

    数据是什么? 数据(data)是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的的原始素材。 数据有很多种分类,但大的类...

  • Resize,w 360,h 240
    数据科学简谈

    随着互联网、大数据技术的快速发展,数据量成指数级增长,近年来,数据科学成为一个热门的话题。简单的说,数据科学是关于如何处理数据、获取知识,...

  • Resize,w 360,h 240
    Windows 下安装配置Python的最佳实践

    下面是安装 Python 的步骤: 第一步,下载 anaconda 并进行安装 Anaconda下载地址: https://repo.anaco...

个人介绍
一名在数据处理、数据挖掘多年工作的老程序员。
2年用友ERP JAVA开发,7年SAS解决方案开发,3年阿里巴巴高级数据挖掘专家,5年创业公司各种打拼。。。