一、数据分析的目的 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。 本篇文章中,假设以朝阳医院201...
一、数据来源及说明 数据来源:https://tianchi.aliyun.com/dataset/dataDetail?dataId=46&userId=1 本文从数据集中...
1.业务到底是什么 把产品以合理的方式通过渠道卖给消费者赚取利润。所以业务包括:利润、企业架构、产品、渠道、运营、用户等业务需求:业务方提的需求 2.利润 利润=收入-成本收...
数据分析的步骤1、提出问题——明确数据分析目的2、理解数据——理解数据列名的意义3、数据清洗——统一格式内容4、构建模型——思考用什么样的表现形式把数据呈现出来5、数据可视化...
一、将csv格式的文件导入mysql 第一步:建表,本案例需要键两个表。 -- 表一create table order_info(order_id int pri...
mysql服务器主要配置选项bind-adress 表示服务器绑定的ip,默认为127.0.0.1port 表示端口,默认为3306datadir 表是数据库目录,默认为/v...
一、数据定义语言DDL 二、数据操作语言DML 三、数据查询语言DQL 四、数据控制语言DCL 数据控制语言DCL用来授予或回收访问数据库的某种特权,并控制数据库操纵事务发生...
理论基础 条件概率:朴素贝叶斯最核心的部分是贝叶斯法则,而贝叶斯法则的基石是条件概率。贝叶斯法则如下: 词集模型:对于给定文档,只统计某个侮辱性词汇(准确说是词条)是否在本文...
一、线性回归 (1) 线性回归的数学定义 数据 模型 (2)线性回归的数学定义(矩阵表达) 数据 模型 解析解 (3)损失函数损失函数: 二、逻辑回归 逻辑回归是一个分类的问...
一、KNN介绍 既可以做回归也可以做分类 k邻近的3要素(1) 选择合适的K(一般选奇数):通过交叉验证来选(2) 距离选择:欧式距离、曼哈顿距离、余弦值、相关度(3) 决策...
爬虫入门学习 一、爬虫基本流程 第一步,根据URL,获取网页的HTML信息。在Python3中,可以使用urllib.request和requests进行网页爬取。urlli...
sklearn学习 中文官网 一、一般使用 1.1 选择学习方法 从 START 开始,首先看数据的样本是否 >50,小于则需要收集更多的数据。 由图可知,算法有四类:分类,...
Matlpotlib学习 Matplotlib 是一个非常强大的 Python 画图工具。可以画线图、散点图、等高线图、条形图、柱状图、3D图像、动画图形等。 一、基本使用 ...
Numpy学习 一、数组基本属性 ndim:维度 shape:行数和列数 size:元素个数 二、numpy创建数组 array:创建数组 dtype:指定数据类型 使用li...
一、基本使用 1.1 print功能 1.python3以后的版本需要加括号,python2.7及2.7以前的版本不需要加括号。 2.打印字符串需要加单引号或者双引号。 3....