实践-python简单实现数据度量

作业链接:

前言:本节主要是针对前期的学习进行简单的动手操作,以加深对常用度量指标的计算逻辑和相关函数理解与掌握。

无需死记硬背,了解或简单知道怎么用就行。而且掌握一个自己熟悉且实用的就可以,比如excel,使用方便 但是数据量多,如10W行,则不再适用,spss则更侧重于图表分析,sql主要是针对较大数据量的线上表数据。而python更倾向于数据量在100W以内之间使用

1.excel篇

常用函数:

平均数(AVERAGE )、

中位数(MEDIAN)、四分位数(QUARTILE)

众数(MODE)、极差(MAX-MIN),方差:VAR(样本) VARP(总体) 留意参数范围,因为涉及方差计算时是除以n,还是n-1

2.spss篇

         spss下载安装及简单使用,对照第三章的例题进行实践。已完成

3.sql篇

       作为一个习惯了写sql的数据开发而言,用excel直言没有数据库方便,只是平均数。极差还好算

中位数(需自关联)、众数(需分组计算求最多的那个)、VAR_SAMP (样本方差)

标准差:人口标准差STD和STDDEV_SAMP (样本标准差)

4.python篇

本篇参照了其他人的作业:数据的概括性度量

但是 在引用dataframe数据时 有些报错做了调整


#coding=utf-8

import sys

import pandas as pd

import numpy as np

import math

import matplotlib.pyplot as plt

file_path ="D:\\MyDownloads\\Download\\123.csv"

data = pd.read_csv(file_path,encoding="UTF-8").iloc[0:20]

print(data.dtypes)

#平均值 算数平均值&几何平均值

print("算数平均数:%.2f" %data.mean())

s =1

for iin data['data'].tolist():

# print(i)

    s = s * i

#print(s)

print("几何平均数: %.2f" %math.sqrt(s))

#众数

print("众数为:%d," %data.mode().iloc[0])

from scipy.statsimport mode

mode_num = mode(data)

print("众数为:%d, 众数的个数为:%d,"%(mode_num[0][0], mode_num[1][0]))

print(mode_num)

print(data.mode())

#中位数

# 中位数

# 法一:

print("中位数1:%d" %data.median())

# 法二

print("中位数2:%d" %np.percentile(data,50))

# 法三

print("中位数3:%d" %data.quantile(.50))

# 方差

# 法一:

print("方差1:%d" %data.var())

# 法二:

s =0

#for i in data:

for iin data['data'].tolist():

s = (i - data.mean())**2 + s

print("方差2:%d" %(s/(len(data)-1)))

# 标准差

# 法一

print("标准差1:%d" %data.std())

# 法二:

print("标准差2:%d" %np.sqrt(s/(len(data)-1)))

# 极差

print("极差:%d" %(data["data"].max() - data["data"].min()))

# 平均绝对离差

M =0

for iin data["data"].tolist():

M +=abs(i - data.mean())

print("平均绝对离差:%f" %(M/len(data)))

# 上四分位数

# 法一

print("上四分位数:%d" %(data.quantile(.75)))

# 法二

print("上四分位数:%d" %(np.percentile(data,75)))

data.quantile(.75)

# 下四分位数

# 法一

print("下四分位数:%d" %(data.quantile(.25)))

# 法二:

np.percentile(data,25)

print("下四分位数:%d" %(np.percentile(data,25)))

# 四分位差

print("四分位差:%d" %(np.percentile(data,75) - np.percentile(data,25)))

# 离散系数

print("离散系数:%f" %(data.std()/data.mean()))# 0.5824757050156248

# 偏度

from scipyimport stats

print("偏度:%f" %stats.skew(data))# 0.4264951788847028

# 峰度

print("峰度:%.16f" %stats.kurtosis(data))# -0.5821005917159772

# 直接输出data的概括性信息

print(data.describe())

import seabornas sns

sns.set_palette("hls")#设置所有图的颜色,使用hls色彩空间

sns.distplot(data,color="r",bins=10,kde=True)

plt.show()

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,524评论 5 460
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,869评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,813评论 0 320
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,210评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,085评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,117评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,533评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,219评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,487评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,582评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,362评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,218评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,589评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,899评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,176评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,503评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,707评论 2 335

推荐阅读更多精彩内容