设计思路:
1.准备好初始数据
2.pandas库导入,初步处理数据
3.matplotlib库处理数据,把数据画成图
4.从sklearn库里调用K-mean算法,处理数据,分类
5.对数据再次画图
import pandas as pd# 导入数据处理模块
file = pd.read_csv("cluster_data.csv", header=0)# 导入数据文件printfile# 输出文件
X = file['x']# 定义横坐标数据
y = file['y']# 定义纵坐标数据
from matplotlib import pyplot as plt# 导入绘图模块
plt.scatter(X, y)# 绘制散点图
plt.show()# 显示图
from sklearn.cluster import k_means# 导入 K-Means 方法
model = k_means(file, n_clusters =3)# 建立聚类模型
cluster_centers = model[0]# 聚类中心数组
cluster_labels = model[1]# 聚类标签数组
plt.scatter(X, y, c=cluster_labels)# 绘制样本并按聚类标签标注颜色
# 绘制聚类中心点,标记成五角星样式,以及红色边框
for center in cluster_centers:
plt.scatter(center[0], center[1], marker="p", edgecolors="red")
plt.show()# 显示图