使用说明 代码很简单 陈述如下:
1.实验背景 最近毕业设计中,希望通过wifi数据计算人员轨迹的相似度。人员轨迹数据按照时间顺序,以地点id的序列来表示。示例: LCSS算法则可以计算出两个序列之间的最长公...
代码大纲 数据预处理 第一步 /macinfo/origin2normal_test2.py功能:数据预处理第一步。将原始数据打散。/macinfo/macdata/orig...
一、 数据说明: 针对全国的余额宝用户,按照一定的规则抽样,给出对应的性别、城市和星座 针对抽样用户,抽取他们的余额宝交易数据,并归类为申购和赎回两类 训练数据:201307...
关键字K_means、ARIMA 前言 一月份主要工作如下: 精细化数据预处理过滤掉单一地点mac、过滤掉出现天数低于10天的mac、进一步细分地点列表; 数据索引保留两份原...
前言 许久未更,百感交集...因为最近研究各类算法,无边落发萧萧下TAT废话不多说,最近使用FP-Growth算法继续进行毕设数据挖掘 选择它的原因有二:1.比kNN算法逼格...
前言 最近帮师弟做了一个数据挖掘的大作业,觉得多少还是有点心得,乘兴记录一下( -з) 问题陈述 Over 40,000 instances, mix of continuo...
前言 最近在之前的数据基本预处理工作之上,增加了两个新的工作。 1.数据扩容,将数据的维度由3列扩容到13列 2.对于数据扩容后的数据,进行两方面的条件筛选:a.通过pid、...
目录: 一、概述二、MySQL安装以及配置三、NavicatforMySQL下载及使用 概述: MySQL版本:5.7.20 MySQL下载地址:https://dev.my...
是雷峰塔和雷锋的关系w
pandas格式化输出文件对于上篇中,预处理后的结构化数据,本篇希望对其进行数据的格式化输出。 主要目标是:根据地点id,起止时间段的设定,在条件筛选下得到对应的数据,并格式化输出到本地文件中。 上篇...
对于上篇中,预处理后的结构化数据,本篇希望对其进行数据的格式化输出。 主要目标是:根据地点id,起止时间段的设定,在条件筛选下得到对应的数据,并格式化输出到本地文件中。 上篇...
最近关于毕业设计遇到了第一个小难题,那就是读取一个将近1G的文件,并对其进行数据预处理工作。意图是将数据打散,对于每个mac地址对其分配对应的时间戳和地点id(第二列) 数据...
最近在学习研究python下的决策树算法时遇到了一个小小的问题,弄了一下午的时间,中午解决。 问题描述:决策树算法结果的graph图形无法打印并且以pdf或者jpg的格式呈现...
本文主要参考:http://www.jianshu.com/p/773ff5f08a2c 年初,国家统计局公布了70个大中城市住宅销售价格变动情况其中有一项为价格指数表: 为...
关于DTW算法 动态时间规整/规划(Dynamic Time Warping, DTW)是一个比较老的算法,大概在1970年左右被提出来,最早用于处理语音方面识别分类的问题。...
前言 众所周知,BeautifulSoup 是个非常强大的库,不过还有一些比较流行的解析库,例如 lxml,使用的是 Xpath 语法,同样是效率比较高的解析方法。如果大家对...
课题1 毕业设计里面涉及到人员相关度的计算,在这里我提出了一个猜想,大致如下: 现有数据:学生id、学生手机mac地址、时间戳、地点id 构想:通过学生mac地址某地点出现频...