奇异值分解是一类矩阵分解方法,它能够将一个大矩阵转化成几个小矩阵相乘的形式,这些小矩阵中蕴含着大矩阵的很多重要特征。正如我们要记住一张陌生的脸总是先记住这张脸的种种特征一样,...
奇异值分解是一类矩阵分解方法,它能够将一个大矩阵转化成几个小矩阵相乘的形式,这些小矩阵中蕴含着大矩阵的很多重要特征。正如我们要记住一张陌生的脸总是先记住这张脸的种种特征一样,...
RNN是两种神经网络模型的缩写,一种是递归神经网络(Recursive Neural Network),一种是循环神经网络(Recurrent Neural Network)...
这一周仔细研究了一下自然语言处理方面(NLP)的一个大问题,Word2Vec。并且针对这个问题手动用代码实现了一下。所谓Word2Vec就是将自然语言中的词汇转化成向量形式。...
word2vector已经成为NLP领域的基石算法。作为一名AI 从业者,如果不能主动去熟悉该算法,应该感到脸红。本文是一篇翻译的文章,原文链接是:http://mccorm...
写在前面 有一个多月没有更新博客了,整个三月份都在忙项目的事,忙着各种扫尾解决一些“历史遗留问题”。终于到了清明节假期,可以写一写博客了。老实讲,一共有好几篇可以写,不过想来...
葡萄牙银行电话贷款数据分析写在前面 研究生一年级上半学期的课程很快就结束了,本学期数据挖掘课程老师在寒假留给我们一个大作业。大作业一共有五个project,要求任选一个进行数据分析,在权衡后选择了葡萄...
写在前面 研究生一年级上半学期的课程很快就结束了,本学期数据挖掘课程老师在寒假留给我们一个大作业。大作业一共有五个project,要求任选一个进行数据分析,在权衡后选择了葡萄...
写在前面 这两天研究了一下机器学习中较为简单的一类回归问题,对数回归。写一篇博客总结一下自己的体会和经验,若是其中出现错误,还希望读者能够留言帮我指出。 对数回归问题是机器学...
写在前面 最近几天忙完考试看了一个关于机器学习的基础算法——k近邻算法,简称为KNN。KNN是数据挖掘领域的十大经典算法之一,优点是简单,精度高,对异常值不敏感,无数据输入假...
最近两周研究了Greenplum集群搭建,在docker环境下实现了一个3节点的Greenplum集群实例。现在把建设的具体过程写出来供读者参考。 Greenplum是一款分...
以前只是听说某某互联网公司被黑,某程数据库被物理删除。每每在知乎上看见这种文章自己还乐的不行,但是今天我自己居然也被黑了,真的是悲愤异常,接下来就按照时间线梳理一下自己被黑的...
写在前面 当前是人工智能的时代,各种机器学习的算法层出不穷,各种各样的AI不但在自我快速迭代发展,也在深刻地影响和改变着人们的生活。最近笔者在上一门机器学习的研究生课程,在完...
基本概念 这周数据挖掘课上老师介绍了一种基础的数据挖掘算法——频繁项集挖掘算法。这种算法用一句话来总结就是要在数据库中扫描出所有的频繁项集。所谓频繁项集是指一个n项集合,该集...
这两天实在是被毕设折磨的够呛!哎,经常在卡壳,写一点,再卡壳,再写一点的循环中慢慢前进。老崔死催着十号前交稿,真是焦头烂额。今天就换换脑子,做一点好玩的事儿。干什么呢?来爬一...
J2EE(Java 2 Platform Enterprise Edition)即Java2平台企业版,是一套全新的技术架构,便于企业级用户规范化高效率地开发企业级web服务...
写在前面 这两天仔细研究了python中元类的概念,从最开始的一头雾水,到现在的渐渐有一点明白。想借这篇文章来阐述一下我对于python中元类的一些粗浅见解,同时也希望能给其...