中文分词 中文分词(Chinese Word Segmentation),将中文语句切割成单独的词组。英文使用空格来分开每个单词的,而中文单独一个汉字跟词有时候完全不是同个含...
中文分词 中文分词(Chinese Word Segmentation),将中文语句切割成单独的词组。英文使用空格来分开每个单词的,而中文单独一个汉字跟词有时候完全不是同个含...
假设 《社会关系与企业信息披露质量》一文利用了我国上市公司02-13年的年报进行分析,通过计算机语言判断这些年报的质量(可读性),进而研究企业的社会关系是否会影响其年报的可读...
摘要 本文主要是笔者第一次接触kaggle入门竞赛的一次记录,整个过程是通过jupyter notebook实现的。第一次接触这类比赛,过程中参考了很多大佬的文章学习,在此尽...
视频课简记 7、正则化 7.1 过拟合的问题 在数据拟合方面存在着三种结果: 第一种称之为欠拟合,也叫高偏差;第二种刚好拟合了数据;第三种称之为过拟合,也叫高方...
前言 我跳过了Octave部分的学习,转而利用这部分时间去研究python如何实现这系列课程的小作业,当作是熟悉一边python的一些常用库及一些好用的工具。关于这系列的py...
本文是参考寒小阳大神的博客:http://blog.csdn.net/han_xiaoyang/article/details/49797143中的实现所做的记录,想通过这个...
前言 刚学完吴恩达老师的机器学习课程线性回归部分,想跑一下找到的python版本的小作业,就开始纠结选什么软件来编译。在jupyter notebook和vs code之间纠...
视频课简记: 4、多变量线性回归 4.1 多维特征 之前给的数据集只知道一个size特征,现在要开始引入多种特征啦。 我们可以列出函数h的表达式: 简单从表达式层面上...
概念 机器学习是研究计算机模仿人类学习的过程,利用新的数据改善自身的性能,是人工智能的核心。 机器学习、人工智能、深度学习之间的关系: 人工智能=机器人; 机器学习是实现人工...