简单实现神经网络,逻辑回归

来自:腩啵兔子 - 博客园

作者:腩啵兔子

链接:http://www.cnblogs.com/lrysjtu/p/5399704.html

已获转载授权

最近在github上看到一个很有趣的项目,通过文本训练可以让计算机写出特定风格的文章,有人就专门写了一个小项目生成汪峰风格的歌词。看完后有一些自己的小想法,也想做一个玩儿一玩儿。用到的原理是深度学习里的循环神经网络,无奈理论太艰深,只能从头开始开始慢慢看,因此产生写一个项目的想法,把机器学习和深度学习里关于分类的算法整理一下,按照原理写一些demo,方便自己也方便其他人。项目地址:https://github.com/LiuRoy/classfication_demo,目前实现了逻辑回归和神经网络两种分类算法。

Logistic回归

这是相对比较简单的一种分类方法,准确率较低,也只适用于线性可分数据,网上有很多关于logistic回归的博客和文章,讲的也都非常通俗易懂,就不赘述。此处采用随机梯度下降的方式实现,讲解可以参考《机器学习实战》第五章logistic回归。代码如下:

def train(self, num_iteration=150):

    """随机梯度上升算法

    Args:

        data (numpy.ndarray): 训练数据集

        labels (numpy.ndarray): 训练标签

        num_iteration (int): 迭代次数

    """

    for j in xrange(num_iteration):

        data_index = range(self.data_num)

        for i in xrange(self.data_num):

            # 学习速率

            alpha = 0.01

            rand_index = int(random.uniform(0, len(data_index)))

            error = self.label[rand_index] - sigmoid(sum(self.data[rand_index] * self.weights + self.b))

            self.weights += alpha * error * self.data[rand_index]

            self.b += alpha * error

            del(data_index[rand_index])


效果图:

图片发自简书App


神经网络

参考的是这篇文章,如果自己英语比较好,还可以查看英文文章,里面有简单的实现,唯一的缺点就是没有把原理讲明白。关于神经网络,个人认为确实不是一两句就能解释清楚的,尤其是网上的博客,要么只给公式,要么只给图,看起来都非常的晦涩,建议大家看一下加州理工的一个公开课,有中文字幕,一个小时的课程绝对比自己花一天查文字资料理解的深刻,知道原理之后再来看前面的那篇博客就很轻松啦!

BGD实现

博客里面实现用的是批量梯度下降(batch gradient descent),代码:

def batch_gradient_descent(self, num_passes=20000):

    """批量梯度下降训练模型"""

    for i in xrange(0, num_passes):

        # Forward propagation

        z1 = self.data.dot(self.W1) + self.b1

        a1 = np.tanh(z1)

        z2 = a1.dot(self.W2) + self.b2

        exp_scores = np.exp(z2)

        probs = exp_scores / np.sum(exp_scores, axis=1, keepdims=True)

        # Backpropagation

        delta3 = probs

        delta3[range(self.num_examples), self.label] -= 1

        dW2 = (a1.T).dot(delta3)

        db2 = np.sum(delta3, axis=0, keepdims=True)

        delta2 = delta3.dot(self.W2.T) * (1 - np.power(a1, 2))

        dW1 = np.dot(self.data.T, delta2)

        db1 = np.sum(delta2, axis=0)

        # Add regularization terms (b1 and b2 don't have regularization terms)

        dW2 += self.reg_lambda * self.W2

        dW1 += self.reg_lambda * self.W1

        # Gradient descent parameter update

        self.W1 += -self.epsilon * dW1

        self.b1 += -self.epsilon * db1

        self.W2 += -self.epsilon * dW2

        self.b2 += -self.epsilon * db2

效果图:

图片发自简书App


注意:强烈怀疑文中的后向传播公式给错了,因为和代码里的delta2 = delta3.dot(self.W2.T) * (1 - np.power(a1, 2))对不上。

SGD实现

考虑到logistic回归可以用随机梯度下降,而且公开课里面也说随机梯度下降效果更好一些,所以在上面的代码上自己改动了一下,代码:

def stochastic_gradient_descent(self, num_passes=200):

    """随机梯度下降训练模型"""

    for i in xrange(0, num_passes):

        data_index = range(self.num_examples)

        for j in xrange(self.num_examples):

            rand_index = int(np.random.uniform(0, len(data_index)))

            x = np.mat(self.data[rand_index])

            y = self.label[rand_index]

            # Forward propagation

            z1 = x.dot(self.W1) + self.b1

            a1 = np.tanh(z1)

            z2 = a1.dot(self.W2) + self.b2

            exp_scores = np.exp(z2)

            probs = exp_scores / np.sum(exp_scores, axis=1, keepdims=True)

            # Backpropagation

            delta3 = probs

            if y:

                delta3[0, 0] -= 1

            else:

                delta3[0, 1] -= 1

            dW2 = (a1.T).dot(delta3)

            db2 = np.sum(delta3, axis=0, keepdims=True)

            va = delta3.dot(self.W2.T)

            vb = 1 - np.power(a1, 2)

            delta2 = np.mat(np.array(va) * np.array(vb))

            dW1 = x.T.dot(delta2)

            db1 = np.sum(delta2, axis=0)

            # Add regularization terms (b1 and b2 don't have regularization terms)

            dW2 += self.reg_lambda * self.W2

            dW1 += self.reg_lambda * self.W1

            # Gradient descent parameter update

            self.W1 += -self.epsilon * dW1

            self.b1 += -self.epsilon * db1

            self.W2 += -self.epsilon * dW2

            self.b2 += -self.epsilon * db2

            del(data_index[rand_index])

可能是我写的方式不好,虽然可以得到正确的结果,但是性能上却比不上BGD,希望大家能指出问题所在,运行效果图:


图片发自简书App


其他

SVM我还在看,里面的公式推导能把人绕死,稍晚一点写好合入,数学不好就是坑啊。至于决策树分类,贝叶斯分类等比较简单的,没有数学功底的人实现起来也很容易,就不放进去了。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,491评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,856评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,745评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,196评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,073评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,112评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,531评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,215评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,485评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,578评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,356评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,215评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,583评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,898评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,174评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,497评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,697评论 2 335