【整理】ty4z2008201《Understanding Convolutions》
【编辑】Major术业
文章链接地址:https://github.com/ty4z2008/Qix/blob/master/dl.md
401《How to Choose a Neural Network》
介绍:deeplearning4j官网提供的实际应用场景NN选择参考表,列举了一些典型问题建议使用的神经网络
402《Deep Learning (Python, C/C++, Java, Scala, Go)》
介绍:一个深度学习项目,提供了Python, C/C++, Java, Scala, Go多个版本的代码
403《Deep Learning Tutorials》
介绍:深度学习教程,github
404《自然语言处理的发展趋势——访卡内基梅隆大学爱德华·霍威教授》
介绍:自然语言处理的发展趋势——访卡内基梅隆大学爱德华·霍威教授.
405《FaceNet: A Unified Embedding for Face Recognition and Clustering》
介绍:Google对Facebook DeepFace的有力回击—— FaceNet,在LFW(Labeled Faces in the Wild)上达到99.63%准确率(新纪录),FaceNet embeddings可用于人脸识别、鉴别和聚类.
406《MLlib中的Random Forests和Boosting》
介绍:本文来自Databricks公司网站的一篇博客文章,由Joseph Bradley和Manish Amde撰写,文章主要介绍了Random Forests和Gradient-Boosted Trees(GBTs)算法和他们在MLlib中的分布式实现,以及展示一些简单的例子并建议该从何处上手.中文版.
407《Sum-Product Networks(SPN) 》
介绍:华盛顿大学Pedro Domingos团队的DNN,提供论文和实现代码.
408《Neural Network Dependency Parser》
介绍:基于神经网络的自然语言依存关系解析器(已集成至Stanford CoreNLP),特点是超快、准确,目前可处理中英文语料,基于《A Fast and Accurate Dependency Parser Using Neural Networks》 思路实现.
409《神经网络语言模型》
介绍:本文根据神经网络的发展历程,详细讲解神经网络语言模型在各个阶段的形式,其中的模型包含NNLM[Bengio,2003]、Hierarchical NNLM[Bengio, 2005], Log-Bilinear[Hinton, 2007],SENNA等重要变形,总结的特别好.
410《Classifying Spam Emails using Text and Readability Features》
介绍:经典问题的新研究:利用文本和可读性特征分类垃圾邮件。
411《BCI Challenge @ NER 2015》
介绍:Kaggle脑控计算机交互(BCI)竞赛优胜方案源码及文档,包括完整的数据处理流程,是学习Python数据处理和Kaggle经典参赛框架的绝佳实例
412《IPOL Journal · Image Processing On Line》
介绍:IPOL(在线图像处理)是图像处理和图像分析的研究期刊,每篇文章都包含一个算法及相应的代码、Demo和实验文档。文本和源码是经过了同行评审的。IPOL是开放的科学和可重复的研究期刊。我一直想做点类似的工作,拉近产品和技术之间的距离.
413《Machine learning classification over encrypted data》
介绍:出自MIT,研究加密数据高效分类问题.
414《purine2》
介绍:新加坡LV实验室的神经网络并行框架Purine: A bi-graph based deep learning framework,支持构建各种并行的架构,在多机多卡,同步更新参数的情况下基本达到线性加速。12块Titan 20小时可以完成Googlenet的训练。
415《Machine Learning Resources》
介绍:这是一个机器学习资源库,虽然比较少.但蚊子再小也是肉.有突出部分.此外还有一个由zheng Rui整理的机器学习资源.
416《Hands-on with machine learning》
介绍:Chase Davis在NICAR15上的主题报告材料,用Scikit-Learn做监督学习的入门例子.
417《The Natural Language Processing Dictionary》
介绍:这是一本自然语言处理的词典,从1998年开始到目前积累了成千上万的专业词语解释,如果你是一位刚入门的朋友.可以借这本词典让自己成长更快.
418《PageRank Approach to Ranking National Football Teams》
介绍:通过分析1930年至今的比赛数据,用PageRank计算世界杯参赛球队排行榜.
419《R Tutorial》
介绍:R语言教程,此外还推荐一个R语言教程An Introduction to R.
420《Fast unfolding of communities in large networks》
介绍:经典老文,复杂网络社区发现的高效算法,Gephi中的[Community detection](The Louvain method for community detection in large networks)即基于此.
421《NUML》
介绍: 一个面向 .net 的开源机器学习库,github地址
422《synaptic.Js》
介绍: 支持node.js的JS神经网络库,可在客户端浏览器中运行,支持LSTM等 github地址
423《Machine learning for package users with R (1): Decision Tree》
介绍: 决策树
424《Deep Learning, The Curse of Dimensionality, and Autoencoders》
介绍: 讨论深度学习自动编码器如何有效应对维数灾难,国内翻译
425《Advanced Optimization and Randomized Methods》
介绍: CMU的优化与随机方法课程,由A. Smola和S. Sra主讲,优化理论是机器学习的基石,值得深入学习 国内云(视频)
426《CS231n: Convolutional Neural Networks for Visual Recognition》
介绍: "面向视觉识别的CNN"课程设计报告集锦.近百篇,内容涉及图像识别应用的各个方面
427《Topic modeling with LDA: MLlib meets GraphX》
介绍:用Spark的MLlib+GraphX做大规模LDA主题抽取.
428《Deep Learning for Multi-label Classification》
介绍: 基于深度学习的多标签分类,用基于RBM的DBN解决多标签分类(特征)问题
429《Google DeepMind publications》
介绍: DeepMind论文集锦
430《kaldi》
介绍: 一个开源语音识别工具包,它目前托管在sourceforge上面
431《Data Journalism Handbook》
介绍: 免费电子书《数据新闻手册》, 国内有热心的朋友翻译了中文版,大家也可以在线阅读
432《Data Mining Problems in Retail》
介绍: 零售领域的数据挖掘文章.
433《Understanding Convolution in Deep Learning》
介绍: 深度学习卷积概念详解,深入浅出.
434《pandas: powerful Python data analysis toolkit》
介绍: 非常强大的Python的数据分析工具包.
435《Text Analytics 2015》
介绍: 2015文本分析(商业)应用综述.
436《Deep Learning libraries and ?rst experiments with Theano》
介绍: 深度学习框架、库调研及Theano的初步测试体会报告.
437《DEEP learning》
介绍: MIT的Yoshua Bengio, Ian Goodfellow, Aaron Courville著等人讲深度学习的新书,还未定稿,线上提供Draft chapters收集反馈,超赞!强烈推荐.
438《simplebayes》
介绍: Python下开源可持久化朴素贝叶斯分类库.
439《Paracel》
介绍:Paracel is a distributed computational framework designed for machine learning problems, graph algorithms and scientific computing in C++.
440《HanLP:Han Language processing》
介绍: 开源汉语言处理包.
441《Simple Neural Network implementation in Ruby》
介绍: 使用Ruby实现简单的神经网络例子.
442《Hacker's guide to Neural Networks》
介绍:神经网络黑客入门.
443《The Open-Source Data Science Masters》
介绍:好多数据科学家名人推荐,还有资料.
444《Text Understanding from Scratch》
介绍:实现项目已经开源在github上面Crepe
445《 Improving Distributional Similarity with Lessons Learned from Word Embeddings》
介绍:作者发现,经过调参,传统的方法也能和word2vec取得差不多的效果。另外,无论作者怎么试,GloVe都比不过word2vec.
446《CS224d: Deep Learning for Natural Language Processing》
介绍:Stanford深度学习与自然语言处理课程,Richard Socher主讲.
447《Math Essentials in Machine Learning》
介绍:机器学习中的重要数学概念.
448《Improved Semantic Representations From Tree-Structured Long Short-Term Memory Networks》
介绍:用于改进语义表示的树型LSTM递归神经网络,句子级相关性判断和情感分类效果很好.实现代码.
449《Statistical Machine Learning》
介绍:卡耐基梅隆Ryan Tibshirani和Larry Wasserman开设的机器学习课程,先修课程为机器学习(10-715)和中级统计学(36-705),聚焦统计理论和方法在机器学习领域应用.
450《AM207: Monte Carlo Methods, Stochastic Optimization》
介绍:《哈佛大学蒙特卡洛方法与随机优化课程》是哈佛应用数学研究生课程,由V Kaynig-Fittkau、P Protopapas主讲,Python程序示例,对贝叶斯推理感兴趣的朋友一定要看看,提供授课视频及课上IPN讲义.
451《生物医学的SPARK大数据应用》
介绍:生物医学的SPARK大数据应用.并且伯克利开源了他们的big data genomics系统ADAM,其他的内容可以关注一下官方主页.
452《ACL Anthology》
介绍:对自然语言处理技术或者机器翻译技术感兴趣的亲们,请在提出自己牛逼到无以伦比的idea(自动归纳翻译规律、自动理解语境、自动识别语义等等)之前,请通过谷歌学术简单搜一下,如果谷歌不可用,这个网址有这个领域几大顶会的论文列表,切不可断章取义,胡乱假设.
453《Twitter Sentiment Detection via Ensemble Classification Using Averaged Confidence Scores》
介绍:论文+代码:基于集成方法的Twitter情感分类,实现代码.
454《NIPS 2014 CIML workshop》
介绍:NIPS CiML 2014的PPT,NIPS是神经信息处理系统进展大会的英文简称.
455《CS231n: Convolutional Neural Networks for Visual Recognition》
介绍:斯坦福的深度学习课程的Projects 每个人都要写一个论文级别的报告 里面有一些很有意思的应用 大家可以看看 .
456《A Speed Comparison Between Flexible Linear Regression Alternatives in R》
介绍:R语言线性回归多方案速度比较具体方案包括lm()、nls()、glm()、bayesglm()、nls()、mle2()、optim()和Stan’s optimizing()等.
457《Back-to-Basics Weekend Reading - Machine Learning》
介绍:文中提到的三篇论文(机器学习那些事、无监督聚类综述、监督分类综述)都很经典,Domnigos的机器学习课也很精彩
458《A Probabilistic Theory of Deep Learning》
介绍:莱斯大学(Rice University)的深度学习的概率理论.
459《Nonsensical beer reviews via Markov chains》
介绍:基于马尔可夫链自动生成啤酒评论的开源Twitter机器人,github地址.
460《Deep Learning for Natural Language Processing (without Magic)》
介绍:视频+讲义:深度学习用于自然语言处理教程(NAACL13).
461《Introduction to Data Analysis using Machine Learning》
介绍:用机器学习做数据分析,David Taylor最近在McGill University研讨会上的报告,还提供了一系列讲机器学习方法的ipn,很有价值 GitHub.国内
462《Beyond Short Snippets: Deep Networks for Video Classification》
介绍:基于CNN+LSTM的视频分类,google演示.
463《How does Quora use machine learning in 2015?》
介绍:Quora怎么用机器学习.
464《Amazon Machine Learning – Make Data-Driven Decisions at Scale》
介绍:亚马逊在机器学习上面的一些应用,代码示例.
465《Parallel Machine Learning with scikit-learn and IPython》
介绍:并行机器学习指南(基于scikit-learn和IPython).notebook
466《Intro to machine learning with scikit-learn》
介绍:DataSchool的机器学习基本概念教学.
467《DeepCLn》
介绍:一个基于OpenGL实现的卷积神经网络,支持Linux及Windows系.
468《An Inside Look at the Components of a Recommendation Engine》
介绍:基于Mahout和Elasticsearch的推荐系统.
469《Forecasting in Economics, Business, Finance and Beyond》
介绍:Francis X. Diebold的《(经济|商业|金融等领域)预测方法.
470《Time Series Econometrics - A Concise Course》
介绍:Francis X. Diebold的《时序计量经济学》.
471《A comparison of open source tools for sentiment analysis》
介绍:基于Yelp数据集的开源情感分析工具比较,评测覆盖Naive Bayes、SentiWordNet、CoreNLP等 .
472《Pattern Recognition And Machine Learning》
介绍:国内Pattern Recognition And Machine Learning读书会资源汇总,各章pdf讲稿,博客.
473《Probabilistic Data Structures for Web Analytics and Data Mining 》
介绍:用于Web分析和数据挖掘的概率数据结构.
474《Machine learning in navigation devices: detect maneuvers using accelerometer and gyroscope》
介绍:机器学习在导航上面的应用.
475《Neural Networks Demystified 》
介绍:Neural Networks Demystified系列视频,Stephen Welch制作,纯手绘风格,浅显易懂,国内云.
476《swirl + DataCamp 》
介绍:{swirl}数据训练营:R&数据科学在线交互教程.
477《Learning to Read with Recurrent Neural Networks 》
介绍:关于深度学习和RNN的讨论 Sequence to Sequence Learning with Neural Networks.
478《深度强化学习(Deep Reinforcement Learning)的资源》
介绍:Deep Reinforcement Learning.
479《Machine Learning with Scikit-Learn》
介绍:(PyCon2015)Scikit-Learn机器学习教程,Parallel Machine Learning with scikit-learn and IPython.
480《PDNN》
介绍:PDNN: A Python Toolkit for Deep Learning.
481《Introduction to Machine Learning》
介绍:15年春季学期CMU的机器学习课程,由Alex Smola主讲,提供讲义及授课视频,很不错.国内镜像.
482《Big Data Processing》
介绍:大数据处理课.内容覆盖流处理、MapReduce、图算法等.
483《Spark MLlib: Making Practical Machine Learning Easy and Scalable》
介绍:用Spark MLlib实现易用可扩展的机器学习,国内镜像.
484《Picture: A Probabilistic Programming Language for Scene Perception》
介绍:以往上千行代码概率编程(语言)实现只需50行.
485《Beautiful plotting in R: A ggplot2 cheatsheet》
介绍:ggplot2速查小册子,另外一个,此外还推荐《A new data processing workflow for R: dplyr, magrittr, tidyr, ggplot2》.
486《Using Structured Events to Predict Stock Price Movement: An Empirical Investigation》
介绍:用结构化模型来预测实时股票行情.
487《International Joint Conference on Artificial Intelligence Accepted paper》
介绍:国际人工智能联合会议录取论文列表,大部分论文可使用Google找到.
488《Why GEMM is at the heart of deep learning》
介绍:一般矩阵乘法(GEMM)对深度学习的重要性.
489《Distributed (Deep) Machine Learning Common》
介绍:A Community of awesome Distributed Machine Learning C++ projects.
490《Reinforcement Learning: An Introduction》
介绍:免费电子书<强化学习介绍>,第一版(1998),第二版(2015草稿),相关课程资料,Reinforcement Learning.
491《Free ebook: Microsoft Azure Essentials: Azure Machine Learning》
介绍:免费书:Azure ML使用精要.
492《A Deep Learning Tutorial: From Perceptrons to Deep Networks》
介绍:A Deep Learning Tutorial: From Perceptrons to Deep Networks.
493《Machine Learning is Fun! - The world’s easiest introduction to Machine Learning》
介绍:有趣的机器学习:最简明入门指南,中文版.
494《A Brief Overview of Deep Learning》
介绍:深度学习简明介绍,中文版.
495《Wormhole》
介绍:Portable, scalable and reliable distributed machine learning.
496《convnet-benchmarks》
介绍:CNN开源实现横向评测,参评框架包括Caffe 、Torch-7、CuDNN 、cudaconvnet2 、fbfft、Nervana Systems等,NervanaSys表现突出.
497《This catalogue lists resources developed by faculty and students of the Language Technologies Institute.》
介绍:卡耐基梅隆大学计算机学院语言技术系的资源大全,包括大量的NLP开源软件工具包,基础数据集,论文集,数据挖掘教程,机器学习资源.
498《Sentiment Analysis on Twitter》
介绍:Twitter情感分析工具SentiTweet,视频+讲义.
499《Machine Learning Repository @ Wash U》
介绍:华盛顿大学的Machine Learning Paper Repository.
500《Machine learning cheat sheet》
介绍:机器学习速查表.
501《Spark summit east 2015 agenda》
介绍:最新的Spark summit会议资料.
502《Learning Spark》
介绍:Ebook Learning Spark.
503《Advanced Analytics with Spark, Early Release Edition》
介绍:Ebook Advanced Analytics with Spark, Early Release Edition.
504《国内机器学习算法及应用领域人物篇:唐杰》
介绍:清华大学副教授,是图挖掘方面的专家。他主持设计和实现的Arnetminer是国内领先的图挖掘系统,该系统也是多个会议的支持商.
505《国内机器学习算法及应用领域人物篇:杨强》
介绍:迁移学习的国际领军人物.
506《国内机器学习算法及应用领域人物篇:周志华》
介绍:在半监督学习,multi-label学习和集成学习方面在国际上有一定的影响力.
507《国内机器学习算法及应用领域人物篇:王海峰》
介绍:信息检索,自然语言处理,机器翻译方面的专家.
508《国内机器学习算法及应用领域人物篇:吴军》
介绍:吴军博士是当前Google中日韩文搜索算法的主要设计者。在Google其间,他领导了许多研发项目,包括许多与中文相关的产品和自然语言处理的项目,他的新个人主页.
509《Cat Paper Collection》
介绍:喵星人相关论文集.
510《How to Evaluate Machine Learning Models, Part 1: Orientation》
介绍:如何评价机器学习模型系列文章,How to Evaluate Machine Learning Models, Part 2a: Classification Metrics,How to Evaluate Machine Learning Models, Part 2b: Ranking and Regression Metrics.
511《Building a new trends experience》
介绍:Twitter新trends的基本实现框架.
512《Storm Blueprints: Patterns for Distributed Real-time Computation》
介绍:Storm手册,国内有中文翻译版本,谢谢作者.
513《SmileMiner》
介绍:Java机器学习算法库SmileMiner.
514《机器翻译学术论文写作方法和技巧》
介绍:机器翻译学术论文写作方法和技巧,Simon Peyton Jones的How to write a good research paper同类视频How to Write a Great Research Paper,how to paper talk.
515《神经网络训练中的Tricks之高效BP(反向传播算法)》
介绍:神经网络训练中的Tricks之高效BP,博主的其他博客也挺精彩的.
516《我和NLP的故事》
介绍:作者是NLP方向的硕士,短短几年内研究成果颇丰,推荐新入门的朋友阅读.
517《The h Index for Computer Science 》
介绍:UCLA的Jens Palsberg根据Google Scholar建立了一个计算机领域的H-index牛人列表,我们熟悉的各个领域的大牛绝大多数都在榜上,包括1位诺贝尔奖得主,35位图灵奖得主,近百位美国工程院/科学院院士,300多位ACM Fellow,在这里推荐的原因是大家可以在google通过搜索牛人的名字来获取更多的资源,这份资料很宝贵.
518《Structured Learning for Taxonomy Induction with Belief Propagation》
介绍:用大型语料库学习概念的层次关系,如鸟是鹦鹉的上级,鹦鹉是虎皮鹦鹉的上级。创新性在于模型构造,用因子图刻画概念之间依存关系,因引入兄弟关系,图有环,所以用有环扩散(loopy propagation)迭代计算边际概率(marginal probability).
519《Bayesian analysis》
介绍: 这是一款贝叶斯分析的商业软件,官方写的贝叶斯分析的手册有250多页,虽然R语言 已经有类似的项目,但毕竟可以增加一个可选项.
520《deep net highlights from 2014》
介绍:deep net highlights from 2014.
521《Fast R-CNN》
介绍:This paper proposes Fast R-CNN, a clean and fast framework for object detection.
522《Fingerprinting Images for Near-Duplicate Detection》
介绍:图像指纹的重复识别,作者源码,国内翻译版本.
523《The Computer Vision Industry 》
介绍:提供计算机视觉、机器视觉应用的公司信息汇总.应用领域包括:自动辅助驾驶和交通管理、眼球和头部跟踪、影视运动分析、影视业、手势识别、通用视觉系统、各种工业自动化和检验、医药和生物、移动设备目标识别和AR、人群跟踪、摄像、安全监控、生物监控、三维建模、web和云应用.
524《Seaborn: statistical data visualization》
介绍:Python版可视化数据统计开源库.
525《IPython lecture notes for OCW MIT 18.06》
介绍:麻省理工Gilbert Strang线性代数课程笔记,Gilbert Strang《Linear Algebra》课程主页视频+讲义.
526《Canova: A Vectorization Lib for ML》
介绍:面向机器学习/深度学习的数据向量化工具Canova,github, 支持CSV文件、MNIST数据、TF-IDF/Bag of Words/word2vec文本向量化.
527《DZone Refcardz: Distributed Machine Learning with Apache Mahout》
介绍:快速入门:基于Apache Mahout的分布式机器学习.
528《Learning scikit-learn: Machine Learning in Python》
介绍:基于scikit-learn讲解了一些机器学习技术,如SVM,NB,PCA,DT,以及特征工程、特征选择和模型选择问题.
529《Lightning fast Machine Learning with Spark》
介绍:基于Spark的高效机器学习,视频地址.
530《How we’re using machine learning to fight shell selling》
介绍:WePay用机器学习对抗信用卡"shell selling"诈骗.
531《Data Scientists Thoughts that Inspired Me》
介绍:16位数据科学家语录精选.
532《Deep learning applications and challenges in big data analytics》
介绍:深度学习在大数据分析领域的应用和挑战.
533《Free book:Machine Learning,Mathematics》
介绍:免费的机器学习与数学书籍,除此之外还有其他的免费编程书籍,编程语言,设计,操作系统等.
534《Object detection via a multi-region & semantic segmentation-aware CNN model》
介绍:一篇关于CNN模型对象识别Paper.
535《A Statistical View of Deep Learning (V): Generalisation and Regularisation》
介绍:深度学习的统计分析V:泛化和正则化.
536《Highway Networks》
介绍:用SGD能高效完成训练的大规模(多层)深度网络HN.
537《What I Read For Deep-Learning》
介绍:深度学习解读文章.
538《An Introduction to Recommendation Engines》
介绍:Coursera上的推荐系统导论(Introduction to Recommender Systems)公开课.
539《Stanford Machine Learning》
介绍:Andrew Ng经典机器学习课程笔记.
540《ICLR 2015》
介绍:ICLR 2015见闻录,博客的其他机器学习文章也不错.
541《Stanford Machine Learning》
介绍:推荐系统"个性化语义排序"模型.
542《The More Excited We Are, The Shorter We Tweet》
介绍:激情时分更惜字——MIT的最新Twitter研究结果.
543《苏州大学人类语言技术研究论文主页》
介绍:苏州大学人类语言技术研究相关论文.
544《Neural Turing Machines implementation》
介绍:实现神经图灵机(NTM),项目地址,此外推荐相关神经图灵机算法.
545《Computer Vision - CSE 559A, Spring 2015》
介绍:华盛顿大学的机器视觉(2015),参考资料Computer Vision: Algorithms and Applications.
546《Mining of Massive Datasets》
介绍:"Mining of Massive Datasets"发布第二版,Jure Leskovec, Anand Rajaraman, Jeff Ullman 新版增加Jure Leskovec作为合作作者,新增社交网络图数据挖掘、降维和大规模机器学习三章,电子版依旧免费.
547《Learning Deep Learning》
介绍:一个深度学习资源页,资料很丰富.
548《Learning Deep Learning》
介绍:免费电子书"Learning Deep Learning".
549《Tutorial: Machine Learning for Astronomy with Scikit-learn》
介绍:Machine Learning for Astronomy with scikit-learn.
550《An Introduction to Random Forests for Beginners》
介绍:免费电子书"随机森林入门指南".
551《Top 10 data mining algorithms in plain English》
介绍:白话数据挖掘十大算法.
552《An Inside Look at the Components of a Recommendation Engine》
介绍:基于Mahout和Elasticsearch的推荐系统,国内译版.
553《Advances in Extreme Learning Machines》
介绍:博士学位论文:ELM研究进展.
554《10-minute tour of pandas》
介绍:Pandas十分钟速览,ipn.
555《Data doesn't grow in tables: harvesting journalistic insight from documents》
介绍:面向数据新闻的文本挖掘.
556《Time-lapse Mining from Internet Photos》
介绍:用网络图片合成延时视频(SIGGRAPH 2015).
557《The Curse of Dimensionality in classification》
介绍:分类系统的维数灾难.
558《Deep Learning vs Big Data: Who owns what?》
介绍:深度学习vs.大数据——从数据到知识:版权的思考,[翻译版](http://www.csdn.net/article/2015-05-19/2824707
559《A Primer on Predictive Models》
介绍:预测模型入门.
560《Demistifying LSTM Neural Networks》
介绍:深入浅出LSTM.
561《ICLR 2015》
介绍:2015年ICLR会议视频与讲义.
562《On Visualizing Data Well》
介绍:Ben Jones的数据可视化建议.
563《Decoding Dimensionality Reduction, PCA and SVD》
介绍:解读数据降维/PCA/SVD.
564《Supervised learning superstitions cheat sheet》
介绍:IPN:监督学习方法示例/对比参考表,覆盖logistic回归, 决策树, SVM, KNN, Naive Bayes等方法.
565《DopeLearning: A Computational Approach to Rap Lyrics Generation》
介绍:基于RankSVM和DNN自动(重组)生成Rap歌词.
566《An Introduction to Random Indexing》
介绍:随机索引RI词空间模型专题.
567《VDiscover》
介绍:基于机器学习的漏洞检测工具VDiscover.
568《Minerva》
介绍:深度学习系统minerva。拥有python编程接口。多GPU几乎达到线性加速。在4块GPU上能在4天内将GoogLeNet训练到68.7%的top-1以及89.0%的top-5准确率。和同为dmlc项目的cxxnet相比,采用动态数据流引擎,提供更多灵活性。未来将和cxxnet一起整合为mxnet项目,互取优势.
569《CVPR 2015 paper》
介绍:2015年国际计算机视觉与模式识别会议paper.
570《What are the advantages of different classification algorithms?》
介绍:Netflix工程总监眼中的分类算法:深度学习优先级最低,中文版.
571《Results for Microsoft COCO Image Captioning Challenge》
介绍:Codalab图像标注竞赛排行+各家论文,Reddit上flukeskywalker整理了各家技术相关论文.
572《Caffe con Troll: Shallow Ideas to Speed Up Deep Learning》
介绍:基于Caffe的加速深度学习系统CcT.
573《Low precision storage for deep learning》
介绍:深度学习(模型)低精度(训练与)存储.
574《Model-Based Machine Learning (Early Access)》
介绍:新书预览:模型机器学习.
575《Regret Analysis of Stochastic and Nonstochastic Multi-armed Bandit Problems》
介绍:免费电子书多臂老虎机,此外推荐Introduction to Bandits: Algorithms and Theory.
576《Kaggle R Tutorial on Machine Learing》
介绍:基于Kaggle's Titanic Competition的交互式R机器学习教程,介绍《Interactive R Tutorial: Machine Learning for the Titanic Competition》.
577《Deep Learning(深度学习)学习笔记整理系列》
介绍:Deep Learning(深度学习)学习笔记整理系列.
578《Introduction to Neural Machine Translation with GPUs 》
介绍:神经(感知)机器翻译介绍.
579《Andrew Ng: Deep Learning, Self-Taught Learning and Unsupervised Feature Learning》
介绍:Andrew Ng关于深度学习/自学习/无监督特征学习的报告,国内云.
580《Recurrent Neural Network Training with Dark Knowledge Transfer》
介绍:论文:通过潜在知识迁移训练RNN.
581《Show Me The Money》
介绍:面向金融数据的情感分析工具.
582《pyLDAvis》
介绍:(Python)主题模型交互可视化库pyLDAvis.
583《Logistic Regression and Gradient Descent》
介绍:Logistic回归与优化实例教程.
584《贾扬清微信讲座记录》
介绍:贾扬清(谷歌大脑科学家、caffe缔造者)微信讲座记录.
585《sketch》
介绍:Theano/Blocks实现RNN手写字符串生成sketch.
586《Web Scale Document Clustering: Clustering 733 Million Web Pages》
介绍:基于TopSig的海量(7亿+)网页聚类.
587《NAACL 2015 Proceedings on ACL Anthology》
介绍:NAACL 2015 论文papers.
588《Stock Forecasting With Machine Learning - Seven Possible Errors》
介绍:机器学习预测股市的七个问题.
589《Are there any good resources for learning about neural networks?》
介绍:神经网络学习资料推荐.
590《A Critical Review of Recurrent Neural Networks for Sequence Learning》
介绍:面向序列学习的RNN综述.
591《Handling and Processing Strings in R》
介绍:R文本处理手册.
592《Must-watch videos about Python》
介绍:“必看”的Python视频集锦.
593《The Google Stack》
介绍:Google(基础结构)栈.
594《Randomized Algorithms for Matrices and Data》
介绍:矩阵和数据的随机算法(UC Berkeley 2013).
595《Intermediate R》
介绍:DataCamp中级R语言教程.
596《Topology Without Tears》
介绍:免费电子书:轻松掌握拓扑学,中文版.
597《Information Theory, Pattern Recognition, and Neural Networks》
介绍:Book,video.
598《Scikit-learn》
介绍:Scikit-learn 是基于Scipy为机器学习建造的的一个Python模块,他的特色就是多样化的分类,回归和聚类的算法包括支持向量机,逻辑回归,朴素贝叶斯分类器,随机森林,Gradient Boosting,聚类算法和DBSCAN。而且也设计出了Python numerical和scientific libraries Numpy and Scipy
599《Pylearn2》
介绍:Pylearn是一个让机器学习研究简单化的基于Theano的库程序。
600《NuPIC》
介绍:NuPIC是一个以HTM学习算法为工具的机器智能平台。HTM是皮层的精确计算方法。HTM的核心是基于时间的持续学习算法和储存和撤销的时空模式。NuPIC适合于各种各样的问题,尤其是检测异常和预测的流数据来源。
601《Nilearn》
介绍:Nilearn 是一个能够快速统计学习神经影像数据的Python模块。它利用Python语言中的scikit-learn 工具箱和一些进行预测建模,分类,解码,连通性分析的应用程序来进行多元的统计。
602《PyBrain》
介绍:Pybrain是基于Python语言强化学习,人工智能,神经网络库的简称。 它的目标是提供灵活、容易使用并且强大的机器学习算法和进行各种各样的预定义的环境中测试来比较你的算法。
603《Pattern》
介绍:Pattern 是Python语言下的一个网络挖掘模块。它为数据挖掘,自然语言处理,网络分析和机器学习提供工具。它支持向量空间模型、聚类、支持向量机和感知机并且用KNN分类法进行分类。
604《Fuel》
介绍:Fuel为你的机器学习模型提供数据。他有一个共享如MNIST, CIFAR-10 (图片数据集), Google’s One Billion Words (文字)这类数据集的接口。你使用他来通过很多种的方式来替代自己的数据。
605《Bob》
介绍:Bob是一个免费的信号处理和机器学习的工具。它的工具箱是用Python和C++语言共同编写的,它的设计目的是变得更加高效并且减少开发时间,它是由处理图像工具,音频和视频处理、机器学习和模式识别的大量软件包构成的。
606《Skdata》
介绍:Skdata是机器学习和统计的数据集的库程序。这个模块对于玩具问题,流行的计算机视觉和自然语言的数据集提供标准的Python语言的使用。
607《MILK》
介绍:MILK是Python语言下的机器学习工具包。它主要是在很多可得到的分类比如SVMS,K-NN,随机森林,决策树中使用监督分类法。 它还执行特征选择。 这些分类器在许多方面相结合,可以形成不同的例如无监督学习、密切关系金传播和由MILK支持的K-means聚类等分类系统。
608《IEPY》
介绍:IEPY是一个专注于关系抽取的开源性信息抽取工具。它主要针对的是需要对大型数据集进行信息提取的用户和想要尝试新的算法的科学家。
609《Quepy》
介绍:Quepy是通过改变自然语言问题从而在数据库查询语言中进行查询的一个Python框架。他可以简单的被定义为在自然语言和数据库查询中不同类型的问题。所以,你不用编码就可以建立你自己的一个用自然语言进入你的数据库的系统。现在Quepy提供对于Sparql和MQL查询语言的支持。并且计划将它延伸到其他的数据库查询语言。
610《Hebel》
介绍:Hebel是在Python语言中对于神经网络的深度学习的一个库程序,它使用的是通过PyCUDA来进行GPU和CUDA的加速。它是最重要的神经网络模型的类型的工具而且能提供一些不同的活动函数的激活功能,例如动力,涅斯捷罗夫动力,信号丢失和停止法。
611《mlxtend》
介绍:它是一个由有用的工具和日常数据科学任务的扩展组成的一个库程序。
612《nolearn》
介绍:这个程序包容纳了大量能对你完成机器学习任务有帮助的实用程序模块。其中大量的模块和scikit-learn一起工作,其它的通常更有用。
613《Ramp》
介绍:Ramp是一个在Python语言下制定机器学习中加快原型设计的解决方案的库程序。他是一个轻型的pandas-based机器学习中可插入的框架,它现存的Python语言下的机器学习和统计工具(比如scikit-learn,rpy2等)Ramp提供了一个简单的声明性语法探索功能从而能够快速有效地实施算法和转换。
614《Feature Forge》
介绍:这一系列工具通过与scikit-learn兼容的API,来创建和测试机器学习功能。这个库程序提供了一组工具,它会让你在许多机器学习程序使用中很受用。当你使用scikit-learn这个工具时,你会感觉到受到了很大的帮助。(虽然这只能在你有不同的算法时起作用。)
615《REP》
介绍:REP是以一种和谐、可再生的方式为指挥数据移动驱动所提供的一种环境。它有一个统一的分类器包装来提供各种各样的操作,例如TMVA, Sklearn, XGBoost, uBoost等等。并且它可以在一个群体以平行的方式训练分类器。同时它也提供了一个交互式的情节。
616《Python 学习机器样品》
介绍:用亚马逊的机器学习建造的简单软件收集。
617《Python-ELM》
介绍:这是一个在Python语言下基于scikit-learn的极端学习机器的实现。
618《Dimension Reduction》
介绍:电子书降维方法,此外还推荐Dimensionality Reduction A Short Tutorial、Matlab Toolbox for Dimensionality Reduction、Unsupervised Kernel Dimension Reduction
619《Datasets Used For Benchmarking Deep Learning Algorithms》
介绍:deeplearning.net整理的深度学习数据集列表.
620《Golang Natural Language Processing》
介绍:Go语言编写的自然语言处理工具.
621《Rehabilitation of Count-based Models for Word Vector Representations》
介绍:词频模型对词向量的反击,参考Improving Distributional Similarity with Lessons Learned from Word Embeddings 。
622《Three Aspects of Predictive Modeling》
介绍:预测模型的三个方面.
623《CS224d: Deep Learning for Natural Language Processing》
介绍:斯坦福大学深度学习与自然语言处理课程,部分课程笔记词向量、引言
624《Google Computer Vision research at CVPR 2015》
介绍:CVPR2015上Google的CV研究列表.
625《Using Deep Learning to Find Basketball Highlights》
介绍:利用(Metamind)深度学习自动发现篮球赛精彩片段.
626《Learning Deep Features for Discriminative Localization》
介绍:对本土化特征学习的分析