2、实用机器学习问题

什么是机器学习?我们可以阅读机器学习的权威定义,但实际上,机器学习是由正在解决的问题定义的。因此,了解机器学习的最佳方法是查看一些示例问题。

在这篇文章中,我们将首先看一些现实世界中机器学习问题的众所周知和理解的例子。然后,我们将查看标准机器学习问题的分类法(命名系统),并学习如何将问题识别为这些标准案例之一。这很有价值,因为了解我们面临的问题类型可以让我们考虑我们需要的数据以及要尝试的算法类型。

10机器学习问题的例子

机器学习问题比比皆是。它们构成了您每天在网络或桌面上使用的软件的核心或难点部分。想想推特上的“你想跟随”的建议以及Apple的Siri中的言语理解。

下面是10个机器学习的例子,它们真正奠定了机器学习的全部意义。

  • 垃圾邮件检测:给定收件箱中的电子邮件,识别那些垃圾邮件和非垃圾邮件。拥有此问题的模型将允许程序将非垃圾邮件留在收件箱中并将垃圾邮件移动到垃圾邮件文件夹。我们都应该熟悉这个例子。
  • 信用卡欺诈检测:在一个月内为客户提供信用卡交易,识别客户和非客户进行的交易。具有此决定模型的程序可以退还那些欺诈性交易。
  • 数字识别:给定一个手写在信封上的邮政编码,识别每个手写字符的数字。该问题的模型将允许计算机程序读取和理解手写邮政编码并按地理区域对信封进行排序。
  • 语音理解:给定用户的话语,识别用户提出的具体请求。该问题的模型将允许程序理解并尝试满足该请求。带Siri的iPhone具有这种功能。
  • 人脸检测:鉴于数百张数码照片的数码相册,请识别包含特定人物的照片。该决策过程的模型将允许程序按人员组织照片。一些相机和像iPhoto这样的软件具有这种功能。
face_detection.jpg

照片中的人脸检测示例。
先生的照片 'sto根据署名 - ShareAlike 2.0通用知识共享许可获得许可。

  • 产品推荐:根据客户的购买历史记录和大量产品库存,确定该客户将感兴趣并可能购买的产品。该决策过程的模型将允许程序向客户提出建议并激励产品购买。亚马逊有这种能力。还要考虑Facebook,GooglePlus和LinkedIn,建议用户在注册后与您联系。
  • 医疗诊断:鉴于患者出现的症状和匿名患者记录数据库,预测患者是否可能患病。程序可以使用该决策问题的模型来为医疗专业人员提供决策支持。
  • 股票交易:鉴于股票的当前和过去价格变动,确定是否应该购买,持有或出售股票。这个决策问题的模型可以为金融分析师提供决策支持。
  • 客户细分:考虑到用户在试用期间的行为模式以及所有用户的过去行为,请确定将转换为产品的付费版本和不会转换为付费版本的用户。该决策问题的模型将允许程序触发客户干预以说服客户提前或更好地参与试验。
  • 形状检测:给定用户手在触摸屏上绘制形状和已知形状的数据库,确定用户试图绘制的形状。该决定的模型将允许程序显示用户绘制的用于制作清晰图表的那种形状的柏拉图版本。该Instaviz iPhone应用程序做到这一点。

这10个例子很好地理解了机器学习问题。有一个历史性的例子,有一个需要建模的决定,一个企业或领域的好处,使自己的决策建模和有效。

其中一些问题是人工智能中最难的问题,例如自然语言处理和机器视觉(人类很容易做的事情)。其他人仍然很难,但却是机器学习的经典例子,如垃圾邮件检测和信用卡欺诈检测。

想想你上周在线和离线软件的一些互动。我相信你可以很容易地猜到你直接或间接使用的另外十或二十个机器学习的例子。

机器学习问题的类型

通过阅读上面的示例机器学习问题列表,我相信你可以开始看到相似之处。这是一项有价值的技能,因为善于提取问题的本质将使您能够有效地思考您需要哪些数据以及您应该尝试哪种类型的算法。

机器学习中存在常见的问题类别。下面的问题类是我们在进行机器学习时所提到的大多数问题的原型。

  • 分类:数据被标记意味着它被分配了一个类,例如垃圾邮件/非垃圾邮件或欺诈/非欺诈。建模的决定是为新的未标记数据分配标签。这可以被认为是歧视问题,模拟群体之间的差异或相似性。
  • 回归:数据标有实际值(想想浮点数),而不是标签。易于理解的示例是时间序列数据,如股票价格随时间的变化,建模的决策是预测新的不可预测数据的值。
  • 聚类:数据未标记,但可以根据数据中的相似性和其他自然结构度量进行划分。上面列表中的一个示例是通过没有名称的面部组织图片,其中人类用户必须为组指定名称,例如Mac上的iPhoto。
  • 规则提取:数据被用作提取命题规则的基础(先行/结果,即if-then)。这样的规则可以但通常不是针对性的,这意味着方法发现数据中的属性之间的统计上可支持的关系,不一定涉及正被预测的事物。一个例子是发现购买啤酒和尿布之间的关系 (这是数据挖掘民间法,无论是否真实,它是对欲望和机会的说明)。

当您认为问题是机器学习问题(需要根据数据建模的决策问题)时,请考虑您可以轻松地将其置于何种类型的问题或客户或要求要求和工作的结果类型向后。

资源

几乎没有资源提供真实世界机器学习问题的列表。他们可能在那里,但我找不到他们。我仍然为你找到了一些很酷的资源:

  • 年度“Humies”奖项:这些是通过算法获得的奖项列表,这些算法与人类提出的结果相比具有竞争力。这令人兴奋,因为这些算法只能从数据或成本函数中运作,并且能够具有创造性和创造性,足以侵犯专利。惊人!
  • 人工智能效应:一旦人工智能程序获得足够好的结果,它就不再被视为人工智能,而只是技术并且在日常事物中被使用。同样适用于机器学习。
  • AI-Complete:指的是人工智能中非常困难的问题,如果解决这个问题将是强AI(AI在科幻小说中设想,真正的AI)的一个例子。计算机视觉和自然语言处理的问题都是AI完全问题的例子,也可能被认为是特定领域的机器学习问题类别。
  • 2013年机器学习的十大问题是什么?这个Quora问题有一些很好的答案,并列出了一些广泛的实际机器学习问题。

我们已经回顾了现实世界机器学习问题的一些常见例子以及机器学习问题类别的分类。我们现在有信心评论问题是否是机器学习问题,并从问题描述中挑选元素并确定它是分类,回归,聚类还是规则提取类型的问题。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,524评论 5 460
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,869评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,813评论 0 320
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,210评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,085评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,117评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,533评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,219评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,487评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,582评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,362评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,218评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,589评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,899评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,176评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,503评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,707评论 2 335