人工智能技术入门_杨正洪_AZW3_MOBI_EPUB_PDF_电子书(无页码)_杨正洪
内容节选
第6章算法选择和优化 机器学习一直以来都是人工智能研究的核心领域。它主要通过各种算法使得机器能够从样本、数据和经验中学习规律,从而对新的样本做出识别或对未来做出预测。20世纪80年代开始的机器学习浪潮诞生了包括决策树学习、聚类、强化学习和贝叶斯网络等非常多的机器学习算法(模型),它们已经被广泛地应用在网络搜索、垃圾邮件过滤、推荐系统、网页搜索排序、广告投放、信用评价、欺诈检测等领域。而这几年来取得突破性进展而受到人们关注的深度学习,只是实现机器学习的其中一种技术手段。图6-1展示了产品、数据和算法的协同效应。 图6-1 产品、数据和算法的协同效应 6.1 算法概述 最常见的机器学习算法就是学习(训练)y=f(x)的映射,针对新的x预测y,这叫作预测建模或预测分析。我们的目标就是让预测更加精确。但不知道目标函数f是什么样的。如果知道,就可以直接使用它,而不需要再通过机器学习从数据中进行学习(训练)。机器学习算法可以描述为学习一个目标函数f,它能够最好地映射出输入变量x到输出变量y。预测建模的首要目标是减小模型误差或将预测精度做到最佳。我们从统计学等不同领域借鉴了多种算法来达到这个目标。 当面对各种机器学习算法时,一个新手最常问的问题是“我该使用哪个算法”?要回答这个问题需要考虑很多因素:①数据的大小、质量和类型;②完成计算所需要的时间;③任务的紧迫程度;④你需要对数据做什么处理。在尝试不同算法之前,即使是一个经验丰富的数据科学家,也不可能告诉你哪种算法性能最好。本节列举的是最常用的几种。如果你是一个机器学习的新手,这几种是最好的学习起点。 6.1.1 线性回归 线性回归可能是统计和机器学习领域最广为人知的算法之一。给线性回归找到一组特定的权值,称为系数B。通过最能符合输入变量x到输出变量y关系的等式所代表的线表达出来。线性回归的例子如图6-2所示。 图6-2 线性回归的例子 例如,y=b0+b1×x。我们针对输入的x来预测y。线性回归学习算法的目标是找到b0和b1的值。不同的技巧可以用于线性回归模型,比如线性代数的普通最小二乘法以及梯度下降优化算法。线性回归已经有超过200年的历史,这种算法可以很好地消除相似的数据,以及去除数据中的噪声,是快速且简便的首选算法。 6.1.2 逻辑回归 逻辑回归(Logistic Regression,LR)是另一种从统计领域借鉴而来的机器学习算法。与线性回归相同,逻辑回归学习算法的目的是找出每个输入变量对应的参数值。不同的是,预测输出所用的变换是一个被称作Logistic函数的非线性函数。Logistic函数像一个大S,它将所有输出值转换为0到1之间的数(可看作概率值),如图6-3所示。这很有用,我们可以定义一些规则将Logistic函数的输出转换为0或1(比如,当小于0.5时则为1),然后以此进行分类。 图6-3 逻辑回归的例子 逻辑回归模型是一种常见的分类模型。我们不要被名字所惑,逻辑回归是一个分类模型,也就是说,要使用这个模型,标签数据必须是离散型变量。最简单的离散型变量是二元离散型变量(Binary Variable),即变量只取两个值:0或者1。逻辑回归之所以带有“回归”二字,是因为它以线性回归为基础演化而来,与线性回归的表达形式相似。 正如上面所讲的,逻辑回归模型其实仅在线性回归的基础上套用了一个逻辑函数,但也由于这个逻辑函数,使得逻辑回归模型成为机器学习领域一颗耀眼的明星。在回归模型中,y是一个定性变量,比如y=0或1,逻辑回归主要应用于研究某些事件发生的概率。比如,如何预测硬币抛出后正面朝上的概率?概率为0到1之间的值。这就是逻辑回归。这是一种非常实用的预测方法,我们经常将这种方法映射到分类任务上,比如想确定某封电子邮件是否是垃圾邮件。总的来说,逻辑回归的用途如下: ·预测:根据模型,预测在不同自变量的情况下,发生某种疾病或某种情况的概率有多大。 ·判别:实际上与预测有些类似,也是根据模型,判断某人属于某种疾病或属于某种情况的概率有多大,也就是看一下这个人有多大的可能性属于某种疾病或某种情况。 逻辑回归分析非常有用。以胃癌病情分析为例,选择两组人群,一组是胃癌组;另一组是非胃癌组,两组人群必定具有不同的体征与生活方式等。因此,因变量(标签)就为是否患有胃癌,值为“是”或“否”,自变量(特征)就可以包括很多了,如年龄、性别、饮食习惯、幽门螺杆菌感染等。自变量既可以是连续的,也可以是分类的。然后通过逻辑回归分析,可以得到自变量的权重,从而可以大致了解到底哪些因素是导致胃癌的危险因素。同时,通过该权值可以根据危险因素预测一个人患癌症的可能性。 逻辑回归做出的预测可以被当作0和1这两个分类数据的概率值。这在一些需要给出预测合理性的问题中非常有用。就像线性回归,在需要移除与输出变量无关的特......
- 信息
- 内容简介
- 前言
- 第1章 人工智能概述
- 第2章 AI产业
- 第3章 机器学习概述
- 第4章 特征工程
- 第5章 模型训练和评估
- 第6章 算法选择和优化
- 第7章 深度学习
- 第8章 TensorFlow
- 第9章 TensorFlow高级知识
- 第10章 神经网络
- 第11章 人工智能应用
- 附录A 人工智能的历史发展
- 附录B 人工智能网上资料
- 附录C 本书中采用的人工智能中英文术语
- 附录D 术语列表