人工智能技术入门_杨正洪_AZW3_MOBI_EPUB_PDF_电子书(无页码)_杨正洪

内容节选

第6章算法选择和优化 机器学习一直以来都是人工智能研究的核心领域。它主要通过各种算法使得机器能够从样本、数据和经验中学习规律,从而对新的样本做出识别或对未来做出预测。20世纪80年代开始的机器学习浪潮诞生了包括决策树学习、聚类、强化学习和贝叶斯网络等非常多的机器学习算法(模型),它们已经被广泛地应用在网络搜索、垃圾邮件过滤、推荐系统、网页搜索排序、广告投放、信用评价、欺诈检测等领域。而这几年来取得突破性进展而受到人们关注的深度学习,只是实现机器学习的其中一种技术手段。图6-1展示了产品、数据和算法的协同效应。 图6-1 产品、数据和算法的协同效应 6.1 算法概述 最常见的机器学习算法就是学习(训练)y=f(x)的映射,针对新的x预测y,这叫作预测建模或预测分析。我们的目标就是让预测更加精确。但不知道目标函数f是什么样的。如果知道,就可以直接使用它,而不需要再通过机器学习从数据中进行学习(训练)。机器学习算法可以描述为学习一个目标函数f,它能够最好地映射出输入变量x到输出变量y。预测建模的首要目标是减小模型误差或将预测精度做到最佳。我们从统计学等不同领域借鉴了多种算法来达到这个目标。 当面对各种机器学习算法时,一个新手最常问的问题是“我该使用哪个算法”?要回答这个问题需要考虑很多因素:①数据的大小、质量和类型;②完成计算所需要的时间;③任务的紧迫程度;④你需要对数据做什么处理。在尝试不同算法之前,即使是一个经验丰富的数据科学家,也不可能告诉你哪种算法性能最好。本节列举的是最常用的几种。如果你是一个机器学习的新手,这几种是最好的学习起点。 6.1.1 线性回归 线性回归可能是统计和机器学习领域最广为人知的算法之一。给线性回归找到一组特定的权值,称为系数B。通过最能符合输入变量x到输出变量y关系的等式所代表的线表达出来。线性回归的例子如图6-2所示。 图6-2 线性回归的例子 例如,y=b0+b1×x。我们针对输入的x来预测y。线性回归学习算法的目标是找到b0和b1的值。不同的技巧可以用于线性回归模型,比如线性代数的普通最小二乘法以及梯度下降优化算法。线性回归已经有超过200年的历史,这种算法可以很好地消除相似的数据,以及去除数据中的噪声,是快速且简便的首选算法。 6.1.2 逻辑回归 逻辑回归(Logistic Regression,LR)是另一种从统计领域借鉴而来的机器学习算法。与线性回归相同,逻辑回归学习算法的目的是找出每个输入变量对应的参数值。不同的是,预测输出所用的变换是一个被称作Logistic函数的非线性函数。Logistic函数像一个大S,它将所有输出值转换为0到1之间的数(可看作概率值),如图6-3所示。这很有用,我们可以定义一些规则将Logistic函数的输出转换为0或1(比如,当小于0.5时则为1),然后以此进行分类。 图6-3 逻辑回归的例子 逻辑回归模型是一种常见的分类模型。我们不要被名字所惑,逻辑回归是一个分类模型,也就是说,要使用这个模型,标签数据必须是离散型变量。最简单的离散型变量是二元离散型变量(Binary Variable),即变量只取两个值:0或者1。逻辑回归之所以带有“回归”二字,是因为它以线性回归为基础演化而来,与线性回归的表达形式相似。 正如上面所讲的,逻辑回归模型其实仅在线性回归的基础上套用了一个逻辑函数,但也由于这个逻辑函数,使得逻辑回归模型成为机器学习领域一颗耀眼的明星。在回归模型中,y是一个定性变量,比如y=0或1,逻辑回归主要应用于研究某些事件发生的概率。比如,如何预测硬币抛出后正面朝上的概率?概率为0到1之间的值。这就是逻辑回归。这是一种非常实用的预测方法,我们经常将这种方法映射到分类任务上,比如想确定某封电子邮件是否是垃圾邮件。总的来说,逻辑回归的用途如下: ·预测:根据模型,预测在不同自变量的情况下,发生某种疾病或某种情况的概率有多大。 ·判别:实际上与预测有些类似,也是根据模型,判断某人属于某种疾病或属于某种情况的概率有多大,也就是看一下这个人有多大的可能性属于某种疾病或某种情况。 逻辑回归分析非常有用。以胃癌病情分析为例,选择两组人群,一组是胃癌组;另一组是非胃癌组,两组人群必定具有不同的体征与生活方式等。因此,因变量(标签)就为是否患有胃癌,值为“是”或“否”,自变量(特征)就可以包括很多了,如年龄、性别、饮食习惯、幽门螺杆菌感染等。自变量既可以是连续的,也可以是分类的。然后通过逻辑回归分析,可以得到自变量的权重,从而可以大致了解到底哪些因素是导致胃癌的危险因素。同时,通过该权值可以根据危险因素预测一个人患癌症的可能性。 逻辑回归做出的预测可以被当作0和1这两个分类数据的概率值。这在一些需要给出预测合理性的问题中非常有用。就像线性回归,在需要移除与输出变量无关的特......

  1. 信息
  2. 内容简介
  3. 前言
  4. 第1章 人工智能概述
  5. 第2章 AI产业
  6. 第3章 机器学习概述
  7. 第4章 特征工程
  8. 第5章 模型训练和评估
  9. 第6章 算法选择和优化
  10. 第7章 深度学习
  11. 第8章 TensorFlow
  12. 第9章 TensorFlow高级知识
  13. 第10章 神经网络
  14. 第11章 人工智能应用
  15. 附录A 人工智能的历史发展
  16. 附录B 人工智能网上资料
  17. 附录C 本书中采用的人工智能中英文术语
  18. 附录D 术语列表