R数据挖掘实战_【意大利】安德烈亚·奇里洛_AZW3_MOBI_EPUB_PDF_电子书(无页码)_【意大利】安德烈亚·奇里洛
内容节选
7.1定义数据建模策略 “我向克劳夫提出的这个解决方案也许太过草率了。他是一位非常出色的专业人士,我从没有听说过他的请求会得不到满意的答复。而且,从他的话语间,我感觉导致现金流下降的原因不排除欺诈的假设。如果事情真是这样的话,我会更加紧张。”安迪说道。 “尽管如此,我们也要按‘一切照旧’的情形去处理当前的问题。重点是眼下需要获得以往的违约事件相关的数据,以及有过违约历史记录的公司列表。”安迪说道,“什么?公司还给了你过去的违约事件的数据集,你还对它进行了清理?这真是太好了。接下来,请把数据集发给我,我们就可以马上把它用起来了。” “clean_casted_stored_data_validated_complete,是这个数据集吗?文件名字太长没有关系的。”只需要用glimpse()函数运行一下,观察文件的内容就行了。glimpse(clean_casted_stored_data_validated_complete) Observations: 11,523 Variables: 16 $ attr_3
- 信息
- 内容提要
- 作者简介
- 审稿人简介
- 前言
- 第1章 为何选择R语言
- 1.1 什么是R语言
- 1.2 R语言的发展历史
- 1.3 R语言的优势
- 1.4 安装R语言和编写R语言代码
- 1.5 R语言的基本概念
- 1.6 R语言的劣势以及如何克服这些劣势
- 1.7 更多参考
- 1.8 小结
- 第2章 数据挖掘入门
- 2.1 获取并组织银行数据
- 2.2 使用数据透视表汇总数据
- 2.3 使用ggplot2程序包对数据进行可视化
- 2.4 更多参考
- 2.5 小结
- 第3章 数据挖掘进阶
- 3.1 CRISP-DM方法论之数据挖掘周期
- 3.2 业务理解
- 3.3 数据理解
- 3.4 数据准备
- 3.5 建模
- 3.6 评估
- 3.7 部署
- 3.8 小结
- 第4章 保持室内整洁
- 4.1 概述
- 4.2 数据源
- 4.3 数据仓库和数据库
- 4.4 数据挖掘引擎
- 4.5 用户界面
- 4.6 如何使用R语言创建数据挖掘架构
- 4.7 更多参考
- 4.8 小结
- 第5章 如何解决数据挖掘问题
- 5.1 安静祥和的一天
- 5.2 数据清洗
- 5.3 更多参考
- 5.4 小结
- 第6章 观察数据
- 6.1 汇总EDA介绍
- 6.2 图形化EDA
- 6.3 更多参考
- 6.4 小结
- 第7章 最初的猜想
- 7.1 定义数据建模策略
- 7.2 应用线性回归
- 7.3 更多参考
- 7.4 小结
- 第8章 浅谈模型性能评估
- 8.1 定义模型性能
- 8.2 衡量回归模型的性能
- 8.3 衡量分类问题模型的性能
- 8.4 区分训练数据集与测试数据集
- 8.5 更多参考
- 8.6 小结
- 第9章 不要放弃—继续学习 包括多元变量的回归
- 9.1 从简单线性回归到多元线性回归
- 9.2 降维
- 9.3 使用R语言拟合多元线性模型
- 9.4 更多参考
- 9.5 小结
- 第10章 关于分类模型问题的不同展望
- 10.1 为什么需要分类模型
- 10.2 逻辑回归
- 10.3 支持向量机
- 10.4 更多参考
- 10.5 小结
- 第11章 最后冲刺
- 11.1 随机森林
- 11.2 集成学习
- 11.3 在新数据上应用估计模型
- 11.4 结构化更加良好的预测分析方法
- 11.5 对预测数据应用集成学习中的多数投票技术
- 11.6 更多参考
- 11.7 小结
- 第12章 寻找罪魁祸首
- 12.1 提取PDF文件中的数据
- 12.2 文本情感分析
- 12.3 开发词云
- 12.4 N元模型分析
- 12.5 网络分析
- 12.6 更多参考
- 12.7 小结
- 第13章 借助R Markdown分享公司现状
- 13.1 富有说服力的数据挖掘报告的原则
- 13.2 编制R Markdown报告
- 13.3 在RStudio中编制R Markdown报告文档
- 13.4 渲染和分享R Markdown报告
- 13.5 更多参考
- 13.6 小结
- 第14章 结语
- 附录 日期、相对路径和函数处理
- 彩图