面向数据科学家的实用统计学 azw3 chm 地址 kindle 阿里云 下载 umd pdf

面向数据科学家的实用统计学电子书下载地址
内容简介:
本书解释了数据科学中至关重要的统计学概念,介绍如何将各种统计方法应用于数据科学。作者以易于理解、浏览和参考的方式,引出统计学中与数据科学相关的关键概念;解释各统计学概念在数据科学中的重要性及有用程度,并给出原因。
书籍目录:
前言 ii
第 1 章 探索性数据分析 1
1.1 结构化数据的组成 2
1.2 矩形数据 4
1.2.1 数据框和索引 5
1.2.2 非矩形数据结构 5
1.2.3 拓展阅读 6
1.3 位置估计 6
1.3.1 均值 7
1.3.2 中位数和稳健估计量 8
1.3.3 位置估计的例子:人口和谋杀率 9
1.3.4 拓展阅读 10
1.4 变异性估计 10
1.4.1 标准偏差及相关估计值 11
1.4.2 基于百分位数的估计量 13
1.4.3 例子:美国各州人口的变异性估计量 14
1.4.4 拓展阅读 14
1.5 探索数据分布 14
1.5.1 百分位数和箱线图 15
1.5.2 频数表和直方图 16
1.5.3 密度估计 18
1.5.4 拓展阅读 20
1.6 探索二元数据和分类数据 20
1.6.1 众数 21
1.6.2 期望值 22
1.6.3 拓展阅读 22
1.7 相关性 22
1.7.1 散点图 25
1.7.2 拓展阅读 26
1.8 探索两个及以上变量 26
1.8.1 六边形图和等势线(适用于两个数值型变量) 26
1.8.2 两个分类变量 28
1.8.3 分类数据和数值型数据 29
1.8.4 多个变量的可视化 31
1.8.5 拓展阅读 33
1.9 小结 33
第 2 章 数据和抽样分布 34
2.1 抽样和样本偏差 35
2.1.1 偏差 36
2.1.2 选择 37
2.1.3 数据规模与数据质量:何时规模更重要 38
2.1.4 样本均值与总体均值 38
2.1.5 拓展阅读 39
2.2 选择偏差 39
2.2.1 趋均值回归 40
2.2.2 拓展阅读 41
2.3 统计量的抽样分布 42
2.3.1 中心极限定理 44
2.3.2 标准误差 44
2.3.3 拓展阅读 45
2.4 自助法 45
2.4.1 重抽样与自助法 47
2.4.2 拓展阅读 48
2.5 置信区间 48
2.6 正态分布 50
2.7 长尾分布 53
2.8 学生t 分布 55
2.9 二项分布 57
2.10 泊松分布及其相关分布 58
2.10.1 泊松分布 59
2.10.2 指数分布 59
2.10.3 故障率估计 60
2.10.4 韦伯分布 60
2.10.5 拓展阅读 61
2.11 小结 61
第3 章 统计实验与显著性检验 62
3.1 A/B 测试 62
3.1.1 为什么要有对照组 64
3.1.2 为什么只有处理A 和B,没有C、D…… 65
3.1.3 拓展阅读 66
3.2 假设检验 66
3.2.1 零假设 67
3.2.2 备择假设 67
3.2.3 单向假设检验和双向假设检验 68
3.2.4 拓展阅读 68
3.3 重抽样 68
3.3.1 置换检验 69
3.3.2 例子:Web 黏性 69
3.3.3 穷尽置换检验和自助置换检验 72
3.3.4 置换检验:数据科学的底线 72
3.3.5 拓展阅读 72
3.4 统计显著性和p 值 72
3.4.1 p 值 74
3.4.2 α 值 75
3.4.3 类错误和第二类错误 76
3.4.4 数据科学与p 值 76
3.4.5 拓展阅读 77
3.5 t 检验 77
3.6 多重检验 78
3.7 自由度 81
3.8 方差分析 82
3.8.1 F 统计量 84
3.8.2 双向方差分析 85
3.8.3 拓展阅读 86
3.9 卡方检验 86
3.9.1 卡方检验:一种重抽样方法 86
3.9.2 卡方检验:统计理论 88
3.9.3 费舍尔检验 88
3.9.4 与数据科学的关联 90
3.9.5 拓展阅读 91
3.10 多臂老虎机算法 91
3.11 检验效能和样本规模 93
3.11.1 样本规模 95
3.11.2 拓展阅读 96
3.12 小结 96
第4 章 回归与预测 97
4.1 简单线性回归 97
4.1.1 回归方程 98
4.1.2 拟合值与残差 100
4.1.3 二乘法 101
4.1.4 预测与解释(剖析) 102
4.1.5 拓展阅读 103
4.2 多元线性回归 103
4.2.1 美国金县房屋数据案例 103
4.2.2 评估模型 104
4.2.3 交叉验证 106
4.2.4 模型选择和逐步回归法 107
4.2.5 加权回归 108
4.3 使用回归做预测 109
4.3.1 外推法的风险 109
4.3.2 置信区间和预测区间 110
4.4 回归中的因子变量 111
4.4.1 虚拟变量的表示 112
4.4.2 多层因子变量 113
4.4.3 有序因子变量 114
4.5 解释回归方程 115
4.5.1 相关的预测变量 116
4.5.2 多重共线性 117
4.5.3 混淆变量 117
4.5.4 交互作用和主效应 118
4.6 检验假设:回归诊断 119
4.6.1 离群值 120
4.6.2 强影响值 121
4.6.3 异方差性、非正态分布和相关误差 123
4.6.4 偏残差图和非线性 126
4.7 多项式回归和样条回归 127
4.7.1 多项式回归 128
4.7.2 样条回归 129
4.7.3 广义加性模型 131
4.7.4 拓展阅读 132
4.8 小结 133
第5 章 分类 134
5.1 朴素贝叶斯算法 135
5.1.1 准确的贝叶斯分类是不切实际的 136
5.1.2 朴素解决方案 136
5.1.3 数值型预测变量 138
5.1.4 拓展阅读 138
5.2 判别分析 138
5.2.1 协方差矩阵 139
5.2.2 费希尔线性判别分析 139
5.2.3 一个简单的例子 140
5.2.4 拓展阅读 142
5.3 逻辑回归 142
5.3.1 逻辑响应函数和Logit 函数 143
5.3.2 逻辑回归和广义线性模型 144
5.3.3 广义线性模型 145
5.3.4 逻辑回归的预测值 145
5.3.5 解释系数和优势比 146
5.3.6 线性回归与逻辑回归:相似之处和不同之处 147
5.3.7 模型评估 148
5.3.8 拓展阅读 150
5.4 评估分类模型 150
5.4.1 混淆矩阵 151
5.4.2 稀有类问题 152
5.4.3 准确率、召回率和特异性 153
5.4.4 ROC 曲线 153
5.4.5 AUC 155
5.4.6 提升 156
5.4.7 拓展阅读 157
5.5 不平衡数据的处理策略 157
5.5.1 欠采样 158
5.5.2 过采样以及上权重和下权重 158
5.5.3 数据生成 159
5.5.4 基于代价的分类 160
5.5.5 探索预测值 160
5.5.6 拓展阅读 161
5.6 小结 161
第6 章 统计机器学习 162
6.1 K 最近邻算法 163
6.1.1 预测贷款拖欠的示例 164
6.1.2 距离度量 165
6.1.3 独热编码 166
6.1.4 标准化 166
6.1.5 K 值的选取 168
6.1.6 KNN 作为特征引擎 169
6.2 树模型 170
6.2.1 一个简单的例子 171
6.2.2 递归分区算法 172
6.2.3 测量同质性或不纯度 174
6.2.4 阻止树模型继续生长 175
6.2.5 预测连续值 176
6.2.6 如何使用树模型 176
6.2.7 拓展阅读 177
6.3 Bagging 和森林 177
6.3.1 Bagging 方法 178
6.3.2 森林 178
6.3.3 变量的重要性 181
6.3.4 超参数 183
6.4 Boosting 184
6.4.1 Boosting 算法 184
6.4.2 XGBoost 软件 185
6.4.3 正则化:避免过拟合 186
6.4.4 超参数和交叉验证 189
6.5 小结 191
第7 章 无监督学习 192
7.1 主成分分析 193
7.1.1 一个简单的例子 194
7.1.2 计算主成分 195
7.1.3 解释主成分 196
7.1.4 拓展阅读 198
7.2 K-Means 聚类 198
7.2.1 一个简单的例子 199
7.2.2 K-Means 算法 201
7.2.3 解释类 201
7.2.4 选择类的个数 203
7.3 层次聚类 204
7.3.1 一个简单的例子 205
7.3.2 树状图 205
7.3.3 凝聚算法 206
7.3.4 测量相异性 207
7.4 基于模型的聚类 208
7.4.1 多元正态分布 209
7.4.2 混合正态分布 210
7.4.3 类数的选取 212
7.4.4 拓展阅读 213
7.5 变量的缩放和分类变量 213
7.5.1 变量的缩放 214
7.5.2 控制变量 215
7.5.3 分类数据和高氏距离 216
7.5.4 混合数据的聚类问题 218
7.6 小结 219
作者简介 220
封面说明 220
作者介绍:
彼得·布鲁斯(Peter Bruce),知名统计学家,Statistics.统计学教育学院的创立者兼院长,重采样统计软件的开发者。曾在美国马里兰大学和各种短训班教授重采样统计课程。
安德鲁·布鲁斯(Andrew Bruce),华盛顿大学统计学博士,拥有30多年的统计学和数据科学经验,在多家知名学术期刊上发表过多篇论文。
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
原文赏析:
暂无原文赏析,正在全力查找中!
其它内容:
书籍介绍
本书解释了数据科学中至关重要的统计学概念,介绍如何将各种统计方法应用于数据科学。作者以易于理解、浏览和参考的方式,引出统计学中与数据科学相关的关键概念;解释各统计学概念在数据科学中的重要性及有用程度,并给出原因。
网站评分
书籍多样性:4分
书籍信息完全性:9分
网站更新速度:9分
使用便利性:5分
书籍清晰度:7分
书籍格式兼容性:7分
是否包含广告:3分
加载速度:8分
安全性:6分
稳定性:5分
搜索功能:9分
下载便捷性:5分
下载点评
- 体验满分(106+)
- 还行吧(304+)
- 内容完整(400+)
- txt(69+)
- 实惠(575+)
- 体验好(135+)
- epub(487+)
- 好评多(233+)
- 三星好评(496+)
- 书籍完整(418+)
- 体验差(237+)
- 值得下载(573+)
- 在线转格式(519+)
下载评价
- 网友 后***之:
强烈推荐!无论下载速度还是书籍内容都没话说 真的很良心!
- 网友 蓬***之:
好棒good
- 网友 马***偲:
好 很好 非常好 无比的好 史上最好的
- 网友 曾***玉:
直接选择epub/azw3/mobi就可以了,然后导入微信读书,体验百分百!!!
- 网友 温***欣:
可以可以可以
- 网友 宫***凡:
一般般,只能说收费的比免费的强不少。
- 网友 车***波:
很好,下载出来的内容没有乱码。
- 网友 利***巧:
差评。这个是收费的
- 网友 冉***兮:
如果满分一百分,我愿意给你99分,剩下一分怕你骄傲
- 网友 隗***杉:
挺好的,还好看!支持!快下载吧!
- 网友 晏***媛:
够人性化!
- 网友 常***翠:
哈哈哈哈哈哈
- 网友 宓***莉:
不仅速度快,而且内容无盗版痕迹。
- 网友 居***南:
请问,能在线转换格式吗?
- 网友 堵***格:
OK,还可以
- 网友 养***秋:
我是新来的考古学家
喜欢"面向数据科学家的实用统计学"的人也看了
债券投资会计计量与业绩归因分析 余坚 上海财经大学出版社【新华书店正版图书书籍】 azw3 chm 地址 kindle 阿里云 下载 umd pdf
2023春阳光同学期末复习15天冲刺100分语文人教版4年级下册 azw3 chm 地址 kindle 阿里云 下载 umd pdf
明太祖平胡录 明代野史丛书 [明]陆深【正版书籍】 azw3 chm 地址 kindle 阿里云 下载 umd pdf
小即是美小 空间花园园艺设计 RHS年度设计师 BBC园艺画报Deig作者 打造迷人花园 屋顶花园 阳台花园 露台花园 花园设计工具书 azw3 chm 地址 kindle 阿里云 下载 umd pdf
英国 azw3 chm 地址 kindle 阿里云 下载 umd pdf
景观实录 (荷)尼克·卢森(Niek Roozen) 编;李婵 译 辽宁科学技术出版社 【新华书店正版图书书籍】 azw3 chm 地址 kindle 阿里云 下载 umd pdf
9787514801798 azw3 chm 地址 kindle 阿里云 下载 umd pdf
新东方 剑桥商务英语(BEC)中级词汇精选:乱序版(采用“乱序”编排,30天突破词汇难关,BEC制胜神器,考场、职场全HOLD住) azw3 chm 地址 kindle 阿里云 下载 umd pdf
考点清单-历史(初中/八年级) azw3 chm 地址 kindle 阿里云 下载 umd pdf
爱迪生:创新之源与商业成的秘密里昂纳多·迪格拉夫湖南科学技术出版社鑫隆博图书专营店 azw3 chm 地址 kindle 阿里云 下载 umd pdf
- 5-6岁-宝宝学语言-下 azw3 chm 地址 kindle 阿里云 下载 umd pdf
- 新版家庭藏书-名家选集卷-王安石集 (宋)王安石 魏晓虹 解评 三晋出版社【.正版】 azw3 chm 地址 kindle 阿里云 下载 umd pdf
- 9787544529389 azw3 chm 地址 kindle 阿里云 下载 umd pdf
- 教育理论 azw3 chm 地址 kindle 阿里云 下载 umd pdf
- 四川 重庆自驾游地图册(四川地图、重庆地图)旅游地图 旅行装备 自驾游装备—中国分省自驾游地图册系列 azw3 chm 地址 kindle 阿里云 下载 umd pdf
- 平小猪的故事 azw3 chm 地址 kindle 阿里云 下载 umd pdf
- 现代企业人力资源管理 azw3 chm 地址 kindle 阿里云 下载 umd pdf
- 想象:创造力的艺术与科学【可开电子发票】 azw3 chm 地址 kindle 阿里云 下载 umd pdf
- 中国经济50人看三十年--回顾与分析 azw3 chm 地址 kindle 阿里云 下载 umd pdf
- 人格障碍的认知行为疗法 人民邮电出版社 azw3 chm 地址 kindle 阿里云 下载 umd pdf
书籍真实打分
故事情节:8分
人物塑造:4分
主题深度:4分
文字风格:8分
语言运用:9分
文笔流畅:3分
思想传递:9分
知识深度:6分
知识广度:5分
实用性:4分
章节划分:4分
结构布局:6分
新颖与独特:5分
情感共鸣:8分
引人入胜:8分
现实相关:4分
沉浸感:7分
事实准确性:3分
文化贡献:3分