1、大数据时代下的统计学目录01.1 大数据时代下的统计学07.7 统计杂谈03.3 描述数据05.5 统计推断02.2 样本魅影04.4 正态女神06.6 变量间的关系08.8 大数据,在水一方1 大数据时代下的统计学01Part One1 大数据时代下的统计学1.2 概率上帝的指引1.4 你真的了解数据吗1.1 统计学天使还是恶魔1.3 小概率事件必然不会发生的事件1.5 数据来自哪里1 大数据时代下的统计学1.1 统计学天使还是恶魔【知识点】统计学的定义1.2 概率上帝的指引1 大数据时代下的统计学01【案例1】硬币的指引02【案例2】赌徒的错觉03【知识点1】随机性04【知识点2】概率1
2、大数据时代下的统计学1.3 小概率事件必然不会发生的事件01【案例】挑战者号航天飞机(STS Challenger)失事02【知识点】“必然会发生”和“必然不会发生”的事件LOGOM.94275.CN1 大数据时代下的统计学1.4 你真的了解数据吗A【案例】淘宝的客户评价体系【知识点】数据的类型B1 大数据时代下的统计学1.5 数据来自哪里【知识点1】二手数据02【案例】大数据,大偏差谷歌的流感预测模型真的靠谱吗01【知识点2】相关关系和因果关系032 样本魅影02Part One2 样本魅影2.1 样本窥一斑而见全豹,观滴水而知沧海2.2 抽样尝一勺锅里的靓汤2.5 大数据时代,当“样本”已
3、成往事2.3 不回应误差沉默不是金2.4 措辞的艺术僧推/敲月下门2 样本魅影2.1 样本窥一斑而见全豹,观滴水而知沧海【案例2】救护车垄断业务调查02【案例1】客户满意度调查01【知识点】随机样本,方便样本和自愿回应样本032.2 抽样尝一勺锅里的靓汤2 样本魅影【案例2】“捉放法”估算鱼苗成活率【知识点1】简单随机抽样【知识点3】访问员【案例1】红豆和绿豆【案例3】被解雇的市场调研部员工【知识点2】抽样中存在的错误风险2 样本魅影2.3 不回应误差沉默不是金【知识点1】不回应(Nonresponse)贰【案例】不回应的影响有多大壹【知识点2】如何降低不回应率叁2 样本魅影2.4 措辞的艺术
4、僧推/敲月下门01【案例1】娱乐圈话题:锋菲恋03【案例3】双重否定的疑惑05【知识点2】有效性(Validity)和可靠性(Reliability)02【案例2】几字之差对于民众支持率的影响04【知识点1】响应误差(Response Error)2 样本魅影2.5 大数据时代,当“样本”已成往事A【案例】Farecast,美国创业梦【知识点】大数据的4V特征B3 描述数据03Part One3 描述数据3.1 均值可能会说谎的天平3.2 寻找中位数排序,数到中间3.5 数据可视化“云想衣裳花想容”3.3 标准差、标准误,傻傻分不清楚3.4 图形替数据说话“剩女”和相亲市场3 描述数据3.1
5、均值可能会说谎的天平2020【案例1】中关村创业者平均39岁012021【案例2】令人啼笑皆非的统计局数据022022【知识点】均值计算033 描述数据3.2 寻找中位数排序,数到中间【案例2】淘宝卖家评分体系0204【知识点2】四分位数【案例1】腾讯笔试题:大数据量寻找中位数03【知识点1】求取中位数013 描述数据3.3 标准差、标准误,傻傻分不清楚【案例2】语文成绩调研0204【知识点2】标准误(Standard Error)【案例1】均值-方差证券资产组合理论03【知识点1】标准差(Standard Deviation)013.4 图形替数据说话“剩女”和相亲市场3 描述数据【知识点1
6、】饼状图(Pie Chart)【知识点3】散点图(Scatter Plot)【案例】“剩女”和潜力巨大的相亲市场【知识点2】条状图(Bar Chart)3 描述数据3.5 数据可视化“云想衣裳花想容”2019【案例】谁在开网店012020【知识点1】什么是数据可视化022021【知识点2】数据可视化主要应用领域032022【知识点3】数据可视化的工具044 正态女神04Part One4 正态女神ADBC4.2 大数定律为什么十赌九输4.3 正态分布大道至简,大美天成4.4 中心极限定理4.1 期望量化你的预期4.1 期望量化你的预期4 正态女神【案例2】赌场就是概率场【知识点2】期望(Exp
7、ectation)【案例1】掷骰子和伯努利试验【知识点1】概率分布【知识点3】方差4 正态女神4.2 大数定律为什么十赌九输2020【案例1】澳门风云012021【案例2】谁会是被骗的大傻瓜022022【知识点】大数定律034.3 正态分布大道至简,大美天成4 正态女神【案例2】女博士嫁人难,谁之过【案例1】高尔顿钉板【知识点】正态分布4 正态女神4.4 中心极限定理A【案例】肯家和麦家的博弈【知识点】中心极限定理B5 统计推断05Part One5 统计推断5.1 点估计统计学家比间谍干得漂亮5.2 置信区间责善切戒尽言5.3 两类错误:有罪被判无罪和无罪被判有罪哪个更严重5.4 假设检验“
8、凑巧”可以拒绝吗5.5p 值打开潘多拉魔盒的钥匙5 统计推断5.1 点估计统计学家比间谍干得漂亮2019【案例1】二战中的德军坦克数012020【案例2】首家新鲜咖啡速递服务企业022021【知识点1】样本统计量和总体参数032022【知识点2】点估计045 统计推断5.2 置信区间责善切戒尽言1【案例】美国盖洛普公司的民意调查2【知识点1】置信水平3【知识点2】置信区间5.3 两类错误:有罪被判无罪和无罪被判有罪哪个更严重5 统计推断【案例2】抗击埃博拉要避免两类错误【知识点2】两类错误【案例1】法律中的人文精神【知识点1】零假设和备择假设5 统计推断5.4 假设检验“凑巧”可以拒绝吗【案例
9、1】奶茶情缘01【案例2】咖啡新鲜吗02【知识点1】显著性水平03【知识点2】p值04【知识点3】统计显著05【知识点4】统计显著vs.实际显著065 统计推断5.4 假设检验“凑巧”可以拒绝吗AB【知识点6】单侧检验 vs.双侧检验【知识点5】假设检验vs.置信区间5 统计推断5.5p 值打开潘多拉魔盒的钥匙2020【案例】金榜题名无望、少年得志梦断012021【知识点1】p值的历史和思想022022【知识点2】p值误用036 变量间的关系06Part One6 变量间的关系6.1 卡方分析细腻的眼神里岂容得半粒沙6.2 相关性分析早起的鸟儿有虫吃6.3 ANOVA地域,我们没有什么不同6.
10、4 回归分析对不起,其实我也想长高6 变量间的关系6.1 卡方分析细腻的眼神里岂容得半粒沙【案例1】仙道迟到事件发生率分析【案例2】性别和文化程度是相互独立的吗【知识点1】卡方分布【知识点2】卡方检验6 变量间的关系6.2 相关性分析早起的鸟儿有虫吃01【案例1】早起的鸟儿有虫吃03【知识点1】相关关系05【知识点3】相关表、相关图和相关系数02【案例2】化妆品销售额与广告费的关系分析04【知识点2】相关分析06【知识点4】相关系数t统计量6 变量间的关系6.3 ANOVA地域,我们没有什么不同【案例】地域歧视问题01【知识点1】方差分析02【知识点2】方差分析统计模型03【知识点3】离差平方
11、和及其分解04【知识点4】均方05【知识点5】AMOVA F统计量066 变量间的关系6.3 ANOVA地域,我们没有什么不同【知识点6】方差分析表6.4 回归分析对不起,其实我也想长高6 变量间的关系【案例2】身高地区差异分析【知识点2】随机误差项【知识点4】回归分析T检验【案例1】子女身高遗传学的发现【知识点1】回归分析【知识点3】最小二乘法6 变量间的关系6.4 回归分析对不起,其实我也想长高【知识点5】回归分析F检验【知识点6】拟合优度R27 统计杂谈07Part One7 统计杂谈7.2 调查问卷中的分类变量7.4 极大似然估计看起来最像7.6 贝叶斯7.1 为什么对回归情有独钟7.
12、3 条件概率和更多的信息7.5 R you happy7 统计杂谈7.7 来自星星的统计陷阱7 统计杂谈7.1 为什么对回归情有独钟【回归和电影】1【回归和手游】27 统计杂谈7.2 调查问卷中的分类变量01020304【疼痛】【Rank-Invariant】【Svensson Method】【工作环境和员工满意度】7 统计杂谈7.3 条件概率和更多的信息【门后的世界:到底是谁错了】【生男生女的问题】7 统计杂谈7.4 极大似然估计看起来最像【白狐,iphone 6 plus和房价】7.5 R you happy7 统计杂谈【名门闺秀SAS】【国民初恋SPSS】【小家碧玉Stata、Minitab、Excel】【清新萝莉R】7 统计杂谈7.6 贝叶斯【起源】【定义】【自拍杆和蓝牙耳机】7 统计杂谈7.7 来自星星的统计陷阱【被黑的统计机构】【统计局的无奈】【王老吉状告加多宝】8 大数据,在水一方08Part One8 大数据,在水一方8.1 洛阳 纸贵 大 数 据 思维【案例1】罩杯和败家程度【案例2】外滩踩踏悲剧【案例3】大数据和途牛网8.2 大数据驱动运营【案例】DataEye,数据驱动手游运营8.3 商业 智能 决 策 者 的锦 囊【案例】广告业的商业智能8.4 市 场智 能 商 业 智 能的 衍 生 智慧 8.5 消 费智 能 当 数 据 成为 一 种 服务 感谢聆听