深入浅出数据分析
数据分析固定流程 |
|
心智模型 |
|
观察研究法 | 被研究的人自行决定自己属于哪个群体的一种研究方法 |
拆分数据块 | 为了控制观察研究混杂因素,有时需将数据拆分为更小的数据块。这些数据块更具有同质性,即数据块不包含那些有可能扭曲你的分析结果及让你产生错误想法的内部偏差。 |
控制组 |
|
不可控因素; 可控因素 |
|
假设检验 |
证伪法:剔除无法证实的假设。可以克服人们专注于错误答案而无视于其他答案的天然倾向。通过强迫自己以完全正规的方式思考问题,会减少因忽视重要特征情况而犯错误的可能性。 满意法:选出看上去最可信的第一个假设。满意法的问题是当人们在未对其他假设进行透彻分析的情况下选取某种假设时,往往会坚持这个假设,即使反面证据堆积如山。 |
诊断性 | 是证据所具有的一种功能,能够帮助你评估所考虑的假设的相对似然。如果证据具有诊断性,就能帮助你对假设排序。 |
基础概率 | 事前概率:在根据试验结果单独分析前,就知道的概率 |
主观概率 |
如果用一个数字形式的概率来表示自己对某事的确认程度,所用的就是主观概率 是根据规律进行分析的巧妙方法,尤其是在预测孤立事件却缺乏从前在相同条件下发生过的可靠数据的情况下 |
启发法 |
心理学定义:用一种更便于理解的属性代替一种难理解的、令人困惑的属性 |
快省树 | 快是指完成这个过程费时不多,省是指不需要大量认知资源 |
外插法 |
用回归方程预测数据范围以外的数值称为外插法,风险大。使用外插法需要指定附加假设条件,明确表示不考虑数据集外发生的情况。 用回归方程预测数据范围以内的数值称为内插法,准确。 |
机会误差 |
实际结果与预测结果之间的偏差,又叫残差 预测总是与机会误差同在 |
标准偏差 |
描述的是平均值周围的分布情况 这种度量方式描述的是一个变量 |
均方根误差 |
描述的是回归线周围的分布情况 指两个变量之间的关系 又称残差标准差 |
分割 |
将数据分析拆分为几个组。如果为几个分组分别创建预测模型比单独使用一个模型更能减小误差,则应进行分割。 回归线是与平均值图形重合程度最高的线条 |
相关阅读
本文基于MT5756 Data Analysis 复习笔记。禁止未经本人同意任何形式的转载,如有需要请联系[email protected]第一章 介绍对统计学的
原文:秒懂,Java 注解 (Annotation)你可以这样学 文章开头先引入一处图片。 这处图片引
Hi,各位看官老爷大家好,今天跟大家分享的主题是“初始数据埋点”,本文主要面向的对象是0-1岁刚入门或者即将入门的看官老爷们,本汪把
做淘宝,尤其是非一件件代发的分销型卖家,一定要有一定的风险把控意识。所以,产品的上新前一定要做好市场分析,将风险降到最低。这时候
1. 摘要 ( 注意:请仔细看下摘要,留心此文是否是您的菜,若浪费宝贵时间,深感歉意!!!) SSO这一概念由来已久,也是相当普遍的一种身份验证设