1、第八章第八章模型的构建和检验的模型的构建和检验的若干问题若干问题 我们建立的什么类型的模型?在什么程度上模型是正确的?模型建立中存在问题吗?第八章第八章模型的构建和检验的若干问题模型的构建和检验的若干问题模型构建的问题模型构建的问题模型的有效性检验模型的有效性检验模型的可信度评估模型的可信度评估一一 模型构建的问题模型构建的问题数学分析的严密性给人们深刻印象,数学分析的严密性给人们深刻印象,以及给人以精确而细致的感觉,但这以及给人以精确而细致的感觉,但这可能蒙蔽我们,使我们看不到制约整可能蒙蔽我们,使我们看不到制约整个过程的前提和缺陷。建立在不可靠个过程的前提和缺陷。建立在不可靠前提上苦心完成
2、的细致的数学过程,前提上苦心完成的细致的数学过程,恐怕比任何的欺骗手段都更为隐蔽和恐怕比任何的欺骗手段都更为隐蔽和更为危险。更为危险。1.1 归纳和演绎 把观测数据排列成互相联系的形式是把观测数据排列成互相联系的形式是“归纳归纳”的思维过程,的思维过程,包括提出一种和事实相符合的假说或理论。包括提出一种和事实相符合的假说或理论。如果最初基于直觉做出的工作假说导致了可以得到验证的如果最初基于直觉做出的工作假说导致了可以得到验证的“演绎演绎”,这种工作假说就起了有效的作用。,这种工作假说就起了有效的作用。根据假说进行的逻辑演绎可用来预测尚没观测到的事实。根据假说进行的逻辑演绎可用来预测尚没观测到的
3、事实。假说的有效性是根据指定该假说时的事实进行检验的,新假说的有效性是根据指定该假说时的事实进行检验的,新的事实可能导致这种假说的修改的事实可能导致这种假说的修改 1.2 方法论的谬误方法论的谬误 统计联系与因果关系统计联系与因果关系 事后解释事后解释 生态学谬误生态学谬误 还原论还原论 混淆统计检验显著与实际意义的显著混淆统计检验显著与实际意义的显著 1)统计联系与因果关系)统计联系与因果关系 因果关系是事物之间的一种本质联系因果关系是事物之间的一种本质联系 统计联系只是观测数据中所反映的事物的统计联系只是观测数据中所反映的事物的数量联系数量联系 统计模型是进行假说检验的一种手段,其统计模型
4、是进行假说检验的一种手段,其检验的本质是证伪,而不是证实检验的本质是证伪,而不是证实 2)事后解释)事后解释 如果在进行统计分析之前没有理论假设,如果在进行统计分析之前没有理论假设,那么这一分析属于探索性或描述性的。在那么这一分析属于探索性或描述性的。在得到的统计结果基础上,可以形成新的理得到的统计结果基础上,可以形成新的理论假设。论假设。然而,如果反过来再将同一统计分析作为然而,如果反过来再将同一统计分析作为假设检验看待,就是犯了事后解释错误假设检验看待,就是犯了事后解释错误 事后解释谬误的要害事后解释谬误的要害 将一个仅仅处于刚刚建成的假设当作经过将一个仅仅处于刚刚建成的假设当作经过检验的
5、假设来对待,将一个探索性或描述检验的假设来对待,将一个探索性或描述性分析结果当作了一个解释性分析的结果,性分析结果当作了一个解释性分析的结果,完全混淆建立假说和假说检验的区别完全混淆建立假说和假说检验的区别 由一个数据集所形成的假说或假设不能用由一个数据集所形成的假说或假设不能用同一数据集进行检验同一数据集进行检验 3)生态学谬误)生态学谬误 根据集合单位的分析结果作关于个体的断言根据集合单位的分析结果作关于个体的断言 在人口研究中,微观行为模式(如夫妇或家庭)在人口研究中,微观行为模式(如夫妇或家庭)可能与宏观行为模式可能与宏观行为模式(省和国家的汇总资料)有省和国家的汇总资料)有重大区别。
6、从宏观来说,人口控制已经成为一种重大区别。从宏观来说,人口控制已经成为一种公共利益,但是个人、家庭却不一定能够自觉按公共利益,但是个人、家庭却不一定能够自觉按照公共利益要求行动,因为宏观利益并不完全与照公共利益要求行动,因为宏观利益并不完全与微观利益相一致微观利益相一致 教育和经济水平越发达、地区生育水平越教育和经济水平越发达、地区生育水平越低低 个人受教育水平越高、收入越多,生育数个人受教育水平越高、收入越多,生育数量越低量越低?生态学谬误的表现生态学谬误的表现 发达国家的家庭多没有子女发达国家的家庭多没有子女 这个家庭是发达国家的这个家庭是发达国家的 这个家庭没有子女这个家庭没有子女区别:
7、区别:所有的树都有根所有的树都有根这是棵树这是棵树这棵树有根这棵树有根血统论?血统论?生态学谬误的表现生态学谬误的表现 在国家这个层次上,可能看到收入和犯罪在国家这个层次上,可能看到收入和犯罪之间有强烈的关系,即低收入往往伴随着之间有强烈的关系,即低收入往往伴随着高犯罪。高犯罪。但是,如果我们据此认为低收入的人更可但是,如果我们据此认为低收入的人更可能干坏事,那就犯了生态学谬误的错误能干坏事,那就犯了生态学谬误的错误 4)还原论)还原论 与生态学谬误相对的一种方法论谬误与生态学谬误相对的一种方法论谬误 根据较低层次研究单位的分析结果推断较根据较低层次研究单位的分析结果推断较高层次单位的运行规律
8、高层次单位的运行规律还原论的表现还原论的表现 物理学、生物学对一般物质或生物研究所物理学、生物学对一般物质或生物研究所得到的规律,套用在社会研究中,便产生得到的规律,套用在社会研究中,便产生了社会物理学、社会生物学等种种理论了社会物理学、社会生物学等种种理论 5)混淆统计检验显著与)混淆统计检验显著与实际意义的显著实际意义的显著 根据抽样数据得到的统计量只是总体参数根据抽样数据得到的统计量只是总体参数的点估计的点估计统计检验是否显著统计检验是否显著受到三个方面的影响受到三个方面的影响 实际差异幅度或作用强度的影响实际差异幅度或作用强度的影响-对总体的推测对总体的推测 所要求的把握或称置信度的大
9、小所要求的把握或称置信度的大小 抽样样本规模的大小抽样样本规模的大小如果不根据统计量的实际意义来判定,样本规模如果不根据统计量的实际意义来判定,样本规模足够大,或者降低对结论的把握性要求,一个完足够大,或者降低对结论的把握性要求,一个完全没有实际意义的差异幅度或作用强度也可以取全没有实际意义的差异幅度或作用强度也可以取得统计显著的结果得统计显著的结果下面的显著是没有意义的下面的显著是没有意义的 省际平均收入相差省际平均收入相差0.001元,在样本规模很元,在样本规模很大时,也可能取得统计检验十分显著的结大时,也可能取得统计检验十分显著的结果果 模型中的可能错误模型中的可能错误 混淆因果关系和统
10、计关系混淆因果关系和统计关系 混淆统计显著和实际意义混淆统计显著和实际意义 使用相同的数据产生结论并证实自己使用相同的数据产生结论并证实自己 使用个体行为推测整体行为使用个体行为推测整体行为 使用整体行为推测个体行为使用整体行为推测个体行为1.3 模型解释与研究对象模型解释与研究对象 科学研究并不企图以模型形式完美地再现科学研究并不企图以模型形式完美地再现客观世界,而是努力寻求其最本质的特征,客观世界,而是努力寻求其最本质的特征,去揭示和发现世界去揭示和发现世界 地理学研究对象的复杂性决定了地理学的地理学研究对象的复杂性决定了地理学的研究主要采用常规模型(研究主要采用常规模型(nomothet
11、ic model)来解释世界,它不需要(也不可)来解释世界,它不需要(也不可能)列举所有的影响因素,而只选用解释能)列举所有的影响因素,而只选用解释总体时最重要的因素。所以,它实际上是总体时最重要的因素。所以,它实际上是对人类活动或影响人类活动的自然过程的对人类活动或影响人类活动的自然过程的部分解释,它的部分解释,它的目标是用尽可能少的原因目标是用尽可能少的原因变量提供尽可能多的解释力,解释各变量变量提供尽可能多的解释力,解释各变量之间的基本联系和因果关系形式之间的基本联系和因果关系形式 1.4 统计分析与理论分析统计分析与理论分析 统计分析是在理论分析的基础上,检查各统计分析是在理论分析的基
12、础上,检查各个模型变量的作用,对其作用进行量化描个模型变量的作用,对其作用进行量化描述,并对有关理论假设进行检验述,并对有关理论假设进行检验 1.5 真理性检验与统计检验真理性检验与统计检验 实践是检验真理的唯一标准实践是检验真理的唯一标准 实践是一个活动过程,不能简单归结为直实践是一个活动过程,不能简单归结为直接经验这样的个别环节接经验这样的个别环节 统计检验,可以认为是实践检验的一种形统计检验,可以认为是实践检验的一种形式式 二二 模型的有效性检验模型的有效性检验 模型验证模型验证 模型确认模型确认模型验证模型验证 考察模型与模型计算机实现之间的关系考察模型与模型计算机实现之间的关系 强调
13、当前模型与计算机程序之间的一致性强调当前模型与计算机程序之间的一致性 模型确认模型确认 考察模型(所建立的模型)与被仿真系统考察模型(所建立的模型)与被仿真系统(研究对象)之间的关系(研究对象)之间的关系 强调理论模型与实际系统之间的一致性强调理论模型与实际系统之间的一致性 理论模型理论模型可能的错误可能的错误 I类错误:结果本应有效却判为无效;类错误:结果本应有效却判为无效;建模者风险建模者风险 II类错误:结果本应无效,却判为有效;类错误:结果本应无效,却判为有效;用户风险用户风险 III类错误:研究目的不明确而误认为明确,类错误:研究目的不明确而误认为明确,即研究的实际内容与所需研究的内
14、容不相即研究的实际内容与所需研究的内容不相符符 建模者与用户共同风险建模者与用户共同风险 影响因素影响因素 建模的原理和方法不正确,或者原理和方建模的原理和方法不正确,或者原理和方法虽是正确的,但建模时的假设条件、参法虽是正确的,但建模时的假设条件、参数选取或模型简化的方法不对数选取或模型简化的方法不对 建模过程中忽略了部分次要因素建模过程中忽略了部分次要因素影响因素影响因素 目前尚没有标准能确定哪些约束在建模时目前尚没有标准能确定哪些约束在建模时是可以忽略的是可以忽略的 模型实验的时间过短模型实验的时间过短 对模型初始数据的选取存在失误对模型初始数据的选取存在失误 影响因素影响因素 随机变量
15、的概率分布类型确定或参数选取随机变量的概率分布类型确定或参数选取有误有误 模型输出结果的统计误差模型输出结果的统计误差 在进行计算机实现、求解和实验过程中,在进行计算机实现、求解和实验过程中,模型的有效性还会受到诸如计算机字长、模型的有效性还会受到诸如计算机字长、编码错误和算法等方面的影响编码错误和算法等方面的影响 模型确认的内容模型确认的内容 理论模型有效性确认理论模型有效性确认 数据有效性确认数据有效性确认 运行有效性确认运行有效性确认 三三 模型可信度评估模型可信度评估 理论模型有效性确认;理论模型有效性确认;模型软件验证;模型软件验证;模型运行有效性确认;模型运行有效性确认;数据有效性确认;数据有效性确认;内部安全性验证内部安全性验证 理论模型的有效性理论模型的有效性 表观确认表观确认 历史分析历史分析 预期应用和需求分析预期应用和需求分析 模型概念和逼真度分析模型概念和逼真度分析 模型的软件验证模型的软件验证 计算机模型追踪分析计算机模型追踪分析 软件度量分析软件度量分析 代码分析代码分析 正确性证明正确性证明