1、1统计模型一般构造方法2目录一、构建步骤1.假设(创新点)2.变量设计(属性、尺度)3.数据收集(问卷、访谈、实验)4.数据分析(变量之间的关系)5.建立模型(模型检验)6.研究评估(信度与效度)二、变量关系分析1.变量之间的关联性检验2.变量之间的变化关系的模型3研究过程的要点(创新点) 研究中最重要的是创新点,所研究问题的假设是研究过程中的关键,所有这一切都必须抓住研究过程中两大环节。(1)问题辨析辨识问题、提炼主题(2)论证和验证主题(即回答解决什么问题,预期取得什么结果,选择论证该预期结果的技术方法)41假设(创新点)(1)问题辨析辨识问题、提炼主题(2)论证和验证主题(即回答解决什么
2、问题,预期取得什么结果,选择论证该预期结果的技术方法)51假设(创新点)(1)问题辨析辨识问题、提炼主题(2)论证和验证主题(即回答解决什么问题,预期取得什么结果,选择论证该预期结果的技术方法)61假设(创新点)(1)问题辨析辨识问题、提炼主题(2)论证和验证主题(即回答解决什么问题,预期取得什么结果,选择论证该预期结果的技术方法)7 找好研究问题(创新)的要点:(1)大量理论阅读,并思考,(2)从实践和理论中观察和归纳。 因此,按趣向选择研究领域,集中阅读问题域有关的文献,了解前人的研究成果,同时收集实际问题需要的资料 领域细化为研究问题,如领域问题分类、问题定位和变量筛选,确定问题领域的研
3、究视角,切入层面,然后才可能找到研究主题 问题导向还是方法导向:有的同学问题还没搞清楚,就说要用某种理论或方法,企图让问题来适应方法。8 问题辨析要素 (1)分析单位,个人、群体、组织、项目、社会产品 (2)研究侧重点,门类、特性、行为。 (3)时间维度,横剖研究、纵贯研究 研究单位,对象不一致,例如: 缺勤率与单身职工比率 政策支持率与青年老年比例9 门类-个人可按性别、年龄、婚姻、高度 特性个人的态度、价值观念、信仰、个性、动机、偏好、倾向、思维方式 行为个人的消费投资行为,企业的产品定价、兼并、招聘,分析单位之间的互动行为如寻租行为、谈判行为、委托代理行为。 门类、特性、行为组合构成研究
4、的主要内容。 (3)时间维度,横剖研究、纵贯研究 趋势研究、同期群研究、追踪研究10112变量之间的关系 (1)单变量(统计特征数字) (2)双变量(相关关系,关联分析) (3)多变量(轮廓分析,因子分析,聚类分析,判别分析,对应分析,典型相关分析,路径分析,结构方程模型,多维标度分析,回归分析) 1 积差相关系数一、概念及适用条件(一)概念积差相关,又称积矩相关(或皮尔逊(英国)相关)。公式为yxNxyr(5.1)。Y;Xyx的标准差为的标准差为即变量的离差为即变量的离差为式中;Y-Yy,Yy;X-Xx,Xx:(二)适用条件1、两变量均应由测量得到的连续变量。2、两变量所来自的总体都应是正态
5、分布,或接近正态的单峰对称分布。3、变量必须是成对的数据。4、两变量间为线性关系。二、计算方法(一)基本公式计算法步骤: r。xyxy、Y、Xyx求得将上述数据代入公式计算计算计算, 1 . 54;3;2;1学生序号X(政治)Y(语文)xyxy17482-1.6-1.72.7227175-4.6-8.740.02380814.4-2.7-11.88485899.45.349.82576820.4-1.7-0.68677891.45.37.42777881.44.36.0286884-7.60.3-2.2897480-1.6-3.75.92107487-1.63.3-5.2875.683.74.
6、4542114.3370591.8 例1 某学校为调查学生学习各科目之间的能力迁移问题,随机抽取10名学生的政治与语文成绩见表5-1,请计算其相关程度。X解:依表5-1的资料,计算结果为475. 0337. 4454. 41080.91yxNxyr 即 10名学生的政治与语文成绩的相关程度为0.475。(二)原始数据计算法NYYNXXNYXXYr/2222课后练习:用原始数据计算法计算例5-1。2 其他相关系数一、等级相关系数(一)斯皮尔曼等级相关1、概念及适用条件(1)概念 两变量是等级测量数据,且总体不一定呈正态分布,样本容量也不一定大于30,这样两变量的相关,称为等级相关(斯皮尔曼相关)
7、(2)适用条件 两变量的资料为等级测量数据,且具有线性关系。 连续变量的测量数据,按其大小排成等级,亦可用等级相关计算。 不要求总体呈正态分布。2、计算方法)1(6122NNDrR式中:D为两变量每对数据的等级之差;N表示样本容量。(5.4)计算步骤:(1)计算两变量等级之差D;(2)计算D2;(3)计算 D2;(4)代入公式(5.4),求得rR 例3 求10名学生的语文成绩与阅读能力成绩之间的等级相关系数。序号X(语文等级)Y(阅读等级)DD218800267-11354114321152111645-11776118910-11913-24101091112表5-3 10名学生的语文成绩与
8、阅读能力成绩相关计算表解:将有关数据代入公式(5.4)得927. 01100101261) 1(6122NNDrR 如果求相关的是连续变量,计算时先把两组数据分别按大小排成等级,最大值取为1等,其它类推。若出现相同的等级分数时,可用它们所占等级位置的平均数作为它们的等级。 例4 某校为了研究学生自学能力与学业成绩之间的关系,随机抽取10名学生的自学能力和学科成绩,见表5-4,求其相关系数。序号X(能力)等级Y(成绩)等级DD21903.5884-10.25285780611370108064164857798-115903.5952.51168097010-117857759-24810019
9、81009875806-1110922922.5-10.2525.5表表5-4 10名学生的自学能力和学科成绩相关计算表名学生的自学能力和学科成绩相关计算表解:85. 01100105 .2561) 1(6122NNDrR即学生的自学能力与学习成绩的相关程度为0.85。(二)肯德尔和谐系数1、概念及适用条件(1)概念当多个变量值以等级顺序表示时,这几个变量之间的一致性程度,称为肯德尔和谐系数或肯德尔W系数。(2)适用条件适用于两列以上等级变量。如了解几个评定者对同一组学生成绩等级评定的一致性程度等。2、计算方法它以符号W表示,公式为。n;KnRRSS,R:SSnnKssWRRR为被评对象的数目
10、价者数目为等级变量的列数或评的离差平方和为式中;/1212232计算步骤:略 例5 某评价小组7人依据已确定的4项内容对某教师打分,将分数转换为等级后的结果见表5-5,求这7人对该教师评价意见的一致性程度。一二三四 12.542.5123.53.51.51.532.52.514442225341.51.56123472422R18.52213.516=70R2342.25484182.25256R2=1264.5表表5-5 7人评价某教师意见资料表人评价某教师意见资料表161.04471214705.126412132232nnKssWR解:将上述数据代入公式(5.5)中得 实际上,当出现相同
11、等级时,应校正W系数,其校正公式为CKnnKssWRc32121。tttC为相同等级数式中12:3例5中第一个人评的有2个等级相同,第二个人评的有2个3.5和2个1.5等级所以C为5 . 612331222123312221222122212223333333C198. 05 . 674471215 .391213232CKnnKssWRc二、点二列相关(一)概念及适用条件1、概念两列变量一列是正态连续变量,另一列是二分变量,描述这两个变量之间的相关,称为点二列相关。2、适用条件一列是正态连续变量,另一列是二分变量(如男与女,对与错等)。(二)计算方法点二列相关系数以表示rpb,公式为qpqX
12、Xrxppb 式中:p为二分变量中某一项所占比例;q为二分变量中另一项所占比例,p+q=1; 为二分变量中比例为p部分所对应的连续变量的平均数; 为二分变量中比例为q部分所对应的连续变量的平均数.x为连续变量的标准差。pXqX 例6 随机抽取某区初二数学期末考试卷15份,试计算第二题的得分与总分相一致的程度(即试题的区分度,它是衡量试题鉴别能力的指标值)。数据见表5-6。学生序号123456789101112131415第二题得分101000110111111总分697179868787818981929193929393表表5-6 数据表数据表解:(1)求答对第二题的比率p和答错的比率q:p
13、=10/15=0.67q=1-p=0.33(2)求 和 ,分别为答对和答错第二题学生成绩的平均数:(3) 求x,所有考生的总分的标准差: x=7.597(分)将上述数据代入公式(5.7),可得pXqX分2 .87pX分4 .82qX297. 033. 067. 0597. 74 .822 .87pbr即该试卷第二题的区分度为0.297。三、相关(一)概念及适用条件1、概念当两变量均为二分变量时,描述这两个变量之间的相关,称为相关。2、适用条件两变量均为二分变量;或资料整理为22列联表一形式。(二)计算方法相关以符号r表示,其计算公式为)()(dcdbcababcadr 式中:a、b、c、d分别
14、表示四格表中的实际次数,如表5-7所示。Y1Y2X1aba+bX2cdc+da+cb+da+b+c+d表表5-7 22列联表列联表 例7 某区为研究性别与学习数学的关系,随机抽取100名学生,以数学成绩85分为线进行分类,求性别与数学成绩间的相关系数。85分以上 85分以下男生311849女生2922516040100表表5-8 100名学生成绩分布表名学生成绩分布表065. 0)2229)(2218)(2931(183129182231r即性别与数学成绩间的相关系数为0.065。第四节 解释与应用相关系数时应注意的问题略: 见第一节见第一节 四四作业:1、某小组10名学生物理期中与期末考试成
15、绩如下,请用相关散点图分析其成绩动态变化情况并提出指导意见。序号12345678910期中7874604253637090 5482期末8569765370598295 60672、某校为研究高中模拟考试与高考之间的相关程度,随机抽取为20名学生模拟考试与高考的数学成绩如下,请计算其相关系数。序号12345678 91011121314151617181920模拟考 798084817869 90 111 831217276906183726910081104高考856976537059 8295 606770798462807672100851003、4位教师对5名学生的论文水平按等级评定,
16、结果如下表,求评定结果的一致性程度。 教师论文11111123223321345454545452113线性趋势线性趋势时间序列的分析时间序列的分析平稳性检验长期趋势长期趋势非线性趋势非线性趋势1.趋势模型的选择方法(1)观察散点图(2)根据观察数据本身,按以下标准选择趋势线一次差大体相同,配合直线二次差大体相同,配合二次曲线对数的一次差大体相同,配合指数曲线一次差的环比值大体相同,配合修正指数曲线对数一次差的环比值大体相同,配合 Gompertz 曲线倒数一次差的环比值大体相同,配合Logistic曲线(3)比较估计标准误差mnyySiiy2)(线性模型法(概念要点与基本形式)现象的发展按线
17、性趋势变化时,可用线性模型表示线性模型的形式为btaYttY线性模型法(a 和 b 的最小二乘估计)趋势方程中的两个未知常数 a 和 b 按最小二乘法(Least-square Method)求得根据回归分析中的最小二乘法原理使各实际观察值与趋势值的离差平方和为最小最小二乘法既可以配合趋势直线,也可用于配合趋势曲线根据趋势线计算出各个时期的趋势值线性模型法(a和b的最小二乘估计)2tbtatYtbnaY t bYattnYttYnb222tbtYnaY2ttYbYa二次曲线(Second Degree Curve) 现象的发展趋势为抛物线形态一般形式为 2ctbtaYt二次曲线(Second
18、Degree Curve) 根据最小二乘法得到求解 a、b、c 的标准方程为4322322tctbtaYttctbtatYtctbnaY42222tctaYttbtYtcnaY指数曲线(Exponential curve) 用于描述以几何级数递增或递减的现象一般形式为ttabY 指数曲线(a、b 的求解方法) 采取“线性化”手段将其化为对数直线形式 根据最小二乘法,得到求解 lga、lgb 的标准方程为2lglglglglglgtbtaYttbanY2lglglglgtbYtanY修正指数曲线(Modified exponential curve) 在一般指数曲线的基础上增加一个常数K一般形式
19、为ttabKY修正指数曲线(求解k、a、b 的三和法) 修正指数曲线(求解k、a、b 的三和法) mmttmmttmttYSYSYS312321211,11111121211223bbabSmKbbbSSaSSSSbmmm龚铂茨曲线(Gompertz curve) 以英国统计学家和数学家 BGompertz 而命名一般形式为tbtKaY 罗吉斯蒂曲线(Logistic Curve) ttabKY157一经济变量之间关系的分析方法一经济变量之间关系的分析方法585960当当代代计计量量经经济济模模型型体体系系二计量经济学的模型体系二计量经济学的模型体系61 单位根检验单位根检验 按序列性质划分按
20、序列性质划分: 非季节序列、季节非季节序列、季节 序列、面板数据。序列、面板数据。 按检验方法划分:按检验方法划分: DF、 ADF、 PP、 GLS- DF、 KPSS、HEGY 等等 30 余余种种。 按单位根个数划分按单位根个数划分: 单根检验,双根检单根检验,双根检 验,多根检验。验,多根检验。 季节序列、面板。季节序列、面板。 按估计方法划分按估计方法划分: OLS 法、 拟法、 拟 GLS 法、法、 GLS 法、法、LM 法法等等。 按检验统计量性质按检验统计量性质 划分划分: 参数的、非参数的。参数的、非参数的。 按研究方法划分按研究方法划分: 蒙特卡罗模拟、数值蒙特卡罗模拟、数
21、值 计算、极限分布推导计算、极限分布推导 按序列类型划分按序列类型划分: 随机游走、随机趋势、随机游走、随机趋势、 退势平稳、趋势非平稳。退势平稳、趋势非平稳。 按序列结构划分:按序列结构划分: 无突变、均值突变、无突变、均值突变、 趋势突变、双突变。趋势突变、双突变。 622. .线性时间序列模型线性时间序列模型 636465 向向量量自自回回归归模模型型 VAR 的的平平稳稳性性分分析析 VAR 的的 协协积积检检验验 VAR 的的 脉脉冲冲响响应应分分析析 VAR 的的估估计计与与预预测测 VAR 的的 方方差差分分解解 Granger 非非因因果果性性检检验验 VAR 模模型型的的滞滞后后期期选选择择 向向量量误误差差修修正正模模型型 (VEC 模模型型) 666768 注注: : 随着市场经济体制的深化和完善,这种模型的用途将越来越广泛。随着市场经济体制的深化和完善,这种模型的用途将越来越广泛。 9 9蒙特卡罗模拟技术蒙特卡罗模拟技术69谢谢。谢谢。此课件下载可自行编辑修改,供参考!感谢您的支持,我们努力做得更好!