1、第一节第一节 信用评分的概念与用途信用评分的概念与用途一、信用评分的概念和分类二、信用评分技术发展的简要历史三、信用评分的应用领域一、信用评分的概念和分类一、信用评分的概念和分类l概念 指帮助放贷机构发放消费信贷的一整套决策模型及其支持技术。这些技术决定谁能得到贷款、得到多少贷款,以及为放贷款机构提高盈利水平提供操作策略。是预测贷款申请人或现有借款人违约可能性的一种统计方法,它利用贷款人的历史数据和统计方法及其他定量方法对贷款申请人的不同特征对其拖欠和违约行为的影响进行分析。信贷机构利用信用评分分数对借款人的违约风险进行排序。表表7-1 7-1 一个假设的信用评分卡一个假设的信用评分卡现工作时
2、间6个月6个月1年零6个月1年零7个月6年零8个月6年零9个月10年零5个月10年零6个月以上514202739住房状况自有住房租赁住房其他401926拥有银行帐户情况活期存款帐户储蓄存款帐户同时拥有活期存款帐户和储蓄账户无2217310主要信用卡有无2711职业退休专业技术人员 办事员销售人员从事服务活动人员其他413627181227年龄1825岁2631岁3234岁3551岁5261岁 62岁及以上191422263440不良信用记录严重负面轻微负面无记录较好好未调查-15-4-29180表表7-1 7-1 一个假设的信用评分卡一个假设的信用评分卡(续)(续)一、信用评分的概念和分类一、
3、信用评分的概念和分类l分类 从信用评分的目的看 申请评分:应用于对一个新的申请人是否发放贷款、估计其信用额度、基于风险的定价 行为评分:应用于对现有客户的帐户进行管理:风险 监测预警、信用额度管理、拖欠催收策略从建立评分模型所使用的数据来源看 通用化评分(generic scoring)-利用征信局数据或业内多家金融机构数据 -不针对单个信用产品 定制化评分(custom scoring)-针对某个信用产品开发 -建模数据来自征信局及贷款机构内部利用信用评分进行信贷决策的优点:利用信用评分进行信贷决策的优点:节约审批时间,提高审批效率。可以将贷款申请审批所花时间缩短到1个小时之内。减少审批过程
4、中的主观性。可以保证信贷机构对不同的申请者使用同一个标准。信用评分模型使得信贷机构在进行信贷决策时可以考虑多种因素。除用于评估信用风险之外,信用评分技术还被应用于评估账户关系的风险调整获利能力、确定借款人初始及后来的信用额度、信贷欺诈的预防、拖欠干预以及减少不良贷款损失等多方面。二、信用评分技术发展的简要历史二、信用评分技术发展的简要历史 1941年,戴维.杜兰提出可以用判别分析方法来区分“好”的贷款和“坏”的贷款。1956年,比尔.费尔和厄尔.艾萨克建立Fair Isaac公司,尝试将统计方法应用于信贷决策。1960s,越来越多商业银行和信用卡公司使用自动审批的评分系统,开始了对于行为评分的
5、研究。1975年,美国平等信用机会法通过,标志着信用评分已经被社会所接受。1980s以来,信用评分的技术和运用不断拓广。三、信用评分的应用领域三、信用评分的应用领域(以信用卡为例)(以信用卡为例)(一)客户获取阶段发卡机构面临的主要决策:目标客户是谁?给客户提供什么样的产品及采取什么样的激励策略?是否给客户邮寄信用卡?常用的评分模型有:征信局风险评分客户响应评分征信局收益评分三、信用评分的应用领域三、信用评分的应用领域(以信用卡为例)(以信用卡为例)(二)客户审批阶段发卡机构面临的主要决策:是否批准客户的申请?给客户的信用卡确定的利率是多少以及是否收取年费或其他费用?给客户提供的初始信用额度是
6、多少?常用的评分模型有:申请评分模型征信局评分模型(如FICO评分)三、信用评分的应用领域三、信用评分的应用领域(以信用卡为例)(以信用卡为例)(三)账户管理阶段这一阶段的主要决策:信用额度的调整。超额透支授权。拖欠催收策略。重新定价。重新发卡。激活及防止客户流失。常用的评分模型有:行为评分模型。交易欺诈预测模型。第二节第二节 信用评分模型的数据来源信用评分模型的数据来源一、征信局数据二、信贷机构内部数据一、征信局数据一、征信局数据 消费者个人基本信息包括姓名、性别、出生日期、身份证号码、婚姻状况、居住地址、职业信息等 信用记录包括银行信贷交易信息及非银行信用信息 公共记录信息包含欠税记录、法
7、院民事判决记录、强制执行记录、行政处罚记录、电信欠费记录等信息 查询信息反映消费者的信用报告被查询的历史记录二、信贷机构内部数据二、信贷机构内部数据 申请人填写的信贷申请表需要回答的问题特征变量:不同信贷产品设置不同。一般消费信贷申请表要比信用卡申请表复杂。许多申请表会使用同样的特征变量。问题的回答项特征项:对同样一个问题,不同的申请表设置的回答项或特征项可能不一样。描述借款人交易行为的变量根据客户的交易状况,可以生成成百上千个特征变量用于建立行为评分模型。u 大数据时代,有大数据时代,有“一切数据皆为信用数据一切数据皆为信用数据”的观点。的观点。特征变量某消费信贷公司美国某信用卡公司英国某信
8、用卡公司邮政编码XXX现住址时间XXX住房状况XXX职业XXX雇佣时间XXX申请人月收入XXX其他收入XX供养人口XX小孩数XXX结算帐户/活期存款帐户XXX储蓄帐户XX信用卡XXX购物卡XXX生日X电话XX每月还款额X总资产X家用轿车年限X表7-2 三个信贷机构申请表中的特征变量第三节第三节 信用评分模型的开发与应用信用评分模型的开发与应用一、选取建模样本二、构造信用评分模型的变量三、信用评分模型的分组四、建立信用评分模型五、信用评分模型的检验六、信用评分模型的实施、监测与验证一、选取建模样本一、选取建模样本要求:(1)建模样本总体与未来可能的信用申请人总体(through-the-door
9、 population)类似;(2)样本应该包括足够多的不同类型的还款行为(好客户、坏客户)关于样本的数量:关于样本的数量:p一般,好、坏客户的比率或者为50:50,或者位于50:50与总体中好、坏客户比例之间。p泰德.莱温斯(1992)建议,好、坏客户各1,500个p马库其(1998)建议,将所有的”坏”客户都选入样本中,选取的”好”客户数在10,000个左右。二、构造信用评分模型的变量二、构造信用评分模型的变量(一)表现变量的定义 1.“好”“坏”客户的定义适应管理需要以及与信贷机构的市场策略相吻合是定义“好”“坏”客户时需要遵循的重要原则。这牵涉到信贷机构以下几个方面的考虑:风险偏好催收
10、管理水平监管部门的相关政策不能确定“好”“坏”的客户要从建模样本中剔除掉二、构造信用评分模型的变量二、构造信用评分模型的变量(一)表现变量的定义 2.观察期和表现期的划分观察期收集样本客户的历史基本特征和行为特征信息,提炼形成模型的特征变量(即自变量);表现期收集样本客户的信用表现,形成模型的因变量。u一般先定义表现期,然后向前倒推一定时间段形成观察期选。表现期的确定随着信贷产品的不同会发生一些变化。在行为评分中,通常选取一个1824个月的时间段。图7-1 观察期和表现期的划分申请模型表现期和观察期样本的选取:申请模型表现期和观察期样本的选取:定义好表现期后,向前倒推一定的时间段形成观察期选,
11、取该时间段内申请得到批准的客户的特征信息并提炼形成特征变量作为模型的自变量(又称为解释变量、预测变量),表现期则用于观测客户的信用表现,按照一定的规则将他们区分为不同类型(如“好客户”或“坏客户”),从而形成因变量。二、构造信用评分模型的变量二、构造信用评分模型的变量(一)表现变量的定义 3.建模样本的“拒绝推断”“拒绝推断”是指对被拒绝的客户的信用表现进行推断(即推断这些客户的表现变量)。处理这一问题时常用的方法包括:接受部分本来应该被拒绝的客户的申请。将被拒绝的客户全部作为“坏”客户。二、构造信用评分模型的变量二、构造信用评分模型的变量(二)特征变量的形成 1.申请信用评分模型特征变量的构
12、造 构造特征变量的数据来源:客户的基本状况客户的学历、居住状况等不需要进行提炼和构造,但“按揭成数”“收入还贷比”等需要进行构造。客户与信贷机构的业务关系数据客户的征信局历史数据二、构造信用评分模型的变量二、构造信用评分模型的变量(二)特征变量的形成 2.行为评分模型特征变量的构造 构造的特征变量包括:账户基本情况(账户已开户月数)、拖欠情况(如当前是否拖欠、观察期内拖欠的期数占总账期期数的比重等)、贷款情况(如贷款总额、月平均贷款余额)和还款情况(如还款额占贷款额的比重、贷款余额占信用额度的比重)以及消费和交易行为(如消费总额、月消费平均金额、有交易行为的账期次数)、取现行为(最近6个月信用
13、卡剔除现金额超过1000元的次数)等。三、信用评分模型的分组三、信用评分模型的分组分组即按照某种标准,将客户划分为不同的组,每个组内客户的行为模式在某种程度上相同或相似,组之间则存在显著差异。分组完成后对每一组分别建立评分模型。分组的原因:不同类型的客户其信用行为的影响因素是不一样的,即使同样的影响因素在模型中的权重也可能不一样。出于信贷政策的需要。出于统计上的原因。用于分组的变量是可以观察到的观察期的变量。分组可以按一个变量进行,也可以按多个变量进行复杂的分组。四、建立信用评分模型四、建立信用评分模型(一)特征变量预测能力分析 1.离散型特征变量的分组分组的目的:减少特征变量的特征项个数;使
14、一个特征变量的不同特征项之间客户的信用行为存在明显差异。分组的基本原则:对样本容量少的特征项进行合并;将“发生比”较接近的特征项予以合并。特征项好客户频数坏客户频数好客户频率(%)坏客户频率(%)好客户发生比(Odds to be good)=32000 10-缺失313844.9355.070.82/1合计79392346.2153.790.86/1表7-3 “收入”特征变量各特征项频率及发生比表7-4 “收入”重新分组后的特征项的频率及发生比特征项好客户频数坏客户频数好客户频率(%)坏客户频率(%)好客户发生比(Odds to be good)=4000 26818958.6441.351
15、.418/1合计79392346.2153.790.86/1四、建立信用评分模型四、建立信用评分模型(一)特征变量预测能力分析 2.连续型变量的分组连续型变量的离散化分组的好处:捕捉到特征变量与表现变量之间的非线性关系。分组的方法:先在特征变量取值范围内将特征变量划分成若干组,每组所包含的客户数占全部客户数的百分比相等,然后,再利用对离散型变量重新分组的方法考虑是否将临近的组进行合并,最后得到最终的分组结果。图7-2 不同年龄段好客户比率四、建立信用评分模型四、建立信用评分模型(二)选取建模特征变量 方法:专家咨询法。统计学方法。信用评分建模特有的方法。考虑因素:不同国家的法律约束以及社会文化
16、因素的影响。模型的预测结果具有可解释性。模型实施时具有可行性。四、建立信用评分模型四、建立信用评分模型(三)选择适当的建模工具统计学方法。包括传统的判别分析、线性回归、Logistic回归、生存分析等参数统计方法以及分类树算法、最近邻估计等非参数方法。非统计学方法。包括线性规划、整数规划、神经网络、遗传算法、支持向量机等方法。选择何种方法既与建立信用评分的目的有关,也与建模样本有关。实际常将多种方法交叉使用。利用这些建模工具,我们可以确定特征变量各特征项在评估消费者信用时的权重。五、信用评分模型的检验五、信用评分模型的检验“保留样本法”:在收集了建模样本后,将样本随机地分成两部分,一部分用于模
17、型的开发,另一部分(称为“保留样本”,通常为占样本总量的20%-40%)用于检验。常用的区分度统计量:K-S统计量 分离度统计量 马氏距离图7-3 两个模型计算的客户信用得分的概率分布六、信用评分模型的实施、监测与验证六、信用评分模型的实施、监测与验证(一)模型的实施牵涉到管理和技术两方面的问题。实施过程中要开展的具体的工作包括组织计划、制定信贷政策、实施流程的管理及员工培训等。六、信用评分模型的实施、监测与验证六、信用评分模型的实施、监测与验证(二)模型的监测与验证1.前台监测报告(在评分模型开始实施时进行)监测目标客户总体与历史客户总体之间的相似性。关注的是新的信贷申请人信用分数的分布以及
18、模型中特征变量分布等的变化状况。常用的前台跟踪报告包括:总体稳定性报告、特征变量分析报告和人工修正比率报告。2.后台验证报告(在评分模型运行几个月后进行)用于度量评分模型是否有效,即区分“好”“坏”客户的能力。关注:评分卡是否退化;是否较高的坏帐率出现第四节第四节 了解了解FICOFICO评分评分一、什么是FICO评分二、FICO评分考虑的主要因素三、FICO评分的新发展一、什么是一、什么是FICOFICO评分评分FICO评分是世界著名的信用评分公司Fair Isaac(后来改名为FICO)开发的信用评分系统。存在三种FICO评分:Experian的评分,Equifax的Beacon评分,Tr
19、ans Union的Empirica评分。FICO评分预测的是消费者在评分后24个月内发生90天以上拖欠的可能性。分数分数人数比例(人数比例(%)违约率(违约率(%)300-499187500-549571550-599751600-6491131650-6991615700-749205749-799292800 及以上111表7-5 FICO评分与违约率之间的关系评分范围为300850中位数为723分700分,同意发放贷款;600分,提高贷款利率或者拒绝;600700分,进一步调查核实,采用其它的信用分析工具,作个案处理。FICOFICO评分评分:二、二、FICOFICO评分考虑的主要因素
20、评分考虑的主要因素图7-4 FICO不同因素的权重三、三、FICOFICO评分的新发展评分的新发展 最新版FICO Score 9(2014年8月发布):使用更精细的建模技术,对客户还款可能性具有更好的预测性;满足了信贷机构在客户信用记录不足的情况下仍然想对其进行评分的需求;评估的消费者信用风险几乎囊括了全部信贷产品,并且覆盖整个客户信贷周期。大数据采集技术。ZestFinance以大数据技术为基础从不同的数据源采集数据,一方面它继承了传统征信体系的决策变量,重视深度挖掘授信对象的信贷历史;另一方面,将能够影响消费者信用水平的其他因素也考虑在内,如社交网络信息等。其评分模型中应用的特征变量是传统模型的上百倍。大数据分析模型。采用先进的机器学习预测模型和集成学习策略。首先,数千种各种来源的原始数据被输入系统;其次,寻找数据间的关联性并对数据进行转换;再次,在关联性分析的基础上将变量重新整合成新的预测变量(即特征变量);然后将这些新的特征变量输入到不同的数据分析模型中去;最后,将每一个模型输出的结果按照模型投票的原则,形成最终的信用分数。
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。