1、20122012年北京大学生数学建模与年北京大学生数学建模与计算机应用竞赛论文答辩计算机应用竞赛论文答辩基于感官分析和理化指标对葡萄酒的评价基于感官分析和理化指标对葡萄酒的评价基于感官分析和理化指标对葡萄酒的评价基于感官分析和理化指标对葡萄酒的评价中央民族大学主要内容主要内容一、摘要一、摘要二、问题的理解与分析二、问题的理解与分析三、基本假设三、基本假设四、模型的建立与求解四、模型的建立与求解五、结果与评价五、结果与评价基于感官分析和理化指标对葡萄酒的评价基于感官分析和理化指标对葡萄酒的评价中央民族大学 我们通过对两组感官分析结果的差异性分析以及对葡萄我们通过对两组感官分析结果的差异性分析以及
2、对葡萄与葡萄酒理化指标相关度的分析,建立了基于理化指标的葡与葡萄酒理化指标相关度的分析,建立了基于理化指标的葡萄酒质量评价体系。萄酒质量评价体系。针对问题一,我们通过双因素方差分析模型,得到了两针对问题一,我们通过双因素方差分析模型,得到了两组评价结果有显著性差异并采用了第二组的评价结果。组评价结果有显著性差异并采用了第二组的评价结果。针对问题二,我们聚类分析后根据质量分数综合得到葡针对问题二,我们聚类分析后根据质量分数综合得到葡萄的分级结果。萄的分级结果。针对问题三,我们通过回归方程建立了理化指标之间的针对问题三,我们通过回归方程建立了理化指标之间的联系,并根据典型相关分析模型进一步得出指标
3、间关联。联系,并根据典型相关分析模型进一步得出指标间关联。针对问题四,我们通过逐步多元线性回归分析,得到理针对问题四,我们通过逐步多元线性回归分析,得到理化指标对葡萄酒质量的影响方程。化指标对葡萄酒质量的影响方程。摘摘 要要基于感官分析和理化指标对葡萄酒的评价基于感官分析和理化指标对葡萄酒的评价中央民族大学问题的理解与分析问题的理解与分析【问题一问题一】由于所给数据中酒样品间分数差异较大,所以由于所给数据中酒样品间分数差异较大,所以选用双因素方差分析。基于波动性分析,我们选出可信结选用双因素方差分析。基于波动性分析,我们选出可信结果。果。【问题二问题二】先将葡萄酒评价总分进行转化,根据葡萄的理
4、先将葡萄酒评价总分进行转化,根据葡萄的理化指标初步分级后,用葡萄酒的质量进行校正。化指标初步分级后,用葡萄酒的质量进行校正。【问题三问题三】选出对各个葡萄酒影响最大的葡萄的理化指标选出对各个葡萄酒影响最大的葡萄的理化指标后,对每一个葡萄酒的理化指标建立回归方程,用典型相后,对每一个葡萄酒的理化指标建立回归方程,用典型相关分析模型进行了分析,进一步得出指标间的关联。关分析模型进行了分析,进一步得出指标间的关联。【问题四问题四】我们建立了回归方程来表示理化指标对葡萄质我们建立了回归方程来表示理化指标对葡萄质量的影响程度。量的影响程度。基于感官分析和理化指标对葡萄酒的评价基于感官分析和理化指标对葡萄
5、酒的评价中央民族大学基本假设基本假设n1、假设不同评酒员的评分是相互独立的,同一评酒员对、假设不同评酒员的评分是相互独立的,同一评酒员对不同葡萄酒的评分也是相互独立的。不同葡萄酒的评分也是相互独立的。n2、葡萄和葡萄酒的理化指标完全能够代表葡萄和葡萄酒、葡萄和葡萄酒的理化指标完全能够代表葡萄和葡萄酒的性质。的性质。n3、评酒员的最终评分服从正态分布。、评酒员的最终评分服从正态分布。n4、假设每个评酒员都是客观公正的,将严格按照标准品、假设每个评酒员都是客观公正的,将严格按照标准品评葡萄酒。评葡萄酒。基于感官分析和理化指标对葡萄酒的评价基于感官分析和理化指标对葡萄酒的评价中央民族大学基于感官分析
6、和理化指标对葡萄酒的评价基于感官分析和理化指标对葡萄酒的评价中央民族大学基于感官分析和理化指标对葡萄酒的评价基于感官分析和理化指标对葡萄酒的评价中央民族大学 各个指标的显著性差异分析模型各个指标的显著性差异分析模型 利用利用SAS软件进行均值假设检验,得到软件进行均值假设检验,得到p值结果:值结果:模型一的结果模型一的结果红葡萄酒白葡萄酒p值显著性p值显著性澄清度0.6226无0.2991无色调0.001有0.7079无香气纯正度0.001有0.9371无香气浓度0.0767无0.5997无香气质量0.0081有0.6828无口感纯正度0.3998无0.001有口感浓度0.1079无0.008
7、9有口感持久性0.2221无0.8937无口感质量0.1364无0.001有平衡/整体评价0.6611无0.0019有基于感官分析和理化指标对葡萄酒的评价基于感官分析和理化指标对葡萄酒的评价中央民族大学2、可信度分析可信度分析 为了分析两组评酒员的评酒结果可信度,本文首先求出每个为了分析两组评酒员的评酒结果可信度,本文首先求出每个样品中各个项目样品中各个项目1010个评酒员的评分的标准差,然后通过将不同个评酒员的评分的标准差,然后通过将不同样品同一指标的标准差求和,得到各个组不同评分指标的标准样品同一指标的标准差求和,得到各个组不同评分指标的标准差之和。画出折线图后,可以更加直观地比较了两组的
8、差异。差之和。画出折线图后,可以更加直观地比较了两组的差异。模型的结果模型的结果 由下图显然可见,无论是红葡萄酒还是白葡萄酒,二组的各由下图显然可见,无论是红葡萄酒还是白葡萄酒,二组的各项指标评分标准差都小于一组的评分标准差,说明第二组评酒项指标评分标准差都小于一组的评分标准差,说明第二组评酒员的评分更集中,波动性比较小。由此可见,第二组的评酒结员的评分更集中,波动性比较小。由此可见,第二组的评酒结果更可信。果更可信。基于感官分析和理化指标对葡萄酒的评价基于感官分析和理化指标对葡萄酒的评价中央民族大学模型一的结果模型一的结果基于感官分析和理化指标对葡萄酒的评价基于感官分析和理化指标对葡萄酒的评
9、价中央民族大学问题二问题二问题二:问题二:为了降低评酒员的异质性,本文先采用置信区间法对第二为了降低评酒员的异质性,本文先采用置信区间法对第二组数据进行了处理,然后提出了两种酿酒葡萄分级的方案组数据进行了处理,然后提出了两种酿酒葡萄分级的方案。模型二建立:模型二建立:方案一:先简化理论指标再分类方案一:先简化理论指标再分类 出于对每种物质作用的考虑,本文先对葡萄的理化指标进行出于对每种物质作用的考虑,本文先对葡萄的理化指标进行聚类,得到大致分为聚类,得到大致分为4类:酚类,酸类,糖类以及果实的基本性类:酚类,酸类,糖类以及果实的基本性质类。然后利用主成分分析法结合相关性分析,得到最终代表这质类
10、。然后利用主成分分析法结合相关性分析,得到最终代表这四类的指标:总酚,可滴定酸,总糖,果实基本性质类。四类的指标:总酚,可滴定酸,总糖,果实基本性质类。通过使用通过使用SAS软件中的聚类分析,对简化后的酿酒葡萄理化软件中的聚类分析,对简化后的酿酒葡萄理化指标对葡萄进行聚类,得到指标的分级结果图。指标对葡萄进行聚类,得到指标的分级结果图。基于感官分析和理化指标对葡萄酒的评价基于感官分析和理化指标对葡萄酒的评价中央民族大学方案一分级结果图方案一分级结果图红葡萄白葡萄样品质量平均值样品质量平均值一1,2,9,2373.754,21,5,20,10,24,12,25,26,2878.5二20,2673
11、.5178三9,19,21,22,11,16,13,1470.46,18,7,13,15,2777四3,6,1269.332,23,9,19,17,3,11,8,16,14,2276.45五4,27,15,10,25,5,17,7,18,2469.3基于感官分析和理化指标对葡萄酒的评价基于感官分析和理化指标对葡萄酒的评价中央民族大学方案二分级结果图方案二分级结果图 方案方案2:用葡萄的全部理化指标对葡萄进行聚类分析,得到:用葡萄的全部理化指标对葡萄进行聚类分析,得到指标的分级结果图指标的分级结果图 红葡萄白葡萄样品质量平均值样品质量平均值一2,9,23,375.754,22,17,2178.7
12、5二 4,27,15,25,13,19,5,17,24,20,26,1070.676,18,7,1577.75三16,22,2170.619,28,23,26,3,5,20,10,25,12,14,24,9,277.3四1,8,1468.672777五6,12,18,768.851,1376六11618,11,1670基于感官分析和理化指标对葡萄酒的评价基于感官分析和理化指标对葡萄酒的评价中央民族大学问题三问题三 在寻找两个理化指标的联系时,本文旨在建立以酿酒葡萄的理在寻找两个理化指标的联系时,本文旨在建立以酿酒葡萄的理化指标为解释变量,每个葡萄酒理化指标为响应变量的函数回归模化指标为解释变量
13、,每个葡萄酒理化指标为响应变量的函数回归模型。由于酿酒葡萄的理化指标明显多于葡萄酒的理化指标,所以本型。由于酿酒葡萄的理化指标明显多于葡萄酒的理化指标,所以本文先对影响不显著的葡萄理化指标进行剔除,由其他自变量建立回文先对影响不显著的葡萄理化指标进行剔除,由其他自变量建立回归分析方程。归分析方程。模型三建立:模型三建立:1、葡萄与葡萄酒的理化指标之间的联系、葡萄与葡萄酒的理化指标之间的联系相关分析、多元回归分析法相关分析、多元回归分析法 根据相关系数矩阵。剔除影响程度低的指标后,列出对葡萄酒有显著根据相关系数矩阵。剔除影响程度低的指标后,列出对葡萄酒有显著影响的葡萄指标。影响的葡萄指标。建立多
14、元线性回归模型,线性回归模型的一般形式为:建立多元线性回归模型,线性回归模型的一般形式为:此过程由此过程由SAS软件实现。得到函数回归方程。软件实现。得到函数回归方程。011kkYXX基于感官分析和理化指标对葡萄酒的评价基于感官分析和理化指标对葡萄酒的评价中央民族大学 对红葡萄酒有显著影响的葡萄指标示意表对红葡萄酒有显著影响的葡萄指标示意表酒指标酒指标相关显著指标相关显著指标花色苷花色苷花色苷花色苷苹果酸苹果酸褐变度褐变度DPPHDPPH自由自由基基总酚总酚单宁单宁果梗比果梗比 单宁单宁 花色苷花色苷DPPHDPPH自由自由基基总酚总酚单宁单宁葡萄总黄酮葡萄总黄酮黄酮醇黄酮醇总酚总酚花色苷花色
15、苷DPPHDPPH自由自由基基总酚总酚单宁单宁葡萄总黄酮葡萄总黄酮酒总黄酮酒总黄酮花色苷花色苷DPPHDPPH自由自由基基总酚总酚单宁单宁葡萄总黄酮葡萄总黄酮果皮质量果皮质量白藜芦醇白藜芦醇葡萄总黄酮葡萄总黄酮DPPHDPPH半抑制体半抑制体积积花色苷花色苷DPPHDPPH自由自由基基总酚总酚单宁单宁葡萄总黄酮葡萄总黄酮以红葡萄酒为例以红葡萄酒为例基于感官分析和理化指标对葡萄酒的评价基于感官分析和理化指标对葡萄酒的评价中央民族大学基于感官分析和理化指标对葡萄酒的评价基于感官分析和理化指标对葡萄酒的评价中央民族大学基于感官分析和理化指标对葡萄酒的评价基于感官分析和理化指标对葡萄酒的评价中央民族大
16、学2 2、基于典型性相关分析对各指标联系的模型基于典型性相关分析对各指标联系的模型 前面模型单纯地指出单个葡萄酒理化指标的回归前面模型单纯地指出单个葡萄酒理化指标的回归方程。为了进一步得出指标间的关联,我们又从典型方程。为了进一步得出指标间的关联,我们又从典型相关分析模型进行了分析。使模型建立的更加全面。相关分析模型进行了分析。使模型建立的更加全面。基于感官分析和理化指标对葡萄酒的评价基于感官分析和理化指标对葡萄酒的评价中央民族大学问题四问题四 为了避免作用不显著的变量影响模型的显著性,我们通过为了避免作用不显著的变量影响模型的显著性,我们通过逐步多元回归分析,建立了回归方程来表示理化指标对葡
17、萄质逐步多元回归分析,建立了回归方程来表示理化指标对葡萄质量的影响程度。为了指出能否用葡萄和葡萄酒的理化指标来评量的影响程度。为了指出能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,将数据代入方程计算得到葡萄酒质量的计算价葡萄酒的质量,将数据代入方程计算得到葡萄酒质量的计算值,并计算得出相对误差,以此为标准论证。值,并计算得出相对误差,以此为标准论证。模型四建立:模型四建立:1、由理化指标评价葡萄酒质量由理化指标评价葡萄酒质量逐步多元回归模型逐步多元回归模型 使用逐步分析法,自动选择最优自变量,得到回归方程。使用逐步分析法,自动选择最优自变量,得到回归方程。红葡萄酒和葡萄的理化指标对红葡萄酒质
18、量影响的回归方程为:红葡萄酒和葡萄的理化指标对红葡萄酒质量影响的回归方程为:12340.033410.062790.012820.097510.88596yxxxx基于感官分析和理化指标对葡萄酒的评价基于感官分析和理化指标对葡萄酒的评价中央民族大学白葡萄酒和葡萄的理化指标对白葡萄酒质量影响的回归方程为:白葡萄酒和葡萄的理化指标对白葡萄酒质量影响的回归方程为:2 2、论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量 将数据代入方程计算得到葡萄酒质量的计算值,并计算得出将数据代入方程计算得到葡萄酒质量的计算值,并计算得出相对误差。如果相对误差。如
19、果误差很小,则能用葡萄和葡萄酒的理化指标来评价葡误差很小,则能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。萄酒的质量。1230.298730.096610.045150.64981yxxx基于感官分析和理化指标对葡萄酒的评价基于感官分析和理化指标对葡萄酒的评价中央民族大学红酒红酒白酒白酒真实值真实值计算值计算值误差误差真实值真实值计算值计算值误差误差1 10.96575460.96575460.945490.945490.02098310.02098311.0178731.0178730.998550.998550.01898370.01898372 21.04942491.04942491.
20、079271.07927-0.028439-0.0284390.99043360.99043361.010871.01087-0.020634-0.0206343 31.05793381.05793381.044231.044230.01295340.01295340.98782030.98782030.977910.977910.01003250.01003254 41.0097171.0097170.962420.962420.04684180.04684181.00480661.00480661.025321.02532-0.020415-0.0204155 51.02248021.02
21、248021.033941.03394-0.011208-0.0112081.06491211.06491211.045481.045480.01824760.01824766 60.9402280.9402280.997070.99707-0.060456-0.0604560.98651360.98651361.011141.01114-0.024963-0.0249637 70.92604660.92604660.937620.93762-0.012498-0.0124980.96952730.96952730.981630.98163-0.012483-0.0124838 80.9359
22、7360.93597360.950330.95033-0.015338-0.0153380.94470110.94470110.966960.96696-0.023562-0.0235629 91.10898691.10898691.105981.105980.00271140.00271141.0505391.0505390.989680.989680.05793120.057931210100.97568160.97568160.954820.954820.02138150.02138151.04269921.04269921.027411.027410.01466310.01466311
23、1110.87357540.87357540.891370.89137-0.02037-0.020370.93294140.93294140.954970.95497-0.023612-0.02361212120.96859090.96859090.970480.97048-0.00195-0.001950.94600780.94600780.97310.9731-0.028638-0.02863813130.97568160.97568160.978780.97878-0.003176-0.0031760.96560740.96560740.983090.98309-0.018105-0.0
24、1810514141.0295711.0295711.009341.009340.019650.019651.007421.007420.993720.993720.0135990.013599误差分析表误差分析表基于感官分析和理化指标对葡萄酒的评价基于感官分析和理化指标对葡萄酒的评价中央民族大学红酒红酒白酒白酒真实值真实值计算值计算值误差误差真实值真实值计算值计算值误差误差15150.9317190.9317190.978860.97886-0.0506-0.05061.0244061.0244060.967790.967790.0552670.05526716160.9912810.991
25、2811.021021.02102-0.03-0.030.8793690.8793690.917680.91768-0.04357-0.0435717171.0565161.0565160.999360.999360.0540980.0540981.0492321.0492321.008151.008150.0391550.03915518180.9274650.9274650.972660.97266-0.04873-0.048731.0021931.0021931.008411.00841-0.0062-0.006219191.0295711.0295711.014461.014460.0
26、146770.0146770.9982730.9982730.987170.987170.0111230.01112320201.0749511.0749511.059641.059640.0142440.0142441.0008871.0008871.029851.02985-0.02894-0.0289421211.0238981.0238980.999110.999110.024210.024211.0348591.0348591.038871.03887-0.00388-0.0038822221.015391.015391.001541.001540.013640.013641.037
27、4731.0374731.050481.05048-0.01254-0.0125423231.0933871.0933871.101321.10132-0.00726-0.007261.011341.011340.992360.992360.0187670.01876724241.0139711.0139710.994430.994430.0192720.0192720.9943530.9943531.019671.01967-0.02546-0.0254625250.9671730.9671730.973430.97343-0.00647-0.006471.0387791.0387791.0
28、1211.01210.0256830.02568326261.0210621.0210621.025351.02535-0.0042-0.00420.9708340.9708341.028411.02841-0.05931-0.0593127271.0139711.0139710.997690.997690.0160570.0160571.0061131.0061130.979640.979640.0263120.02631228281.0400861.0400861.019611.019610.0196870.019687基于感官分析和理化指标对葡萄酒的评价基于感官分析和理化指标对葡萄酒的评
29、价中央民族大学结果与评价结果与评价 我们主要分析了葡萄酒的两种评价体系,即评酒员的感官评价我们主要分析了葡萄酒的两种评价体系,即评酒员的感官评价和以理化指标为标准评价葡萄酒质量评价体系。和以理化指标为标准评价葡萄酒质量评价体系。首先是基于评酒员的感官分析对葡萄酒质量的评价,在问题一首先是基于评酒员的感官分析对葡萄酒质量的评价,在问题一中,我们巧妙地运用双因素方差分析模型间接得到了结果,方法简中,我们巧妙地运用双因素方差分析模型间接得到了结果,方法简单,便于推广。单,便于推广。然后是对葡萄和葡萄酒理化指标的分析。我们先采用了置信区然后是对葡萄和葡萄酒理化指标的分析。我们先采用了置信区间法对评级分
30、数进行转换,使尽可能的消除评酒员异质性的影响。间法对评级分数进行转换,使尽可能的消除评酒员异质性的影响。针对葡萄的分级问题,我们给出了两种方案,方案不同之处在于,针对葡萄的分级问题,我们给出了两种方案,方案不同之处在于,方案一先对葡萄的理化指标进行了简化。在对葡萄的理化指标进行方案一先对葡萄的理化指标进行了简化。在对葡萄的理化指标进行简化的过程中,我们利用主成分分析法、系统聚类法、相关分析找简化的过程中,我们利用主成分分析法、系统聚类法、相关分析找出其中出其中4个指标用来代表葡萄的理化指标。对这三种模型取长补短,个指标用来代表葡萄的理化指标。对这三种模型取长补短,巧妙的联合应用保证了结果的准确
31、性。分级结果大致相同,说明对巧妙的联合应用保证了结果的准确性。分级结果大致相同,说明对葡萄的分级准确。葡萄的分级准确。基于感官分析和理化指标对葡萄酒的评价基于感官分析和理化指标对葡萄酒的评价中央民族大学 针对酿酒葡萄与葡萄酒的理化指标之间联系的问题,我们先针对酿酒葡萄与葡萄酒的理化指标之间联系的问题,我们先对葡萄酒的每个指标建立回归方程,然后对葡萄酒的每个指标建立回归方程,然后从典型相关分析模型角度从典型相关分析模型角度进一步分析得出指标间的关联。模型建立全面。进一步分析得出指标间的关联。模型建立全面。最后我们通过建立逐步回归方程,用酿酒葡萄和葡萄酒的理最后我们通过建立逐步回归方程,用酿酒葡萄和葡萄酒的理化指标反映出了葡萄酒的质量化指标反映出了葡萄酒的质量。方法简便,可操作性强。方法简便,可操作性强。结果与评价结果与评价基于感官分析和理化指标对葡萄酒的评价基于感官分析和理化指标对葡萄酒的评价中央民族大学