|
因此有价格每上涨1英镑太阳镜的销售量下降12.2×1000=12200副,广告费用每增加1000英镑销售量增加2320副,日照时间每增加1小时销售量增加13200副。系数的统计显著性。通过统计软件包得到价格P的t-值为-2.77。判断该系数的统计显著性有两种方式。一是与t-统计表中自由度为n-k-l的t的临界值相比较,其中K是自变量的个数。于是对单尾检验(假设H1:BI〈0〉来说,t=-1.86(即8个自由度的T0.05)。因为-2.77〈-1.86,所以我们拒绝假设HO:BI=0并推断BI是显著小于零的。进行假设检验的另一个方法是利用统计软件包计算给出的P-值(概率值)。相应于-2.77的t-值的p-统计值为0.024。这表明-2.77的t-值切断了0.024(即2.4%)的单尾区域。因此如果检验是在5%的显著水平下进行的(=0.05),p-值表明检验统计量的值落入拒绝区域的概率。一般而言,如果P-值小于那么n个检验统计量必然位于拒绝区域,而如果p-值大于或等于那么检验统计量必定位于接受区域。
解释了P-值的含义以后,我们可以很快地评论其化两个解释变量统计显著性,由统计软件包得到广告费用变量E的P-值为0.036,日照时间变量H的P-值为0.000,都小于0.05,因此可以认为两个变量在5%的显著水平下都是统计上显著的(即B2>0以及B3>0)。注意这里P-值只表述到小数点后第三位。
整体解释力。用统计软件包计算得到多元决定系数R2=0.988,这表明销售量的变化中有98.8%可以由回归方程来解释(即通过3个解释变量的变化来说明)。调整过的多元决定系数R2=0.983。
异常观测值。有些统计软件包特别指出残差(观测值减去预测值)相当大的应变量的观测值,以引起注意,它可能是误计了,也可能是一个异常事件。这样异常观测值经常被称为异常点。
预测得到的回归方程为:
S=120-12.2P+2.32E+13.2H
把问题中给定的三个解释变量的值代入方程有:
预测销售量 =120-12.2×2.5+2.32×25+13.2×5
=120-30.5+58+66
=213.5(千副)
(二)回归分析(7)
3.曲线相关
变量之间的关系并不完全是线性相关,更多是呈现非线性关系,这就需要我们借助变量转换,将复杂难解的曲线回归转变成通常的线性回归,求出我们所需要的模型。
对数转换不仅改变了各自变量值而且也影响着方程随机误差的数值,值得注意的是,它还会改变样本的数据容量,常见的变量转换法还有增设虚变量,可以查阅有关资料,这里就不再详细介绍了。
(三)多变量数据分析简介
1.多变量数据分析方法
计算机软硬件的发展为在市场调研数据分析中使用很多高级的统计方法提供了基础。这些发展也使得方便地分析大量且复杂的数据成为可能。特别是,被称为多元变量分析的一组技术在数据分析变革中已引起特别的关注。
多变量分析是指用来对所研究的每个人或物体的多重测量同时进行分析的一组统计过程。一些流行的多变量技术包括多元回归分析、判别分析、因子分析、归类(聚类)分析、认知图和联合分析。
多元回归分析使调查人员可以根据一个以上自变量的水平来预测因变量。由多元回归分析得到的一个统计量被称为可决系数或R2,它的数值在0一-1的范围内,代表了因变量变化中由自变量变化解释的百分比。b值,叫回归系数,指明了单个自变量对因变量产生的影响。
多元回归分析要求因变量是可计量的,而在多元判别分析中使用的因变量在性质上是类别变量。判别分析可以用来确定在两个或两个以上组的平均判别分值是否存在统计显著性差异。这种技术也可用于建立模型,根据个人或物体在几个变量上的得分将其进行分组。最后,判别分析可用于决定两个或两个以上组别的平均数值的差别中有多少是由于自变量引起的。判别得分,被称为Z值,是根据判别方程获得的。
归类(聚类)分析使调查人员可以识别各组群,这些组群内的个人或物体是相似的而与其他组群则有所不同。归类分析要求所有自变量是可计量的,但对因变量则没有特殊规定。归类分析是进行市场细分的有效工具。
因子分析的目的是使大量的数据简单化。其目标是利用少量的概括性指标(即因子)来反映包括在大量可计量指标(如等级评分)中的信息。在因子分析中,没有因变量。因子分析产生出因子,它们每一个都是一组相关变量的加权组合。每个指标都根据其对每个因子变化的贡献来加权。另外一个重要的概念是因子载荷。因子载荷是通过计算因子得分与初始输人变量间的相关系数来决定的。通过检查哪些变量对给定因子的载荷大,研究人员可以为因子命名。
认知图可通过因子分析、多维度量表、判别分析或相关分析等产生。这种图形象地反映了品牌、产品、公司或其他对象诸如质量和价值等关键特性方面是如何被感知的。所有方法都需要将消费者对目标现象在关键特性上的评定值或等级评分作为输人。
联合分析是一种用于衡量潜在消费者如何根据每种产品或服务的特性对不同产品或服务进行权衡的技术。这种技术允许调查人员决定各种特性在各种水平上的相对值。这些估计值被称为效用,它们可作为模拟消费者选择的基础。
尽管人们对多变量技术的了解仍然有限,但它们已有数十年的历史,并已在各种商业统计中得到广泛采用。例如,FairIsaac公司已发展成为年营业额达7亿美元的多变量商业应用技术企业。该公司及其客户发现,这些技术能准确预测准将按时付账、谁将延迟付账及谁将赖账。根据该公司的分析,联邦政府用秘密方式来查出逃税者。FairIsaac公司的成功表明,多变量分析可以用来预测销售前景。
2.多变量软件
各类多变量技术要求的计算量是相当大的。实际上,要进行所讨论的分析需用依赖计算机及相关软件。
现在的个人计算机则有能力处理市场调研者有可能遇到的任何问题。多数典型的问题几秒钟内就可以得到解决。现在有许多Windows版本的多元变量分析软件,其中WindowsSPSS8.0(1997年11月版)和WindowsSTATISTICA”5.l(1997年夏季版)是最好的两种应用软件。
这两种软件包括了数据库的创建和管理、数据变换和处理、图表、描述性统计和多变量过程,而且都有简单易用的图形界面。关于SPSS软件的其他信息详见wwwspss.corn。有关STATISTICA”的信息详见www.statsoft.corn。这两个网址上还提供了其他一些有用的资料。 上一页 [1] [2] |