您现在所在的位置是:首页 > 业界新闻

服装企业的业务数据如何统计

数据分析是指用适当的统计分析方法对 收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加 以详细研究和概括总结的过程。数据也称观测值,是实验、测量、观察、调查等的结果,常以数量的形式给出。通过不断的摸索与发展,现形成了一门独立的学科 ——数据挖掘与客户关系管理硕士。

数据分析建立在统计分析基础上,统计参数是表达数据分析结果的基本指标,也是描述数据属性的特征值。数据分析的过程,实际上就是挖掘数据中隐含的具有统计意义的统计参数,从而揭示数据变化的内在规律。

★综述变量数据特征的描述
对于等比变量,通常用均值,总值,方差等统计量来描述其数据特征,而不用变量不同取值的频数来描述其数据特征,这类变量称为综述变量。一般来讲,综述变量不能直接用频数来描述其特征,在进行数据变异检验时,这类变量的检验称为参数检验。

一。综述变量数据特征的图描述
综述变量的图描述主要是用频数图来揭示数据的分布规律,常用的综述变量特征描述图包括直方图,线图,茎叶图等。
(一)直方图(Histogram)
直方图是用来描述综述变量数值分布规律的工具。其横轴代表数据的等距分类,各组之间无间隔(这是与条图最大的区别),纵轴代表各组数据出现的频数。

(二)线图
线图是将描述综述变量的各种特征数据用点或折线连接起来,反映综述变量特征的变化趋势。线图和条图在原理上比较接近,只是外观上有差别,因此两种图形可以转换。如果数据较多,或者需要观察两个连续变量之间的关系时,只能用线图来表达。

(三)茎叶图(Stem—and—leafplot)
茎叶图也是用来揭示综述变量数据频率分布情况的有效手段。茎叶的定义如下:先将原数表示为科学计数法,x=x·10‘,不过x的整数位可以超过1位,称为茎(茎的数字乘以10‘还原为原数据的对应整数位),其宽度为k,小数位只取一位,称为叶。显然,一条茎后面可能会有0-9的数字作为叶,每个数字也可能出现多次,叶的个数代表频数。

二,综述变量的统计参数描述
对于定量分析的变量(称综述变量),在进行统计分析时,其总体特征主要是通过均值,汇总值,方差等表达出来,以此发现分析变量的集中趋势,变化趋势,离散程度等分布规律,从而预测这些变量未来的变化趋势。对连续性,定量数据进行分析的常用方法之一是将这些数据进行综合,如计算这些数据的平均值,汇总值,方差等,并生成综述报表(Reports)。这种分析方法一般不适合分类数据资料。综述报表在销售数据分析中被广泛应用,在市场调查中一些定量评价分析中也可使用这种分析方法。

三,SPSS统计分析提供的各种参数
利用SPSS统计分析工具可计算丰富的指标参数,常用的指标参数包括以下几类:
(一)描述总体集中趋势的参数
该类参数主要有:
(1)平均值(Mean)。
(2)汇总值(Sum)。
(3)中位数/众数(Median/Mode)。
(4)最大值/最小值(Maximum/Minimum)。
(5)分位数(PercentileValues)。
(6)频数及百分l:匕(Frequencies&Percentage),个案总数(NumberofCases)。

(二)描述总体离散程度的参数
该类参数主要有:
(1)极差(Range)。
(2)方差/标准差(Variance/Std.deviation)。
(3)平均抽样误差(S.E.Mean)。

(三)表格计算指标
表格计算指标主要有:
(1)汇总百分比,包括频数百分比(Table%),汇总百分比或称比重(Tablesam%)。
(2)子表格数据百分比,包括频数百分比(Subtable%),汇总百分比(Subtablesum%)。
(3)层汇总数据的百分比,包括频数百分比(Layer%),汇总百分比(Lave,sum%)。
(4)列汇总数据的百分比,包括频数百分1:匕(Col%),汇总百分比(Col。um%)。
(5)行汇总数据的百分比,包括频数百分比(Row%),汇总百分比(Rowsum%)。

四,SPSS输出结果的引用
在办公处理软件中,Word和Excel仍然是主流软件,其文档和图表的编辑表达能力是SPSS无法相比的。SPSS的优点在于其统计分析功能,但其不太合适写分析报告。因此如果要用SPSS生成的统计分析结果写报告,最后都会被Word和Excel文档引用。由于SPSS统计分析产生的表格和图表是专用格式,因此在被Word和Excel文档引用时,要注意以下几个方面的问题:
(一)文本输出结果的引用
SPSS的统计分析结果如果是文本输出,点击选中所要引用的文本结果,可直接复制(Copy)到Word文档中,Word会自动转换相应的字体和格式。由于数据之间有空格或制表符分隔,利用Word中的文字转换成表格的功能,可将这些文字数据转化成表格。

(二)统计图表的引用
对统计表格的引用,有以下两种方法:
(1)直接复制(Copy)到Word或Excel文档中,表格框架将保持原状,数据小数位的位数可能会发什么变化(不同软件其默认数据精度不同),SPSS中的格式也将被丢失,而且如果表格中有中文,中文可能显示乱码(如果用选择性粘贴,以纯文本格式复制,中文不会乱码,但需要再进行一次文字转化成表格的编辑)。这种复制,在Word或Excel文档中可对引用的表格进行修改。
(2)用复制对象(Copyobject)的功能,将SPSS的表格复制到Word或Excel文档中,表格将以标准的图片格式出现,不可对其中的数据修改,但可进行图片编辑。
统计图的引用,一般使用复制对象(CopyobJect)的功能。如果使用直接复制(Copy),该图在Word或Excel文档中也不能进行数据编辑,只能进行图片编辑。
在实际使用过程中,如果引用的表格需要在Excel进一步编辑,可采用直接复制(Copy)。Word文档引用统计图表时,最好采用复制对象(Copyobject)的功能生成图片。因为这样图片在Word文档中比较容易进行排版,统一格式,而且如果数据分析过程正确,原始数据录入没有问题,则无需保留对表格修改的能力。再者,如果原始数据错误,所有的分析表格均可能出错,这时使用下面介绍的数据分析过程重现,再做一次统计图表并引用,效率会更高。

★数据分析中常用的统计量及其分布
服装企业内部产生的销售数据或通过市场调查产生的调查数据通常都没有明显的规律,为了分析数据对象的总体规律,需对这些原始数据进行整理计算,以得出反映总体特征的参数。在统汁学中,将通过样本构造出来的参数统称为统计量。由于样本数据的随机性,由此计算的统计量也是一个随机变量,因此统计量是一个不含未知参数的样本函数,可记为F(X1,X2,X3,…Xn)。如样本平均值,样本方差与标准差等,这些变量的值都可由样本的观察值(Observed)计算得到,都是典型的统计量。

一,描述总体集中趋势的统计量
描述总体集中趋势(Centraltendency)的指标主要有以下几个:
(一)算术平均值及汇总值(MeanOfValues&Sum)
该组参数是数据分析中最常用的统计量,通常用于描述连续型和综述型变量的集中趋势,但均值容易受到最大值与最小值的影响,在描述集中趋势时不够稳健。如描述销售价格的平均值,描述某类产品的销售汇总值等。

(二)中位数(Median)
中位数指一组按大小排列的数据中处于中间位置的数据,它可将一组观测数据分为两半,通常用来反映一组观测数据的中间水平。如果样本个数为奇数,中位数为中间位置对应的数据;如果样本个数为偶数,中位数取中间两位数的平均值。由于中位数是根据一组升序或降序数据的位置确定的,不会受到极端值影响,比较稳健。在数据分析中,如果以中位数作为参考线,可以观测数据的波动或分布情况。

(三)分位数特征描述(PercentileValues)
通常将变量按其值的升序从小到大排列,然后求个案数占一定比例(分位数)所对应的变量值,分位数一般用来描述数据取值在一定范围的概率或频率。上面所提到的中位数,实际上就是将数据等分为两个部分,如果再将中位数与最大值或最小值之间再等分为两个部分,就得到了两个四分位数。上四分位数表示约有25%的数据比该值大,下四分位数表示约有25%的数据比该值小。
如数据序列:1,2,3,4,5,6,7,8,9,共有9个数,中位数为5,上四分位为7,下四分位为3,分别表示,大于或小于5的数据各占50%,小于3的数据约占25%,大于7的数据约占25%,3到7的数据约占50%。

(四)众数(Mode)
一组按大小排列的数据中出现次数最多的数值或有明显集中趋势的点所对应的某一个数值为这组数的众数。通常众数用来反映一组观测数据中分布最高点所对应的数值。对于类别数据,众数就是频数最大的组别,而对于分组数据,众数是频数最大组别中的某一个值,通过计算可得到。众数也是一种位置指标,在数据分析中,应用较少。
如数据序列:1,2,2,2,3,4,4,5,6,6,7,7,8,9,共有14个数,中位数为(4+5)/2=4.5,上四分位为7,下四分位为2,众数为2。

(五)最大值与最小值(Maximum&Minimum)
该参数可反映某一变量的取值范围。在数据分析中,可用来分析一组观测数据是否在预计的取值范围之内,并判断观测数据是否有差错。

(六)频数及频率(Frequencies&Percentaqe)
频数指频数变量各个分类值的个案数,频率指频数变量各个分类值的个案数与总体数的百分比,该参数通常用于描述频数变量的特征。

在数据的统计分析中,均值,汇总值,频数,频率用的比较多,而其他指标作为辅助性指标,用来描述数据的位置规律或数据的变化范围。

二,描述总体离散程度的统计量
总体的离散程度(Dispersion)与总体集中趋势是一对统计变量,共同构成对总体数据特征的描述。描述总体离散程度的指标包括以下儿个:
(一)极差(Range)
极差又称为全距,指一组数据中最大值与最小值的差,反映一组数据的最大变化幅度。其主要用来提供观测数据两端极值的信息,不受中间数据的影响。一般极差越大,表示数据分散程度越高。

(二)方差和标准差(Variance&Std.Deviation)
方差是指一组数据中各个个案数据与该组数据平均值的差的平方和的平均值,标准差或均方差则是方差的开方。在数据分析过程中,方差和标准差是最常用的参数之一。它既可反映一组数据的内部差异,也可代表该组数据的特征。

(三)平均抽样误差(S.E.Mean)
每一个总体都存在若干样本,每个样本的平均值可能不同,样本平均值的差异用平均抽样误差来描述。在一定可靠程度下,平均抽样误差决定了估计值的误差范围。在抽样过程中,平均抽样误差不可避免,但可以控制。减少平均抽样误差的方法是扩大样本容量。

(四)协方差(Covariance)和相关系数(CoefficientOfCorrelation)
协方差用来描述二维随机变量X,r之间相互关系的数字特征,当协方差不为。时,表示两个变量之间存在相互关系,其相关程度用相关系数表示。协方差分析常用于多元统计分析中,用来排除已知的非实验因素对实验结果的影响。如研究消费者满意度水平与消费水平之间的关系时,消费者的收人为非研究因素,但它可能对研究结果产生影响,该变量称为协变量,通过协方差分析可以消除该因素对分析结果产生的影响。

三,描述数据分布特征的
统计量数据的分布(Distribution)特征可从以下两个方面描述:一是偏度(Skewnes),用来显示数据不对称性的参数,标准正态分布的偏唛为0;二是峰度(kurtosls),用来显示数据分布密度的平坦程度,标准正态分布的峰度为0,

四,常用统计量的分布函数
在数据分析过程中,会搜集一系列原始数据,这些数据只是分析总体的一个子样本,他们的特征和变异都表现在数据的分布上-通常用数据的图或表的形式来描述数据的分布情况,如频数表,频数图,直方图等,如果将这些图表用数学函数描述出来,就成为样本的分布函数F(r),样本分布函数是用米描述样本取值与概率密度之间关系的函数,用该函数可计算样本数据落在一定区间的概率。由于统计量是样本的函数,因此样本分布函数又称为统汁量分布函数:在数据分析过程中,常用的分布函数有以下几个:
(一)正态(Normaldistribution)分布
正态分布基本特点是数据分布具有良好的对称性,呈现两头小,中间大?一般的正态分布函数由数学期望值(Expectedvalue)和标准差(St‘1.deviation)确定,正态分布可简记为”(从61)。当弘二0,6’二1时,称为标准正态分布,其特点是均值为0,标准差为l,偏度与峰度均为0。

根据统计原理,将若干服从正态分布的样本通过线性叠加,所形成的样本也服从正态分布。理论研究证明,只要抽取的样本足够大,大量的自然现象或社会现象均服从正态分布。在统计计算中,一个正态总体或两个正态总体均值变异的检验均使用了这一规律。如检验两个地区调查结果是否相同或前后两次调查结果是否相同,通常需要从统计的角度分析差异的显著性,并做出判断。

(二)X’(Chi—square)—分布
若随机变量X服从标准正态分布,X1,X:,…为X的样本,构造一个统计量尸=J1’+J2’+…称该统计量服从X’—分布,即简记为K’(/V),/V为自由度Df信该分布的特点是其均值为/v,其方差为2n,数据分布是偏态的,其偏度与峰度由该统计量的自由度决定,该分布通常用来构造假设检验的统计量。在统计计算中,主要用来进行一个正态总体方差的变异检验及独立样本的非参数检验。如检验对某地区调查结果与往年相比,其方差是否发生显著性的变化。

(三)T—分布
若随机变量X服从/V(0,1),r服从X’(N)分布,构造一个统计量了,其表达式为:厂=—÷l
qY/n
称了服从自由度为/V的厂分布,简记为了(/V),/V为自由度Df。其特点是具有对称性,其自由度等于X’—分布的自由度,偏度与峰值与统计变量的自由度有关,当自由度很大时,其分布可近似为标准正态分布,因此正态分布是该分布的一个特例。在统计计算中,该统计量主要用来构造检验变量,用来检验一个方差未知的正态总体均值是否等于某一期望值,两个方差齐性总体的均值是否相同,对于两个方差不具有齐性的总体均值检验采用正态分布统计量进行检验。

(四)F—分布
若随机变量U和/分别服从X’(付),X’(/kf)分布,构造一个统计量F。
称F服从F分布,记为F(/V,A4)。该分布的特点是偏度与峰度由两个X’—分布的样本各自的自由度共同决定。该统计量主要用来构造检验变量,检验两个正态总体的方差是否具有齐性(EqualityOfvariances)或相同,检验回归方程的显著性等。

(五)二项(Binomial)分布
二项分布又称0—1分布,其特点是变量的取值只有0或1,即是或不是。市场调查中许多问题属于这种分布,如对品牌形象的评价,可能有四个备选答案,每个答案都服从0—1分布。此外,分析某类个体占总体的比例,也可用0—1分布来描述,记为B(1,尸),表示属于该类的个体所占的百分比为尸,不属于该类个体所占的百分比为l—户,记为B(0,1—尸)。0—1分布的特点是:其均值等于尸,其方差等于户(1一户)。
二项分布主要用于非参数检验,如想分析不同地区的被访者对该品牌形象的评价是否有差异,属于非参数检验(NonparametricTests),可采用二项分布对每个答案进行检验。如果对该问题的变量设计没有分解为o—1分布的变量,在分析前,要对原数据进行转换。

五,常用的检验统计量
假设总体父服从正态总体/V(从S2)分布,X,,X:…为总体J的样本,在进行统计分析中常用的统计量如下:
(一)样本均值统计量
(二)p检验统计量
(三)X2检验统计量
(四)T检验统计量
(五)F检验统计量

★频数变量数据特征描述
服装企业的营销数据分析,可分成两个层面,一个层面是销售数据的分析,另一个层面是市场调查数据的分析。通常情况下,前者主要应用一些数据报表对数据进行分类汇总,用于向管理者提供经营管理的成果分析,关注的是数据值的具体变化;后者较多使用频数分析的方法,关注的是数值出现的频率及其变化,也就是数值的分布规律。任何类型的数据都可采用频数分析的方法来了解数据的变化规律。

一,频数,频率及频数变量的涵义
在前面的学习中,我们已了解到频数和频率是用来描述总体集中趋势的参数。频数(Fre叫ency)是指在观察的数据序列中,某一个值出现的次数,频率指某一个值出现的次数占所观察的数据序列的总个案的百分比(Percenta肛)。频数变量是指可以用频数或频率宋描述其数据特征的变量。
对于顺序变量和类别变量,频数与频率是最有效的分析工具。但对于连续型的等比变量,由于数据是连续变化的,不可能通过频数统计来了解其变化规律。但是如果通过数据分组,将连续型的等比变量转化为分组的类别变量,则也可进行频数与频率的分析。如观察某一地区,某一产品在各个店铺中的价格,得到一组价格数据。通过对价格数据分组,可了解到某一‘区间的价格被大多数店铺所接受,这一价格区间就成为主流的价格区间。显然如果经营者只关心某一价格水平,就很难发现价格数据在市场中的变化规律。

二.频数表和频率图
频数表是用来反映频数变量的各个类别在观察数据中出现的次数和频率的表格。频率图是利用频数表中的数据绘制而成。在条形图中,横轴代表类别,纵轴代表频率;在饼图中,以各类频率的大小对饼进行切割,形成不同面积的块,面积的大小代表频率的大小。频数表能精确地记录频数,而频率图则能直观地反映各类数据的大小。

三,多选题频数和频率
在市场问卷调查中,总会设计一些多选问题,对于这类问题的频数统计,SPSS提供了专门的多选题频数统计分析功能。

四,频数图表中的数据分析方法
应用频数图表将原始数据进行整理之后,接下来要做的是如何解释这些数据。

(一)表内数据的对比分析
在频数足够大时,主要关注频率最高和频率最低的组别,这实际上是一种众数分析的思想。频率较高组别的累计频率也有一定的意义,如果较少的几个组别累计频率达到较高的水平,这几个组别就成为重点的关注对象,反之亦然。

(二)不同期数据的对比分析
主要关注数据的变化是否显著,以及这种变化是否有利,这是提出分析建议的重要依据。这种分析的前提是要有可用来对比的历史数据。

(三)竞争对手数据的对比分析
主要关注竞争对手数据与本企业数据之间的差异,以此判断竞争实力或差距。这种分析的前提是要有可用来对比的竞争对手的数据。

★数据分析过程的记录与重现
数据的整理与分析通常是一个程序化的过程,而且很多工作需要重复进行,重复性工作做得多,工作效率就会很低。虽然有些工作可以通过编程来解决,但是编程不能替代数据分析师解决所有的数据分析问题,正因如此,许多数据分析应用软件只能提供宁富的数据分析工具,而解决企业面临的一些不确定性的,随机性的数据分析任务,需要数据分析人员充分发挥自己的能动性,在数据分析思想和方法上进行创新。当一类数据分析问题的分析思想和方法确定之后,就形成了解决这类数据分析问题的程序化的数据分析过程。SPSS作为优秀的数据分析软件,在为数据分析人员提供各种数据分析工具的同时,还提供了记录和重现数据分析整理过程的paste功能。

一,销售数据分析实例
销售部门主管为了对各个销售小组及其成员的销售业绩进行管理和控制,需要根据每天的销售情况,对各个小组的销售业绩进行汇总,得到销售分组汇总表,同时还要将每个小组销售人员的销售业绩进行排名,得到各个小组销售人员的销售额及小组排名表。销售部门吏管每天都需要做这份工作。
假定所有销售数据保存在练习库中数据文件“销售业绩.say”中,下面利用SPSS提供的一些基本的数据统计功能,完成上面的数据分析任务。数据分析操作的过程如下:
(一)打开销售数据库
(1)点击"File--40pen斗Data”。
(2)在文件目录...\Practice中选择数据文件“销售业绩.sav”。
(3)点击[Open]按钮,显示一个数据库。

(二)生成分组的销售数据汇总表
(1)点击"Analyze—)Repons—)CaseSummaries”,显示输入对话框。
(2)输入分析变量"perform”,分组变量"group”。
(3)选择统计参数(Statistics)列表中的个案数,均值,汇总值,综述变量的百分比四个参数,去掉个案显示Displaycases,其他均采用系统默认值。
(4)点击确认钮[OK],生成综述报表。

(三)对每一组的销售人员按销售业绩排序,并生成名次变量
(1)点击"Transform—)RankCases”,显示秩变换对话框。
(2)指定需要计算名次的变量“perform”,指定分组变量“group”,指定将1分配给最大值(AssignRankltoLargestValue),指定秩计算类型(南nkTypes)为"Rank”,指定秩相同时Ties的处理方式为取较小的值(Low)。
(3)点击确认钮[OK],生成一个排名变量"rperform"。

(四)对销售业绩按小组及名次排序
(1)点击"Data-}SortCases”,显示排序菜单。
(2)指定两个排序变量“group,rperform”。
(3)点击确认钮[OK],原数据库中的数据各个小组按名次排列。

(五)切分文件,以便分组的销售数据及名次能分组输出
(1)点击"Data—)Splitfile”,显示分割方式及分组变量列表。
(2)指定分割方式为Repeatanalysisforeachgroup分组变量为"group”。
(3)点击确认钮[OK]。

(六)生成分组的,按名称排列的销售数据表
(1)点击"Analyze—>Reports斗CaseSummaries”,显示输入对话框。
(2)输入分析变量“name,perform,rperform”,去掉统计参数(Statistics)列表中的参数,要求显示个案(Displaycases),其他均采用系统默认值。
(3)点击确认钮[OK],生成分组原始数据报表。

(七)恢复切分文件,以便后面数据分析时不会受到切分文件的影响
(1)点击"Data__4Splitfile”,显示分割方式及分组变量列表。
(2)指定不分割方式AnalyzeallCases。
(3)点击确认钮[OK]。
执行以上操作之后,生成四张报表,将其复制到Word分析文档中,得到的统计结果女口表4—8和表4—9所示。

以上的分析过程是一个比较简单的数据分析任务,实际上,出于管理的需要,这一数据分析任务可能设计的更复杂一些。但是不管这一数据分析工作多么简单,如果每天都要一步一步地用原始销售数据,来完成这些数据分析表格,不仅枯燥,而且费时。其实,在执行上面的每个步骤时,输入对话框中都会有一个粘贴(Paste)功能按钮出现,该功能是用来记录执行该过程所使用的SPSS的内部指令,或称语法(Syntax)。只要在执行上面的操作步骤时,点击Paste命令,该过程调用的SPSS语法就会送到一个语法编辑窗口。按顺序将所有的语法都贴到语法文件中,用一个文件名保存起来,下次分析时,只需要调整分析数据库中的数据,执行该文件,就可生成以上各种需要的分析表格。

二,SPSS中常用的语法
从上面的操作可以看出,要记录数据分析过程并重新执行分析过程,只要将执行过程定义完之后,使用粘贴功能,将数据分析操作使用过程的语法记录下来即可。这是SPSS在数据整理与分析过程中一个很重要的功能。不过要能很好地运用SPSS的语法粘贴功能,除了要事先对数据分析过程进行正确的构思与规划之外,还要熟悉一些常用操作的语法特点,这样,若想改变分析过程中使用的变量或参数,只需要对语法中的变量或参数进行修改即可,从而大大提高数据分析的效率。

上面介绍了数据整理过程中的一些常用语法,除了需要输入的变量或输出参数的选择需要人工修改之外,所有的语句均通过语法粘贴功能Paste自动输入。分析过程中用到的语法结构比较复杂,但同样可用粘贴功能复制到语法文件中,不再一一列出。在分析的过程中,只要按分析过程将所有的指令用粘贴功能记录下来,该分析过程就可通过执行语法文件而重新操作一遍,不需要进行任何语法文件的修改。不过SPSS提供的语法编辑功能比较少,如果要提高语法的编辑效率,可在Word中进行语法编辑,然后粘贴到SPSS的语法文件中。

三,SPSS语法文件的保存与调用
语法文件生成之后,可通过文件菜单(File)中的保存命令将其保存在指定的目录中,文件的类型为*.sps。当需要调用或修改该文件时,可在文件菜单中用打开指令,选择打开语法文件(Syntax),在指定的目录中打开需要的语法文件,此时会出现语法文件的编辑窗口。在该窗口中,有一个语法文件运行菜单(Run),下面有三个选项:
(1)All,表示执行语法文件中的所有语句。
(2)5election,表示执行所选定的语句。
(3)Current,表示执行光标所在的语句。
(4)toEnd,表示从光标所在的语句开始执行到最后语句。

如果要全部执行语法文件,选择第一项,如果只需执行语法文件中的部分语句,可根据需要在后面几项中选择。

文章来源:秘奥软件网,中小企业信息化领跑者!全国咨询热线:400-9908-527_www.misall.com


最新新闻: 上一篇: 下一篇: