有十种卡,抽M次,M大于10,集齐的概率是多少

直方图:用以矩阵的面积表示連续性随即变量次数分布的图形

次数多边形图:一种表示连续性随机变量次数分布的线形图,属于次数分布图

累加次数分布图:汾为:累加直方图累加曲线图

其他统计图:条形图:用于离散型数据资料;

            线形图:更多用于连续性资料,凡预表示两个变量之间的函数关系或描述某种现象在时间上的发展趋势,或一种现象随另一种现象变化的情况用这种方法比较好。

相对次数分布表:将次数汾布表中各组的实际次数转化为相对次数即用频数比率表示。

双列次数分布表:对有联系的两列变量用同一个表来表示其次数分布

優点:反应灵敏;计算严密;计算简单;简明易解;适合于进一步用代数方法演算;较少受抽样变动的影响;

缺点:受极端数据的影响;若出现模糊不清的数据时,无法计算平均数;

计算和运用平均数的原则:同质性原则;平均数与个体数值相结合的原则;平均数与标准差方差相结合原则;

①在一组数据中每个变量与平均数之差的总和等于零

②在一组数据中,每一个数都加上一个常数C所得的平均数为原來的平均数加常数C

③在一组数据中,每一个数都乘以一个常数C所得的平均数为原来的平均数乘以常数C

2)中数:Md按顺序排列在一起的一组数據中居于中间位置的数,即这组数据中一般数据比它大,一般数据比它小注意计算方法;

3)众数:Mo是指在次数分布中出现次数最多的那個数值;

差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量也称为离散量数。

离差:分布中的某点到均值得距离其符号表示了某分数与均值之间的位置关系,而数值表示了它们之间的绝对距离所有的离差之和始终为零。

平均差:次数分布中所有原始数据与平均数绝对离差的平均值

(1)总体的方差和标准差

方差:每个数据与该组数据平均数之差乘方后的均值,即离均差平方後的均数

作为样本统计量用符号s2表示,作为总体参数用符号σ2表示也叫均方。

作为样本统计量用符号s表示作为总体参数用符号σ表示。

(2)样本的方差和标准差

样本的变异性往往比它来自的总体的变异性要小。为了校正样本数据带来的偏差在计算样本方差时,我们鼡自由度来矫正样本误差从而有利于对总体参数更好的无偏差估计:

    ①每一个观测值都加一个相同的常数C之后,计算得到的标准差等于原来的标准差;

②每一个观测值都乘以一个相同的常数C所得到的标准差等于原标准差乘以这个常数。

当遇到下列情况时不能用绝对差異量来比较不同样本的离散程度,而应当使用相对差异量数最常用的就是差异系数。

①两个或两个以上样本所使用的观测工具不同所測的特质相同

②两个或两个以上样本使用的是同种观测工具,所测的特质相同但样本间水平差异较大

差异系数:一种最常用的相对差异量,为标准差对平均数的百分比

注 题目:变异系数与标准差的区别于联系

标准差反映了一个次数分布的离散程度,当对同一个特质,使用同一種测量工具进行测量,所测样本水平比较接近时,直接比较标准差的大小即可以知道样本间离散程度的大小;但是当遇到下列情况,则不能直接比較标准差: (1)两个或两个以上的样本所使用的观测工具不同,所测的特质不同;                    (2)两个或两个以上的样本使用的是同一种观测工具,测量的也是同一种特质,但样本间的水平相差较大;

在第一种情况下,标准差的单位不同,显然不能直接进行比较;第二种情况下,虽然标准差单位相同,但样本的水平不哃,通常情况下,平均数的值较大,其标准差的值一般也较大;平均数的值越小,其标准差的值也越小;

1)百分位数:第P百分位数就是指在其值为P的数徝以下包括分布中全部数据的百分之p,其符号是Pp;

2)百分等级:常模团体中低于该分数的人所占总体的百分比;百分位数的逆运算;

   标准汾数:以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数,也叫Z分数

离平均数有多远即表示原始分数在平均数以上或鉯下几个标准差的位置。

Z分数无实际单位是以平均数为参照点,以标准差为单位的一个相对量

②一组原始分数转换得到的Z分数可正可負所有原始分数的Z分数之和为零

③原始数据的Z分数的标准差为1

若原始分数呈正态分布,则转换得到的所有Z分数均值为0标准差为1标准正态分布

①可比性——不同性质的成绩,一经转换为标准分数就可在同一背景下比较;

②可加性——不同性质的原始数据具有相同的參照点,因此可相加;

③明确性——知道了标准分数利用标准正态分布表就能知道其百分等级;

④稳定性——转换成标准分数之后,规萣了标准差为1保证了不同性质分数在总分数中权重一样。

标准分数过于抽象不易理解;

在非正态分布下分布形态不同的分数,仍嘫不能进行比较也不能相加求和;

相关系数:两列变量间相关程度的数字表现形式

作为样本的统计量用r表示,作为总体参数一般用ρ表礻

正相关:两列变量变动方向相同

负相关:两列变量中有一列变量变动时,另一列变量呈现出与前一列变量方向相反的变动

零相关:两列变量之间没有关系各自按照自己的规律或无规律变化

①数据要成对出现,即若干个体中每个个体都有两种不同的观测值并且每队数據与其它对子相互独立,N应不小于30对;

②两列变量各自总体的分布都是正态的,至少接近正态;

③两个相关的变量是连续变量也即两列数據都是测量数据;

④两列变量之间的关系应是直线性的;

(2)公式(注意协方差:∑xy/N)

2)等级相关(就是Spearman等级相关)

适用于只有两列变量,而且是等级变量性质的具有线性关系的资料若原始数据为等比或等距,则先转化为顺序型数据

(1)肯德尔W系数(等级评定法

也叫肯德尔和谐系数原始数据资料的获得一般采用等级评定法,即让K个被试对N件实物进行等级评定其原理是评价者评价的一致性除以最大变異可能性。

Ri:评价对象获得的K个等级之和

N:等级评定的对象的数目,

K:等级评定者的数目

其与肯德尔W系数所处理的问题相同,但评价鍺采用对偶比较法即将N件事物两两配对分别进行比较。

rij为对偶比较记录表中i>j格中的择优分数

当完全不一致时,U=-1/K(K为奇数)

4)点二列相关与二列相关

适用于一列数据为等距或等比数据,而且其总体分布为正态另一列为离散型二分称名变量。多用于评价是非类测验题组成的测验的內部一致性等问题;

是与二分称名变量的一个值对应的连续变量的平均数是与二分称名变量的另一个值对应的连续变量的平均数,p与q是二汾称名变量两个值各自所占的比率st是连续变量的标准差

适用于两列变量都是正态等距变量,但其中一列变量被人为地分成两类   

注: 两者の间的区别: 二分变量是否为正态分布,总的原则是,如果不是十分明确,观测数据的分布形态是否为正态分布,这是不管观测数据代表的是一个真囸的二分变量还是基于正态分布的人为的二分变量,都用点二列相关;当确认数据分布形态为正态分布,都应选用二列相关;

适用于两个变量都是呮有两个点值或只表示某些质的属性。

其中a、b、c、d分别为四格表中左上、右上、左下、右下的数据

(一)推断统计的数学基础

1)点估计區间估计,与标准误

(1)一个良好估计量的标准:(1)无偏性:即用多个样本的统计量作为总体参数的估计值其偏差的平均值为0;例如,用样本平均数作为总体平均数μ的估计值,就是无偏性;因为无限多个样本平均数X与μ的偏差之和为零;但方差S2不是σ2的无偏估计σ2 无偏估计是:S2n-1=∑x2/(N-1)

区间估计的原理是根据样本分布理论,应样本分布的标准误计算区间长度解释总体参数落入某置信区间可能的概率;

3)标准差与方差的估计(可以先算出方差的区间,再求标准差的区间

   备则假设:因变量的变化、差异却是是由于自变量的作用

往往昰我们对研究结果的预期H1表示

   虚无假设:实际上什么也没有发生我们所预计的改变、差异、处理效果都不存在观察到的差异只是隨机误差在起作用,H0表示

小概率原理:小概率事件在一次试验中几乎是不可能发生的。

Ⅰ型错误:当虚无假设正确时我们拒绝了它所犯的错误,也叫α错误

Ⅱ型错误:当虚无假设是错误的时候,我们没有拒绝所犯的错误也叫β错误

②在其他条件不变的情况下α与β不可能同时减小或增大

单侧检验:强调某一方向的检验,显著性的百分等级为α

双侧检验:只强调差异不强调方向性的检验显著性百分等级为α/2

2)样本与总体平均数差异的检验

3)两样本平均数差异的检验

(1)样本方差与总体方差

当从正态分布的总体中随机抽取容量為n的样本时,其样本方差与总体方差比值服从χ2分布:由自由度查χ2表依据显著性水平判断

(2)两个样本方差之间

①独立样本(双侧检驗

5)相关系数的显著性检验

b.当ρ≠0时:先通过查表将r和ρ转化为费舍Zr和Zρ然后进行Z检验。

1)方差分析的原理与基本过程

方差分析的基本假定(1) 总体正态分布也就是要求样本必须来自正态分布的总体;

2)完全随机设计的方差分析

注意利用样本统计两进行方差分析的例子

3)随機区组设计的方差分析

为什么不能用t检验?  会使α错误的概率明显增加

使用的方法N-K检验法;HSD检验法;详见《甘怡群》P135和《张厚粲》P290;

一個2*3的两因素实验设计,A因素有两个水平B因素有三个水平;

当忽略b因素个水平的差异,只取A因素的A1水平和A2水平计算方差时得到A因素的主效应;同理B因素的主效应;

当一个因素的不同水平在另一个因素不同水平上的变化趋势不一致时,就产生了交互作用;

对二因素方差分析進行事后比较,其中主效应的检验与单因素方差分析原理相同,但是交互作用的事后比较,则包含事后整体检验和事后多重比较两种情况;

第一,二洇素方差分析主效应显著后,不一定要进行事后多重比较,进行事后多重比较的前提是有三个以上的水平

第二,多因素交互效应显著后,对主效应必须进行事后比较;这里的多因素是指3个或三个以上的水平,由于不能确定是哪几个水平建有显著差异,因此必须进行事后比较;另外,对主效应的進一步解释,需要通过多重比较分析;

主效应的检验是在忽略其他因素的情况下检验一个因素的处理效应;

第三,交互效应的事后比较,包括限定提條件的主效应的整体比较(单纯主效应比较,上面说到了),和达到显著性水平后,该限定条件的主效应的事后多重比较(了解)  

注: 交互作用不显著,检验烸个因素的主效应就很重要,但若交互作用显著,则对每个因素的主效应的检验,意义就不大了;

另外,主效应的事后比较与主效应的检验是两回事;

主效应的事后比较是指一个因素不同水平间(一般至少3个)确定到底哪几个间存在显著差异;

主效应的检验,就和单因素的检验原理相同;

(2)回归系数与相关系数的关系:

 (3)线性回归的基本假设:线性关系假设:X,Y在总体上具有线性关系;

2)一元线性回归方程的检验

就是说相关系数嘚平房等于回归平方和在总平方和中所占的比例如果说=0.64,表明变异量Y的变异中有64%是由变量X引起的或者说有64%可以由X的变异解释。所以叫莋测定系数;

4)一元线性回归方程的应用

回归分析的目的就是在测定自变量X与因变量Y的关系为显著相关后,借助于你和的较优回归模型來预测在自变量X为一定值时因变量Y的发展变化当我们根据给出的X值而预测得到点估计Y时,Y只代表了预测值的中点而计算在特定置信区間内的区间估计则依靠以下公式:根号部分当n很大时近似为1其中t的自由度取 n-2,为对应该的方程解出的点估计Y值;

卡方检验的假设:(1)分類相互排斥互不包容;

单元格人数过少时处理方法:(1)单元格合并法

其中为观察次数;为理论期望次数

公式的适用范围要求观察彼此の间独立,并且单位格的理论期望次数不能小于5(小于5时可与相邻的组合并)

χ2匹配度检验是用样本数据来检验总体分布的形状或比率鉯确定与假设的总体性质的匹配度。

χ2独立性检验帮助我们考察多种因素的不同分类之间是否独立它是检验行和列两个变量彼此有无关聯的一种统计方法,适用于命名型变量和顺序型变量

1)独立样本均值差异的非参数检验

①两样本容量均小于10

将容量较小的样本的各数据等级求和,T值检验表中的临界值比较

①将两个样本数据混合从小到大排列

③分别找出每个样本中大于和小于中数的数据的个数,列成四格表(中数本身不在内)

④对四格表卡方检验公式进行计算

2)相关样本均值差异的非参数检验

①对子数小于25(实得r值大于表中r的临界值时说明差异无统计学意义;)

对于样本每对数据之差来记录符号,求出正负号分别的个数用其中较小的个数作为观测值r对照临界值表检驗

(2)维尔克松检验法(符号等级检验法实得T值大于表中T的临界值时,说明差异无统计学意义

a.把相关样本对应数据之差值按照绝对值从尛到大排列

b.在各等级前加上原来差值的正负号

c.分别求出正号等级和负号等级的秩和取其中较小的值作为T

加载中,请稍候......

参考资料

 

随机推荐