2020年健康管理师三级考前复习知识点:统计学的几个重要概念

2020年09月26日 来源:来学网

     【摘要】根据“调整2020年健康管理师职业技能鉴定考试通知”可知,健康管理师考试时间为第一批次2020年10月24-27日,第二批次2020年10月31-11月1日,第三批次2020年11月7-8日进行,现在已经9月底了,离考试越来越近了,为助各位考生顺利备考,来学网小编搜集整理了有关2020年健康管理师三级考前复习知识点:统计学的几个重要概念,供各位考生参考,预祝各位考生考试顺利,更多详情请关注健康管理师考试栏目, 提供最新考试大纲,精心模拟考场试题,更有名师授课、视频详解和海量试题供您选择,试用点击进入》》

  1.同质与变异

  研究对象具有相同的背景、条件、属性称为同质(homogeneity);同一性质的事物,其个体观察值(变量值)之间的差异,在统计学上称为变异(variation)。统计学所研究的对象是以同质为基础,并具有变异的事物或现象。例如,调查1998年所有20岁健康男大学生的身高。它的同质基础是同一地区、同一年份、同为20岁健康男大学生;这些20岁健康男大学生的身高值有的相同,有的不尽相同,存在差异,这种身高值之间的差异就是变异。

  2.总体与样本

  总体(population)是根据研究目的确定的同质观察单位的全体,更确切地说,是同质的所有观察单位某种变量值的集合。这里的观察单位亦称个体,是统计研究中最基本的单位。有的总体是在确定的同质基础上明确了一定时间、一定空间的有限个观察单位,称为有限总体。有时总体是抽象的,观察单位数是无限的,该总体称无限总体。

  医学研究中的很多情况是无限总体,而即使是有限总体,由于总体较大,要收集所有观察单位的数据既费时、费力还容易产生差错,很多时候是不必要和不必须的,所以医学研究的资料多数是通过抽样研究去获得。即从总体中随机抽取有代表性的一部分观察单位,其测量值(或观察值)的集合称为样本(sample)。抽样研究的目的是用样本信息推论总体特征。

  3.参数与统计量

  参数(parameter)指总体指标,如总体均数、总体率、总体标准差等。

  统计量(statistic)指样本指标,如样本均数、样本率、样本标准差等。一般情况下,参数是未知的,需要用统计量去估计。用统计量推论参数的方法,统计学上称为参数估计和参数检验。

  4.误差

  任何周密设计的科学研究,都不可能没有误差(error)。医学科学研究中的误差通常指测量值与真实值之差,其中包括系统误差和随机测量误差;以及样本指标与总体指标之差,即抽样误差。系统误差应该通过周密的研究设计和调查(或测量)过程中的严格质量控制措施予以解决;随机测量误差及抽样误差都属于随机误差,随机测量误差是不可避免的,但应尽量的小;抽样误差是抽样机遇所致,是客观存在,不可避免的。这种误差可以通过统计方法估计,也可通过增大样本含量使其减小。

  5.概率与频率

  概率(probability)是对总体而言,频率(frequency)是对样本而言。概率指某随机事件发生的可能性大小的数值,常用符号P来表示。随机事件的概率在0与1之间,即0≤P≤1,常用小数或百分数表示。P越接近1,表明某事件发生的可能性越大,P越接近0,表明某事件发生的可能性越小。频率指一次实验结果计算得到的样本率。统计中的许多结论都是带有概率性的。一般常将P≤0.05或P≤0.01称为小概率事件,表示某事件发生的可能性很小。

  6.频数表

  相同观察结果出现的次数称为频数。将所有观察结果的频数按一定顺利排列在一起便是频数表(frequency table)。编制频数表的主要目的,一是简化数据,二是便于考察观察结果的分布特征。

  定量测量结果通常不一一列出各测量值的频数。此时,应将所有测量值中最小值与最大值之间的范围划分成若干等长度的组段,以各个组段内的变量个数作为频数。由于样本量有限,组段的数量不宜过多或过少,通常取10个左右,组段长度(组距)的选取以方便阅读为原则。各组段首尾相接,每个组段都有下限L和上限U(在频数表中,上限通常省略),测量值X的归组统一规定为L≤X

  7.频数分布图

  为了更直观地反映计量览料的分布特点,可进一步绘制频数分布图,以评分组段(每段2分)为底,相应频数为高作一系列密闭的矩形。频数分布图又称直方图,它能直观地反映连续变量各种取值出现的机会。

  8.描述集中趋势的指标

  (1)算术均数:当资料服从对称分布时,统计中常采用算术均数描述其平均水平(或集中趋势)。

  (2)中位数(median):指一组由小到大顺序排列的观测值中位次居中的那个观测值。全部观测值中大于和小于中位数的观测值的个数相等,各占总例数的50%。

   (3)几何均数(geometry mean):是描述偏态分布资料集中趋势的另一种重要指标。它尤其适用于描述以下两类资料的集中趋势:①等比资料,如医学上血清抗体滴度、人口几何增长资料等;②对数正态分布资料(有些正偏态分布的资料,原始数据经过对数转换后服从正态分布),如正常成人血铅值或某些疾病的潜伏期等。

  9.描述离散趋势的指标

  (1)极差:亦称全距(range),用符号表R表示。极差是一组观察值中最大值与最小值之差,用于反映观察值变异的范围大小。极差大,说明变异度大。用极差描述变异度大小,简单明了。但缺点是:①除最大值和最小值外,不能反映组内其他数据的变异度,因此用它来描述资料的离散趋势是粗略的;②易受个别特大值、特小值的影响,即不够稳定。

  (2)四分位数间距 四分位数间距是上四分位数QU (P75)与下四分位数QL (P25)之差,记作Q。

  (3)方差与标准差:是描述对称分布资料离散趋势的重要指标。方差与标淮差的数值越大,说明观测值的变异度越大,即离散程度越大,此时的数据就会越分散,均数的代表性越差。

  (4)变异系数(coefficient of variation):用符号CV表亦,即称准差s与均数之比用百分数表示。

 

      来学网现已开通线上辅导课程,名师授课、专家答疑、更有定制科学复习计划!点击进入:来学网

心之所往 

来而学之

更多热门考试资讯,点击进入:来学网

在线视频学习,海量题库选择,点击进入:来学网

 

来学网现已开通线上辅导课程,名师授课、专家答疑、更有定制科学复习计划!点击进入: 来学网

心之所往
来而学之

更多热门考试资讯,点击进入:来学网

在线视频学习,海量题库选择,点击进入:来学网

梅花香自苦寒来,学习是一个打磨自己的过程,希望小编整理的资料可以助你一臂之力。

点击进入>>>>来学网—未来因学而变

学习视频,在线题库、报考指南、成绩查询、行业热点等尽在来学网