日期:2023-01-23 阅读量:0次 所属栏目:学前教育
一、引言
随着高等教育的发展,高校教学质量评估深入展开,教学质量越来越引起人们的重视,而关于大学教师教学评分的研究也越来越受到重视。然而,在实际中对教师的教学效果进行评估时会受到多方面因素的影响,一般认为最主要的因素是教师教学质量的好坏。但不可否认的是,还有一些因素也会影响到学生对教师教学质量的评估,如教师的个人特征、学科的差异、不同年级,以及师生间认知方式等。但是,关于这些因素的影响研究基本上是对教评体系进行定性的,简单的描述,而定量的实证研究结果较少。而且由于教评的复杂性,采用简单的定性方法,要做出令人信服、满意的评价似乎很困难,另一方面,简单的定量方法则可能更加脱离实际性。
总之,教评的合理性是教评体系中的重中之重,如何设计出一套科学的教评体系是高校教育工作者们所关心的问题。本文在前人的研究基础上,利用科学的定量模型,试图找出可能的影响因素,以期进一步分析影响学生教评的关键因素,最后根据实证结果进行分析并提供相应的意见与建议。
二、研究方法
1.贝叶斯推断与MCMC算法
由贝叶斯定理发展而来的统计理论被许多统计学家发展为一种全面的统计推断理论,称为贝叶斯理论。贝叶斯理论的核心观点是认为总体的参数服从某一个先验分布,它是在进行推断时一个必不可少的信息。贝叶斯推断的过程是利用样本的分布以及总体的先验分布,根据贝叶斯公式计算得到总体的后验分布,后验分布则被认为包含了样本信息以及先验信息。
但是,贝叶斯统计分析面临的最大挑战就是对后验信息的计算,因为后验信息的推断往往涉及到对多维积分的数值计算,如以下形式的积分:
其中f(x)是一个高维空间中的目标函数,而传统的方法是难以计算多维积分的,这一直限制着贝叶斯方法的发展。随着计算机科学的进步,其中马尔科夫蒙特卡洛算法(MCMC)的应用使得贝叶斯理论在过去的几十年得以迅速应用。
MCMC的基础理论为马尔科夫过程。在MCMC算法中,为了在某一个指定的分布上采样,根据马尔科夫原理,首先从任一状态出发,模拟马尔科夫过程,不断进行转移,最终收敛平稳分布。它的基本思路是,对于一个给定的概率分布P(X),若是要得到其样本,我们可以构造一个转移矩阵为 的马尔科夫链,使得该马尔科夫链的平稳分布为P(X)。现如今,MCMC已经是解决高维统计问题时必不可少的工具,它可以获得一条或许多条收敛的马尔科夫链,该马氏链的极限分布即为总体参数的后验分布。
2.贝叶斯分层回归模型
一般的线性混合效应模型假设模型里一部分系数具有随机效应,另外一部分具有固定效应,考虑到了观测值不一定来自于同一总体,但是却没有充分利用观测值的先验信息。贝叶斯分层线性回归模型即假设所有随机的系数服从某个分布(一般是正态分布),并且假设分布中的所有未知参数都服从某个先验分布,充分利用先验信息,由此建构更为合理的模型。
一般贝叶斯分层线性回归模型可以用如下公式表述:
其矩阵形式为:
其中y代表因变量,一共有i组水平,每组水平有ki个观测值。β0是固定效应截距, b0i是第i组水平的随机截距,并有p个解释变量具有固定效应,有q个解释变量具有随机效应, εi是每组水平测量误差(其不必服从独立同分布条件,即对ε没有Var(ε)=σ2及Cov(εi,εi)=0的假定)是一个ki维的向量。
在矩阵形式中,X为固定效应矩阵,是一个ki×p维的矩阵, Z为随机效应矩阵,是一个ki×p维矩阵。贝叶斯混合效应模型要求对所有参数都设置先验分布,其中
误差的方差σ2的先验分布为逆伽马分布,
假定系数的先验分布为多元正态分布,
随机效应系数的协方差矩阵Σ服从逆Wishart分布,即:
Σ~IWishart(r,R)
同时假定超参数的先验值为无信息量的先?。已知先验分布和条件概率函数,由贝叶斯公式,可以写出其后验分布的密度函数形式,由于篇幅限制,本文不这里进行推导。
三、实证与分析
1.数据说明
本文的数据选取于得克萨斯大学奥斯汀分校(University of Texas at Austin)在2000~2002年的一份针对教职人员教学质量评价影响因素的研究。数据总共包含了463个班级评分(观测值),分别描述了94个教师(即94个水平),每个教师所教授的班级数有所不同,变量的描述性统计见表1。数据可由R软件中AER安装包里的数据集: 获得。
2.模型建立
(1)经典线性回归模型
经典线性回归模型的一般形式为:
其中i=1,2...,94。εi相互独立同分布,E(εi)=0,且Var(εi)=σ2,则有εi~N(0,σ2)。以上假设保证了各观测值来自于同一总体,即自变量没有随机误差,它对因变量的作用效应是固定的。拟合简单线性模型,并用最小二乘法进行估计, 得到模型一的各系数估计如下表所示: Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘
分析上表,可以得出:①教学评分与教师外貌评分的统计关系最为显著,并且呈正相关,即外貌评分越高的教师更易获得更高的教学评分;②课程学分越低,教师获得的评分相对较高;③而女性教师,黑人教师,母语非英语的教师以及获得终身职称的教师的教学评分相对较低;④年龄差异,学生年级差异则对教评无显著影响。图1展示了beauty与eval的关系,直线为回归拟合曲线,可以直观的看出随着教师外貌评分的提高,教学评分也相应提高。
系数保留两位小数得到的回归模型如下:
其中i=1,2...,94。
(2)贝叶斯混合效应模型
与线性混合效应模型有所不同,贝叶斯分层回归模型假设教师的外貌评分变量B1服从正态分布,并且假设其参数服从某一先验分布。其先验分布形式已在前文陈述,并且先验分布的参数采用无信息先验,可由R语言安装包MCMCpack中函数dwish和rwish计算得出。将B1作为随机效应,将X1,X2,X3,X4,X5,X6,X7作为固定效应,教学评分Y作为因变量,得模型二的表达式如下:
其中i=1,2...,94分别对应94位教师,j=1,2...,nj分别对应于第 i个教师的第j次观测值,β0为固定效应截距,b1i为随机效应的系数, b0i为随机截距, εij为误差项。
根据上述数据,在R语言中利用安装包MCMCpack中MCMChregress函数对模型进行估计。由于贝叶分层线性回归模型对每个水平下的随机效应变量都进行估计,于是分别得到94个随机截距和变量B1的估计值和8个固定效应变量估计值,共计192个估计值,即估计出每个教师所在水平下对应的模型。
需要注意的是,在对于任何一个以MCMC为基础的贝叶斯模型的估计中,关于模型的收敛性的检验都是必不可少的。而一个MCMC模型达到收敛,是指模拟的结果来源于所构造的马尔科夫链的平稳分布或目标分布。下图反映了随着抽样迭代次数的增加截距项的平稳性以及密度函数状态。由图2可以直接看出,在进行抽样迭代200次之后,马氏链仍未收敛,而在抽样迭代1000次以后,则可以认为马氏链达到平稳收敛状态,并且截距项的密度函数近似服从正态分布。
可以得到模型二的表达式如下:
由于模型二得到的估计值太多,在这里便不再一一列出,我们分别计算随机截距和变量B1的94个估计值平均值来与模型一进行比较。其中: =0.01622,=0.20378。
下图显示的是模型二的预测评分与原始评分的拟合情况,可以看出预测评分与原始评分拟合效果较好。
(3)结果分析
下表显示了模型一,模型二的各参数对比情况:
由上表可以看出:模型二中的beauty系数远小于模型一。这是由于贝叶斯分层模型将所有教师分别看作94个水平,对于每一层建立模型。即认为同一层次下的观测值是相互联系的,所以对于每一位教师,其beauty系数相同。而不同层次之间的观测值是相互独立的,其间的差异性由随机截距中和,而beauty系数的减小则可以降低因教师外貌评分引起的误差。
总的来说,由比较结果可以看出,应用贝叶斯分层模型分别对变量B1及其随机截距进行估计,得到的模型二较优。可认为贝叶斯方法综合了先验数据和实际教师外貌评分,起到了减小误差的作用。
四、结论与建议
本文首先简述了贝叶斯统计分析、MCMC方法的基本思想,以及贝叶斯分层模型的性质和一般形式,随后分别建立两个模型进行理论研究及比较,最后进行实证。证明了贝叶斯分层线性回归方法比经典的线性回归更加适用于分层数据。本文的意义在于从理论和实证讨论了贝叶斯分层线性回归模型,对教学质量评价影响因素的分析有着重大意义。
通过以上的模型分析与研究,可以得出以下结论:
(1)教师外貌评分对教评有显著影响,即教师外貌会影响到学生的主观评分倾向,从而影响教评结果。
(2)课程学分越低,学生对教师的教学评分越高。即课程越重要,学生在给教师评分时会降低教评分数。
(3)总的看来,教师的籍贯会对学生教评产生较大影响。其中母语为英语的教师更加受到学生的喜爱,评分较高。
(4)值得注意的是,黑人教师的相对评分较低。由此可以看出学生对于黑人教师的评分可能存在肤色歧视。
(5)教师的年龄和学生的年级高低对于教评无较大影响。
针对以上结论,本文给出以下建议:
(1)不可否认,教评是一种带有感情化的评分,学生在教评过程中,难免会受到心理,感情上的主观因素影响,导致对教师授课质量的评估出现误差。例如教师的外貌越好看就越容易受到学生的喜爱,而黑人教师可能受到学生的歧视等。为减少学生主观因素造成的误差,建议在教评工作前对学生进行培训,讲明评估的意义和重要性,让学生能真实地反映实际情况。
(2)培养学生的学习兴趣。学生倾向于对学分较高的课程打较低的分数,这可能是由于课程的难易程度,考试成绩等因素影响的。而如果学生对所学的课程感兴趣,那么其相应的学习态度和学习动力都会对教评产生影响。
(3)选择有效的评估工具,进行科学的结果分析。有效合理的教评系统是能否真实检测教学质量的关键,开发或选择合适的评估工具对提高整个评估系统的精确性具有重要意义。科学的结果分析避免了结论的主观性,使得教评结果更加具有说服力。
本文链接:http://www.qk112.com/lwfw/jiaoyulunwen/xueqianjiaoyu/216778.html