欢迎光临112期刊网!
网站首页 > 论文范文 > 计算机论文 > 信息安全 > 基于层次分析法的自动组卷评价模型的构建预防

基于层次分析法的自动组卷评价模型的构建预防

日期:2023-01-24 阅读量:0 所属栏目:信息安全


 在教育领域中,考试是整个教学过程中的重要环节,它是对学生所学知识和能力的一种评价,也是衡量教师教学效果优劣的一种教育测量手段。随着计算机科学的迅速发展和广泛应用,计算机技术己进入现代教育领域并形成一门新兴的边缘科学――计算机辅助教学。目前,计算机在自动组卷方面的应用已经十分广泛了,很多高校已经建立了庞大的试题库,并且采用各种数学算法利用计算机完成自动生成试卷和计算机的阅卷工作,不仅能节省教师的宝贵时间,提高工作效率,而且能消除出卷人主观意志的影响,尤其是对于客观题更加方便。但是,自动组成的试卷是否能真实地反映出教师的教学水平以及学生对知识技能的掌握程度,需要我们对试卷质量进行质量评价。
  由于在前期的自动组卷过程中,题库中的信息是预先设定的,并不一定能够客观地描述该题的属性,而且对于不同的考核对象,该题目的属性值会不一样,这些都要通过计算机自动阅卷,统计之后通过相应的模型和算法来评估。这一评估可以反映计算机自动组卷算法的优劣,也可以为下一次自动组卷提供借鉴。因此,可以在自动组卷的基础之上增加一个统计分析模型,让计算机自动地对结果进行分析,同时对考试的结果做出合理的修正。
  1 模型建立
  测量试卷的主要检验指标是:难度、信度、区分度和覆盖度。假设我们考察M份试卷的考试结果(假设这M份试卷的结果符合或近似符合正态分布),自动生成的试卷由n道题目组成,每道题目的总分为[Ai],样本值为[Xj],各题的实际得分为[Xij(i=1,2,3…n,j=1,2,3…M)]。很容易得出试卷的如下信息:
  [Xj=i=1nXij第i道题的平均得分Xi=1Mj=1nXij]
  [第i道题的方差Si=1Mj=1n(Xij-Xi)2]
  1.1 试卷的难度系数
  题目的难度是衡量题目难易水平的数量指标,通常以题目的答错比率Pj 来表示:
  [Pi=1-XiAi]
  于是,整套试卷的难度系数为:
  [P=1Ni=1nAiPi]
  [其中,N=i=1nAi,表示整套试卷的总分。]
  1.2 试卷的区分度
  题目的区分度也叫题目的鉴别力,它是衡量题目对不同水平被测试者的心理特质的区分程度的指标。区分度的取值范围于0-1之间,值越大,区分的效果越佳。一般0.4-0.6 为佳。
  我们定义区分度为该题目的高分组平均得分与低分组平均得分之差在该题目满分中的比例,由于我们只考虑组卷中的客观题,故而对于第i道题目的区分度,
  [δi=1MNj=1nXij]
  从而,整套试卷的区分度
  [δ=1Ni=1nAiδi]
  1.3 试卷的可信度
  可信度指测量数据和结论的可靠性程度,它是表明考试质量的稳定性和可靠性的一个重要指标。信度一般规定是真分数的方差在总体方差S (M个学生总分的方差) 中所占的比例。测量信度系数的方法较多,这里采用[α]系数法[1](该公式由克朗巴赫提出)。
  [α=MM-1(1-S1+S2+…+SnS)]
  [其中,S表示总分的方差,Si表示第i道题目的方差。]
  评测标准:0.9以上:好;0.8-0.9:较好;0.6-0.8:一般;0.6 以下:较差。
  1.4 试题的相关性
  反映学生掌握知识广度的重要指标,也就是我们常说的试题应尽量多的反映该门课的知识点。一般用各题的相关系数矩阵表示:
  [R=(Rij)n×n]
  [其中,Rij表示第i道题目的得分与j得分的相关关系。]
  [Rij=Xij-XiXij-XjSiSj(i,j=1,2,3…n)]
  1.5 试卷的整体评价
  在上述的统计的基础之上,我们对试卷的难度系数、试卷的区分度、试卷的可信度、试题的相关性做了评价,但是对试卷的整体分析并不只是这些基本因素的简单代数之和,因为每个因素对整体的影响的比重是不一样的。为了客观公正地评价一套试卷,我们采用了一种很重要且十分常用的分析方法——层次分析法[3]。
  1.5.1 因素的评分
  前面对各个单因素的评价是基于统计与计算得出的结果,具有很好的直观比较性。但是对于数学模型分析却很不方便,在不影响对试卷评估结果的前提下,结合试卷评价自身的特点,我们对各个因素进行重新评分。
  表1 对试卷的难度系数的评分
  [试卷难度系数\&0-0.2\&0.2-0.4\&0.4-0.5\&0.5-0.6\&0.6-0.8\&0.8-0.9\&0.9-1\&评分(满分为1)\&0.15\&0.35\&0.5\&0.7\&0.85\&0.7\&0.4\&]
  表2 对试卷的区分度的评分
  [试卷区分度\&0-0.2\&0.2-0.4\&0.4-0.6\&0.6-0.8\&0.8-0.9\&0.9-1\&评分(满分为1)\&0.1\&0.45\&0.8\&0.85\&0.9\&0.95\&]
  表3 对试卷的可信度的评分
  [试卷可信度\&0-0.3\&0.3-0.5\&0.5-0.6\&0.6-0.8\&0.8-0.9\&0.9-1\&评分(满分为1)\&0.15\&0.5\&0.6\&0.7\&0.8\&0.9\&]
  对于试题的相关性的评分需要对相关性矩阵作分析,然后合理评分。不妨假设对上述四个因素的评分结果分别为[ω1,,ω2,ω3,ω4。分数向量为:]
  [ω=ω1,,ω2,ω3,ω4]
  [四个要素分别用A试卷的难度系数、B试卷的区分度、C试卷的可信度、][D(试题的相关性)表示,]而四个要素在整体中的比重的影响因子分别为3、5、9、2。于是我们考虑到比分矩阵为
  [J=33353932539355955999529223252922]
  利用迭代法[3]可以求出[J]的权向量为[α=0.1689,0.2765,0.4983,0.1246T]。
  则,试卷的整体评分为
  [ω?α=0.1689ω1,+0.2765ω2+0.4983ω3+0.1246ω4]
  2 结束语
  上述的对试卷的四个方面的评价,均是在对考试结果的统计的基础之上,对数据的相应计算,并建立模型来评价自动生成的试卷。能够在一定的程度上反映出自动组卷算法的优劣,同时,通过开发技术手段实现试题库中各试题的综合系数的自动更新,对今后的组卷过程的优化具有很强的指导意义。
  参考文献:
  [1] 曾一,冉忠,郭永林.试题库中自动组卷的算法及试卷测评策略[J].计算机工程与设计,2006,27(16):3024-3027.
  [2] 魏宗舒.概率论与数理统计教程[M].北京:高等教育出版社,2008.
  [3] 王树禾.数学模型选讲[M].北京:科学教育出版社,2008.

本文链接:http://www.qk112.com/lwfw/jsjlw/xinxianquan/225964.html

论文中心更多

发表指导
期刊知识
职称指导
论文百科
写作指导
论文指导
论文格式 论文题目 论文开题 参考文献 论文致谢 论文前言
教育论文
美术教育 小学教育 学前教育 高等教育 职业教育 体育教育 英语教育 数学教育 初等教育 音乐教育 幼儿园教育 中教教育 教育理论 教育管理 中等教育 教育教学 成人教育 艺术教育 影视教育 特殊教育 心理学教育 师范教育 语文教育 研究生论文 化学教育 图书馆论文 文教资料 其他教育
医学论文
医学护理 医学检验 药学论文 畜牧兽医 中医学 临床医学 外科学 内科学 生物制药 基础医学 预防卫生 肿瘤论文 儿科学论文 妇产科 遗传学 其他医学
经济论文
国际贸易 市场营销 财政金融 农业经济 工业经济 财务审计 产业经济 交通运输 房地产经济 微观经济学 政治经济学 宏观经济学 西方经济学 其他经济 发展战略论文 国际经济 行业经济 证券投资论文 保险经济论文
法学论文
民法 国际法 刑法 行政法 经济法 宪法 司法制度 法学理论 其他法学
计算机论文
计算机网络 软件技术 计算机应用 信息安全 信息管理 智能科技 应用电子技术 通讯论文
会计论文
预算会计 财务会计 成本会计 会计电算化 管理会计 国际会计 会计理论 会计控制 审计会计
文学论文
中国哲学 艺术理论 心理学 伦理学 新闻 美学 逻辑学 音乐舞蹈 喜剧表演 广告学 电视电影 哲学理论 世界哲学 文史论文 美术论文
管理论文
行政管理论文 工商管理论文 市场营销论文 企业管理论文 成本管理论文 人力资源论文 项目管理论文 旅游管理论文 电子商务管理论文 公共管理论文 质量管理论文 物流管理论文 经济管理论文 财务管理论文 管理学论文 秘书文秘 档案管理
社科论文
三农问题 环境保护 伦理道德 城镇建设 人口生育 资本主义 科技论文 社会论文 工程论文 环境科学