学 科 美 育 · A I 美 育 · 美 育 评 价

为成都学校美育,建立可诊断、可改进的
评价体系与 AI 赋能底座

清华青岛艺术与科学创新研究院美育实验中心,依托清华大学美术学院"艺术与科学交叉融合"学术传统, 以"三维一体"评价模型为核心,面向成都开展音乐、美术双学科的学校美育评价研究; 并以 AI 知识工程为底座,赋能区域教研与教师日常,推动新时代学校美育的高质量发展。

合 作 层 级
市级统筹 · 区校落地
覆 盖 学 科
音乐 + 美术
研 究 层 级
校级 + 班级
A I 赋 能
知识工程底座
P R E F A C E

研究缘起

"注重评价的诊断、激励和发展功能,促进学生的全面发展与个性发展。"
——《义务教育艺术课程标准(2022年版)》

新时代的学校美育,正在经历从"结果性打分""诊断性评价"的深刻转型。2022 年版艺术课程标准明确了"审美感知、艺术表现、创意实践、文化理解"四项核心素养,并要求评价回归"诊断、激励和发展"的教育本质。

然而长期以来,学校艺术教育的评价仍多停留于"一次考试、一张分数表"。数据被采集却难以解读,结果被报告却难以转化为教学改进的方向;学校与教师对"本校美育生态究竟怎么样""班级之间差异在哪里"等基础性问题缺乏可靠依据。

本中心以"美育评价"为长期研究方向,开展学校美育评价的理论研究与一线实证积累。面向成都的合作,我们提供从学科素养标准、测评实施到诊断研究、AI 赋能的系统支持——面向学校与班级层面开展诊断性研究,不涉及学生个体画像,将研究成果以可解读、可行动的方式反馈给学校教育共同体。

E V A L U A T I O N M O D E L

三维一体评价模型

单一测试无法完整刻画美育发展。本研究采用三种数据源相互印证,从"知识掌握""日常表现""学习态度"三个维度,构建完整的学校美育图景

D I M E N S I O N I

素养测评 T E S T

面向核心素养设计的纸笔测试与表现性任务,按三级标签体系严格标注,每一道题对应明确的素养维度与能力层级。

测量 · 知识掌握与能力水平
D I M E N S I O N II

过程记录 M A N U A L

嵌入日常教学的表现性任务,由教师按统一量规持续记录学生的真实学习表现,作为测评数据的行为学验证依据。

采集 · 日常学习真实表现
D I M E N S I O N III

学习调查 S U R V E Y

面向学生的自评问卷,涵盖学习态度、艺术兴趣、自我效能等非认知维度,为素养数据提供情感与动机层面的解读。

了解 · 态度、兴趣与动机
三个维度不是简单累加,而是相互印证、交叉验证。测评数据显示"学生能做什么",过程记录显示"学生日常做了什么",学习调查显示"学生愿意做什么"。当三者方向一致,结论可靠;当三者出现张力,则揭示出值得深入研究的教学议题。
D I S C I P L I N E - B A S E D S T A N D A R D

学科素养标准共建

把课标核心素养,翻译为可教、可测、可递进的学科素养标准;音乐、美术双学科统一范式,口径一致、可横向比较(以音乐学科示意)

感知 · 鉴赏
核心素养 · 审美感知

从听得进、辨得清,到析得明、评得当——逐级递进的感知与鉴赏能力。

表现 · 表达
核心素养 · 艺术表现

从准确流畅,到富有表现力与个性韵味——逐级递进的表现与表达能力。

创意 · 文化
核心素养 · 创意实践 + 文化理解

从兴趣识读,到创造表达与文化贯通——逐级递进的创意与文化理解能力。

每一项能力要素,在各年级之间螺旋递进——同一概念(如"节奏")从低年级的感知体验,逐级走向高年级的分析与创编。标准矩阵让课标真正落到每节课、每个年级的具体目标,并与三级标签体系(L1—L2—L3)严格对齐。
互 动 演 示 · K N O W L E D G E G R A P H

学科知识图谱(以音乐学科示意)

点击查看从课标到教材的螺旋知识图谱——同一知识点如何在各年级逐级递进
A C A D E M I C F R A M E W O R K

三级标签体系

严格对齐 2022 年版艺术课标,构建从核心素养到具体行为表现的可测量框架

L1 · 核心素养(4 项)

L2 · 关键能力(共 12 个维度)

L3 · 行为表现 KUD(每个能力下设 3 级递进指标)
L1 四项核心素养——审美感知 · 艺术表现 · 创意实践 · 文化理解
每一道测评题目、每一项表现任务、每一道问卷题,均在 L1—L2—L3 三级标签下严格归类,
确保每一分数据都可以追溯到具体的素养维度与能力层级。
D I A G N O S T I C I N D I C E S

三大核心诊断指数

从"一堆原始分数"到"可解读的教育诊断",研究输出三个学校层面的生态指数,而非学生个人标签

诊断目标 · 学校整体生态

艺术素养均衡度指数

判断学校在四项核心素养上的发展结构是否均衡,是"橄榄型"发展还是"金字塔型",为学校美育整体规划提供依据。

诊断目标 · 教-学-评协同

多维评价协同指数

衡量素养测评、过程记录、学习调查三维数据的一致性程度,诊断学校"教—学—评"机制是闭环有效,还是脱节离散。

诊断目标 · 素养与技能协调

素养-技能融合度指数

衡量学生核心素养发展与具体技能习得之间的协调程度,识别"知行合一""技能超载"或"素养悬浮"等不同教学生态。

S C O P E

研究层级:面向学校与班级

本合作面向学校整体班级教学两个层级开展诊断性研究。
基于教育评价的伦理考量与研究定位,不涉及学生个体画像或标签化分析, 不对学生进行类型分类、能力等级判定或个体行为预测,全部产出聚焦群体层面的结构性诊断。

L E V E L I

校级研究成果

研究对象:学校整体(含年级间横向对比)
  • 本校四项核心素养的整体发展结构
  • 核心素养的校均表现与分布
  • 三大诊断指数的校级结果
  • 不同年级之间的发展差异与趋势
  • 面向学校管理层的教学改进建议
校级研究回答"本校美育整体生态如何、与理想结构相比差距在哪里",是区域美育研究与年度质量报告的基础依据。
L E V E L II

班级研究成果

研究对象:班级(一班一份研究报告)
  • 本班在四项核心素养上的能力结构
  • 本班相对于年级平均的相对定位
  • 本班的优势维度与待提升维度
  • 本班学习态度、兴趣、自我效能等非认知指标
  • 面向任课教师的教学改进建议
班级研究回答"本班整体特征、相对定位、下一步教学方向",是任课教师教学反思与教研组共研的抓手。本层级不包含学生个体数据。
R E P O R T S A M P L E

班级研究报告形态示意

班级层面研究报告的结构与呈现方式,聚焦班级整体特征与教学改进建议,不呈现任何学生个体信息

X 年级 X 班 艺术素养班级研究报告

S A M P L E · 示 意
一、班级能力总览(班均核心素养)
审美感知
0.72
艺术表现
0.58
创意实践
0.45
文化理解
0.66

与年级平均相比,本班审美感知高于年级均值,创意实践低于年级均值。

二、班级结构分布

优势发展层 25% · 稳健成长层 48% · 基础培育层 27%;呈稳健型分布,基础培育层占比略高于年级平均。

三、学习态度与兴趣结构

学习兴趣 4.1 / 5(年级均值 3.8)——兴趣度高;自我效能 3.2 / 5(年级均值 3.5)——信心待提升。本班学生有兴趣但信心不足,建议通过更多成功体验引导。

四、面向任课教师的教学建议

增加开放性创作任务、设计"从欣赏到创作"的桥梁活动、利用高兴趣度引入项目式学习。(教学法的具体设计交由学校教研组与一线教师)

以上为班级研究报告的形态示意,不包含任何学生个体信息。班级报告面向任课教师与学校教研使用,用于支持班级层面的教学反思与改进。
A I - E M P O W E R E D K N O W L E D G E E N G I N E E R I N G

AI 知识工程底座与智能体

把测评数据与学科标准沉淀为知识库,让成都拥有"自己的美育 AI 底座"——脏活在上游做扎实,AI 才能可解释、可信赖

S T E P I

标准与数据结构化

将学科素养标准、三级标签与测评数据深度梳理,形成规范化的本体与语料。

S T E P II

知识库与开放接口

构建本体映射的知识库,开放标准接口,作为区域美育的数字资产沉淀在本地。

S T E P III

本地智能体搭建

培训本地团队基于低代码平台调用接口,搭建面向自身场景的专属智能体。

测评侧应用

测评分析报告辅助生成、区域数据智能问答——让海量诊断结论可对话、可追溯。

教研侧应用

智能备课与教研助手:跨年级知识递进诊断、教学重点建议,支撑教研从经验走向有据可依。

每款智能体均包含:系统提示词工程 · 知识库语料整理 · 工作流编排 · 教师试用版与教研员校准版双版本 · 操作手册。智能体是中心持续优化与开放共享的研究成果,不是面向单一项目的一次性产物。
P A T H W A Y

实施路径:市级统筹 · 区校落地

分阶段推进,与学年节奏和预算周期对齐;单个研究周期通常为 5—6 周

阶段 0标准共建

学科素养标准框架共建

市教委与教科院共同确定学科范围与命名,会签审定音乐、美术双学科素养标准框架。

阶段 I双学科试点

命题指导与试点施测

抽样设计、命题培训与审核、轻量信息采集;现场组织与实施由本地承接。

阶段 II诊断报告

数据处理与研究报告

中心完成三维数据处理与三大诊断指数计算,形成校级与班级研究报告及区域诊断。

阶段 III常态化

常态化复评与 AI 底座

年度复评、知识工程底座上线、本地智能体培训,形成长效运行机制。

T E A C H E R P A R T I C I P A T I O N

教师是研究共同体的核心

一线实施依赖学校教师作为研究共同体的实质性参与;中心全程提供标准化的学术支持

中心全程提供:命题模板 · 标签对照表 · 评分量规 · 数据录入模板 · 标签审核反馈 · 命题培训与过程答疑。教师无需独立设计评价工具,而是在标准化学术框架内,完成本校本班的适配性命题与数据采集——参与培训、按框架命题、组织测试、按量规阅卷、录入数据。
A C A D E M I C F O U N D A T I O N

学术基础与实证积累

本合作建立在长期的理论研究与一线实证积累基础之上

理论基础

测评框架严格对齐《义务教育艺术课程标准(2022年版)》四项核心素养,参照构念地图理论与证据中心设计等评价研究框架,经本中心理论组论证形成。

研究方法

采用三维一体混合方法设计:定量以纸笔测评、问卷、课堂表现评分为主,过程以表现性任务记录为主,态度以学生自评问卷为主,三维数据通过结构化标签统一归类、交叉分析。

伦理原则

严格遵循教育研究伦理:仅在学校与班级层面出具研究报告,不对学生进行个体画像、标签分类或能力等级判定;个人数据按规范处理;参与方有充分的知情权与退出权。

一线实证积累

累计测评校次
297 校次
校次学段分布
小 155 · 初 70 · 高 51
累计覆盖班级
2,345 个
累计参与学生
约 28.7 万 人次
C O L L A B O R A T I O N

合作内容

四个方向可整体推进、形成"标准—测评—诊断—赋能"闭环,也可按需选用;具体合作方式与安排另行商定

D I R E C T I O N I

学科素养标准共建

课标解读、学科素养标准与学业质量标准、教材结构化与课标-教材映射、螺旋知识图谱,确立成都自主的学科素养标准。

研究与实践内容:素养标准 · 质量标准 · 教材映射 · 知识图谱

D I R E C T I O N II

测评实施指导

命题框架与样题、抽样设计、教师命题培训、审题与质量校验、轻量信息采集方案;现场施测由本地组织实施。

研究与实践内容:命题指导 · 抽样设计 · 教师培训 · 采集方案

D I R E C T I O N III

数据诊断与研究报告

三维一体建模、三大诊断指数、校级与班级研究报告及区域美育发展年度研究报告,由中心全流程完成。

研究与实践内容:评价建模 · 诊断指数 · 校级报告 · 区域报告

D I R E C T I O N IV

AI 知识工程底座与师资培训

建知识库、开放接口,培训本地搭建专属智能体;配套教师与教研员的 AI 美育能力培训,数据资产沉淀本地。

研究与实践内容:知识库 · 智能体 · 师资培训 · 平台支持

共建邀请

本合作面向成都市教育行政部门、教科研机构与中小学校开放共建。
我们期待在共同的学术追求与教育使命下,与各方建立长期、稳定的研究协作关系,
以扎实的实证研究与 AI 赋能,推动成都学校美育从"软指标"走向可诊断、可改进。