教育建筑中热感觉投票的预测:基于PMV映射与机器学习方法的全面对比评估

《Energy and AI》:Predicting Thermal Sensation Vote in an Educational Building: A comparative assessment of PMV-based mapping and machine learning approaches

【字体: 时间:2026年06月06日 来源:Energy and AI 9.6

编辑推荐:

  确保热舒适的室内环境是保障 occupant 健康、生产力及整体福祉的基本前提。然而,尽管建模技术不断进步,利用实验收集的真实教室数据进行热舒适性预测的研究仍然探索不足,亟需进一步深入研究。该研究针对寒冷季节空调教育建筑中的热感觉投票(Thermal Sens

  
确保热舒适的室内环境是保障 occupant 健康、生产力及整体福祉的基本前提。然而,尽管建模技术不断进步,利用实验收集的真实教室数据进行热舒适性预测的研究仍然探索不足,亟需进一步深入研究。该研究针对寒冷季节空调教育建筑中的热感觉投票(Thermal Sensation Vote, TSV)预测,对比分析两种方法:第一种方法采用Fanger模型计算预测平均投票(Predicted Mean Vote, PMV),并基于离散化标准将PMV映射至TSV类别;第二种方法采用四种集成机器学习分类器,包括随机森林(Random Forest, RF)、梯度提升机(Gradient Boosting Machine, GBM)、极端梯度提升(Extreme Gradient Boosting, XGBoost)和轻量梯度提升机(Light Gradient Boosting Machine, LightGBM),基于 occupant 采集数据进行训练。模型训练前应用了结合Spearman秩相关与递归特征消除(Recursive Feature Elimination, RFE)的两阶段特征选择框架,并采用贝叶斯优化对各分类器超参数进行调优。PMV方法总体准确率为27.9%,而经贝叶斯优化调优后的最优机器学习模型准确率达82.17%,较PMV基准提升逾54个百分点。结果表明,四种优化后的机器学习模型在TSV预测中均优于基于PMV的估算方法。
该研究聚焦于教育建筑室内热舒适预测这一重要议题,相关成果发表于《Energy and AI》期刊。研究背景方面,北美地区人群约90%时间处于建筑室内环境中,而供暖通风与空调(Heating, Ventilation, and Air Conditioning, HVAC)系统与照明合计约占美国一次能源消费的41%。尽管能源消耗巨大, occupant 满意度却普遍偏低,"同时感觉太热和太冷"成为常见投诉。热舒适性评估主要依赖两类方法:基于物理的传统方法(如PMV模型和适应性热舒适模型)与数据驱动技术。PMV模型基于Fanger热平衡理论,通过空气温度(Ta)、平均辐射温度(Tr)、相对湿度(Relative Humidity, RH)、空气流速(V)、代谢率(met)和服装热阻(clo)六个参数计算连续舒适指数;适应性模型则通过线性回归关联室内外温度与 occupant 感觉,但存在过度简化问题。两类传统方法均存在局限:PMV模型即使环境参数准确测量,因服装热阻和代谢率等个人因素难以精确估计,预测误差仍显著;适应性模型主要经自然通风建筑验证,应用范围受限,且忽略湿度、空气质量等因素。尤为关键的是,PMV预测结果与 occupant 实际感知存在显著偏差,Cheung等的研究显示其映射准确率仅34%。近年来,机器学习(Machine Learning, ML)因处理复杂非线性问题的能力受到关注,包括支持向量机(Support Vector Machine, SVM)、RF、神经网络(Neural Network, NN)、XGBoost、LightGBM、K近邻(K-Nearest Neighbors, KNN)和决策树(Decision Tree, DT)等算法已展现可靠预测性能。现有研究多聚焦PMV预测,使用办公环境数据或大型基准数据集(如ASHRAE RP-884数据库),针对真实教育建筑中基于TSV的直接预测及与PMV的对比研究尚属空白。

为填补上述研究空白,研究人员开展了此项为期四个月的实地研究。研究在美国印第安纳州印第安纳波利斯某教育建筑的教室中进行,该建筑位于寒冷气候区,目标教室面积250平方米,层高约7米,配有变风量(Variable Air Volume, VAV)集中空气处理机组(Air-Handling Unit, AHU),occupied时段(06:00–21:00)满负荷运行,非occupied时段约70%流量,最小新风量425 cfm,occupied区域温度控制在20–24°C。研究期间收集800份独立TSV问卷,配以同步环境测量和个人因素数据,较此前研究(如Li等的34名参与者短期监测)具有更广泛的 inter-occupant 覆盖度。

技术方法层面,研究采用四阶段框架:数据采集与预处理、PMV-TSV映射(Approach 1)、机器学习预测(Approach 2)及对比分析。环境参数采用经NIST校准的Triplett HSDL300便携式数据记录仪测量空气温度、湿度和黑球温度,Testo 405i热丝风速仪测量空气流速,传感器置于距地约0.7米桌面高度。问卷基于ASHRAE 55-2023标准设计,包含参与者信息(年龄、性别、服装描述)和热感觉评价(七级TSV量表:?3"冷"至+3"热",0为中性)。实际回收数据中, occupant 响应集中于?2(凉)、?1(稍凉)、0(中性)、+1(稍暖)四个类别,故后续模型仅针对这四类进行分析。代谢率按1.1–1.3 met均匀分布设定,服装热阻依据问卷按ASHRAE标准55计算。

Approach 1中,PMV通过Fanger方程计算后,采用Cheung等等提出的离散化标准映射至TSV类别:冷(PMV < ?2.5)、凉(?2.5 ≤ PMV < ?1.5)、稍凉(?1.5 ≤ PMV < ?0.5)、中性(?0.5 ≤ PMV ≤ 0.5)、稍暖(0.5 < PMV ≤ 1.5)、暖(1.5 < PMV ≤ 2.5)、热(PMV > 2.5)。

Approach 2的机器学习流程包含:两阶段特征选择(Spearman秩相关筛选+RFE量化贡献)、四种集成分类器(RF、GBM、XGBoost、LightGBM)训练、贝叶斯超参数优化。采用分层10折交叉验证处理类别不平衡,加权F1-score为优化目标,训练集占80%,测试集20%完全独立。优化设置5次随机探索+15次引导迭代(共20次函数评估)。评价指标包括准确率、精确率、召回率和F1-score,均采用加权平均。

研究结果部分:

**数据集特征与类别分布**
800份有效数据中,TSV分布为:?2(凉)97票(12.1%)、?1(稍凉)227票(28.4%)、0(中性)363票(45.3%)、+1(稍暖)113票(14.3%)。环境参数方面,空气温度20.3–23.2°C(中位数21.1°C),平均辐射温度21.1–24.1°C(中位22.5°C),空气流速0.00–0.17 m/s(中位0.03 m/s),相对湿度15.2%–56.9%(中位20.9%);个人参数中,代谢率1.1–1.3 met,服装热阻0.57–1.58 clo(中位1.0 clo),年龄19–26岁(中位22岁),女性55%(440人)、男性45%(360人)。

**PMV-based TSV估算(Approach 1)**
PMV计算值主要分布在?1.0至+1.5区间,呈偏暖趋势。与实际TSV对比显示,PMV离散化额外产生?3(冷)和+2(暖)两个无实际对应票的类别(分别占1.5%和10.1%),表明标准PMV模型高估了该教育建筑的热感觉范围。整体准确率仅27.9%,精确率0.353、召回率0.279、F1-score 0.298。类别层面,?2类召回率9.3%、?1类20.7%、0类33.3%、+1类40.7%为最高。混淆矩阵显示显著误判:33.0%实际?2票和36.6%实际?1票被错划为中性,35.8%实际中性票被错划为稍暖。

**特征选择**
Spearman分析显示六参数均在0.01水平显著相关:平均辐射温度(r = +0.343)和空气温度(r = +0.341)最强正相关,相对湿度(r = +0.165)和空气流速(r = +0.114)中等正相关,代谢率弱正相关(r = +0.096),服装热阻唯一负相关(r = ?0.213)。尽管空气温度与平均辐射温度高度相关(r = 0.94),因代表不同传热机制且RFE显示剔除任一均降低准确率,故均保留。RFE逐步添加特征显示:单空气温度准确率55.76%,加平均辐射温度升至65.49%,继续添加服装热阻、代谢率、空气流速和相对湿度,最终六特征准确率67.24%,各参数均有增量贡献。

**机器学习TSV预测与超参数调优**
未调优时,RF准确率80.36%、F1-score 0.803为最优,LightGBM 72.35%、XGBoost 71.06%、GBM 67.44%。贝叶斯优化后,RF提升至82.17%(+1.81%),XGBoost至76.23%(+5.17%),LightGBM至74.94%(+2.59%),GBM至77.26%(+9.82%),GBM提升幅度最大。优化后RF仍为最优(82.17%,F1-score 0.821),其后GBM、XGBoost、LightGBM。平衡准确率和宏F1方面,RF(0.744,0.756)最优。混淆矩阵对角线显示优化后各类别正确率提升,尤以GBM的+1类误判中性率从59%降至28.2%为著。类别?2因样本量小(测试集约19样本),表现仍相对较弱,但RF仍达62.50%准确率,较PMV的9.3%大幅提升。

**对比分析:PMV估算 vs. 机器学习预测**
两种方法的本质差异在于:PMV为基于Fanger热平衡理论的物理机理模型,面向 steady-state 条件下的群体级热环境设计指数;ML为数据驱动分类器,直接从 occupant TSV标签学习环境与个体感知的复杂非线性关系。性能对比显示,RF(82.17%)较PMV(27.9%)绝对提升54.27个百分点。分类别看,?2类:PMV 9.3% vs. RF 62.50%(+53.2%);?1类:PMV 27.9% vs. RF 87.69%;0类:PMV存在暖偏误,35.8%中性误判为稍暖,而RF达84.41%;+1类:PMV 40.7% vs. RF/GBM 69.23%、LightGBM 71.79%。所有ML模型在所有类别均显著优于PMV,尤其对偏凉类别的预测改善显著,表明ML通过直接学习 occupant 数据有效克服了PMV的暖偏误。

讨论与结论部分,研究人员指出研究的局限性:空间与运行泛化性方面,数据仅来自单一教室的单一HVAC系统,未来需多房间、多建筑类型验证;人口与季节范围方面,数据限于冬季19–26岁学生群体,未来需覆盖多季节、多年龄段及不同建筑类型。实际部署层面,建议未来构建涵盖多季节、多年龄段、多建筑和HVAC配置的全面数据集,以训练更鲁棒、可泛化的模型,进而集成至HVAC控制系统,支持教育建筑实时能耗优化与 occupant 热舒适管理。

研究结论如下:PMV模型总体准确率27.9%、F1-score 0.298,+1类召回率最高(40.7%),?2类最低(9.3%),存在持续暖偏误,中性与稍凉类别间误判显著。特征选择表明六参数均有助于提升预测,空气温度和平均辐射温度相关性最强,RFE验证各参数独立贡献。ML预测中,RF未调优即达80.36%,贝叶斯优化后提升至82.17%,GBM提升幅度最大(+9.82%)。所有优化ML模型在所有评价指标和TSV类别上均显著优于PMV基准,对偏凉类别提升尤为显著,ML通过数据学习克服了PMV的暖偏误。该研究证实,在真实教育建筑环境中,基于集成学习的直接TSV预测方法较传统PMV映射具有实质性优势,为数据驱动的室内热舒适预测提供了实证支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号