型的参数设置上,还有点拿不准。”
她指着屏幕上的参数界面。
“比如平滑度参数,我们试了几个值,拟合效果差异挺大的,想请教您该怎么判断最优值?”
苏沐晴跟着补充。
“还有交叉验证的折数,我们用3折和5折分别试了,结果有点偏差,不知道该以哪个为准?”
李教授俯身仔细看着屏幕,耐心讲解。
“平滑度参数可以结合赤池信息准则来判断,准则值越小,模型拟合效果越好;交叉验证折数的话,样本量较大时用5折更稳健,能减少随机误差的影响。”
他拿起笔,在草稿纸上写下计算公式。
“你们可以用这个公式计算最优参数,再结合实际数据分布调整。”
他顿了顿,继续说道。
“另外,建模后别忘了做残差分析,残差正态分布且无明显趋势,才说明模型拟合得好。”
他打开自己的电脑,调出残差分析的案例图
“你们看,像这样的残差图,就说明模型是可靠的。”
几人听得格外认真,飞快地记录要点,时不时点头回应。
叶冰瑶一边记,一边对照着屏幕上的数据操作。
按照李教授说的方法调整参数,屏幕上的拟合曲线渐渐变得平滑。
误差值也明显下降,她忍不住眼睛一亮。
“教授,您看!这样是不是就对了?”
李教授凑过去看了一眼,赞许地点点头。
“没错,就是这样!你们领悟得很快。”
他又针对其他几个疑问逐一解答,从模型诊断到结果解读,条理清晰、深入浅出。
不知不觉间,一上午的时间悄然流逝。
临走时,李教授看着她们满满的笔记,笑着说。
“数据处理这块基本没问题了,后续写论文时,注意把建模逻辑和结果分析说清楚,有问题随时来找我。”
“太谢谢李教授了!您真是帮了我们大忙!”几人再次道谢,脸上满是如释重负的笑容。”