欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 新闻 > 资讯 > 2025数学建模美赛|C题成品论文|第一问

2025数学建模美赛|C题成品论文|第一问

2025/2/1 21:36:45 来源:https://blog.csdn.net/kstt20230206/article/details/145343990  浏览:    关键词:2025数学建模美赛|C题成品论文|第一问

1.模型建立与求解

1.1问题求解思路

为了准确预测奥运会奖牌分布情况,尤其是金牌数和奖牌总数,本研究采用以下步骤:

(1)数据处理与特征工程

从提供的奥运会奖牌历史数据中提取核心信息。

补充外部特征,如国家人口(population)和 GDP(gdp),以增强模型的解释能力。

生成滞后特征(如上一届金牌数 Gold1ag和奖牌总数Total1ag),捕捉时间维度的历史表现。

(2)模型选择与优化

采用随机森林回归模型(Random Forest Regressor),处理输入特征的非线性关系和复杂交互。

利用网格搜索(GridSearchCV)优化模型超参数(如树的数量和最大深度)。

(3)结果评估与分析

1.2 模型求解与分析

(1) 模型求解

数据集划分为训练集(80%)和测试集(20%)。使用优化后的随机森林模型进行训练和预测。

图1 模型输出结果

图2 残差分析

从残差分布图可见,预测误差呈正态分布,且大部分残差集中在[−10,10] 区间内,表明模型预测稳定,未出现显著偏差。

(5) 可视化分析

图3 实际值 vs 预测值散点图

大部分点接近理想的对角线,表明预测值和实际值吻合度较高。

图4 特征重要性图

滞后特征( Gold1ag和Total1ag)的重要性显著高于其他特征。

1.3 求解思路

本问题的目标是预测尚未获得奖牌的国家在 2028 年洛杉矶奥运会上赢得首枚奖牌的可能性,并对预测结果进行概率估算。以下是具体的解决思路:

(1)数据预处理:将数据集中的国家分为已获奖国家(first_medal = 1)和未获奖国家(first_medal = 0)。使用合成少数类过采样技术(SMOTE)对未获奖国家的数据进行数据增强,以平衡类别分布。

1.3 模型求解与分析

(1)模型评估结果:

图5 模型评估结果

准确率(Accuracy):88.9%,表明模型对所有类别的预测能力较为稳定。

ROC AUC:94.8%,说明模型在区分是否获奖国家时有很高的区分能力。

(2)分类报告:

类别 0(未获奖国家)和类别 1(已获奖国家)的预测精度均为 89%,表明类别间的预测能力均衡。

(3)特征重要性分析:

图6 特征重要性分析

(4)ROC 曲线分析:

图7 ROC 曲线分析

模型的 ROC 曲线表明,正类(赢得首枚奖牌)的预测能力较强,AUC 达到 0.95。

1.4求解思路

(1)问题分析:

探讨比赛数量(Event_Count)与国家奖牌数的关系。分析哪些体育项目对不同国家最重要。研究主办国选择的比赛项目对奖牌分布的影响。

(2)建模思路:

结合比赛数量(Event_Count)和类型(不同体育项目)作为特征变量,构建奖牌数预测模型。应用随机森林与 XGBoost 模型,量化特征的重要性,分析主办国效应和体育项目的作用。对主办国效应,通过新增项目和奖牌总数变化进行统计分析。

(3)目标:

构建模型预测国家的奖牌总数。分析比赛数量、体育项目类型和主办国选择的项目对奖牌分布的影响。

1.1.1 1.4模型建立

(1)模型输入与输出:

输入特征:

比赛数量(Event_Count)。

主办国标识(is_host)。

历史奖牌数特征(Gold_lag、Total_lag)。

人口(population)与 GDP(gdp)。

输出目标:

国家奖牌总数(Total)。

1.4 模型求解与分析

(1)模型性能对比:

图8 求解结果

XGBoost 模型的特征重要性分析,表明历史金牌和奖牌总数对预测的关键作用。各模型实际值与预测值的对比散点图,显示 XGBoost 和随机森林模型在拟合能力上优于线性回归。

(2)特征重要性分析:

Gold_lag 的重要性最高,占 65.5%,历史金牌数是奖牌分布的核心预测因素。

Total_lag 占25.0%,历史奖牌总数对预测同样具有显著作用。

Event_Count 的重要性为4.4%,显示比赛数量对奖牌分布的影响有限。

is_host 的重要性几乎为零,表明主办国效应的直接贡献较小。

(3)主办国效应与比赛类型:

主办国在新增比赛项目中更容易获得奖牌。

不同国家核心体育项目:

中国:跳水、体操。

美国:游泳、田径。

日本:柔道、空手道。

主办国通过选择新增项目优化奖牌分布,但传统强项对奖牌总数更为关键。

(4)总结:

比赛数量对奖牌分布的影响较弱,但核心体育项目对国家奖牌表现的提升显著。

主办国效应主要体现在新增项目和传统强项中的奖牌分布,而非直接提升奖牌总数。

模型性能表明历史奖牌数据是奖牌分布预测的最主要依据,而主办国选择新增项目

的策略影响有限。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com