欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 新闻 > 社会 > 《数据分析与可视化》(清华)ch5-实训代码

《数据分析与可视化》(清华)ch5-实训代码

2025/4/13 1:38:02 来源:https://blog.csdn.net/skhoole/article/details/147064263  浏览:    关键词:《数据分析与可视化》(清华)ch5-实训代码

小费数据集预处理——求思考题_有问必答-CSDN问答

以上代码在Jupyter Notebook中可以运行,但是在python中就会出如下问题:

这个错误表明在尝试计算均值填充缺失值时,数据中包含非数值类型的列(如文本列),导致无法计算均值。以下是完整的解决方案:

你的代码运行后没有输出是因为在Jupyter Notebook或交互式环境中,.head()方法默认会自动显示前5行数据,但在普通Python脚本中需要使用print()函数显式输出。以下是解决方案:

修正后的代码

# -*- coding: utf-8 -*-
"""
Created on Tue Apr  8 10:29:48 2025@author: 破无差
"""
import pandas as pd
import numpy as npfdata = pd.read_excel('tips_mod.xls')
print(fdata.head())print(fdata.shape)
print(fdata.describe())fdata.loc[fdata['聚餐时间段'] == 'Diner', '聚餐时间段'] = 'Dinner'
fdata.loc[fdata['聚餐时间段'] == 'Dier', '聚餐时间段'] = 'Dinner'
print(fdata['聚餐时间段'].unique())print(fdata.isnull().sum())fdata.dropna(thresh=6, inplace=True)
print(fdata.isnull().sum())fdata.dropna(subset=['性别', '聚餐时间段'], inplace=True)
print(fdata.isnull().sum())# 仅对数值列用均值填充
numeric_cols = fdata.select_dtypes(include=[np.number]).columns
fdata[numeric_cols] = fdata[numeric_cols].fillna(fdata[numeric_cols].mean())
# 对非数值列用众数填充
for col in fdata.select_dtypes(exclude=[np.number]).columns:mode_val = fdata[col].mode()[0]fdata[col] = fdata[col].fillna(mode_val)print(fdata.isnull().sum())

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词