主页 > 知识库 > pandas快速处理Excel,替换Nan,转字典的操作

pandas快速处理Excel,替换Nan,转字典的操作

热门标签:百度AI接口 客户服务 Win7旗舰版 电话运营中心 硅谷的囚徒呼叫中心 企业做大做强 语音系统 呼叫中心市场需求

pandas读取Excel

import pandas as pd
# 参数1:文件路径,参数2:sheet名
pf = pd.read_excel(path, sheet_name='sheet1')

删除指定列

# 通过列名删除指定列
pf.drop(['序号', '替代', '签名'], axis=1, inplace=True)

替换列名

# 旧列名 新列名对照
columns_map = {
    '列名1': 'newname_1',
    '列名2': 'newname_2',
    '列名3': 'newname_3',
    '列名4': 'newname_4',
    '列名5': 'newname_5',
    # 没有列名的情况
    'Unnamed: 10': 'newname_6',
}
new_fields = list(columns_map.values())
pf.rename(columns=columns_map, inplace=True)
pf = pf[new_fields]

替换 Nan

通常使用

pf.fillna('新值')

替换表格中的空值,(Nan)。

但是,你可能会发现 fillna() 会有不好使的时候,记得加上 inplace=True

# 加上 inplace=True 表示修改原对象
pf.fillna('新值', inplace=True)

官方对 inplace 的解释

inplace : boolean, default False

If True, fill in place. Note: this will modify any other views on this object, (e.g. a no-copy slice for a column in a DataFrame).

全列输出不隐藏

你可能会发现,输出表格的时候会出现隐藏中间列的情况,只输出首列和尾列,中间用 … 替代。

加上下面的这句话,再打印的话,就会全列打印。

pd.set_option('display.max_columns', None)
print(pf)

将Excel转换为字典

pf_dict = pf.to_dict(orient='records')

全部代码

import pandas as pd
pf = pd.read_excel(path, sheet_name='sheet1')
columns_map = {
    '列名1': 'newname_1',
    '列名2': 'newname_2',
    '列名3': 'newname_3',
    '列名4': 'newname_4',
    '列名5': 'newname_5',
    # 没有列名的情况
    'Unnamed: 10': 'newname_6',
}
new_fields = list(columns_map.values())
pf.drop(['序号', '替代', '签名'], axis=1, inplace=True)
pf.rename(columns=columns_map, inplace=True)
pf = pf[new_fields]
pf.fillna('Unknown', inplace=True)
# pd.set_option('display.max_columns', None)
# print(smt)
pf_dict = pf.to_dict(orient='records')

补充:python pandas replace 0替换成nan,bfill/ffill

0替换成nan

一般情况下,0 替换成nan会写成

df.replace(0, None, inplace=True)

然而替换不了,应该是这样的

df.replace(0, np.nan, inplace=True)

nan替换成前值后值

df.ffill(axis=0) # 用前一个值替换
df.bfill(axis=0) # 用后一个值替换

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。

您可能感兴趣的文章:
  • 教你使用Pandas直接核算Excel中的快递费用
  • Python入门之使用pandas分析excel数据
  • pandas读取excel时获取读取进度的实现
  • pandas读取excel,txt,csv,pkl文件等命令的操作
  • python pandas模糊匹配 读取Excel后 获取指定指标的操作
  • pandas针对excel处理的实现
  • 关于Python 解决Python3.9 pandas.read_excel(‘xxx.xlsx‘)报错的问题
  • 解决使用Pandas 读取超过65536行的Excel文件问题
  • 利用Python pandas对Excel进行合并的方法示例
  • Python pandas对excel的操作实现示例
  • pandas to_excel 添加颜色操作
  • 解决python pandas读取excel中多个不同sheet表格存在的问题
  • Python pandas如何向excel添加数据
  • pandas中的ExcelWriter和ExcelFile的实现方法
  • pandas实现excel中的数据透视表和Vlookup函数功能代码
  • Python使用Pandas读写Excel实例解析
  • pandas将多个dataframe以多个sheet的形式保存到一个excel文件中
  • 利用python Pandas实现批量拆分Excel与合并Excel

标签:山西 长沙 山西 崇左 海南 济南 安康 喀什

巨人网络通讯声明:本文标题《pandas快速处理Excel,替换Nan,转字典的操作》,本文关键词  ;如发现本文内容存在版权问题,烦请提供相关信息告之我们,我们将及时沟通与处理。本站内容系统采集于网络,涉及言论、版权与本站无关。
  • 相关文章
  • 收缩
    • 微信客服
    • 微信二维码
    • 电话咨询

    • 400-1100-266