利用python进行数据加载-巨人网络通讯

主页 > 知识库 > 利用python进行数据加载

利用python进行数据加载

前言

最近参加了datawhale的组队学习活动，在组队学习动员下，开始通过强迫自己输出来实现更好的输入与处理，6-15开始自己的第一次文章发布，我会把自己这个真的很小白遇到的问题写出来，希望能给屏幕前小白的你带来帮助。

工作中大量繁琐的自动化，把以前在学校摸过的python重新捡起来，不成体系的、拼图一样把需要的工作搭建起来，工作暂时是可用上了，每天节省了至少3个小时的数据处理工作，手里拿着python这个锤子，看什么都像钉子。

首先，你要先学会安装软件，anaconda软件,安装成功后，你点击jupyter notebook打开代码框。

现在可以开始尝试做数据分析了。

一、数据加载

1.1 载入数据

数据集下载 https://www.kaggle.com/c/titanic/overview

1.1.1 导入包

导入numpy和pandas

import pandas as pd
import numpy as np

如果出错了，需要注意大小写、有没有单词写错了

1.1.2 载入数据

(1) 使用相对路径载入数据
(2) 使用绝对路径载入数据

df = pd.read_csv('train.csv')
df.head(3)

df = pd.read_csv('/Users/Documents/train.csv')
df.head(3)

注意绝对路径的 “ / ” 方向不要错。

1.1.3 大文件时要分块读取

每1000行为一个数据模块，逐块读取

chunker = pd.read_csv('train.csv', chunksize=1000)

1.1.4

对着整个表修改列名：将表头改成中文，索引改为乘客ID ，要注意的是，要记得把名字跟列一一对上，数量对上、顺序对上

PassengerId => 乘客ID
Survived => 是否幸存
Pclass => 乘客等级(1/2/3等舱位)
Name => 乘客姓名
Sex => 性别
Age => 年龄
SibSp => 堂兄弟/妹个数
Parch => 父母与小孩个数
Ticket => 船票信息
Fare => 票价
Cabin => 客舱
Embarked => 登船港口

df = pd.read_csv('train.csv', names=['乘客ID','是否幸存','仓位等级','姓名','性别','年龄','兄弟姐妹个数','父母子女个数','船票信息','票价','客舱','登船港口'],index_col='乘客ID',header=0)
df.head()

1.2 初步观察

导入数据后，我们可以对数据的整体结构和样例进行概览，比如说，数据大小、有多少列，各列都是什么格式的，是否包含null等。info 后面加（）跟不加（）会有不同的内容。

print(df.info())

如想在python的查看数据，可以用head

df.head(10)
df.tail(15)

判断数据是否为空，为空的地方返回True，其余地方返回False

df.isnull().head()

1.3 保存数据

在工作目录下保存为一个新文件train_chinese.csv，如不希望表格自带index，可以加入index=false

df.to_csv('train_chinese.csv',index=flase)

到此这篇关于利用python进行数据加载的文章就介绍到这了,更多相关python数据加载内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

Python加载数据的5种不同方式(收藏)
Python实现爬取网页中动态加载的数据
Python使用Selenium爬取淘宝异步加载的数据方法
python用pandas数据加载、存储与文件格式的实例

标签：洛阳安庆泉州长春吉林清远岳阳怒江

巨人网络通讯声明：本文标题《利用python进行数据加载》，本文关键词利用,python,进行,数据,加载,；如发现本文内容存在版权问题，烦请提供相关信息告之我们，我们将及时沟通与处理。本站内容系统采集于网络，涉及言论、版权与本站无关。

下面列出与本文章《利用python进行数据加载》相关的同类信息！

利用python进行数据加载

前言最近参加了datawhale的组队学习活动，在组队学习动员下，开始通过强迫自己输出来实现更好的输入与处理，6-15开始自己的第一次文章发布，我会把自己这个真的很小白遇到的问题...

10-18

400电话是免费吗400电话的免费与不免费

400电话是代理400电话主要的分摊支付业务，也就是说需要支付一定的电话费，但是这个费用很低，只是一个本地的城市电话费...

01-12

多功能客服带动400电话办理

400电话从通常意义上来讲就是一种主被叫分摊业务，就是说主叫承担市话接入费，而被叫承担所有来电接听费用。400电话具有...

05-15

在线客服系统选择要点，用户满意度调查显示明确结果

企业发展需要挖掘和维护客户关系，找到适合的在线客服系统至关重要。选择在线客服系统关键点在于接入全渠道客户资源，...

07-12

呼叫中心职业生涯目标制订的基本步骤方法与目标制定的具体方法

(一) 呼叫中心职业生涯目标制订的基本步骤: 职业生涯目标的制订一般需要经过6个步骤。 (1)自我分析，认识自我，找出自己...

10-20

物联卡应用_远特通信卡盟不仅为合作伙伴赋能还可增强变现能....

2022年，物联网领域突破万亿市场，各种工业级和民用级智能设备层出不穷。物联网卡在物联网设备中起着重要作用，需求也...

11-07

最全Windows 10高清锁屏壁纸下载附网盘下载地址

为了增加Windows 10的美观性，微软为自己的新一代操作系统新增了一个锁屏壁纸更换功能Windows聚焦（Windows spotlight）。 Window...

10-20

现代企业是否有必要开通400电话？

在发展竞争中，企业希望与潜在客户沟通，改善客户服务体验，优化品牌形象，提高竞争力。很难使用网络平台或其他社交软...

04-03

电销客户软件使用介绍

导入编号【电销客户软件使用介绍】外呼模板【电销客户软件使用介绍】 4、设定编号说明规则【电销客户软件使用介绍】...

10-30

济南三网电销软件批发,电话销售系统办理-点击查看

济南三网电销软件批发,电话销售系统办理实际上，言通智能营销系统作为一站式智能营销解决方案服务平台，本质上就是为...

12-16

长治自动电销卡大全（长治电信营业厅电话号码）

本文目录一览：1、有什么适合做电销的手机卡2、什么是电销卡3、哪些电销卡?4、智慧加油站系统公司找哪家比较好？5、防封...

07-10

随时随地新浪网看病，东华互联网医院药品处方

尽管现在优先选择电话销售服务中心BizTalk的民营企业有许多，但也并非所有民营企业的电话销售服务中心都有必要BizTalk出去...

11-29

电销卡办理难吗（办电销卡有什么影响）

本文目录一览： 1、电销卡在哪里处理多少钱2、平顶山电销卡怎样处理3、电信电销改套餐好做吗?4、本年电销卡真的太难了，...

04-22

抖音短视频代运营中有哪些流量池引荐规律？

抖音是一个关于夸姣的短视频APP，不同于快手的略微低俗的流量和受众，抖音是一个记载“夸姣”的产品，夸姣是什么？每个...

03-01

宁波房产专用语音电销机器人多少一台-诚信优惠

宁波房产专用语音电销机器人多少一台机器人都要等到这通转接人工通话结束后才会进行下一通的呼出，这就降低了机器人的...

05-18

汕尾企业电销卡（汕尾企业电销卡怎么办理）

本文目录一览：1、电销卡如何避免封卡?2、电销卡是什么卡?3、电销卡为什么要留公司名4、电销卡是否真的不封号?卡总被停...

07-10

400开头的电话能接吗400开头电话可以接听吗

(400开头的电话能接吗)(400开头电话可以接听吗)以下内容由巨人小编整理发布。 400电话只是一个转接来电的服务，没有线路，...

01-12

青岛将认定技术先进型服务企业

人民网青岛视窗1月11日消息: 青岛将在今年开展技术先进型服务企业的认定工作,以促进企业技术创新和技术服务能力的提升。...

10-22

兰州电销卡外呼系统线路

兰州电销卡外呼系统线路现在工信部对高频段呼出严打的环境下，电销公司只能依靠外呼系统线路来避免因高频外呼而封号...

11-15

《世界版权公约》

《世界版权公约》由联合国教科文组织发起签订，于1952年9月6日在瑞士日内瓦获得通过，1955年生效。1971年7月在巴黎曾作补充...

10-23

使用电销卡是不是不会被封号？电销卡会被封号吗？

使用电销卡是不是不会被封号？电销卡会被封号吗？由于电销卡越来越容易出现封号的问题，所以不少的电销人员把目光...

10-26

河北电话外呼系统有效果吗（电话外呼人员是干什么的）

今天给各位分享河北电话外呼系统有效果吗的知识，其中也会对电话外呼人员是干什么的进行解释，如果能碰巧解决你现在面...

06-09

400电话办理的费用是多少呢400电话办理如何选择一家靠谱的服务商

说到客户服务电话的使用，我相信很多企业不会感到奇怪。随着科学技术的不断发展，也有许多高质量的工具可以使用，这...

01-13

400号码接听要钱吗400电话办理费用会受哪些因素影响

作为企业的专属客户服务电话，400电话采用主被称分享的方式。无论是用户打电话还是企业接听，都需要支付电话费，但双...

01-12

阿朗或15亿美元出售企业电信设备部门正寻买家

4月14日消息，据国外媒体报道，知情人士称，阿尔卡特-朗讯正在探索出售其向企业销售电话和其它电信设备的业务部门。这...

10-19

专利权限制的立法完善

专利权的内容立法始终关系专利权个人利益与国家、社会利益之间的平衡问题。在各国立法实践中。它们大都规定了专利权的...

10-23

海航通信卡正规吗?（海航通信电话卡正规么）

近些年虚拟运营商慢慢走进大家的日常生活中，但是有很多人并不了解虚拟运营商，甚至对虚拟运营商存在误解，虚拟运营商...

09-19

湖州crm外呼系统多少钱（crm外呼工作的弊端）

本文目录一览： 1、外呼体系一个多少钱，有哪些功用？2、外呼体系多少钱一个月？3、外呼体系多少钱一套？怎样装置？4、...

04-22

商标品牌俗称、简称、昵称法律保护的典型案例

来源：福建质量管理作者：纪翔 “索尼爱立信”是日本索尼公司和瑞典爱立信公司的合资企业，成立于2001年，在中国市场上...

10-23

上海ai外呼电话机器人哪家强（ai机器人运营商外呼线路）

本文目录一览：1、ai智能电话销售机器人哪家的靠谱?2、选择智能电话机器人的话,哪家的比较好?3、人工电话机器人选哪家实...

07-15

win8系统连网就蓝屏提示unexpected kernel mode trap错误怎么办?

win8一连上网，不久便蓝屏，显示unexpected kernel mode trap,怎么办呢？ 1、同时按下 win键和x键，呼出快捷菜单。 2、按下M键，启...

10-20

安装ghost win7系统时蓝屏提示错误代码0x0000007E的故障原因及解决方法

电脑蓝屏问题是Windows系统中常见的问题，安装系统时也不常会遇到系统蓝屏的问题。比如有一用户安装win7 纯净版系统出现蓝...

10-19

宜春外呼系统价格（外呼系统哪家线路比较好）

本篇文章给大家谈谈宜春外呼系统价格，以及外呼系统哪家线路比较好对应的知识点，希望对各位有所帮助，不要忘了收藏本...

05-17

移动拨打400电话怎么收费移动，灵活，可扩展和可靠的400电话系统解决方案

目前，通信工具越来越发展，固定电话逐渐淡出人们的视野。人们越来越喜欢日常交流的移动通信工具。我们可以随时随地...

01-13

得到XML文档大小的方法

XML文档从格式到大小都是不是确定的。有的可能只有几行，而有的却有好几兆字节。你也许会怀疑是不是需要了解XML文档的大...

10-18

徐州人工智能电话机器人（徐州人工智能电话机器人招聘）

本文目录一览： 1、人工智能电话机器人到底值不值得应用?2、人工智能电话营销机器人到底能做什么？3、人工智能电话机器...

11-28

打电销不封号的手机卡

不封号的手机卡，电销不封卡，电销手机卡为什么要用电销卡？对于电销公司来说，电销封卡是给不容忽视的问题！如果没...

11-15

菏泽市机器人电销外包招聘（菏泽市机器人电销

本文目录一览：1、有了电销机器人是不是就不需求招电销职工了？2、没有用的比较好的电销机器人啊？求介绍！现在的招...

来源：中国法院网近日，北京知识产权法院受理了“叔同”商标无效宣告请求行政纠纷一案。诉争商标由牧马人公司于201...

10-23

南江免费的电销外呼系统（电销外呼系统南牛网络）

本篇文章给咱们谈谈南江免费的电销外呼体系，以及电销外呼体系南牛网络对应的知识点，期望对各位有所协助，不要忘了...

05-17

移动400资费包括什么移动业务400是什么意思

移动400资费包括什么移动业务400是什么意思以下内容由巨人小编整理发布。座机拨打400电话是收费的按照市话费收取。手机...

02-07

在全球外包100名中，RR Donnelley是领先的外包服务提供商

R. R. Donnelley & Sons 公司今天宣布：在全球外包 100 名中，其全球外包服务已连续第四年被公众认可。全球外包 100 强名单，每年...

10-22

python 实现多线程的三种方法总结

1._thread.start_new_thread(了解) import threadingimport timeimport _threaddef job(): print("这是一个需要执行的任务。。。。。") print("当前线程...

10-18

Linux使用文本浏览器lynx并显示中文的方法

使用Fedora，当然需要玩一些酷的东东，lynx是在文本环境下不错的网页浏览工具，在网速不好的时候使用lynx可以减少网页下载...

10-20

未来农业报告：物联网和新零售是主要力量

35斗对这份名为《食物革命：粮食的未来和我们面临的挑战》的报告进行了编译，将陆续刊出。这是该系列的第四篇文章，主...

10-13

丽水防封外呼机器人办理价格,外呼机器人-原来是这样

丽水防封外呼机器人办理价格,外呼机器人不变则亡”的抉择。据有关预测，在未来销售行业，越早接触人工智能的企业，就...

12-16

内蒙古电销机器人（电销机器人外呼）

今天给各位共享内蒙古电销机器人的常识，其间也会对电销机器人外呼进行解说，假如能可巧处理你现在面临的问题，别忘...

11-06

天润融通助力梵客家居优化呼叫中心体系

在当今社会，倾听用户的每一个声音，确保服务渠道的方便和顺畅，及时响应服务人员，是企业与用户进行良性沟通、建立信...

07-12

服务外包行业上QQ开会

本报讯从区外经贸局了解到，萧山区服务外包第一次网络工作会议已于近日召开，全区有30多家服务外包企业在网上以QQ群聊...

10-22

400电话语音导航内容内蒙古400电话有哪些功能

内蒙古赤峰400电话语音导航功能：通过语音提示选择按钮，将电话直接转到相关部门。 “欢迎致电***公司，咨询请按1，售后...

01-12

利用python进行数据加载

10-18

本页收集关于利用python进行数据加载的相关信息资讯供网民参考！

推荐文章

上一篇：Python编解码问题及文本文件处理方法详解

下一篇：Python机器学习之底层实现KNN

一起分享吧