PyTorch数据读取的实现示例-巨人网络通讯

主页 > 知识库 > PyTorch数据读取的实现示例

PyTorch数据读取的实现示例

前言

PyTorch作为一款深度学习框架，已经帮助我们实现了很多很多的功能了，包括数据的读取和转换了，那么这一章节就介绍一下PyTorch内置的数据读取模块吧

模块介绍

pandas 用于方便操作含有字符串的表文件，如csv
zipfile python内置的文件解压包
cv2 用于图片处理的模块,读入的图片模块为BGR,N H W C
torchvision.transforms 用于图片的操作库，比如随机裁剪、缩放、模糊等等，可用于数据的增广，但也不仅限于内置的图片操作，也可以自行进行图片数据的操作，这章也会讲解
torch.utils.data.Dataset torch内置的对象类型
torch.utils.data.DataLoader 和Dataset配合使用可以实现数据的加速读取和随机读取等等功能

import zipfile # 解压
import pandas as pd # 操作数据
import os # 操作文件或文件夹
import cv2 # 图像操作库
import matplotlib.pyplot as plt # 图像展示库
from torch.utils.data import Dataset # PyTorch内置对象
from torchvision import transforms # 图像增广转换库 PyTorch内置
import torch

初步读取数据

数据下载到此处
我们先初步编写一个脚本来实现图片的展示

# 解压文件到指定目录
def unzip_file(root_path, filename):
  full_path = os.path.join(root_path, filename)
  file = zipfile.ZipFile(full_path)
  file.extractall(root_path)
unzip_file(root_path, zip_filename)

# 读入csv文件
face_landmarks = pd.read_csv(os.path.join(extract_path, csv_filename))

# pandas读出的数据如想要操作索引 使用iloc
image_name = face_landmarks.iloc[:,0]
landmarks = face_landmarks.iloc[:,1:]

# 展示
def show_face(extract_path, image_file, face_landmark):
  plt.imshow(plt.imread(os.path.join(extract_path, image_file)), cmap='gray')
  point_x = face_landmark.to_numpy()[0::2]
  point_y = face_landmark.to_numpy()[1::2]
  plt.scatter(point_x, point_y, c='r', s=6)
  
show_face(extract_path, image_name.iloc[1], landmarks.iloc[1])

使用内置库来实现

实现MyDataset

使用内置库是我们的代码更加的规范，并且可读性也大大增加
继承Dataset,需要我们实现的有两个地方:

实现__len__返回数据的长度，实例化调用len()时返回
__getitem__给定数据的索引返回对应索引的数据如：a[0]
transform 数据的额外操作时调用

class FaceDataset(Dataset):
  def __init__(self, extract_path, csv_filename, transform=None):
    super(FaceDataset, self).__init__()
    self.extract_path = extract_path
    self.csv_filename = csv_filename
    self.transform = transform
    self.face_landmarks = pd.read_csv(os.path.join(extract_path, csv_filename))
  def __len__(self):
    return len(self.face_landmarks)
  def __getitem__(self, idx):
    image_name = self.face_landmarks.iloc[idx,0]
    landmarks = self.face_landmarks.iloc[idx,1:].astype('float32')
    point_x = landmarks.to_numpy()[0::2]
    point_y = landmarks.to_numpy()[1::2]
    image = plt.imread(os.path.join(self.extract_path, image_name))
    sample = {'image':image, 'point_x':point_x, 'point_y':point_y}
    if self.transform is not None:
      sample = self.transform(sample)
    return sample

测试功能是否正常

face_dataset = FaceDataset(extract_path, csv_filename)
sample = face_dataset[0]
plt.imshow(sample['image'], cmap='gray')
plt.scatter(sample['point_x'], sample['point_y'], c='r', s=2)
plt.title('face')

实现自己的数据处理模块

内置的在torchvision.transforms模块下，由于我们的数据结构不能满足内置模块的要求，我们就必须自己实现
图片的缩放，由于缩放后人脸的标注位置也应该发生对应的变化，所以要自己实现对应的变化

class Rescale(object):
  def __init__(self, out_size):
    assert isinstance(out_size,tuple) or isinstance(out_size,int), 'out size isinstance int or tuple'
    self.out_size = out_size
  def __call__(self, sample):
    image, point_x, point_y = sample['image'], sample['point_x'], sample['point_y']
    new_h, new_w = self.out_size if isinstance(self.out_size,tuple) else (self.out_size, self.out_size)
    new_image = cv2.resize(image,(new_w, new_h))
    h, w = image.shape[0:2]
    new_y = new_h / h * point_y
    new_x = new_w / w * point_x
    return {'image':new_image, 'point_x':new_x, 'point_y':new_y}

将数据转换为torch认识的数据格式因此，就必须转换为tensor
注意: cv2和matplotlib读出的图片默认的shape为N H W C,而torch默认接受的是N C H W因此使用tanspose转换维度，torch转换多维度使用permute

class ToTensor(object):
  def __call__(self, sample):
    image, point_x, point_y = sample['image'], sample['point_x'], sample['point_y']
    new_image = image.transpose((2,0,1))
    return {'image':torch.from_numpy(new_image), 'point_x':torch.from_numpy(point_x), 'point_y':torch.from_numpy(point_y)}

测试

transform = transforms.Compose([Rescale((1024, 512)), ToTensor()])
face_dataset = FaceDataset(extract_path, csv_filename, transform=transform)
sample = face_dataset[0]
plt.imshow(sample['image'].permute((1,2,0)), cmap='gray')
plt.scatter(sample['point_x'], sample['point_y'], c='r', s=2)
plt.title('face')

使用Torch内置的loader加速读取数据

data_loader = DataLoader(face_dataset, batch_size=4, shuffle=True, num_workers=0)
for i in data_loader:
  print(i['image'].shape)
  break

torch.Size([4, 3, 1024, 512])

注意: windows环境尽量不使用num_workers会发生报错

总结

这节使用内置的数据读取模块，帮助我们规范代码，也帮助我们简化代码，加速读取数据也可以加速训练，数据的增广可以大大的增加我们的训练精度，所以本节也是训练中比较重要环节

到此这篇关于PyTorch数据读取的实现示例的文章就介绍到这了,更多相关PyTorch数据读取内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

关于PyTorch源码解读之torchvision.models
pytorch实现ResNet结构的实例代码
PyTorch实现ResNet50、ResNet101和ResNet152示例
关于ResNeXt网络的pytorch实现
pytorch教程resnet.py的实现文件源码分析

标签：锦州安庆日照天水西安白城随州股票

巨人网络通讯声明：本文标题《PyTorch数据读取的实现示例》，本文关键词 PyTorch,数据,读,取的,实现,；如发现本文内容存在版权问题，烦请提供相关信息告之我们，我们将及时沟通与处理。本站内容系统采集于网络，涉及言论、版权与本站无关。

下面列出与本文章《PyTorch数据读取的实现示例》相关的同类信息！

PyTorch数据读取的实现示例

前言 PyTorch 作为一款深度学习框架，已经帮助我们实现了很多很多的功能了，包括数据的读取和转换了，那么这一章节就介绍一下 PyTorch 内置的数据读取模块吧模块介绍 pandas 用于方便...

10-18

ai电话机器人讯飞（ai语音电话机器人）

本篇文章给咱们谈谈ai电话机器人讯飞，以及ai语音电话机器人对应的知识点，期望对各位有所协助，不要忘了保藏本站喔。...

05-17

呼叫中心客服系统-企蜂-企蜂云

客户关系管理的实施重在员工的参与，让员工充分的认识到其中的价值尤为重要。要实施新的客户管理模式，还要适应一个相...

10-25

如何成为一名客服“神枪手”

“我们都是神枪手，每一颗子弹消灭一个敌人”，这是经典红色歌曲《游击队之歌》当中的一句歌词。作为客服行业从业者，...

10-22

400电话办理怎样选择适合套餐企业400电话申请的套餐选择

选择合适的400电话套餐，不仅可以为企业节省成本，避免浪费，还可以满足企业的所有需求。面对10多个400电话套餐，我该如...

01-12

石家庄电话机器人如何（大连电话机器人）

本篇文章给大家谈谈石家庄电话机器人如何，以及大连电话机器人对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔...

05-03

人工客服机器人云呼ai_电话机器人

比人工销售电话机器人更容易使用。电话机器人一天可以打800-1000通电话，不受环境、感情、身体状况等的影响，经常进行稳...

10-31

微信公众号代运营公司如何吸粉？有哪些技巧？

微信公众号代运营本身的吸粉的具体办法就有很多，所以这也是威海市呢么会有很多企业和商家挑选公众号代运营的主要原因...

03-01

兰州企业外呼系统公司的简单介绍

今天给各位分享兰州企业外呼系统公司的知识，其中也会对进行解释，如果能碰巧解决你现在面临的问题，别忘了关注本站，...

05-17

电销卡为什么要收费用？

相信很多没有用过电销卡的朋友，第一次买卡都会有这个疑问，就是电销卡为什么要收取一个额外的费用呢？有这个疑问也不...

05-30

语音外呼系统平台软件价格（语音营销外呼系统）

本文目录一览： 1、呼叫中心或外呼系统哪种又便宜又好的啊2、外呼系统安装需要哪些费用？3、外呼系统一个多少钱，有哪...

11-27

金华稳定群呼线路办理公司,呼叫中心软件-原创

金华稳定群呼线路办理公司,呼叫中心软件但实际意图客户很少，不是电动推销员能力不好，不是销售员技能不够，但在电话...

12-16

录音外呼系统怎么删录音（呼呼收音机怎么删除录音）

今天给各位分享录音外呼系统怎么删录音的知识，其中也会对呼呼收音机怎么删除录音进行解释，如果能碰巧解决你现在面临...

11-06

汕头电销卡外呼系统厂家（电销外呼是什么）

07-10

如何在百度地图注册多个店面？如何在百度地图注册多个店面入驻？

如何在百度地图上标注多个地点？地理法：举例来说：的地理位置 1、点内右上角的容第2个图标（如图），确认“收藏点”...

11-27

常州客服外呼系统开发（常州呼叫中心）

本文目录一览： 1、外呼系统怎么办理？2、哪些电话外呼系统及电话销售系统好使？而且功能完善？3、外呼系统哪家公司做...

11-27

史上最“给力”的机器人——FANUCM-2000iA机器人

在过去的生产模式中，要搬运重量级物品的时候一般都需要输送带或者有类似功能的机器。虽然很多厂家仍然在使用这种机器...

10-30

怎么申请一个400的电话（怎样申请400电话号码）

怎么申请一个400的电话（怎样申请400电话号码）近年来，越来越多的企业开始使用400电话，它可以提高客服效率、降低客户...

08-14

包含催收外呼系统联系方式的词条

本篇文章给我们谈谈催收外呼体系联络方法，以及对应的知识点，期望对各位有所协助，不要忘了保藏本站喔。本文目录一...

05-18

丽江语音电销机器人（电销机器人电话机器人）

本文目录一览： 1、电销板滞人运用成就怎样样 2、电销板滞人是什么？ 3、电销板滞人怎样样？ 4、电销板滞人有什么听命...

11-25

移动蓝星卡9元套餐怎么样?

现在有很多的流量卡月租非常便宜，但是像移动蓝星卡这样只要9元月租的卡也是很少的，接下来我们来看下移动蓝星卡9元套...

10-20

电销卡代理商湛江店（销售电销卡）

本文目录一览： 1、湛江哪里有沟通100营业厅，我想办全球通卡。2、电销卡不封号卡哪里有卖3、电销卡在哪里办理4、长江电...

04-22

安阳ai电话机器人加盟（安阳ai电话机器人加盟店）

本篇文章给咱们谈谈安阳AI电话机器人加盟，以及安阳ai电话机器人加盟店对应的知识点，希望对各位有所协助，不要忘了保...

06-12

2013十大网络流行用语 2013十大最新网络语言 2013十大最火网络语言

由国家语言资源监测与研究网络媒体中心、商务印书馆、中国网络电视台联合主办的汉语盘点2013近日在京揭晓。经过专家评...

10-19

哪里有羿智云外呼系统（智云呼官网）

本文目次一览： 1、成都那家外呼体系对照好， 2、外呼软件有哪些？ 3、电销外呼体系哪个好了？市道上的太多了！有可能推...

11-26

成都语音外呼系统线路（成都电话外呼系统）

本文目录一览： 1、外呼线路供给(电话发售公用) 2、成都那家外呼体系对照好， 3、外呼线路供给是什么？ 4、外呼体系什么...

11-25

无锡联通电销线路办理多少钱,呼叫中心系统哪家好-大家都知道

无锡联通电销线路办理多少钱,呼叫中心系统哪家好怎样去了解呼叫中心是最快的途径？这个其实都不我们说，您就会知道，...

12-16

周乔亮：政采IT项目如何选择服务外包供应商

在政府采购活动中，与IT有关的采购项目较多，频率也较高。这是因为政府机关、吃财政饭的公共事业机构以及为社会提供公...

10-22

诚信可靠的电销外呼系统（电话销售外呼系统软件电销网）

本文目录一览： 1、电销外呼体系哪个好了？市面上的太多了！有能够引荐的吗？2、有靠谱的外呼体系吗，别让我再办卡，公...

11-28

400电话对企业的好处用代理商安装400电话怎样？怎样选择代理商？

400电话不会占线，这样可以有效的增加用户的体验，也可以直接提升企业的业务量，所以400电话的优势对于企业来说有着极大...

01-12

苏州电销防封app代理

苏州电销防封app代理电销app：操作简单便捷！手机下载APP就可直接在线拨打！不封号、强大CRM管理系统！也可以通过API接...

12-03

电话机器人在自来水客服中心的应用

随着技术的进步，人工智能已经开始走入我们的生活，而且正以一种磁悬浮般的速度向我们奔来。人工智能将会为我们带来哪...

10-24

德阳电话机器人（德阳电话机器人系统）

本文目录一览：1、阿里斯顿太阳能24小时官网电话热线-(全国各网点)24小时400服务热线_百...2、ai问答机器人在线3、315之后,骚...

08-28

贵阳不封卡电销卡办理（贵阳办电话卡）

本篇文章给大家谈谈贵阳不封卡电销卡办理，以及贵阳办电话卡对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔。...

05-18

电信400客服电话是多少电信打400电话要钱吗

400电话是运营商专门为企业设计的呼叫管理中心。它有20多种功能，不仅可以提高企业的通信效率和服务水平，还可以提升企...

01-13

电销免封号好用吗

电销免封号好用吗电销卡的使用成本相对来说是比较低的，一般来说都是套餐服务，一个外呼电话也就几分钱，所以这样也...

12-16

南阳市稳定不封号电销卡便宜

早期，三大运营商各分配了3000万码号资源，空留1704号段无人认领。不过，随着联通合作虚拟运营商飞速发展用户，联通不仅...

02-23

电销卡是什么样的卡号（电销卡是什么卡?谁知道?）

本文目录一览：1、电销卡到底是什么卡呢?2、电销卡和电话卡的区别有哪些?3、电销卡是什么?为什么电销卡也会封号?电销卡...

07-10

金华稳定电话呼叫软件多少钱,呼叫中心系统办理多少钱-了解详情

金华稳定电话呼叫软件多少钱,呼叫中心系统办理多少钱大家知道一个电子商务企业建立呼叫中心。第一个就是客服，有些客...

12-16

南京华翔云语app

南京华翔云语app，办理南京华翔云语app，南京华翔云语app办理云语app 自带黑名单过滤系统呼出不限归属地齐全需要的老板...

11-23

ofo新增用户远超摩拜成行业第一品牌增速连续8个月第一

共享单车在近年来的快速普及，为在城市生活的用户带来了极大的便当，同时也让城市的生活环境变得更加绿色。进入 2017...

10-16

Centos系统用户密码字符串生成命令-shadow

这两天在看puppet，准备用这个管理我手下系统的用户添加分配与删除工作，不过每次要是都用系统的passwd命令生成用户密码那...

10-20

金华房地产电销软件公司,电话营销线路-价格靠谱

金华房地产电销软件公司,电话营销线路不会受到情绪的影响，流畅的与客户进行沟通，回答专业性的问题，提高成交率。依...

12-17

Win10 Build 10125测试版修复了斯巴达项目存在的大问题

Windows 10 Build 10125测试版刚刚在互联网上泄露，感兴趣的可以下载安装（Win10 Build 10125 86/64位ios镜像下载），它可能没有的新功...

10-20

郑州自动外呼系统价钱（智能外呼系统费用）

本文目录一览： 1、外呼体系什么价格？2、外呼体系装置需求哪些费用？3、外呼体系多少钱一个月？4、外呼体系一个多少钱...

04-23

400号怎样申请

申请400号码，需要根据具体需求选择相应的运营商和服务商，按照要求填写相关申请表格，并缴纳相应的费用。下面详细介绍...

07-21

WinXP系统提示werfault.exe应用程序错误该怎么办?

电脑总是提示werfault.exe应用程序错误该怎么办？请问图片中是什么原因？截图是程序错误（内存不能读）。首先要知道werf...

10-20

400电话有哪些智能转接模式

每个企业的400电话都需要绑定多个固话和手机，当用户的拨打咨询时，怎么转接绑定的电话，这就是400电话的智能转接模式。...

05-09

佛山人工外呼系统怎么样（广州外呼系统哪里有）

今天给各位分享佛山人工外呼系统怎么样的知识，其中也会对广州外呼系统哪里有进行解释，如果能碰巧解决你现在面临的问...

11-06

携程商户怎么显示到高德地图？携程地图商户位置服务？

请问：携程的酒店定位？您好您可以致电酒店问一下具体位置使用百度地图查询会更加准确手机携程如何连接百度地图？...

11-26

正规物联卡公司排行，谁第一？（物联卡公司排行榜）

随着社会、科技、经济全面发展，物联网发展、物联卡广泛已成为必不可当的趋势。市面上物联卡公司更是层出不穷。究竟哪...

11-07

PyTorch数据读取的实现示例

10-18

本页收集关于PyTorch数据读取的实现示例的相关信息资讯供网民参考！

四合一精品企业网站建设

多一个网站就为企业多增加一条营销渠道

¥888元限时抢购

立即咨询 快速购买

企业400电话

智能AI客服机器人
￥15000

在线订购

合计11份范本：公司章程+合伙协议+出资协议+合作协议+股权转让协议+增资扩股协议+股权激励+股东会决议+董事会决议

推荐文章

上一篇：Pandas 实现分组计数且不计重复

下一篇：超详细PyTorch实现手写数字识别器的示例代码

一起分享吧

PyTorch数据读取的实现示例

前言

模块介绍

初步读取数据

使用内置库来实现

实现自己的数据处理模块

使用Torch内置的loader加速读取数据

总结

四合一精品企业网站建设

¥888元限时抢购

立即咨询快速购买

企业400电话

合计11份范本：公司章程+合伙协议+出资协议+合作协议+股权转让协议+增资扩股协议+股权激励+股东会决议+董事会决议

在线咨询