佳木斯湛栽影视文化发展公司

主頁 > 知識庫 > Pytorch DataLoader shuffle驗證方式

Pytorch DataLoader shuffle驗證方式

熱門標簽:網(wǎng)站文章發(fā)布 鐵路電話系統(tǒng) 智能手機 美圖手機 服務器配置 呼叫中心市場需求 銀行業(yè)務 檢查注冊表項

shuffle = False時,不打亂數(shù)據(jù)順序

shuffle = True,隨機打亂

import numpy as np
import h5py
import torch
from torch.utils.data import DataLoader, Dataset  
h5f = h5py.File('train.h5', 'w');
data1 = np.array([[1,2,3],
               [2,5,6],
              [3,5,6],
              [4,5,6]])
data2 = np.array([[1,1,1],
                   [1,2,6],
                  [1,3,6],
                  [1,4,6]])
h5f.create_dataset(str('data'), data=data1)
h5f.create_dataset(str('label'), data=data2)
class Dataset(Dataset):
    def __init__(self):
        h5f = h5py.File('train.h5', 'r')
        self.data = h5f['data']
        self.label = h5f['label']
    def __getitem__(self, index):
        data = torch.from_numpy(self.data[index])
        label = torch.from_numpy(self.label[index])
        return data, label
 
    def __len__(self):
        assert self.data.shape[0] == self.label.shape[0], "wrong data length"
        return self.data.shape[0] 
 
dataset_train = Dataset()
loader_train = DataLoader(dataset=dataset_train,
                           batch_size=2,
                           shuffle = True)
 
for i, data in enumerate(loader_train):
    train_data, label = data
    print(train_data)
 

pytorch DataLoader使用細節(jié)

背景:

我一開始是對數(shù)據(jù)擴增這一塊有疑問, 只看到了數(shù)據(jù)變換(torchvisiom.transforms),但是沒看到數(shù)據(jù)擴增, 后來搞明白了, 數(shù)據(jù)擴增在pytorch指的是torchvisiom.transforms + torch.utils.data.DataLoader+多個epoch共同作用下完成的,

數(shù)據(jù)變換共有以下內容

composed = transforms.Compose([transforms.Resize((448, 448)), #  resize
                               transforms.RandomCrop(300), # random crop
                               transforms.ToTensor(),
                               transforms.Normalize(mean=[0.5, 0.5, 0.5],  # normalize
                                                    std=[0.5, 0.5, 0.5])])

簡單的數(shù)據(jù)讀取類, 進返回PIL格式的image:

class MyDataset(data.Dataset):    
    def __init__(self, labels_file, root_dir, transform=None):
        with open(labels_file) as csvfile:
            self.labels_file = list(csv.reader(csvfile))
        self.root_dir = root_dir
        self.transform = transform
        
    def __len__(self):
        return len(self.labels_file)
    
    def __getitem__(self, idx):
        im_name = os.path.join(root_dir, self.labels_file[idx][0])
        im = Image.open(im_name)
        
        if self.transform:
            im = self.transform(im)
            
        return im

下面是主程序

labels_file = "F:/test_temp/labels.csv"
root_dir = "F:/test_temp"
dataset_transform = MyDataset(labels_file, root_dir, transform=composed)
dataloader = data.DataLoader(dataset_transform, batch_size=1, shuffle=False)
"""原始數(shù)據(jù)集共3張圖片, 以batch_size=1, epoch為2 展示所有圖片(共6張)  """
for eopch in range(2):
    plt.figure(figsize=(6, 6)) 
    for ind, i in enumerate(dataloader):
        a = i[0, :, :, :].numpy().transpose((1, 2, 0))
        plt.subplot(1, 3, ind+1)
        plt.imshow(a)

從上述圖片總可以看到, 在每個eopch階段實際上是對原始圖片重新使用了transform, , 這就造就了數(shù)據(jù)的擴增

以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。

您可能感興趣的文章:
  • 我對PyTorch dataloader里的shuffle=True的理解
  • Pytorch在dataloader類中設置shuffle的隨機數(shù)種子方式
  • pytorch 實現(xiàn)多個Dataloader同時訓練
  • 解決Pytorch dataloader時報錯每個tensor維度不一樣的問題
  • pytorch中DataLoader()過程中遇到的一些問題
  • Pytorch dataloader在加載最后一個batch時卡死的解決
  • pytorch鎖死在dataloader(訓練時卡死)

標簽:長治 樂山 滄州 新疆 上海 沈陽 河南 紅河

巨人網(wǎng)絡通訊聲明:本文標題《Pytorch DataLoader shuffle驗證方式》,本文關鍵詞  ;如發(fā)現(xiàn)本文內容存在版權問題,煩請?zhí)峁┫嚓P信息告之我們,我們將及時溝通與處理。本站內容系統(tǒng)采集于網(wǎng)絡,涉及言論、版權與本站無關。
  • 相關文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    资中县| 德令哈市| 汤阴县| 城市| 礼泉县| 武宣县| 宁化县| 微博| 五台县| 紫金县| 崇文区| 莱西市| 顺义区| 新乡市| 犍为县| 台中市| 枣强县| 玉环县| 武陟县| 洞口县| 工布江达县| 斗六市| 广灵县| 乌兰浩特市| 确山县| 墨脱县| 酉阳| 库伦旗| 庄河市| 会东县| 东阳市| 博野县| 扶沟县| 门源| 宜春市| 额敏县| 大宁县| 安义县| 荆门市| 宜州市| 揭西县|