色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

利用 Python 和 PyTorch 處理面向對象的數據集(2)) :創建數據集對象

馬占云 ? 來源:emsthe ? 作者:emsthe ? 2022-08-02 17:35 ? 次閱讀

本篇是利用 Python 和 PyTorch 處理面向對象的數據集系列博客的第 2 篇。

如需閱讀第 1 篇:原始數據和數據集,請參閱此處。

我們在第 1 部分中已定義 MyDataset 類,現在,讓我們來例化 MyDataset 對象

此可迭代對象是與原始數據交互的接口,在整個訓練過程中都有巨大作用。

第 2 部分:創建數據集對象

輸入 [9]:

mydataset = MyDataset(isValSet_bool = None, raw_data_path = raw_data_path, norm = False, resize = True, newsize = (64, 64))

以下是該對象的一些使用示例:

輸入 [10]:

# 對象操作示例。

# 此操作用于調用 method __getitem__ 并從第 6 個樣本獲取標簽

mydataset[6][1]

輸出 [10]:

0

輸入 [11]:

# 此操作用于在類聲明后打印注釋
MyDataset.__doc__

輸出 [11]:

'Interface class to raw data, providing the total number of samples in the dataset and a preprocessed item'

輸入 [12]:

# 此操作用于調用 method __len__
len(mydataset)

輸出 [12]:

49100

輸入 [13]:

# 此操作用于觸發 method __str__
print(mydataset)
原始數據路徑為 ./raw_data/data_images/

可迭代對象的重要性

訓練期間,將向模型提供多批次樣本。可迭代的 mydataset 是獲得高級輕量代碼的關鍵。

以下提供了可迭代對象的 2 個使用示例。

示例 1:

我們可以直接獲取第 3 個樣本張量:

輸入 [14]:

mydataset.__getitem__(3)[0].shape

輸出 [14]:

torch.Size([3, 64, 64])

與以下操作作用相同

輸入 [15]:

mydataset[3][0].shape

輸出 [15]:

torch.Size([3, 64, 64])

示例 2:

我們可以對文件夾中的圖像進行解析,并移除黑白圖像:

輸入 [ ]:

# 數據集訪問示例:創建 1 個包含標簽的新文件,移除黑白圖像

if os.path.exists(raw_data_path + '/'+ "labels_new.txt"):

    os.remove(raw_data_path + '/'+ "labels_new.txt")

with open(raw_data_path + '/'+ "labels_new.txt", "a") as myfile:

    for item, info in mydataset:

        if item != None:

            if item.shape[0]==1:

                # os.remove(raw_data_path + '/' + info.SampleName)

                print('C = {}; H = {}; W = {}; info = {}'.format(item.shape[0], item.shape[1], item.shape[2], info))

            else:

                #print(info.SampleName + ' ' + str(info.SampleLabel))

                myfile.write(info.SampleName + ' ' + str(info.SampleLabel) + '\n')        

輸入 [ ]:

# 查找具有非期望格式的樣本

with open(raw_data_path + '/'+ "labels.txt", "a") as myfile:

    for item, info in mydataset:

        if item != None:

            if item.shape[0]!=3:

                # os.remove(raw_data_path + '/' + info.SampleName)

                print('C = {}; H = {}; W = {}; info = {}'.format(item.shape[0], item.shape[1], item.shape[2], info))

修改標簽文件后,請務必更新緩存:

輸入 [ ]:

if os.path.exists(raw_data_path + '/'+ "labels_new.txt"):

    os.rename(raw_data_path + '/'+ "labels.txt", raw_data_path + '/'+ "labels_orig.txt")

    os.rename(raw_data_path + '/'+ "labels_new.txt", raw_data_path + '/'+ "labels.txt")


@functools.lru_cache(1)

def getSampleInfoList(raw_data_path):

    sample_list = []

    with open(str(raw_data_path) + '/labels.txt', "r") as f:

        reader = csv.reader(f, delimiter = ' ')

        for i, row in enumerate(reader):

            imgname = row[0]

            label = int(row[1])

            sample_list.append(DataInfoTuple(imgname, label))

    sample_list.sort(reverse=False, key=myFunc)

    return sample_list


del mydataset

mydataset = MyDataset(isValSet_bool = None, raw_data_path = '../../raw_data/data_images', norm = False)

len(mydataset)

您可通過以下鏈接閱讀了解有關 PyTorch 中的可迭代數據庫的更多信息https://pytorch.org/docs/stable/data.html

歸一化

應對所有樣本張量計算平均值和標準差。

如果數據集較小,可以嘗試在內存中對其進行直接操作:使用 torch.stack 即可創建 1 個包含所有樣本張量的棧。

可迭代對象 mydataset 支持簡潔精美的代碼。

使用“view”即可保留 R、G 和 B 這 3 個通道,并將其余所有維度合并為 1 個維度。

使用“mean”即可計算維度 1 的每個通道的平均值。

請參閱附件中有關 dim 使用的說明。

輸入 [16]:

imgs = torch.stack([img_t for img_t, _ in mydataset], dim = 3)

輸入 [17]:

#im_mean = imgs.view(3, -1).mean(dim=1).tolist()

im_mean = imgs.view(3, -1).mean(dim=1)

im_mean

輸出 [17]:

tensor([0.4735, 0.4502, 0.4002])

輸入 [18]:

im_std = imgs.view(3, -1).std(dim=1).tolist()

im_std

輸出 [18]:

[0.28131285309791565, 0.27447444200515747, 0.2874436378479004]

輸入 [19]:

normalize = transforms.Normalize(mean=[0.4735, 0.4502, 0.4002], std=[0.28131, 0.27447, 0.28744])

# free memory

del imgs

下面,我們將再次構建數據集對象,但這次將對此對象進行歸一化:

輸入 [21]:

mydataset = MyDataset(isValSet_bool = None, raw_data_path = raw_data_path, norm = True, resize = True, newsize = (64, 64))

由于采用了歸一化,因此張量值被轉換至范圍 0..1 之內,并進行剪切操作。

輸入 [22]:

original = Image.open('../../raw_data/data_images/img_00009111.JPEG')



fig, axs = plt.subplots(1, 2, figsize=(10, 3))

axs[0].set_title('clipped tensor')

axs[0].imshow(mydataset[5][0].permute(1,2,0))

axs[1].set_title('original PIL image')

axs[1].imshow(original)

plt.show()
將輸入數據剪切到含 RGB 數據的 imshow 的有效范圍內,以 [0..1] 表示浮點值,或者以 [0..255] 表示整數值。

poYBAGGYHoaALC2hAAKp5WYBQEk586.png

使用 torchvision.transforms 進行預處理

現在,我們已經創建了自己的變換函數或對象(原本用作為加速學習曲線的練習),我建議使用 Torch 模塊 torchvision.transforms:

“此模塊定義了一組可組合式類函數對象,這些對象可作為實參傳遞到數據集(如 torchvision.CIFAR10),并在加載數據后 __getitem__ 返回數據之前,對數據執行變換”。

以下列出了可能的變換:

輸入 [23]:

from torchvision import transforms
dir(transforms)

輸出 [23]:

['CenterCrop',

 'ColorJitter',

 'Compose',

 'FiveCrop',

 'Grayscale',

 'Lambda',

 'LinearTransformation',

 'Normalize',

 'Pad',

 'RandomAffine',

 'RandomApply',

 'RandomChoice',

 'RandomCrop',

 'RandomErasing',

 'RandomGrayscale',

 'RandomHorizontalFlip',

 'RandomOrder',

 'RandomPerspective',

 'RandomResizedCrop',

 'RandomRotation',

 'RandomSizedCrop',

 'RandomVerticalFlip',

 'Resize',

 'Scale',

 'TenCrop',

 'ToPILImage',

 'ToTensor',

 '__builtins__',

 '__cached__',

 '__doc__',

 '__file__',

 '__loader__',

 '__name__',

 '__package__',

 '__path__',

 '__spec__',

 'functional',

 'transforms']

在此示例中,我們使用變換來執行了以下操作:

1) ToTensor - 從 PIL 圖像轉換為張量,并將輸出格式定義為 CxHxW
2) Normalize - 將張量歸一化

如需了解后續步驟,敬請期待本系列的第 3 部分。

審核編輯 黃昊宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • python
    +關注

    關注

    56

    文章

    4807

    瀏覽量

    84959
  • 數據集
    +關注

    關注

    4

    文章

    1209

    瀏覽量

    24793
  • pytorch
    +關注

    關注

    2

    文章

    808

    瀏覽量

    13331
收藏 人收藏

    評論

    相關推薦

    Python面向對象編程詳解

    一般編程可分為面向過程編程,和面向對象編程。Python面向對象編程,與Java的
    發表于 09-04 16:35 ?591次閱讀
    <b class='flag-5'>Python</b>的<b class='flag-5'>面向</b><b class='flag-5'>對象</b>編程詳解

    3分鐘看懂Python面向對象

    Python雖然是解釋型語言,但從設計之初就已經是一門面向對象的語言,對于Python來說一切皆為對象。正因為如此,在
    發表于 06-08 14:20

    pandas對babynames數據的簡單處理

    利用Python進行數據分析——第二章 引言(2):利用pandas對babynames數據
    發表于 08-09 12:58

    LabVIEW面向對象的ActorFramework(1)

    ` 本帖最后由 bollworm 于 2020-2-10 14:54 編輯 本系列文章主要闡述以下幾個問題:(1)什么是面向對象編程?(2)為什么要學習
    發表于 02-10 14:09

    基于數據對象平均離群因子的離群點選擇算法

    基于數據對象平均離群因子的離群點選擇算法_朱付保
    發表于 01-03 17:41 ?0次下載

    詳談Python數據模型和對象模型

    Python官方文檔說法是“Python數據模型”,大多數Python書籍作者說法是“Python對象
    的頭像 發表于 02-10 15:59 ?2588次閱讀
    詳談<b class='flag-5'>Python</b>的<b class='flag-5'>數據</b>模型和<b class='flag-5'>對象</b>模型

    基于面向對象概念格的卸掉判定定理

    集判定定理,進而得到了新的可辨識屬性和可辨識屬性矩陣,借助布爾邏輯公式轉換給岀了約簡計算方法。提岀的方法可以避免計算所有面向對象的形式概念及面向屬性的所有形式概念。另外,提岀了
    發表于 06-17 14:31 ?3次下載

    利用PythonPyTorch處理面向對象數據

    本篇是利用 PythonPyTorch 處理面向對象
    的頭像 發表于 08-25 15:30 ?3015次閱讀

    利用PythonPyTorch處理面向對象數據(1)

    在本文中,我們將提供一種高效方法,用于完成數據的交互、組織以及最終變換(預處理)。隨后,我們將講解如何在訓練過程中正確地把數據輸入給模型。PyTorch 框架將幫助我們實現此目標,我們
    的頭像 發表于 08-02 08:03 ?710次閱讀

    如何利用Dataloder來處理加載數據

    Pytorch中,torch.utils.data中的Dataset與DataLoader是處理數據的兩個函數,用來處理加載
    的頭像 發表于 02-24 10:42 ?617次閱讀
    如何<b class='flag-5'>利用</b>Dataloder來<b class='flag-5'>處理</b>加載<b class='flag-5'>數據</b><b class='flag-5'>集</b>

    Python中的類和對象詳解

    Python 是一種面向對象的編程語言,它支持類和對象。類是一種用戶自定義的數據類型,用于定義對象
    的頭像 發表于 04-20 16:53 ?1193次閱讀

    PyTorch教程3.2之面向對象的設計實現

    電子發燒友網站提供《PyTorch教程3.2之面向對象的設計實現.pdf》資料免費下載
    發表于 06-05 15:48 ?0次下載
    <b class='flag-5'>PyTorch</b>教程3.2之<b class='flag-5'>面向</b><b class='flag-5'>對象</b>的設計實現

    PyTorch教程14.6之對象檢測數據

    電子發燒友網站提供《PyTorch教程14.6之對象檢測數據.pdf》資料免費下載
    發表于 06-05 11:23 ?0次下載
    <b class='flag-5'>PyTorch</b>教程14.6之<b class='flag-5'>對象</b>檢測<b class='flag-5'>數據</b><b class='flag-5'>集</b>

    PyTorch教程-14.6. 對象檢測數據

    14.6. 對象檢測數據? Colab [火炬]在 Colab 中打開筆記本 Colab [mxnet] Open the notebook in Colab Colab [jax
    的頭像 發表于 06-05 15:44 ?490次閱讀
    <b class='flag-5'>PyTorch</b>教程-14.6. <b class='flag-5'>對象</b>檢測<b class='flag-5'>數據</b><b class='flag-5'>集</b>

    PyTorch如何訓練自己的數據

    PyTorch是一個廣泛使用的深度學習框架,它以其靈活性、易用性和強大的動態圖特性而聞名。在訓練深度學習模型時,數據是不可或缺的組成部分。然而,很多時候,我們可能需要使用自己的數據
    的頭像 發表于 07-02 14:09 ?1962次閱讀
    主站蜘蛛池模板: 国产一区二区精品视频 | 2019香蕉在线观看直播视频 | 国产精自产拍久久久久久蜜 | 熟妇的味道HD中文字幕 | 日韩毛片在线视频 | 亚洲午夜久久久无码精品网红A片 | 九九热只有精品 | VIDEOSGGRATIS欧美另类 | 第一精品福利导福航 | 国产精品第九页 | 黄小说免费看 | 亚洲国产AV精品一区二区蜜芽 | 俄罗斯15一16处交 | 亚洲视频91 | 欲香欲色天天影视大全 | yellow日本动漫观看免费 | 最近日本字幕MV免费观看在线 | 亚洲视频无码中字在线 | 97超视频在线观看 | 色琪琪无码成人AV视频 | 影音先锋av333资源网 | 我的好妈妈BD免费观看 | 国产精人妻无码一区麻豆 | 午夜福利视频极品国产83 | 日本无码毛片一区二区手机看 | 久久视频在线视频观看精品15 | 国产精品久久久久婷婷五月色婷婷 | 亚洲精品AV中文字幕在线 | 亚洲青青草 | 秋葵app秋葵官网18在线观看 | 亚洲国产高清在线观看视频 | 樱桃BT在线观看 | 国产高清视频免费最新在线 | 九九99亚洲精品久久久久 | 女人被躁到高潮嗷嗷叫免费 | 日本亚洲精品无码区国产电影 | 日本aa大片 | 麻豆精品乱码WWW久久密 | 亚洲偷偷自拍免费视频在线 | 野花日本免费完整版高清版动漫 | 亚洲日本欧美国产在线视 |