天美传媒影视在线免费观看,天堂va在线,深夜影院a

在我們深入研究該方法之前，我們將首先討論一個基本的代碼結構，它使我們能夠有效地實現各種 HPO 算法。一般來說，這里考慮的所有 HPO 算法都需要實現兩個決策原語，即搜索和調度。首先，他們需要對新的超參數配置進行采樣，這通常涉及對配置空間的某種搜索。其次，對于每個配置，HPO 算法需要安排其評估并決定為其分配多少資源。一旦我們開始評估配置，我們就會將其稱為試用。我們將這些決定映射到兩個類，HPOSearcher和 HPOScheduler。除此之外，我們還提供HPOTuner執行優化過程的類。

這種調度器和搜索器的概念也在流行的 HPO 庫中實現，例如 Syne Tune （Salinas等人，2022 年）、Ray Tune （Liaw等人，2018 年）或 Optuna （Akiba等人，2019 年）。

import time
from scipy import stats
from d2l import torch as d2l

19.2.1。搜尋器

下面我們定義一個搜索器的基類，通過函數提供一個新的候選配置sample_configuration。實現此功能的一種簡單方法是隨機對配置進行統一采樣，就像我們在第 19.1 節中對隨機搜索所做的那樣。更復雜的算法，例如貝葉斯優化，將根據先前試驗的表現做出這些決定。因此，隨著時間的推移，這些算法能夠對更有希望的候選人進行抽樣。我們添加該update 功能是為了更新以前試驗的歷史，然后可以利用它來改進我們的抽樣分布。

class HPOSearcher(d2l.HyperParameters): #@save
  def sample_configuration() -> dict:
    raise NotImplementedError

  def update(self, config: dict, error: float, additional_info=None):
    pass

以下代碼顯示了如何在此 API 中實現我們上一節中的隨機搜索優化器。作為一個輕微的擴展，我們允許用戶通過指定要評估的第一個配置 initial_config，而隨后的配置是隨機抽取的。

class RandomSearcher(HPOSearcher): #@save
  def __init__(self, config_space: dict, initial_config=None):
    self.save_hyperparameters()

  def sample_configuration(self) -> dict:
    if self.initial_config is not None:
      result = self.initial_config
      self.initial_config = None
    else:
      result = {
        name: domain.rvs()
        for name, domain in self.config_space.items()
      }
    return result

19.2.2。調度程序

除了新試驗的采樣配置外，我們還需要決定何時進行試驗以及進行多長時間。實際上，所有這些決定都是由完成的HPOScheduler，它將新配置的選擇委托給HPOSearcher. suggest只要某些訓練資源可用，就會調用該方法。除了調用sample_configuration搜索器之外，它還可以決定諸如max_epochs（即訓練模型的時間）之類的參數。update每當試驗返回新觀察時調用該方法。

class HPOScheduler(d2l.HyperParameters): #@save
  def suggest(self) -> dict:
    raise NotImplementedError

  def update(self, config: dict, error: float, info=None):
    raise NotImplementedError

要實現隨機搜索以及其他 HPO 算法，我們只需要一個基本的調度程序，它可以在每次新資源可用時調度新的配置。

class BasicScheduler(HPOScheduler): #@save
  def __init__(self, searcher: HPOSearcher):
    self.save_hyperparameters()

  def suggest(self) -> dict:
    return self.searcher.sample_configuration()

  def update(self, config: dict, error: float, info=None):
    self.searcher.update(config, error, additional_info=info)

19.2.3。調諧器

最后，我們需要一個組件來運行調度器/搜索器并對結果進行一些簿記。下面的代碼實現了 HPO 試驗的順序執行，在下一個訓練作業之后評估一個訓練作業，并將作為一個基本示例。我們稍后將使用 Syne Tune來處理更具可擴展性的分布式 HPO 案例。

class HPOTuner(d2l.HyperParameters): #@save
  def __init__(self, scheduler: HPOScheduler, objective: callable):
    self.save_hyperparameters()
    # Bookeeping results for plotting
    self.incumbent = None
    self.incumbent_error = None
    self.incumbent_trajectory = []
    self.cumulative_runtime = []
    self.current_runtime = 0
    self.records = []

  def run(self, number_of_trials):
    for i in range(number_of_trials):
      start_time = time.time()
      config = self.scheduler.suggest()
      print(f"Trial {i}: config = {config}")
      error = self.objective(**config)
      error = float(error.cpu().detach().numpy())
      self.scheduler.update(config, error)
      runtime = time.time() - start_time
      self.bookkeeping(config, error, runtime)
      print(f"  error = {error}, runtime = {runtime}")

19.2.4。簿記 HPO 算法的性能

對于任何 HPO 算法，我們最感興趣的是性能最佳的配置（稱為incumbent）及其在給定掛鐘時間后的驗證錯誤。這就是我們跟蹤runtime每次迭代的原因，其中包括運行評估的時間（調用 objective）和做出決策的時間（調用 scheduler.suggest）。在續集中，我們將繪制 cumulative_runtimeagainstincumbent_trajectory以可視化根據( 和) 定義的 HPO 算法的任何時間性能。這使我們不僅可以量化優化器找到的配置的工作情況，還可以量化優化器找到它的速度。schedulersearcher

@d2l.add_to_class(HPOTuner) #@save
def bookkeeping(self, config: dict, error: float, runtime: float):
  self.records.append({"config": config, "error": error, "runtime": runtime})
  # Check if the last hyperparameter configuration performs better
  # than the incumbent
  if self.incumbent is None or self.incumbent_error > error:
    self.incumbent = config
    self.incumbent_error = error
  # Add current best observed performance to the optimization trajectory
  self.incumbent_trajectory.append(self.incumbent_error)
  # Update runtime
  self.current_runtime += runtime
  self.cumulative_runtime.append(self.current_runtime)

19.2.5。示例：優化卷積神經網絡的超參數

我們現在使用隨機搜索的新實現來優化第 7.6 節中卷積神經網絡的批量大小和學習率。我們通過定義目標函數，這將再次成為驗證錯誤。LeNet

def hpo_objective_lenet(learning_rate, batch_size, max_epochs=10): #@save
  model = d2l.LeNet(lr=learning_rate, num_classes=10)
  trainer = d2l.HPOTrainer(max_epochs=max_epochs, num_gpus=1)
  data = d2l.FashionMNIST(batch_size=batch_size)
  model.apply_init([next(iter(data.get_dataloader(True)))[0]], d2l.init_cnn)
  trainer.fit(model=model, data=data)
  validation_error = trainer.validation_error()
  return validation_error

我們還需要定義配置空間。此外，要評估的第一個配置是第 7.6 節中使用的默認設置。

config_space = {
  "learning_rate": stats.loguniform(1e-2, 1),
  "batch_size": stats.randint(32, 256),
}
initial_config = {
  "learning_rate": 0.1,
  "batch_size": 128,
}

現在我們可以開始隨機搜索了：

searcher = RandomSearcher(config_space, initial_config=initial_config)
scheduler = BasicScheduler(searcher=searcher)
tuner = HPOTuner(scheduler=scheduler, objective=hpo_objective_lenet)
tuner.run(number_of_trials=5)

  error = 0.17130666971206665, runtime = 125.33143877983093

下面我們繪制了現任者的優化軌跡，以獲得隨機搜索的任何時間性能：

board = d2l.ProgressBoard(xlabel="time", ylabel="error")
for time_stamp, error in zip(
  tuner.cumulative_runtime, tuner.incumbent_trajectory
):
  board.draw(time_stamp, error, "random search", every_n=1)

19.2.6. 比較 HPO 算法

正如訓練算法或模型架構一樣，了解如何最好地比較不同的 HPO 算法非常重要。每次 HPO 運行取決于隨機性的兩個主要來源：訓練過程的隨機效應，例如隨機權重初始化或小批量排序，以及 HPO 算法本身的內在隨機性，例如隨機搜索的隨機抽樣。因此，在比較不同的算法時，至關重要的是多次運行每個實驗并報告基于隨機數生成器的不同種子的算法多次重復的總體統計數據，例如平均值或中值。

為了說明這一點，我們比較隨機搜索（參見第 19.1.2 節）和貝葉斯優化（Snoek等人，2012 年）在調整前饋神經網絡的超參數方面的作用。每個算法都經過評估50次使用不同的隨機種子。實線表示現任者在這些方面的平均表現 50重復和虛線標準偏差。我們可以看到隨機搜索和貝葉斯優化在大約 1000 秒內的表現大致相同，但貝葉斯優化可以利用過去的觀察來識別更好的配置，從而在之后迅速超越隨機搜索。

圖 19.2.1示例任意時間性能圖來比較兩種算法 A 和 B。

19.2.7。概括

本節列出了一個簡單而靈活的接口來實現我們將在本章中看到的各種 HPO 算法。在流行的開源 HPO 框架中可以找到類似的接口。我們還研究了如何比較 HPO 算法，以及需要注意的潛在陷阱。

19.2.8。練習

本練習的目標是為一個更具挑戰性的 HPO 問題實現目標函數，并運行更真實的實驗。我們將使用第 5.6 節DropoutMLP 中實現的兩個隱藏層 MLP 。

編寫目標函數，它應該取決于模型的所有超參數和batch_size。使用 max_epochs=50。GPU 在這里無濟于事，所以num_gpus=0. 提示：修改hpo_objective_lenet.

選擇一個合理的搜索空間，其中num_hiddens_1, num_hiddens_2是整數[8,1024], dropout 值位于[0,0.95], 而batch_size在于 [16,384]. 為提供代碼config_space，使用來自的合理分布scipy.stats。

對此示例運行隨機搜索number_of_trials=20并繪制結果。確保首先評估第 5.6 節的默認配置，即 .initial_config = {'num_hiddens_1': 256, 'num_hiddens_2': 256, 'dropout_1': 0.5, 'dropout_2': 0.5, 'lr': 0.1, 'batch_size': 256}

在本練習中，您將實現一個新的搜索器（的子類 HPOSearcher），它根據過去的數據做出決策。這取決于參數probab_local, num_init_random。它的 sample_configuration工作原理如下。對于第一次 num_init_random調用，執行與相同的操作 RandomSearcher.sample_configuration。否則，以概率，執行與相同的操作。否則，選擇迄今為止達到最小驗證錯誤的配置，隨機選擇其超參數之一，并像中一樣隨機采樣其值，但保持所有其他值相同。返回此配置，除了這個超參數外，它與迄今為止的最佳配置相同。1 - probab_localRandomSearcher.sample_configurationRandomSearcher.sample_configuration

編寫這個新的LocalSearcher. 提示：您的搜索者需要 config_space作為構造參數。隨意使用 type 的成員RandomSearcher。您還必須實施該update方法。

重新運行上一個練習中的實驗，但使用新的搜索器而不是RandomSearcher. 對,嘗試不同的值probab_local。num_init_random但是，請注意，不同 HPO 方法之間的適當比較需要多次重復實驗，并且理想情況下要考慮許多基準任務。

Discussions

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

算法

算法

+關注

關注
23

文章
4622

瀏覽量
93057
參數

參數

+關注

關注
11

文章
1840

瀏覽量
32302
pytorch

pytorch

+關注

關注
2

文章
808

瀏覽量
13249

Pytorch模型訓練實用PDF教程【中文】

？模型部分？還是優化器？只有這樣不斷的通過可視化診斷你的模型，不斷的對癥下藥，才能訓練出一個較滿意的模型。本教程內容及結構：本教程內容主要為在 PyTorch 中訓練一個模型所可能涉及到的方法及函數，并且

發表于 12-21 09:18

改善深層神經網絡--超參數優化、batch正則化和程序框架學習總結

《深度學習工程師-吳恩達》02改善深層神經網絡--超參數優化、batch正則化和程序框架學習總結

發表于 06-16 14:52

如何利用PyTorch API構建CNN?

　　很多人對于卷積神經網絡(CNN)并不了解，卷積神經網絡是一種前饋神經網絡，它包括卷積計算并具有很深的結構，卷積神經網絡是深度學習的代表性算法之一。那么如何利用PyTorch API構建CNN

發表于 07-16 18:13

pytorch模型轉換需要注意的事項有哪些？

，并且可以更積極地進行優化。支持什么格式的pytorch模型？答：Sophon的PyTorch模型編譯工具BMNETP只接受PyTorch的JIT模型JIT模型（TorchScri

發表于 09-18 08:05

調參心得:如何優化超參數的，如何證實方法是有效的

自動化超參數優化及其工具最主要的問題之一，是你常常偏離原本的工作方式。預測任務無關的超參數優化的

發表于 08-31 09:53 ?2w次閱讀

PerferredNetworks發布了其超參數優化框架的beta版本

Optuna作為超參數優化框架可以和PFN自己的深度學習框架Chainer充分結合使用。只需要在Chainer中寫接受來自Optuna的超參數

發表于 12-14 09:47 ?3114次閱讀

PyTorch教程6.2之參數管理

電子發燒友網站提供《PyTorch教程6.2之參數管理.pdf》資料免費下載

發表于 06-05 15:24 ?0次下載

PyTorch教程12.1之優化和深度學習

電子發燒友網站提供《PyTorch教程12.1之優化和深度學習.pdf》資料免費下載

發表于 06-05 15:08 ?0次下載

PyTorch教程19.1之什么是超參數優化

電子發燒友網站提供《PyTorch教程19.1之什么是超參數優化.pdf》資料免費下載

發表于 06-05 10:25 ?0次下載

PyTorch教程19.2之超參數優化API

電子發燒友網站提供《PyTorch教程19.2之超參數優化API.pdf》資料免費下載

發表于 06-05 10:27 ?0次下載

PyTorch教程19.4之多保真超參數優化

電子發燒友網站提供《PyTorch教程19.4之多保真超參數優化.pdf》資料免費下載

發表于 06-05 10:45 ?0次下載

PyTorch教程23.8之API

電子發燒友網站提供《PyTorch教程23.8之API.pdf》資料免費下載

發表于 06-05 17:48 ?0次下載

PyTorch教程-19.1. 什么是超參數優化？

19.1. 什么是超參數優化？? Colab [火炬]在 Colab 中打開筆記本 Colab [mxnet] Open the notebook in Colab Colab [jax

發表于 06-05 15:44 ?605次閱讀

PyTorch教程-19.4. 多保真超參數優化

SageMaker Studio Lab 中打開筆記本即使在中等規模的數據集上，訓練神經網絡也可能很昂貴。根據配置空間（第 19.1.1.2 節），超參數優化需要數十到數百次函數評估才能找到性能

發表于 06-05 15:44 ?447次閱讀

2.0優化PyTorch推理與AWS引力子處理器

2.0優化PyTorch推理與AWS引力子處理器

發表于 08-31 14:27 ?629次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

PyTorch教程-19.2. 超參數優化 API

評論

Pytorch模型訓練實用PDF教程【中文】

改善深層神經網絡--超參數優化、batch正則化和程序框架學習總結

如何利用PyTorch API構建CNN?

pytorch模型轉換需要注意的事項有哪些？

調參心得:如何優化超參數的，如何證實方法是有效的

PerferredNetworks發布了其超參數優化框架的beta版本

PyTorch教程6.2之參數管理

PyTorch教程12.1之優化和深度學習

PyTorch教程19.1之什么是超參數優化

PyTorch教程19.2之超參數優化API

PyTorch教程19.4之多保真超參數優化

PyTorch教程23.8之API

PyTorch教程-19.1. 什么是超參數優化？

PyTorch教程-19.4. 多保真超參數優化

2.0優化PyTorch推理與AWS引力子處理器