德國馬克斯·普朗克光學研究所的研究人員提出一種基于人工智能算法的量子糾錯系統,通過足夠的訓練,這種方法有望超過其他糾錯策略。
量子計算機可以解決傳統計算機無法完成的復雜任務。然而,量子態(quantum states)對來自外界的持續干擾極其敏感。研究人員希望使用基于量子糾錯(quantum error correction)的主動保護來解決這個問題。
近日,德國馬克斯·普朗克光學研究所所長Florian Marquardt及其團隊在物理期刊physical review X上發表論文Reinforcement Learning with Neural Networks for Quantum Feedback,提出一種基于人工智能算法的量子糾錯系統。
2016年,人工智能程序AlphaGo在圍棋比賽中擊敗了世界上最強的人類棋手,舉世矚目。鑒于一局圍棋中的移動組合比估計的宇宙中的原子的數量更多,它需要的不僅僅是處理能力。相反,AlphaGo利用了人工神經網絡,它可以識別視覺模式,甚至能夠學習。與人類不同,AlphaGo能夠在短時間內練習下數十萬局圍棋,最終得以超越最優秀的人類棋手。
馬克斯·普朗克研究所的研究人員正試圖利用這種神經網絡為量子計算機開發糾錯學習的系統。
人工神經網絡是一種模擬相互連接的神經細胞(神經元)行為的計算機程序——在這項研究中,大約有2000人工神經元相互連接。
“我們從計算機科學中獲取最新的想法,并將其應用到物理系統,”Florian Marquardt說:“這樣,我們可以從快速進步的AI領域獲益?!?/p>
學習量子糾錯:神經網絡在執行任務時,人工神經元活動的可視化
圖片來源:馬克斯普朗克光學研究所
該研究的主要想法可以概括為一下幾點:
人工神經網絡或能夠超過其他糾錯策略
在論文中,該團隊證明了人工神經網絡能夠自我學習如何執行一項對未來量子計算機操作至關重要的任務——量子糾錯。甚至通過足夠的訓練,這種方法有望超過其他糾錯策略。
為了理解它的工作原理,首先需要了解量子計算機的工作方式。量子信息的基礎是量子比特(quantum bit,或qubit)。與傳統的數字比特不同,量子比特不僅可以采用0和1兩個態,而且可以采用兩種態的疊加。
在量子計算機的處理器中,甚至有多個量子比特作為聯合態的一部分疊加在一起。這種糾纏讓量子計算機具有解決某些復雜任務的強大處理能力,而這些任務是傳統計算機毫無辦法的。
但是,量子信息對環境噪聲非常敏感。量子世界的這一特性意味著量子信息需要定期修正——即量子糾錯。然而,量子糾錯需要的操作不僅復雜,而且必須要保持量子信息本身的完整。
量子糾錯就像一場規則奇特的圍棋游戲
Marquardt在介紹該研究的工作原理時提出了一個有趣的類比,他說:“你可以把量子計算機的元素想象成一塊圍棋棋盤,量子比特像棋子一樣分布在整個棋盤上。”但是,與傳統的圍棋游戲相比有一些關鍵的區別:所有棋子都已經排列在棋盤上,而且每一枚棋子都是一面是白色一面黑色。一種顏色對應0,另一種顏色對應1,并且量子圍棋游戲中的移動相當于將棋子翻過來。根據量子世界的規則,棋子也可以是黑白混合在一起的灰色——代表量子態的疊加和糾纏。
在玩這個量子圍棋游戲時,玩家——讓我們稱她為Alice——做出的動作是為了保留代表某種量子態的模式。這就是量子糾錯操作。與此同時,她的對手竭盡全力摧毀這種模式。這代表實際的量子比特在其環境中經受的過多干擾的持續噪聲。此外,量子圍棋游戲難度特別大,因為還有一條特殊的量子規則:Alice是不允許看到棋盤的。只要一瞥見任何能揭示量子比特狀態的場景,都會摧毀游戲目前敏感的量子狀態。
問題是:在這么多限制下,她如何才能做出正確的舉動?
輔助量子比特揭示了量子計算機中的缺陷
在量子計算機中,這個問題是通過在存儲實際量子信息的量子比特之間定位額外量子比特來解決的。可以采取間斷的測量來監視這些輔助量子比特的狀態,允許量子計算機的控制器識別故障所在的位置,并對這些區域中攜帶信息的量子比特執行糾錯操作。
在作為類比的量子圍棋游戲中,輔助量子比特由在實際游戲棋子之間分布的輔助棋子來表示。Alice可以偶爾看一眼,但只能看這些輔助棋子。
在這個研究中,Alice的角色由人工神經網絡完成。研究人員的想法是,通過訓練,網絡將變得非常擅長這個角色,甚至可以超越人類所設計的糾正策略。
然而,當該團隊研究一個包含五個模擬量子比特的例子時,他們發現僅用一個人工神經網絡是不夠的。由于網絡只能收集關于量子比特狀態的少量信息,它永遠無法超越隨機試錯的策略。最終,這些嘗試破壞了量子態,而不是糾正它。
一個神經網絡使用它的先驗知識來訓練另一個神經網絡
解決方案是加一個額外的神經網絡,作為第一個網絡的教師(teacher)。憑借其對量子計算機的先驗知識,該教師網絡能夠訓練其他網絡——也就是它的學生——從而引導網絡成功地進行量子糾錯。但是,首先,教師網絡本身需要充分了解量子計算機或需要控制的量子計算機組件。
原則上,人工神經網絡使用獎勵系統進行訓練。對于量子糾錯系統,要成功恢復原始量子態,實際的獎勵是必要的。
“然而,如果在實現這個長期目標后再給予獎勵,它需要嘗試許多次糾錯,實現目標需要的時間太長,”Marquardt解釋說。
因此,他們開發了一種獎勵系統,即在訓練階段也能激勵教師神經網絡采用有效的策略。在量子圍棋游戲中,這個獎勵系統將為Alice提供給定時間內游戲的總體狀態,但不泄露細節。
學生網絡可以通過自己的行動超越老師
“我們的第一個目標是讓教師網絡學會在沒有人工協助的情況下成功地實現量子糾錯操作,”Marquardt說。與學生網絡不同,教師網絡不僅可以基于測量結果,還可以基于計算機的整體量子狀態來做到這一點。由教師網絡訓練的學生網絡一開始會變得同樣好,但通過自己的行為,可以變得更好。
除了量子計算機中的糾錯之外,Florian Marquardt還設想了人工智能的其他應用。在他看來,物理學提供了許多系統,可以受益于人工神經網絡的模式識別。
-
神經網絡
+關注
關注
42文章
4778瀏覽量
101013 -
人工智能
+關注
關注
1793文章
47592瀏覽量
239498 -
量子計算
+關注
關注
4文章
1108瀏覽量
35001
原文標題:當AI遇上量子計算:神經網絡量子糾錯系統或超越傳統糾錯策略
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論