色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何在化學(xué)和材料科學(xué)領(lǐng)域開(kāi)展有影響力的人工智能研究?(三)

向欣電子 ? 2024-12-03 01:02 ? 次閱讀

第三部分編譯后的內(nèi)容:

4.如何解決科學(xué)問(wèn)題?

在掌握了上述的工具和視角后,我們將提出一些建議,幫助您在化學(xué)領(lǐng)域選擇具有影響力的研究課題,并介紹機(jī)器學(xué)習(xí)問(wèn)題的高層次結(jié)構(gòu)。最后,我們將概述機(jī)器學(xué)習(xí)在化學(xué)研究中發(fā)展的三個(gè)主要方向:廣度、深度和規(guī)模。

4.1 Aspuru-Guzik/Whitesides 規(guī)則:選擇重要問(wèn)題的原則

當(dāng)我們的一位成員(阿斯普魯-古茲克)在哈佛大學(xué)創(chuàng)辦物質(zhì)實(shí)驗(yàn)室(2006–2018),并于2018年轉(zhuǎn)至多倫多大學(xué)時(shí),一套選擇重要問(wèn)題的規(guī)則開(kāi)始逐漸形成。在與喬治·懷特賽德的走廊對(duì)話中,懷特賽德告訴阿斯普魯-古茲克他也有類似的指導(dǎo)方針,因此在開(kāi)始任何研究之前需要明確的提出三個(gè)問(wèn)題。我們?cè)谖镔|(zhì)實(shí)驗(yàn)室每天都應(yīng)用這些問(wèn)題來(lái)選擇研究課題。在這里,盡管我們專注于化學(xué)中的機(jī)器學(xué)習(xí),但這些原則依然具有廣泛的適用性。這三個(gè)問(wèn)題依次強(qiáng)調(diào)了新穎性、重要性和可行性。

4.1.1 問(wèn)題 1:這個(gè)問(wèn)題以前解決過(guò)嗎?

在開(kāi)始一項(xiàng)科學(xué)事業(yè)之前,先問(wèn)自己這個(gè)問(wèn)題。如果這個(gè)問(wèn)題以前沒(méi)有被解決過(guò),你的解決方案將會(huì)更具影響力和持久性嗎。這是因?yàn)槲覀兊哪繕?biāo)是追求創(chuàng)新,而不是單純爭(zhēng)取排名。

在機(jī)器學(xué)習(xí)的背景下,盡管提升基準(zhǔn)成績(jī)能夠提供有價(jià)值的進(jìn)展信號(hào),但這并不是研究的最終目標(biāo)。尤其是在學(xué)術(shù)工作中,因?yàn)檠芯颗c利潤(rùn)并沒(méi)有直接關(guān)聯(lián),所以應(yīng)該盡可能的去追求新穎性。隨之而來(lái)的是,一旦確立了新的問(wèn)題,整個(gè)領(lǐng)域就會(huì)變得開(kāi)發(fā),從而就會(huì)有機(jī)會(huì)在此基礎(chǔ)上進(jìn)一步提升結(jié)果。

這項(xiàng)工作會(huì)在兩個(gè)領(lǐng)域之間建立新的聯(lián)系嗎?當(dāng)一篇論文提出的問(wèn)題多于答案時(shí),該研究領(lǐng)域就會(huì)得到發(fā)展。僅僅將機(jī)器學(xué)習(xí)方法應(yīng)用于一個(gè)新的領(lǐng)域也可以被視為一種新穎的嘗試。然而,如果所提議的方法能夠提供一個(gè)新的視角,比如將搜索問(wèn)題重新定義為生成模型的問(wèn)題,那么這種新穎性將會(huì)達(dá)到最大化。

例如,我們將3D生成模型引入到旋轉(zhuǎn)光譜學(xué)領(lǐng)域,這為僅依靠旋轉(zhuǎn)光譜學(xué)進(jìn)行3D結(jié)構(gòu)解析的問(wèn)題提供了新的思路。一個(gè)明顯的例子是,在這一領(lǐng)域,我們首次研究的成果是優(yōu)于其他任何研究的。但是,由于我們?cè)谠擃I(lǐng)域提出了首個(gè)方法,因此并沒(méi)有可供比較或基準(zhǔn)測(cè)試的機(jī)器學(xué)習(xí)基準(zhǔn)。

4.1.2 問(wèn)題 2:你要解決的問(wèn)題是否與社會(huì)相關(guān)?

在開(kāi)始一項(xiàng)科學(xué)探索之前,請(qǐng)考慮一下它是否能夠廣泛幫助他人。畢竟,我們所從事的科學(xué)直接影響著人類生活。人類與整個(gè)生物群落每天都在與人造化學(xué)物質(zhì)進(jìn)行互動(dòng)。請(qǐng)思考那些對(duì)地球重要的問(wèn)題。因?yàn)樵诔錆M環(huán)境危機(jī)和政治危機(jī)的二十一世紀(jì),這樣的考慮顯得尤為重要。

哪個(gè)受眾會(huì)對(duì)此感興趣呢?如果這個(gè)任務(wù)能夠以顯著更高的精度或速度解決,將會(huì)有哪些新的任務(wù)變得觸手可及?例如,神經(jīng)網(wǎng)絡(luò)勢(shì)之所以重要,是因?yàn)榱?chǎng)已經(jīng)被廣泛應(yīng)用于了各種計(jì)算化學(xué)方法中了,而這些方法又用于預(yù)測(cè)物質(zhì)的性質(zhì)和光譜。因此,解決這個(gè)問(wèn)題將吸引到科學(xué)界和工業(yè)界等廣泛的受眾。

可以對(duì)所提出的方法進(jìn)行實(shí)驗(yàn)測(cè)試,以驗(yàn)證它是否能夠解決計(jì)算問(wèn)題嗎?那些能夠經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證的方法通常具有更高的影響力。另一方面,如果所提出的方案“無(wú)效”,最糟糕的情況會(huì)是什么?如果新穎性選擇得當(dāng),這種風(fēng)險(xiǎn)就會(huì)降低,因?yàn)槟軌蚪鉀Q未基準(zhǔn)測(cè)試的問(wèn)題的方法已經(jīng)達(dá)到了最先進(jìn)的水平。

4.1.3 問(wèn)題 3:解決這個(gè)問(wèn)題是否有可能?

處理一個(gè)既重要又在你資源范圍內(nèi)的問(wèn)題是成功的關(guān)鍵。顯然,最有效且具有廣泛影響力的出版物將會(huì)產(chǎn)生更大的影響。因此,如果你希望你的工作被人銘記,就應(yīng)該追求那些難度較大的工作,而不是簡(jiǎn)單易得的任務(wù)。

在機(jī)器學(xué)習(xí)的領(lǐng)域,考慮以下問(wèn)題是非常有用的:可用的資源有哪些?是否有足夠的數(shù)據(jù)以達(dá)到所需的泛化性能?是否有公開(kāi)可用的代碼實(shí)現(xiàn)?是否有類似的問(wèn)題已經(jīng)通過(guò)相同的方法得到了有效解決?例如,三維生成模型在構(gòu)象搜索和對(duì)接等任務(wù)中的結(jié)構(gòu)預(yù)測(cè)成功表明,它們?cè)诰w結(jié)構(gòu)預(yù)測(cè)方面也可能取得成功。

可行性的重要組成部分是控制范圍。那么,能夠解決這個(gè)問(wèn)題的算法的最小實(shí)現(xiàn)是什么,同時(shí)又能產(chǎn)生廣泛影響?在這個(gè)問(wèn)題的范圍內(nèi),如何評(píng)估成功?

4.2 數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)問(wèn)題的結(jié)構(gòu)

機(jī)器學(xué)習(xí)和許多數(shù)據(jù)科學(xué)問(wèn)題具有一種普遍存在的結(jié)構(gòu),這在許多論文中得到了體現(xiàn)。當(dāng)你開(kāi)始研究一個(gè)選定的問(wèn)題時(shí),接下來(lái)需要考慮的內(nèi)容遵循以下層次結(jié)構(gòu):(1)數(shù)據(jù),(2)問(wèn)題框架,(3)方法,以及(4)評(píng)估。在我們的研究小組中,總是按照這個(gè)順序和層次來(lái)考慮問(wèn)題。例如,如果沒(méi)有數(shù)據(jù),科學(xué)家將無(wú)法取得進(jìn)展。提出新方法但使用舊數(shù)據(jù)的論文發(fā)表,其影響力通常不及最初提供數(shù)據(jù)(及其機(jī)器學(xué)習(xí)應(yīng)用)的論文發(fā)表。

4.2.1 可用的數(shù)據(jù)有哪些?

在機(jī)器學(xué)習(xí)中,所有事情都源于可用的數(shù)據(jù)。沒(méi)有數(shù)據(jù),任何方法都無(wú)法應(yīng)用。那么,可用數(shù)據(jù)的規(guī)模有多大?模擬新數(shù)據(jù)的難易程度如何?有哪些真實(shí)值數(shù)據(jù)可供使用,以及有哪些方法可以驗(yàn)證模型的預(yù)測(cè)?根據(jù)經(jīng)驗(yàn),當(dāng)數(shù)據(jù)集超過(guò)大約10,000個(gè)樣本時(shí),生成模型更有可能有效地進(jìn)行泛化。社區(qū)中反復(fù)解決的問(wèn)題應(yīng)當(dāng)被考慮。是否可以定期記錄這些數(shù)據(jù)?例如,在量子化學(xué)領(lǐng)域,計(jì)算力和構(gòu)象搜索等任務(wù)是標(biāo)準(zhǔn)流程,這些數(shù)據(jù)的可用性為神經(jīng)力場(chǎng)和3D結(jié)構(gòu)預(yù)測(cè)的成功做出了貢獻(xiàn)。此外,數(shù)據(jù)不僅僅是一個(gè)靜態(tài)的數(shù)據(jù)集,還可能包括實(shí)時(shí)的數(shù)據(jù)采集,例如智能體的環(huán)境或用于黑箱優(yōu)化的oracle函數(shù)。正因?yàn)閿?shù)據(jù)是至關(guān)重要的資源,所以我們小組才開(kāi)始了一個(gè)為期多年的目標(biāo),即開(kāi)發(fā)和使用自動(dòng)化實(shí)驗(yàn)室。因此我們就能夠在數(shù)據(jù)上保證自給自足了。

4.2.2 如何有效地界定問(wèn)題?

接下來(lái)的關(guān)鍵任務(wù)是有效地構(gòu)建問(wèn)題框架。構(gòu)建框架不僅重要于確保選擇表1中的合適工具,還為基準(zhǔn)測(cè)試和理論分析提供了基礎(chǔ)。問(wèn)題框架應(yīng)基于領(lǐng)域知識(shí):需要解決哪些具體挑戰(zhàn)以支持下游任務(wù),例如實(shí)驗(yàn)驗(yàn)證?例如,通過(guò)生成晶體結(jié)構(gòu)作為3D單元格進(jìn)行材料設(shè)計(jì),可能難以轉(zhuǎn)化為實(shí)際材料,因?yàn)閷?shí)驗(yàn)人員無(wú)法對(duì)結(jié)構(gòu)進(jìn)行原子級(jí)的控制。問(wèn)題框架本身往往能夠決定所提議研究的新穎性和重要性:在化學(xué)問(wèn)題與機(jī)器學(xué)習(xí)問(wèn)題之間建立新的聯(lián)系會(huì)產(chǎn)生新穎性,而性能的顯著提升則能增強(qiáng)其重要性。

另一種處理問(wèn)題框架的方法是詢問(wèn)數(shù)據(jù)如何表示。選擇一種緊湊、信息豐富且計(jì)算效率高的表示方式,是融入歸納偏差并加速學(xué)習(xí)的有效途徑。然而,正如“痛苦的教訓(xùn)”這部分所示,我們不必在設(shè)計(jì)“完美”表示上花費(fèi)過(guò)多時(shí)間。如果輸入表示包含了所有必要信息,并且數(shù)量足夠大,深度學(xué)習(xí)能夠自動(dòng)找到理想的表示形式。

4.2.3 哪種模型可以解決這個(gè)問(wèn)題?

當(dāng)問(wèn)題明確后,模型的選擇通常變得清晰且合理。哪些機(jī)器學(xué)習(xí)方法適合這個(gè)任務(wù)?簡(jiǎn)單的方法能否解決這個(gè)問(wèn)題?已建立的方法,如Morgan指紋和XGBoost,仍然是屬性預(yù)測(cè)的強(qiáng)基準(zhǔn),而遺傳算法則是分子生成的強(qiáng)基準(zhǔn)。如果簡(jiǎn)單的方法無(wú)法奏效,那么是否有新的算法適合這個(gè)問(wèn)題?是否有現(xiàn)成的代碼可以在線獲取?在嘗試?yán)斫獯a之前,先運(yùn)行代碼可能會(huì)更簡(jiǎn)單。如何盡量少地修改用于解決其他問(wèn)題的代碼實(shí)現(xiàn),以便解決當(dāng)前的問(wèn)題?選擇與數(shù)據(jù)規(guī)模和可用性相匹配的算法。而對(duì)于小型數(shù)據(jù)集來(lái)說(shuō),經(jīng)典機(jī)器學(xué)習(xí)仍然是表現(xiàn)最佳的。

這可能是本論文中最重要的段落:給研究生和博士后的黃金建議,切勿迷戀新方法論的誘惑。如果舊的方法論已經(jīng)被證明有效,那就直接使用它!要專注于你工作的科學(xué)貢獻(xiàn)。當(dāng)其他方法確實(shí)存在局限性時(shí),才應(yīng)該開(kāi)發(fā)新方法。換句話說(shuō),你的新型自編碼器在長(zhǎng)期內(nèi)的影響力,遠(yuǎn)不如你解決一個(gè)重要的化學(xué)或材料科學(xué)問(wèn)題所帶來(lái)的深遠(yuǎn)影響,因?yàn)檫@樣的答案能夠持久存在。

4.2.4 如何評(píng)估提議的方法?

最后,必須根據(jù)領(lǐng)域知識(shí)提供的合理指標(biāo)來(lái)評(píng)估該方法。這些指標(biāo)是否反映了提議的方法在實(shí)際應(yīng)用中的真實(shí)情況?例如,如果您正在生成并提議新的分子,那么化學(xué)家是否能夠合成這些分子并測(cè)試其性質(zhì)?確定適當(dāng)?shù)闹笜?biāo)是至關(guān)重要的,因?yàn)槲磥?lái)的工作很可能會(huì)采用相同的評(píng)估標(biāo)準(zhǔn)。

4.3 新問(wèn)題:機(jī)器學(xué)習(xí)對(duì)化學(xué)的影響需求

將機(jī)器學(xué)習(xí)應(yīng)用于化學(xué)領(lǐng)域可以在應(yīng)用廣度、考慮深度和執(zhí)行規(guī)模方面產(chǎn)生更大的影響。在應(yīng)用廣度上,許多化學(xué)問(wèn)題可以被重新定義為機(jī)器學(xué)習(xí)問(wèn)題,并引入到機(jī)器學(xué)習(xí)社區(qū)中。在考慮深度上,所提出的方法能夠在機(jī)器學(xué)習(xí)與計(jì)算化學(xué)之間建立更強(qiáng)的理論聯(lián)系,從而推動(dòng)兩個(gè)領(lǐng)域的進(jìn)一步方法開(kāi)發(fā)。最后,在執(zhí)行規(guī)模上,針對(duì)更重要的問(wèn)題,化學(xué)領(lǐng)域的機(jī)器學(xué)習(xí)可以利用更多的數(shù)據(jù)。隨著人們對(duì)語(yǔ)言和視覺(jué)領(lǐng)域網(wǎng)絡(luò)規(guī)模數(shù)據(jù)達(dá)到極限的擔(dān)憂加劇,而化學(xué)領(lǐng)域卻因其可以通過(guò)計(jì)算模擬或高通量實(shí)驗(yàn)“獲取”更多的數(shù)據(jù)而脫穎而出。

4.3.1 解決問(wèn)題的廣度

在第2節(jié)中,我們觀察到機(jī)器學(xué)習(xí)在化學(xué)問(wèn)題上的多樣性應(yīng)用,但許多化學(xué)領(lǐng)域仍然未被充分探索。以下是一些機(jī)器學(xué)習(xí)仍在不斷發(fā)展的化學(xué)領(lǐng)域,順序不分先后:光化學(xué)、化學(xué)教育、核化學(xué)、農(nóng)化學(xué)、分析化學(xué)、電化學(xué)、天體化學(xué)、非晶材料、軟材料、開(kāi)放量子系統(tǒng)、環(huán)境化學(xué)和大氣化學(xué),僅舉幾例。在每個(gè)領(lǐng)域中,都存在一些可以根據(jù)可用數(shù)據(jù)構(gòu)建為機(jī)器學(xué)習(xí)問(wèn)題的任務(wù)。這些任務(wù)不僅限于對(duì)純小有機(jī)分子的理想狀態(tài)進(jìn)行研究。此外,異質(zhì)材料、量子材料和復(fù)雜混合物等都帶來(lái)了新的挑戰(zhàn),而這些挑戰(zhàn)恰恰可以從機(jī)器學(xué)習(xí)的創(chuàng)新中受益。正如第2.5節(jié)所提到的,現(xiàn)實(shí)世界中的大多數(shù)物質(zhì)都是復(fù)雜的混合物。

關(guān)鍵在于不要“強(qiáng)迫”機(jī)器學(xué)習(xí)進(jìn)入這些領(lǐng)域,而是要考慮現(xiàn)有的或新穎的任務(wù)是否可以被視為機(jī)器學(xué)習(xí)問(wèn)題(見(jiàn)表1)。這樣做將有助于實(shí)現(xiàn)迭代改進(jìn),并可能催生新的算法。在某些情況下,可能沒(méi)有足夠的數(shù)據(jù)來(lái)應(yīng)用機(jī)器學(xué)習(xí),但確保新穎性的一種簡(jiǎn)單方法是關(guān)注一個(gè)尚未充分被探索的領(lǐng)域。

回到我們之前的例子,我們很高興運(yùn)用機(jī)器學(xué)習(xí)解決旋轉(zhuǎn)光譜學(xué)中的一個(gè)重要結(jié)構(gòu)確定問(wèn)題:首次應(yīng)用生成模型來(lái)預(yù)測(cè)給定替代坐標(biāo)的分子的三維結(jié)構(gòu)。這是一個(gè)典型的廣度方法示例,旨在尋求多學(xué)科的方法,并讓我們走出自己的舒適區(qū)。

4.3.2 解決問(wèn)題的深度

正如我們?cè)诘?.2.2節(jié)討論應(yīng)用驅(qū)動(dòng)的創(chuàng)新在機(jī)器學(xué)習(xí)(ML)中的作用時(shí)所看到的,化學(xué)問(wèn)題激發(fā)了新算法的產(chǎn)生以及高級(jí)機(jī)器學(xué)習(xí)理論的發(fā)展。而深入?yún)⑴c機(jī)器學(xué)習(xí)理論或理論化學(xué)的研究能夠帶來(lái)新穎性和重要性,并且通常能夠帶來(lái)更加穩(wěn)健的實(shí)證結(jié)果。

許多機(jī)器學(xué)習(xí)方法,例如圖神經(jīng)網(wǎng)絡(luò)和等變架構(gòu),就是受到理論化學(xué)所啟發(fā)的,并開(kāi)始對(duì)這一領(lǐng)域產(chǎn)生影響。再者,擴(kuò)散模型于2015年提出,靈感來(lái)源于統(tǒng)計(jì)力學(xué)中的方法,自那時(shí)起,它們已成為最先進(jìn)的生成模型,使得高分辨率的文本到圖像生成成為可能。近十年后,新研究將擴(kuò)散模型與計(jì)算化學(xué)中的傳統(tǒng)工具聯(lián)系了起來(lái)。使得擴(kuò)散模型能夠同時(shí)學(xué)習(xí)粗粒度力場(chǎng)和生成模型,并且還可以作為采樣和計(jì)算自由能的一種手段。這些研究的開(kāi)展離不開(kāi)對(duì)擴(kuò)散模型與自由能之間關(guān)系的深入探討,以及對(duì)擴(kuò)散分布與理想氣體之間聯(lián)系的理解。

此外,從擴(kuò)散模型衍生的流匹配方法放寬了將數(shù)據(jù)分布噪聲化為純高斯分布的限制,從而能夠連接兩種不同的數(shù)據(jù)分布。這使得軌跡學(xué)習(xí)成為可能,并且這一技術(shù)已經(jīng)開(kāi)始應(yīng)用于反應(yīng)的過(guò)渡路徑采樣。這些研究建立了理論上的聯(lián)系,可能促使更多技術(shù)在計(jì)算化學(xué)與機(jī)器學(xué)習(xí)之間進(jìn)行轉(zhuǎn)移。

此外,神經(jīng)網(wǎng)絡(luò)勢(shì)能將能量計(jì)算視為一個(gè)需要記憶的黑箱函數(shù),而哈密頓預(yù)測(cè)則揭示了哈特里–福克理論(Hartree–Fock theory)的內(nèi)部機(jī)制,使我們能夠獲取波函數(shù),并在準(zhǔn)確性與速度之間實(shí)現(xiàn)新的平衡。自洽訓(xùn)練則通過(guò)不再需要提供哈密頓矩陣作為標(biāo)簽來(lái)與這一理論相結(jié)合,從而整體上提高了密度泛函理論(DFT)的計(jì)算速度。

與實(shí)驗(yàn)人員合作,針對(duì)具體的設(shè)計(jì)目標(biāo)進(jìn)行研究,為我們提供了必要的深度。在真實(shí)世界的問(wèn)題通常需要將機(jī)器學(xué)習(xí)與實(shí)驗(yàn)數(shù)據(jù)相結(jié)合,而這樣的合作能夠帶來(lái)在單獨(dú)研究狀態(tài)下無(wú)法實(shí)現(xiàn)的突破。如量子化學(xué)、機(jī)器學(xué)習(xí)和有機(jī)材料化學(xué)領(lǐng)域的專家之間的大規(guī)模合作促成了新型有機(jī)發(fā)光二極管OLEDs)的發(fā)現(xiàn)。在這項(xiàng)工作中,我們是首批證明基于指紋的機(jī)器學(xué)習(xí)方法、智能篩選方法和實(shí)驗(yàn)驗(yàn)證能夠在在閉環(huán)理念下推動(dòng)新材料開(kāi)發(fā)的團(tuán)隊(duì)之一。

我們的團(tuán)隊(duì)最近參與了一項(xiàng)為期五年的國(guó)際合作,涉及六個(gè)研究小組。這項(xiàng)合作的成果是一個(gè)去局部化、非同步的閉環(huán)設(shè)計(jì),從而產(chǎn)生了迄今為止最好的有機(jī)激光材料(據(jù)我們所知)。同時(shí),另一項(xiàng)關(guān)于閉環(huán)設(shè)計(jì)的多學(xué)科合作也證明,機(jī)器學(xué)習(xí)能夠通過(guò)深入的材料科學(xué)探索,為我們揭示新的化學(xué)原理。

4.3.3 解決問(wèn)題的規(guī)模

如第3.2.3節(jié)所示,規(guī)模的非凡有效性為解決更復(fù)雜的問(wèn)題帶來(lái)了樂(lè)觀的前景。如蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)等著名問(wèn)題最終通過(guò)利用蛋白質(zhì)數(shù)據(jù)庫(kù)(Protein Data Bank)的規(guī)模得以攻克的。而快速且能達(dá)到量子力學(xué)上精度的原子動(dòng)力學(xué)正在由基礎(chǔ)力場(chǎng)實(shí)現(xiàn)。

對(duì)于那些已經(jīng)在機(jī)器學(xué)習(xí)(ML)中形式化的化學(xué)問(wèn)題,僅僅通過(guò)擴(kuò)大數(shù)據(jù)和計(jì)算的規(guī)模,就能加速進(jìn)展。像開(kāi)放催化劑項(xiàng)目(Open Catalyst Project)這樣的項(xiàng)目展示了機(jī)器學(xué)習(xí)在推動(dòng)化學(xué)領(lǐng)域?qū)崿F(xiàn)大規(guī)模進(jìn)展方面的潛力。通過(guò)計(jì)算和模擬獲取新數(shù)據(jù),并設(shè)計(jì)更好的采樣算法,我們可以提高數(shù)據(jù)生成的速度,從而朝著規(guī)模化目標(biāo)努力。例如,大型語(yǔ)言模型智能體(LLM agents)可以執(zhí)行計(jì)算模擬,以生成新的訓(xùn)練數(shù)據(jù),從而進(jìn)一步加快研究的進(jìn)展。

雖然訓(xùn)練基礎(chǔ)模型常被視為導(dǎo)致大量排放的原因,但我們也應(yīng)關(guān)注計(jì)算能力在減少排放方面的潛力。更好的模型可能會(huì)減少所需的濕實(shí)驗(yàn)數(shù)量,或有助于設(shè)計(jì)更環(huán)保的替代方案來(lái)應(yīng)對(duì)當(dāng)前和未來(lái)的化學(xué)過(guò)程。值得一提的是,化學(xué)工業(yè)在全球排放中占據(jù)了相當(dāng)大的比例。

化學(xué)空間的規(guī)模可能相對(duì)較小。常被引用的化學(xué)空間估計(jì)大小為10^60^,這讓人感到著迷。然而,從機(jī)器學(xué)習(xí)的角度來(lái)看,這個(gè)空間可以被認(rèn)為是小的。如果我們僅考慮黑白28 × 28的圖像,也就是標(biāo)準(zhǔn)手寫數(shù)字?jǐn)?shù)據(jù)庫(kù)MNIST的數(shù)據(jù),這個(gè)空間的大小已經(jīng)是2^(28×28)^ ≈ 10^236^。當(dāng)然,圖像的空間要稀疏得多,因?yàn)楝F(xiàn)存的彩色圖像數(shù)量約為14.3萬(wàn)億(≈ 10^13^張)。這正是深度學(xué)習(xí)令人印象深刻之處——它能夠僅通過(guò)展示一堆示例,就能在極高維的空間中找到結(jié)構(gòu)。在語(yǔ)言的背景下,10^60^僅僅是限制在60個(gè)詞匯內(nèi)的10個(gè)單詞句子的數(shù)量,或者是限制在60個(gè)可能句子的10個(gè)句子段落的數(shù)量。顯然,自然語(yǔ)言的規(guī)模要大得多。

這些強(qiáng)大的能力能否將理論思考變?yōu)楝F(xiàn)實(shí)?想象一下,能夠在宏觀時(shí)間尺度上對(duì)一個(gè)細(xì)胞進(jìn)行原子級(jí)模擬,或者準(zhǔn)確地模擬柔性有機(jī)電子設(shè)備在長(zhǎng)年使用過(guò)程中的有效性和穩(wěn)定性,抑或是從頭開(kāi)始發(fā)現(xiàn)新的反應(yīng)。這些挑戰(zhàn)直到最近似乎都遙不可及。而令我們感到驚訝的是,利用神經(jīng)力場(chǎng)進(jìn)行全原子HIV蛋殼的納秒模擬在DFT精度下卻是可行的。如果現(xiàn)代圖像生成模型能夠生成1024 × 1024分辨率及更高質(zhì)量的圖像,那么究竟是什么阻礙了在生物時(shí)間尺度上模擬整個(gè)細(xì)胞的進(jìn)程?如果障礙是數(shù)據(jù),我們很幸運(yùn)能夠獲得越來(lái)越多復(fù)雜的模擬以及能夠獨(dú)立生成高質(zhì)量數(shù)據(jù)的自動(dòng)化實(shí)驗(yàn)室。如果障礙是計(jì)算能力,我們也有幸借助主流人工智能帶來(lái)的計(jì)算能力大幅提升。如果問(wèn)題出在方法或?qū)嶒?yàn)上,那么作為21世紀(jì)的跨學(xué)科理論化學(xué)家,我們需要共同行動(dòng):讓我們一起推動(dòng)學(xué)科的變革吧。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7081

    瀏覽量

    89201
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47437

    瀏覽量

    238982
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8425

    瀏覽量

    132772
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    EBSD在材料科學(xué)中的優(yōu)勢(shì)分析

    材料科學(xué)中,對(duì)晶體結(jié)構(gòu)和晶粒取向的深入研究對(duì)于揭示材料性能具有決定性作用。傳統(tǒng)技術(shù),如X光衍射和中子衍射,雖然能夠提供宏觀層面的晶體結(jié)構(gòu)和取向信息,但它們無(wú)法將這些信息與微觀結(jié)構(gòu)直接關(guān)聯(lián),也無(wú)
    的頭像 發(fā)表于 12-26 14:46 ?202次閱讀
    EBSD在<b class='flag-5'>材料科學(xué)</b>中的優(yōu)勢(shì)分析

    安泰高電壓功率放大器:材料科學(xué)與工程學(xué)科研究的重要推手!

    材料科學(xué)與工程是一門涵蓋廣泛領(lǐng)域的學(xué)科,涉及固體物理學(xué)、化學(xué)、工程學(xué)等多個(gè)學(xué)科的交叉領(lǐng)域。 高壓功率放大器 作為材料測(cè)試
    的頭像 發(fā)表于 12-23 11:02 ?122次閱讀
    安泰高電壓功率放大器:<b class='flag-5'>材料科學(xué)</b>與工程學(xué)科<b class='flag-5'>研究</b>的重要推手!

    電子背散射衍射技術(shù)(EBSD)在材料科學(xué)中的應(yīng)用與解讀

    EBSD技術(shù)的革新電子背散射衍射技術(shù)(EBSD)以其獨(dú)特的分析能力,成為了揭示材料微觀結(jié)構(gòu)秘密的關(guān)鍵技術(shù)盡管EBSD技術(shù)的商業(yè)應(yīng)用起步較晚,但其發(fā)展勢(shì)頭強(qiáng)勁,迅速成為材料科學(xué)研究中的核心工具
    的頭像 發(fā)表于 12-16 17:17 ?322次閱讀
    電子背散射衍射技術(shù)(EBSD)在<b class='flag-5'>材料科學(xué)</b>中的應(yīng)用與解讀

    何在化學(xué)材料科學(xué)領(lǐng)域開(kāi)展有影響力的人工智能研究?(二)

    研究人員和社區(qū)的高層視角出發(fā),探討他們?nèi)绾慰创徒鉀Q問(wèn)題。首先,我們將重新分類前文提到的各種化學(xué)問(wèn)題,將其作為已確認(rèn)的機(jī)器學(xué)習(xí)問(wèn)題實(shí)例。然后,再通過(guò)梳理機(jī)器學(xué)習(xí)社區(qū)共
    的頭像 發(fā)表于 12-03 01:02 ?239次閱讀
    如<b class='flag-5'>何在</b><b class='flag-5'>化學(xué)</b>和<b class='flag-5'>材料科學(xué)</b><b class='flag-5'>領(lǐng)域</b><b class='flag-5'>開(kāi)展</b><b class='flag-5'>有影響力</b><b class='flag-5'>的人工智能</b><b class='flag-5'>研究</b>?(二)

    何在化學(xué)材料科學(xué)領(lǐng)域開(kāi)展有影響力的人工智能研究?(一)

    寫在開(kāi)頭近期,我有幸參加了多場(chǎng)既包括學(xué)術(shù)研討又涵蓋業(yè)界實(shí)踐的會(huì)議,這些會(huì)議都集中討論了人工智能科學(xué)的結(jié)合。而通過(guò)這些深入的交流讓我深刻體會(huì)到,在科學(xué)技術(shù)領(lǐng)域中,尤其是‘AIforScience
    的頭像 發(fā)表于 12-03 01:02 ?1371次閱讀
    如<b class='flag-5'>何在</b><b class='flag-5'>化學(xué)</b>和<b class='flag-5'>材料科學(xué)</b><b class='flag-5'>領(lǐng)域</b><b class='flag-5'>開(kāi)展</b><b class='flag-5'>有影響力</b><b class='flag-5'>的人工智能</b><b class='flag-5'>研究</b>?(一)

    共聚焦激光顯微鏡在材料科學(xué)中的應(yīng)用

    材料科學(xué)研究材料的結(jié)構(gòu)、性質(zhì)、加工和應(yīng)用的學(xué)科。隨著科技的發(fā)展,對(duì)材料性能的要求越來(lái)越高,這就需要更精確的表征手段來(lái)研究
    的頭像 發(fā)表于 10-30 09:44 ?260次閱讀

    電子背散射衍射(EBSD)在材料科學(xué)中的應(yīng)用與解讀

    EBSD技術(shù)的興起與成熟電子背散射衍射(EBSD)技術(shù),作為材料科學(xué)領(lǐng)域的一項(xiàng)革命性技術(shù),自其商業(yè)化以來(lái),已經(jīng)迅速成為材料研究者們的重要工具。這一技術(shù)的發(fā)展得益于信息技術(shù)的飛速進(jìn)步,使
    的頭像 發(fā)表于 10-29 16:14 ?277次閱讀
    電子背散射衍射(EBSD)在<b class='flag-5'>材料科學(xué)</b>中的應(yīng)用與解讀

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    幸得一好書,特此來(lái)分享。感謝平臺(tái),感謝作者。受益匪淺。 在閱讀《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》的第6章后,我深刻感受到人工智能在能源科學(xué)
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    很幸運(yùn)社區(qū)給我一個(gè)閱讀此書的機(jī)會(huì),感謝平臺(tái)。 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章關(guān)于AI與生命科學(xué)的部分,為我們揭示了人工智能技術(shù)在生命
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    人工智能科學(xué)研究中的核心技術(shù),包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等。這些技術(shù)構(gòu)成了AI for Science的基石,使得AI能夠處理和分析復(fù)雜的數(shù)據(jù)集,從而發(fā)現(xiàn)隱藏在數(shù)據(jù)中的模式和規(guī)律。 2. 高性能
    發(fā)表于 10-14 09:16

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    的效率,還為科學(xué)研究提供了前所未有的洞察和精確度。例如,在生物學(xué)領(lǐng)域,AI能夠幫助科學(xué)家快速識(shí)別基因序列中的關(guān)鍵變異,加速新藥研發(fā)進(jìn)程。 2. 跨學(xué)科融合的新范式 書中強(qiáng)調(diào),
    發(fā)表于 10-14 09:12

    DSC:材料科學(xué)的洞察之眼

    材料科學(xué)的探索之旅中,差示掃描量熱儀(DifferentialScanningCalorimetry,簡(jiǎn)稱DSC)猶如一把精準(zhǔn)的鑰匙,開(kāi)啟著材料性能的奧秘之門。DSC,這一精密的熱分析技術(shù),通過(guò)
    的頭像 發(fā)表于 09-09 16:26 ?1217次閱讀
    DSC:<b class='flag-5'>材料科學(xué)</b>的洞察之眼

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.44】AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新

    材料基因組工程的推動(dòng)下,人工智能如何與材料科學(xué)結(jié)合,加快傳統(tǒng)材料和新型材料的開(kāi)發(fā)過(guò)程。 第4章介紹了人工
    發(fā)表于 09-09 13:54

    安泰高壓放大器在極化特性及在材料科學(xué)中的應(yīng)用

    材料科學(xué)中的極化特性是指材料中電荷分布的變化現(xiàn)象。這一特性不僅對(duì)材料的電學(xué)性質(zhì)產(chǎn)生深遠(yuǎn)影響,而且在各種應(yīng)用中發(fā)揮著關(guān)鍵作用。下面將深入探討極化特性的概念以及它在材料科學(xué)中的多重應(yīng)用。
    的頭像 發(fā)表于 09-04 14:49 ?359次閱讀
    安泰高壓放大器在極化特性及在<b class='flag-5'>材料科學(xué)</b>中的應(yīng)用

    差示掃描量熱儀在材料科學(xué)領(lǐng)域的應(yīng)用

    差示掃描量熱儀在材料科學(xué)領(lǐng)域被廣泛應(yīng)用,主要用于研究材料在加熱或冷卻過(guò)程中的熱性質(zhì)和相變行為。利用差示掃描量熱法可以測(cè)量材料的熔點(diǎn)、玻璃化轉(zhuǎn)
    的頭像 發(fā)表于 06-28 11:23 ?322次閱讀
    差示掃描量熱儀在<b class='flag-5'>材料科學(xué)</b><b class='flag-5'>領(lǐng)域</b>的應(yīng)用
    主站蜘蛛池模板: 天堂色| 快播电影官方网站| 永久免费看mv网站入口| 王晶三级作品| 人妻换人妻AA视频| 欧美内射AAAAAAXXXXX| 久久精品中文闷骚内射| 国产在线综合色视频| 国产精品人妻在线观看| 高hnp全肉| old老男人野外树林tv| 99re这里只有精品国产| 中文字幕在线视频网站| 中文字幕AV亚洲精品影视| 亚洲色图p| 亚洲免费在线观看| 亚洲青青草原| 伊人久久精品99热超碰| 伊人久久大香线蕉综合色啪| 一品道门免费高清视频| 一个人免费完整观看日本| 一本道dvd久久综合高清免费| 亚洲欧洲日产国码中学| 野花日本大全免费高清完整版| 亚洲色欲色欲WWW在线丝| 妖精视频一区二区免费| 真人美女精美小穴| 99re8在线视频精品| www.99在线| 国产不卡无码高清视频| 国产精品久久人妻无码蜜| 果冻传媒完整免费网站在线观看 | 亚洲人成色777777老人头| 亚洲欧美高清在线精品一区| 又亲又揉摸下面视频免费看| 最近中文字幕免费高清MV视频| 7723日本高清完整版在线观看| J午夜精品久久久久久毛片| 国产成人ae在线观看网站站| 国产自产第一区c国产| 久久久久久电影|