亚洲国产欧美国产第一区,中国一级毛片在线观看,亚洲穿环

“對我而言，回答了自己心中的問題或者做出一個新的發(fā)現(xiàn)，這種成就感要遠(yuǎn)高于生活中的其他快樂。”李婧翌對《麻省理工科技評論》中國這樣說道。

而她的研究內(nèi)容在很多人眼里或許稍顯枯燥：針對前沿的生物學(xué)問題開發(fā)新的統(tǒng)計學(xué)方法，尤其著重于對大規(guī)模基因組和轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行分析方法的開發(fā)。

由于高通量實驗技術(shù)的發(fā)展，生命科學(xué)從一個靠觀察實驗為主的學(xué)科逐漸變得更加需要定量化，而這些大規(guī)模數(shù)據(jù)的產(chǎn)生也需要算法才能夠進(jìn)行分析，從而總結(jié)出數(shù)學(xué)規(guī)律并用規(guī)律來刻畫事物的本質(zhì)。

加州大學(xué)洛杉磯分校（UCLA）統(tǒng)計系（已獲得終身教職）副教授和博士生導(dǎo)師，生物統(tǒng)計系、人類遺傳學(xué)系和計算醫(yī)學(xué)系博士生導(dǎo)師李婧翌認(rèn)為，生命科學(xué)作為一個“宏科學(xué)”，盡管問題的本質(zhì)與生命強(qiáng)相關(guān)，但研究手段需要各個學(xué)科一起合作，計算則是其中非常重要的一部分，大數(shù)據(jù)也需要有非常適合的挖掘工具，這對于從小對數(shù)學(xué)與科學(xué)有強(qiáng)烈興趣、并在本科與博士階段分別接受了生命科學(xué)與生物統(tǒng)計學(xué)系統(tǒng)教育的李婧翌有強(qiáng)大的吸引。

李婧翌的研究專注于統(tǒng)計學(xué)與生命科學(xué)的交叉問題，她首創(chuàng)性地使用嚴(yán)格的統(tǒng)計學(xué)來分析已發(fā)表的轉(zhuǎn)錄組學(xué)和蛋白組學(xué)數(shù)據(jù)，發(fā)現(xiàn)在過往研究中，由于研究人員對測量誤差的忽略，轉(zhuǎn)錄的重要性被嚴(yán)重低估，該分析挑戰(zhàn)了“翻譯比轉(zhuǎn)錄重要”的觀點卻支持了之前大量在 mRNA 轉(zhuǎn)錄水平的科學(xué)發(fā)現(xiàn)。因其重要性，李婧翌的研究結(jié)果被發(fā)表在 Science 雜志并收錄于本科教材 Molecular Cell Biology 中。

圖 | 左圖是論文 B.Schwanh?usseretal.,Nature473,337(2011) 中在不考慮實驗數(shù)據(jù)誤差的情況下對轉(zhuǎn)錄、翻譯、mRNA 降解和蛋白質(zhì)降解這四個步驟對于蛋白質(zhì)含量的貢獻(xiàn)的估計；右圖是在校正了實驗數(shù)據(jù)誤差之后的估計。（來源：李婧翌的論文 Li et al. (2015). Statistics requantitates the central dogma. Science347(6226):1066-1067.）

此外，李婧翌團(tuán)隊還開發(fā)了大量生物信息學(xué)工具在組織和單細(xì)胞水平上對 mRNA 分子進(jìn)行全系統(tǒng)測量，并正在開發(fā)一項能夠?qū)ふ业饺巳簛喰椭泻图膊∠嚓P(guān)的基因變異的新的統(tǒng)計度量。

憑借上述優(yōu)異的研究成果，李婧翌成功入選《麻省理工科技評論》“35 歲以下科技創(chuàng)新 35 人”（Innovators Under 35）2020 年中國區(qū)榜單。

圖 |《麻省理工科技評論》“35 歲以下科技創(chuàng)新 35 人”2020 年中國區(qū)榜單入選者李婧翌

無心插柳，卻顛覆固有認(rèn)知

早在 1958 年，中心轉(zhuǎn)錄法則便被提出，它指的是遺傳信息被編碼在 DNA 中，通過轉(zhuǎn)錄會變成 mRNA，再通過翻譯的過程變成蛋白質(zhì)，這是所有有細(xì)胞結(jié)構(gòu)的生物所遵循的法則。在這個過程中，除了轉(zhuǎn)錄和翻譯生成了 mRNA 和蛋白質(zhì)這兩個步驟，還存在 mRNA 和蛋白質(zhì)的降解，這四個步驟共同決定了每一個基因所對應(yīng)的蛋白質(zhì)到底在我們細(xì)胞中存在多少量。不過，此前中心轉(zhuǎn)錄法則是一個定性表述，“沒有人知道每一步的速率是多少，也沒有人知道對最后蛋白質(zhì)含量的影響有多少。” 在李婧翌博士即將畢業(yè)之時，她與合作者 Mark Biggin 博士共同研究中心轉(zhuǎn)錄法則的定量工作。偶然的一次機(jī)會，李婧翌和合作者發(fā)現(xiàn)，2011 年發(fā)表在Nature上的一篇文章首次在小鼠的全基因組的基因中進(jìn)行了 4 項步驟的測量，其得出的結(jié)論是每個基因的 mRNA 的含量對于蛋白質(zhì)含量的預(yù)測效果比較差，也就是說一個基因內(nèi) mRNA 的高或低并不太能代表它的蛋白質(zhì)含量的高或低。 “這在當(dāng)時是個非常讓人震驚的結(jié)論。因為我們有很多實驗手段可以用來研究 mRNA，但是研究蛋白質(zhì)相對困難很多，所以大量生物學(xué)的發(fā)現(xiàn)成果都圍繞 mRNA 的含量水平。如果這篇文章的結(jié)果為真，那么之前很多 mRNA 的結(jié)果可能都沒有什么意義了。”李婧翌解釋道。當(dāng)李婧翌與合作伙伴看到這篇文章時，他們觀察到這項工作是將高通量質(zhì)譜轉(zhuǎn)化為蛋白質(zhì)含量，但在轉(zhuǎn)化過程中，它的標(biāo)準(zhǔn)實際上只基于高表達(dá)蛋白，并假設(shè)同樣的轉(zhuǎn)換方式也適用于低表達(dá)蛋白，由此導(dǎo)致了研究里面很多低表達(dá)蛋白的表達(dá)指征是很不準(zhǔn)的，也就意味著高通量蛋白質(zhì)測量很有可能存在誤差。為了解決這一疑惑，李婧翌將實驗誤差考慮進(jìn)建模后發(fā)現(xiàn)，實際上 mRNA 和蛋白質(zhì)含量的相關(guān)性比 Nature 的文章報道的要高很多，轉(zhuǎn)錄的重要性被嚴(yán)重低估。這項“無心插柳”的研究結(jié)果被發(fā)表在 Science 雜志并收錄于本科教材 Molecular Cell Biology 中。李婧翌對《麻省理工科技評論》中國回憶道：“我覺得很有趣的一點是，我們將很基本的統(tǒng)計方法用到了正確的問題上，從而發(fā)現(xiàn)了非常意想不到的結(jié)果。這也說明了考慮數(shù)據(jù)測量的隨機(jī)性和數(shù)據(jù)噪音對科學(xué)結(jié)論十分重要。”這一年，李婧翌還不到 30 歲。科研與教育同樣重要作為一個青年科學(xué)家，李婧翌認(rèn)為，保持對未知問題的好奇心，用研究拓寬人類的知識邊界，是支撐她科研工作的重要推動力。作為一個科研人員，李婧翌認(rèn)為目前的統(tǒng)計分析還遠(yuǎn)遠(yuǎn)談不上科學(xué)，“如果一個分析人員在寫研究報告時沒有記錄分析的每一步，而只是簡略地記錄一個結(jié)果，那最終結(jié)果就不太透明，并且可能也不能被重復(fù)，可信度就要大打折扣。” 此外，李婧翌提到，如果要將最新研究的統(tǒng)計學(xué)方法發(fā)表在比較好的學(xué)術(shù)雜志上，通常情況下做的越復(fù)雜越容易發(fā)表，這就導(dǎo)致統(tǒng)計學(xué)領(lǐng)域出現(xiàn)一個通病：很多統(tǒng)計方法都比較像“黑箱”，它們過于復(fù)雜，也沒有給實際應(yīng)用的人員講授清楚優(yōu)缺點到底在哪里。

圖 | 對于同樣的一套多個病人樣本中的基因表達(dá)數(shù)據(jù)，病人是觀測值，而基因是特征。大部分的病人已知得病或未得病。如果研究問題是：基因A是否為一個有效的疾病標(biāo)志物，那么假設(shè)檢驗是合適的統(tǒng)計方法。而如果研究問題是：1號病人是否得病，那么二元分類是合適的統(tǒng)計方法。（來源：李婧翌的論文Li et al. (2020). Statistical hypothesis testing versus machine-learning binary classification: distinctions and guidelines. Patterns 1(7):110115.）

作為一個有交叉學(xué)科背景的研究人員，李婧翌充分利用了這一點：能夠更好地讓生命科學(xué)領(lǐng)域的數(shù)據(jù)分析人員去理解現(xiàn)有的一些經(jīng)典方法的優(yōu)缺點和適用范圍，同時，李婧翌自己發(fā)展新方法也將以此為目標(biāo)，創(chuàng)造出更透明、更穩(wěn)定的統(tǒng)計學(xué)方法。舉例而言，李婧翌在最近發(fā)表的一篇文章中就嘗試對兩種常用但經(jīng)常被混淆的統(tǒng)計方法：假設(shè)檢驗和二元分類，進(jìn)行解釋并闡述這兩種方法各自適用的數(shù)據(jù)分析問題。譬如對致癌基因和抑癌基因的預(yù)測問題，李婧翌解釋了為什么基于現(xiàn)有的大數(shù)據(jù)，二元分類是一個更加適用的統(tǒng)計方法。作為教師，李婧翌致力于將統(tǒng)計方法開發(fā)和實際應(yīng)用的重要性更緊密的結(jié)合。李婧翌認(rèn)為，無論中美，目前統(tǒng)計學(xué)的基礎(chǔ)教育中都有很多過時的教學(xué)內(nèi)容，因為很多計算都已經(jīng)可以依靠計算機(jī)的程序包來進(jìn)行自動化運算。統(tǒng)計學(xué)教育更重要的應(yīng)該是去教授學(xué)生為什么需要統(tǒng)計學(xué)，數(shù)據(jù)背后的隨機(jī)性應(yīng)該怎么去理解，以及數(shù)據(jù)分析到底想解決什么問題，“我覺得這些其實是統(tǒng)計教育需要改變的的東西，我希望我能夠發(fā)揮一些作用。”

責(zé)任編輯：lq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

自動化

自動化

+關(guān)注

關(guān)注
29

文章
5620

瀏覽量
79532
統(tǒng)計

統(tǒng)計

+關(guān)注

關(guān)注
1

文章
19

瀏覽量
13522
數(shù)據(jù)分析

數(shù)據(jù)分析

+關(guān)注

關(guān)注
2

文章
1460

瀏覽量
34112

原文標(biāo)題：提高數(shù)據(jù)分析的科學(xué)性與透明度，UCLA教授用統(tǒng)計學(xué)“反轉(zhuǎn)”中心法則

文章出處：【微信號：deeptechchina，微信公眾號：deeptechchina】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

Mathematica 在數(shù)據(jù)分析中的應(yīng)用

數(shù)據(jù)分析是現(xiàn)代科學(xué)研究和商業(yè)決策中不可或缺的一部分。隨著數(shù)據(jù)量的爆炸性增長，對數(shù)據(jù)分析工具的需求也在不斷增加。Mathematica，作為一

發(fā)表于 12-26 15:41 ?173次閱讀

首個科學(xué)計算基座大模型BBT-Neutron開源，助力突破大科學(xué)裝置數(shù)據(jù)分析瓶頸

大語言模型能否解決傳統(tǒng)大語言模型在大規(guī)模數(shù)值數(shù)據(jù)分析中的局限性問題，助力科學(xué)界大科學(xué)裝置設(shè)計、高能物理領(lǐng)域科學(xué)計算？高能物理是探索宇宙基本組成與規(guī)律的前沿

發(fā)表于 12-26 15:29 ?191次閱讀

首個<b class='flag-5'>科學(xué)</b>計算基座大模型BBT-Neutron開源，助力突破大<b class='flag-5'>科學(xué)</b>裝置<b class='flag-5'>數(shù)據(jù)分析</b>瓶頸

數(shù)據(jù)可視化與數(shù)據(jù)分析的關(guān)系

的含義。 數(shù)據(jù)分析的定義與作用 數(shù)據(jù)分析是一種使用統(tǒng)計和邏輯方法來分析數(shù)據(jù)集的過程，目的是發(fā)現(xiàn)模式、趨勢和關(guān)聯(lián)

發(fā)表于 12-06 17:09 ?407次閱讀

葡萄酒俱樂部計劃部署RFID技術(shù)以提高供應(yīng)鏈的透明度

來提高葡萄酒供應(yīng)鏈的透明度和效率。該解決方案是基于區(qū)塊鏈和RFID技術(shù)來跟蹤每瓶酒在運輸、儲存、購買和消費過程中的信息。該系統(tǒng)記錄了每瓶葡萄酒的數(shù)字標(biāo)識、生活故事以及周圍的條件，一直到消費者手中。通過將超高頻RFID標(biāo)簽嵌入到瓶子

發(fā)表于 11-23 16:18 ?182次閱讀

LLM在數(shù)據(jù)分析中的作用

隨著大數(shù)據(jù)時代的到來，數(shù)據(jù)分析已經(jīng)成為企業(yè)和組織決策的關(guān)鍵工具。數(shù)據(jù)科學(xué)家和分析師需要從海量數(shù)據(jù)

發(fā)表于 11-19 15:35 ?395次閱讀

raid 在大數(shù)據(jù)分析中的應(yīng)用

RAID（Redundant Array of Independent Disks，獨立磁盤冗余陣列）在大數(shù)據(jù)分析中的應(yīng)用主要體現(xiàn)在提高存儲系統(tǒng)的性能、可靠性和容量上。以下是RAID在大數(shù)據(jù)分

發(fā)表于 11-12 09:44 ?287次閱讀

數(shù)據(jù)分析在數(shù)字化中的作用

與重要性 數(shù)據(jù)分析是指使用統(tǒng)計和邏輯方法對數(shù)據(jù)進(jìn)行處理和解釋的過程。它涉及到數(shù)據(jù)的收集、清洗、轉(zhuǎn)換、建模和解釋，目的是發(fā)現(xiàn)

發(fā)表于 10-27 17:35 ?677次閱讀

《AI for Science：人工智能驅(qū)動科學(xué)創(chuàng)新》第一章人工智能驅(qū)動的科學(xué)創(chuàng)新學(xué)習(xí)心得

的同時，確保其公正性、透明度和可持續(xù)性，是當(dāng)前和未來科學(xué)研究必須面對的重要課題。此外，培養(yǎng)具備AI技能的科研人才，也是推動這一領(lǐng)域發(fā)展的關(guān)鍵。 4. 激發(fā)創(chuàng)新思維閱讀這一章，我被深深

發(fā)表于 10-14 09:12

動態(tài)代理IP的匿名性和透明度，為主要考慮關(guān)鍵！

動態(tài)代理IP的匿名性和透明度是用戶選擇代理服務(wù)時需要考慮的關(guān)鍵因素。根據(jù)用戶的需求和場景，可以選擇不同匿名級別和透明度的代理服務(wù)來平衡隱私保護(hù)和網(wǎng)絡(luò)訪問的需求。

發(fā)表于 09-20 07:36 ?328次閱讀

加州立法推動AI透明度,生成式人工智能迎來數(shù)據(jù)披露新紀(jì)元

的數(shù)據(jù)使用與透明度問題也逐漸成為公眾關(guān)注的焦點。8月28日，美國加州立法機(jī)構(gòu)的一項重大舉措——人工智能訓(xùn)練數(shù)據(jù)透明度法案的通過，標(biāo)志著該州在推動AI行業(yè)健康發(fā)展、保障公眾權(quán)益方面邁出了

發(fā)表于 08-28 16:20 ?604次閱讀

LED透鏡的顏色與透明度基本概念

如果 LED燈有透鏡顏色，則無論透鏡透明度如何，LED 在開和關(guān)時都會顯示該顏色。如果透鏡顏色為白色或無色，則 LED 有可能發(fā)出白色，另一種顏色或各種顏色的光，然后在關(guān)狀態(tài)下返回白色或無色。

發(fā)表于 07-25 09:34 ?474次閱讀

數(shù)據(jù)分析除了spss還有什么

Sciences）是一款非常流行的統(tǒng)計分析軟件，但除了SPSS之外，還有許多其他數(shù)據(jù)分析工具和方法。引言 數(shù)據(jù)分析是一個跨學(xué)科的領(lǐng)域，涉及到統(tǒng)計學(xué)、計算機(jī)

發(fā)表于 07-05 15:01 ?703次閱讀

數(shù)據(jù)分析有哪些分析方法

數(shù)據(jù)分析是一種重要的技能，它可以幫助我們從大量的數(shù)據(jù)中提取有價值的信息，從而做出更明智的決策。在這篇文章中，我們將介紹數(shù)據(jù)分析的各種方法，包括描述性

發(fā)表于 07-05 14:51 ?720次閱讀

Alpha半透明圖形疊加算法Matlab+Verilog的設(shè)計實現(xiàn)

Alpha通道是一個8位的灰度通道，該通道用256級灰度來記錄圖像中的透明度信息，定義透明、不透明和半透明區(qū)域，其中黑表示全

發(fā)表于 05-01 10:28 ?753次閱讀

Mozilla：科技公司廣告透明度工具需進(jìn)一步完善

結(jié)果表明，X 平臺透明度表現(xiàn)欠佳，僅能通過加載速度較慢的 CSV 文件獲取相關(guān)數(shù)據(jù)，且缺乏用戶友好型網(wǎng)絡(luò)界面；同時，該平臺在目標(biāo)參數(shù)和接收方數(shù)據(jù)方面亦存在顯著不足，亟待改進(jìn)。

發(fā)表于 04-17 10:41 ?607次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

提高數(shù)據(jù)分析的科學(xué)性與透明度，用統(tǒng)計學(xué)“反轉(zhuǎn)”中心法則

評論

Mathematica 在數(shù)據(jù)分析中的應(yīng)用

首個科學(xué)計算基座大模型BBT-Neutron開源，助力突破大科學(xué)裝置數(shù)據(jù)分析瓶頸

數(shù)據(jù)可視化與數(shù)據(jù)分析的關(guān)系

葡萄酒俱樂部計劃部署RFID技術(shù)以提高供應(yīng)鏈的透明度

LLM在數(shù)據(jù)分析中的作用

raid 在大數(shù)據(jù)分析中的應(yīng)用

數(shù)據(jù)分析在數(shù)字化中的作用

《AI for Science：人工智能驅(qū)動科學(xué)創(chuàng)新》第一章人工智能驅(qū)動的科學(xué)創(chuàng)新學(xué)習(xí)心得

動態(tài)代理IP的匿名性和透明度，為主要考慮關(guān)鍵！

加州立法推動AI透明度,生成式人工智能迎來數(shù)據(jù)披露新紀(jì)元

LED透鏡的顏色與透明度基本概念

數(shù)據(jù)分析除了spss還有什么

數(shù)據(jù)分析有哪些分析方法

Alpha半透明圖形疊加算法Matlab+Verilog的設(shè)計實現(xiàn)

Mozilla：科技公司廣告透明度工具需進(jìn)一步完善