本文的核心章節,我們將從業務目標、技術架構、優勢特色及應用場景四個方面重點介紹華大區塊鏈。
1. 華大區塊鏈的業務目標
華大區塊鏈的目標是通過融合區塊鏈和密碼學等技術,打造具有自主核心技術的組學數據共享基礎設施,促進數字化生命的價值流動。在保護個人隱私的同時,最大化數據的應用價值。包括兩方面的內容:
(1) 從個人層面而言,實現人人、實時、終身的生命 4D 數據隱私保護,為個人數據確權;通過積分激勵將數據價值還于個人,同時促進科研及產業應用;
(2) 從組織層面而言,為行業伙伴提供企業級的區塊鏈基礎設施與解決方案,形成組學數據與其他健康醫療大數據的共享交互生態體系,最終實現個人(數據所有者)、機構(科研、醫療等)、政府、企業在生命時代共有、共享、共為的多方協作和互惠共贏體系。
1.1 華大區塊鏈技術展望
按照涉及到的技術點與提供的服務方式不同,區塊鏈的技術架構主要分BaaS、PaaS 和 IaaS 三個層次)。
在社會資源有限的約束下,傳統互聯網以信息傳遞效率優先,中心化架構的IT 服務大大降低了單用戶的信息溝通成本。然而,隨著 IT 技術的發展和成本下降,用戶的關注點將逐漸從效率轉為質量,即關注隱私保護、規則透明平等。由于區塊鏈本身的系統成本高,尤其適合于健康醫療領域這樣的高價值行業應用。在華大區塊鏈建設初期,我們以 PaaS 平臺為用戶提供服務,用戶可以自主在平臺上實現數據的安全共享。將來隨著云計算、云存儲等技術的不斷深化成熟,華大區塊鏈將構建自有的開源 BaaS 服務架構,以開源區塊鏈的形式在健康醫療行業形成規?;瘧谩?/p>
區塊鏈技術仍處在早期,目前主要面臨以下幾點問題:
(1) 多節點共識帶來了高信任度,但分布式系統的共識效率性能在企業級的應用有待進一步提升;
(2) 多節點記錄存儲提高了數據透明度,但對數據安全加密和隱私保護提出更高要求,同時還要保證可用性和監管性;
(3) 智能合約定義了自動執行的邏輯規則,其安全問題有待更加成熟的驗證和解決方案;
(4) 區塊鏈技術各成一派,需要跨鏈技術的進步來增強鏈與鏈之間的互操作性。
華大區塊鏈將通過架構優化、技術升級等方式,并和區塊鏈技術生態圈的開發者、標準制定者交流合作,不斷提升區塊鏈適用范圍與應用價值。同時,華大區塊鏈也將重點關注以下特色技術點的突破:
(1) 基因數字 ID:通過個人基因 ID 技術,解決現有區塊鏈技術中的數字身份無法安全關聯個人實體身份,規避網絡應用中的數字權利與現實社會中實體權利難以合法關聯的問題;
(2) 后量子加密:解決現有區塊鏈產品的非對稱加密體制無法防止將來量子計算的破解問題;
(3) 安全多方計算:通過提供安全多方計算解決方案,實現多方數據所有者在不透露數據細節的前提下進行數據協同計算;
(4) 匿名應用:節點可匿名提供暫時數據給區塊鏈上的第三方應用進行處理,通過瞬時加密機制確保用戶隱私;
(5) 亂序存儲:節點可以對數據亂序加擾后分布存儲到多個其他節點(包括云平臺),數據所有者是恢復原始數據所必須的亂序引索(Index)的唯一擁有者。
1.2 華大區塊鏈用來解決什么問題
華大區塊鏈用來解決健康醫療及生命大數據應用的三類矛盾:
(1) 數據應用與隱私保護的矛盾
(2) 數據確權與交互共享的矛盾
(3) 數據安全與加密成本的矛盾
1.3 設計原則
華大區塊鏈在設計上遵循以下幾個原則:
(1) 2B4D 大數據:作為全球跨組學數據生產的引領機構,華大創新性地提出了大人群生命組學大數據(2B4D)的概念。2B4D 數據所具有的的人群覆蓋度廣、數據量大、敏感性高、完整性需求強等特點對區塊鏈的架構與性能提出了極高的要求。因此,從區塊鏈協議、數據結構和功能特性等方面滿足 2B4D 大數據的交互共享是華大區塊鏈的第一設計原則。
(2) 自主創新:華大注重自主創新,目前已在碎片分布式數據存儲、基因ID 等關鍵領域擁有多項自主知識產權的核心技術與專利,并通過融合差分隱私、非對稱數字簽名等技術,實現個人生命大數據的可靠存儲與安全共享。
(3) 標準化:華大區塊鏈通過搭建區塊鏈行業應用的標準化體系,實現數據的安全交互與高效共享。包括區塊鏈底層架構標準化與數據共享交互標準化兩個層次:安全高效:華大區塊鏈在協議設計、架構規劃、接口設置、服務部署等方面都遵循這一原則,確保區塊鏈系統運行的可靠與高效。開放共享: 華大區塊鏈構建自主可控的 BaaS 區塊鏈平臺,發揮運營國家基因庫的經驗優勢,搭建 IT 基礎設施,開放區塊鏈服務能力,與行業伙伴共同打造合作共贏生態圈。
2. 華大區塊鏈技術架構
華大區塊鏈在基于 BaaS、PaaS、IaaS 分層基礎上,結合生命健康行業數據應用場景,針對共識算法和密碼學算法兩個核心技術點進行優化,有效提升系統安全性和業務處理效率。
2.1 共識機制
華大區塊鏈使用的共識算法基于 PBFT 基礎上做了調整優化,可以稱為“PBFT+”共識算法,其核心思想就是針對不同的交易類型實行不同的共識機制。我們把需要上鏈存儲的交易類型分為兩大類:事務性交易和非事務性交易。針對不同類型的區塊鏈交易采用不同的共識算法。所謂事務性交易是指需要進行嚴格排序和所有節點達成共識的區塊鏈交易,維持同樣的狀態變更,因此需要使用嚴格的共識算法確保其執行狀態在區塊鏈上保持一致;事務性交易之外的其他交易都稱為非事務性交易。
針對事務性交易,華大區塊鏈采用 PBFT 算法,具體算法流程圖如下所示。
其中 C 為發送共識請求的客戶端節點,0123 為接受并處理共識請求的服務端節點,3 為故障的服務端節點,共識步驟如下:
(1) Request: C 發送請求到任意一個服務端節點,這里是 0;
(2) Pre-Prepare:節點 0 收到 C 的請求后廣播至節點 123;
(3) Prepare:節點 123 收到后記錄請求,然后再次廣播至所有其他節點,1-》023,2-》013,3-》012;
(4) Commit:0123 節點在 Prepare 階段,若收到超過一定數量的相同請求,則進入 Commit 階段,廣播 Commit 請求;
(5) Reply:0123 節點在 Commit 階段,若收到超過一定數量的相同請求,則對 C 進行反饋。
能夠達成共識的計算公式為 N ≥ 3F + 1, N 為參與共識的服務端節點總數,F 為有問題的服務端節點總數。
針對非事務性交易,我們采用簡單的排序驗證,即發送交易到任一個共識節點上進行交易合法性驗證,確認是非事務性交易類型后,通過 Kafka 協議在多個共識節點之間進行統一排序,然后將排序結果廣播至鏈上所有節點。
2.2 密碼學算法
第一章提到的 HASH 摘要、非對稱加密等算法在傳統計算機環境中是安全的,在實現 128 位安全級別的情況下可以滿足當前區塊鏈應用的加解密速度和存儲空間要求。但是考慮到當前量子計算技術的高速發展,目前已知的量子計算Shor 算法已經能夠在較短時間內破解一些常用的傳統加解密算法。
由上述模 n 位數和安全等級 b 的關系可知,量子計算環境下,傳統的 RSA加密體制在現有的模 n 位數下已經無法保證安全性,如果要在量子計算環境下實現和傳統計算機環境下同等安全性,則需要大為增加 n 值,這意味著公私鑰的長度和加解密速度都急劇增長,這就導致加解密算法失去了應用價值。實際上,基于量子計算環境的 Shor 算法,傳統的 RSA、ECDSA 算法都不再安全。
另一方面,后量子密碼學時代,已經有許多研究證明了量子計算技術的發展并不意味著所有密碼學算法都不再安全,目前已知的抗量子算法有基于 HASH 函數的密碼算法、基于糾錯碼的密碼算法、多變量二次方程組的密碼算法和基于格理論的密碼算法。我們在區塊鏈應用中綜合考慮算法穩定性、加解密性能和未來兼容性,選擇了格密碼算法來進行數字簽名,確保區塊鏈交易安全性。
同時,華大鏈支持中國官方制定的 SM2、SM3 算法,SM2 是國家密碼管理局于 2010 年 12 月 17 日發布的橢圓曲線公鑰密碼算法,SM3 密碼摘要算法是國家密碼管理局 2010 年公布的中國商用密碼雜湊算法標準。SM3 算法適用于商用密碼應用中的數字簽名和驗證,是在 SHA-256 基礎上改進實現的一種算法。華大鏈基于 SM2\SM3 密碼算法的全面兼容性可以更好的滿足國內不同行業的信息安全準入要求。
2.3 基因數字 ID
在公有區塊鏈應用中,用戶所使用的線上數字身份一般都沒有和實體身份對應起來,這樣純粹的虛擬數字身份不具有生物實體的可追溯性,導致線上數字身份的權利義務無法和現實世界中的個人權利義務對應起來,一個典型的問題是比特幣用戶因為丟失地址私鑰后沒有任何挽救途徑可以找回線上資產。因此,我們認為區塊鏈的應用中需要提供能夠同時對應線上數字身份和線下實體身份的技術解決方案。
華大利用自身在基因測序方面的優勢,開發出一套基于個人基因序列多態性的新型加密方式。基因序列對應個人的唯一身份,具有最高特異性。同時,基因序列可以產生大量的公私鑰對,可實現一次一密的動態加密機制,充分保證了身份認證安全。目前,我們撰寫的國家級專利《一種基于個人全基因組數據的數字身份生成方法》正在受理。未來,基因數字 ID 技術將作為華大區塊鏈的核心組件,確保每一次數據交互都安全可靠。
目前線下實體身份通常采用個人臉部識別技術作為身份驗證方式(銀行系統基于身份證的身份鑒別),但同時基于臉部特征識別技術也存在較多問題,例如臉部生物特征唯一性無法保證 100%不重復(雙胞胎撞臉等)、可復制性較高(整容易容)、人工或機器的臉部識別準確率都無法達到 100%。
我們結合基因技術為區塊鏈的身份鑒別提供高可靠性、高精度的基因 ID 數字身份解決方案。在個人基因組中,存在多個短串聯重復序列(short tandem repeat, STR),STR 是核心序列為 2-6 個堿基的短串聯重復結構,其中每個 STR 中重復序列的重復次數范圍在 2-100 之間,對于任何特定個體的全基因組數據,染色體上某個特定位置的 STR 中重復序列的重復次數是固定的,但在不同的個體在相同 STR 的重復序列的重復次數可能不同,這就構成了人群中這些 STR 重復序列的多態性。由于人類基因組中 STR 非常多,通過對這種多態性的檢測,就可以明確區分個體與個體的不同。
個人基因數字 ID 庫的應用,可以實現區塊鏈上的每次交易使用不同 ID,這樣可以有效保護用戶的交易隱私,同時,結合第三方應用,可以對 ID 采取合法性驗證,提供匿名數據服務,應用框架如下圖所示。
2.4 碎片分布式存儲
傳統的云存儲模式中,用戶把完整的數據信息存放到云端數據中心,這種中心化的云存儲模式相對高效和低成本而廣為流行,但在安全性和隱私泄漏等方面存在風險。我們認為,基于區塊鏈的隱私數據保護需要采取一種全新的分布式云存儲方案,這里稱為碎片分布式存儲,基本思想是將用戶的某一完整的隱私數據進行分片操作,然后將不同碎片進行加密擾序后,存儲到不同的網絡節點上。用戶本地保留恢復原始數據所必須的碎片重組索引文件。
碎片化分布式存儲可以把數據分布到多個網絡節點,各網絡節點基于區塊鏈智能合約來提供數據存儲服務,在合約有效期內需要定期證明它們能繼續提供存儲服務的能力。用戶需要訪問數據或者授權他人獲取數據時,需要將訪問憑證消息進行數字簽名后上鏈保存,對應網絡節點獲取到該授權憑證后才提供數據訪問服務。這些憑證在區塊鏈上是公開、透明、可審計的,網絡節點自動保證存儲合約的一致性。
這種去中心化的碎片化分布式存儲方案和區塊鏈技術的結合,可以有效保護用戶的數據隱私。數據被分割成小塊,經過加密擾序后才會分散存儲在眾多節點上,能夠避免中心化存儲的集中式風險,即使某一塊數據被泄露,也只是部分而非全部數據。另外,每個數據分片都有多個備份節點,一旦出現某個存儲空間提供者長期離線的情況,客戶會自動將切片備份到新的提供者中,避免了中心化存儲因網絡或者物理等原因導致數據丟失的風險。結合上一節提到的基因 ID 技術,我們示意了一種基于個人基因組數據的碎片分布式存儲方式,將有效保證個人身份的最大特異性與數據的最高安全性。
2.5 安全多方計算
數據流通安全一直是大數據時代難以解決的難題。如何在保護本地數據隱私安全的情況下,促進不同地區、不同機構間的數據共享與協同計算,正引起研究者們的廣泛關注。
安全多方計算(SMC)最初由圖靈獎得主姚期智院士在 1982 年針對“百萬富翁問題”提出,是一種在無可信第三方的條件下,多方之間在互不公開數據的前提下實現協同計算的技術。兩方計算框架主要實現原理是基于混淆電路(GC,Garbled Circuit)和不經意傳輸協議(OT,Oblivious Transfer)的密碼學技術,將計算邏輯轉化為布爾電路,并加密傳輸電路及標簽數據,最后各方解密獲取計算結果。30 年來,也陸續出現了基于秘密分享協議的多方安全計算框架,如 GMW、SPDZ。目前,安全多方計算技術的進步已使其在金融、征信等領域展開應用,但大規模普及商用仍面臨特定計算場景的性能瓶頸和可擴展性等問題。
華大通過搭建安全多方計算平臺,允許擁有基因數據的各機構在不泄漏原始數據的情況下完成協同計算,將極大促進跨機構開展大人群大隊列的組學數據聯合研究,也可用于大型基因數據庫的安全查詢。同時,我們將與區塊鏈技術進行結合,制定一個標準化的組學數據共享協議,將每一次計算與交互的日志進行區塊鏈存證,確保計算過程的公開透明,實現多方共贏。
安全多方計算和區塊鏈的應用框架如下圖所示,用戶數據存儲在不同網絡節點中,發起計算流程后,通過區塊鏈憑證實現數據的授權。各節點在區塊鏈上接收到授權憑證并確認有效后,由安全多方計算節點進行聯合計算。
2.6 BaaS 接口
為了更好的支持上層業務對區塊鏈模塊的集成應用,我們在華大區塊鏈設計之初就明確以 BaaS 為建設目標,通過豐富的 API 接口為上層業務及產品提供靈活方便的功能集成、運維部署服務(圖 3-2-6)。提供的 BaaS 服務接口包括:
(1) 節點權限認證控制:基于聯盟鏈的應用場景,各個節點的鏈上權限及角色配置都可以通過運維軟件的 WEB 界面進行配置。每個節點的模塊ID、IP 地址、角色信息(Order 節點、Peer 節點、Endorse 節點等)、組織信息及鏈通道信息都嚴格對應,防止越權訪問。
(2) 共識算法可插拔: 默認情況下支持“PBFT+”共識算法,同時支持通過API 接口調用包括 PBFT、PAXOS 等其他共識算法,實現共識算法的靈活配置。目前華大區塊鏈已實現單節點的平均共識性能在 2000TPS 以上,單節點的平均交易性能在 500TPS 以上。
(3) 加密算法自定義配置:可以通過 API 接口配置選擇不同的數字簽名算法 ( ECDSA\SM2\ 后 量 子 簽 名 算 法 ) 、 HASH 摘 要 算 法(SHA256\SHA384\SM3)。
(4) 一鍵式運維部署: 我們提供基于 WEB 界面的運維軟件實現區塊鏈部署的節點配置,包括節點 IP、節點 ID、節點數據庫配置、共識算法及加密算法配置,運維軟件根據配置信息自動生成部署腳本,然后執行腳本即可啟動區塊鏈服務; 此外,運維軟件還提供區塊鏈節點信息查詢、區塊信息查詢功能。
(5) 智能合約動態生成:基于已開展的應用場景,我們提供在線生成智能合約功能。通過運維軟件的 WEB 界面輸入交易條件和參數(例如交易價格、交易對象、生效時間、例外條件)后,即可自動生成基于 Go 語言的智能合約代碼。
3. 華大區塊鏈優勢特色
華大區塊鏈在開發與應用過程中,始終從隱私保護、安全共享、價值交互三方面關注區塊鏈系統架構的搭建與優化,適用于行業內眾多應用場景,滿足企業級需求,提供安全高效的開放服務平臺。
3.1 隱私保護
華大區塊鏈參照 GDPR 和國標 GBT 35273-2017 對個人數據的規定,為數據主體確權,實現個人數據的細顆粒度授權控制,確保所有數據交換都如實、不可篡改地記錄在區塊鏈上,防止隱私泄露。
(1) 支持對數據信息進行多重加密簽名后的鏈上存儲;
(2) 支持憑證撤回功能;
(3) 支持碎片分布式存儲與簽名驗證。
3.2 安全共享
華大區塊鏈旨在構建組學數據的共享生態體系,確保數據共享全程可監管,并通過制定數據交互的協議規則,促進數據流通,建立行業標準。
(1) 支持安全多方計算平臺;
(2) 支持在云端進行密文分析,實現數據零接觸應用;
(3) 支持基于基因數字 ID 的獨特生物特征身份認證系統。
3.3 價值交互
華大區塊鏈的終極目標是通過個人組學數據的價值交互促進“健康長壽”的人類終極追求實現?;谌A大區塊鏈底層架構開發的健康積分激勵系統,個人不僅可以授權數據使用掙取積分報酬,也可通過達成健康提升目標(如每日步數達到 10000、體脂率降低至 15%、主動上傳每日健康飲食情況等)掙取。所有交互日志都登記在區塊鏈上,積分可用于消費健康促進服務(精準運動、精準營養,健康咨詢)等。
(1) 兼容不同機構的數據庫與 APP 端接口;
(2) 從數據生產到應用的全貫穿,促進數據價值流動;
(3) 支持積分任務、社群交互等功能,提升用戶體驗。
4 華大區塊鏈應用場景
全球范圍內,區塊鏈正加速從數字貨幣領域演進為與各類實體經濟應用場景進行創新融合。自 2018 年開始布局區塊鏈以來,華大積極探索基于“區塊鏈+”的應用場景構建,目前已上線和正在部署包括個人數據確權與價值交互、罕見病公益、HPV 保障計劃、區塊鏈與深度學習結合、農產品防偽溯源等方面的應用。未來我們將結合技術進步,不斷豐富和完善應用場景。
4.1 區塊鏈+跨組學數據:個人生命數據的價值流動
華大從 2015 年推出了國產自主可控的測序儀,核心工具的突破,使得高效低成本的基因技術應用于大人群的疾病防控成為可能。從政府主導的民生實事切入,將基因技術惠及民生的同時,匯集寶貴的大人群大樣本資源,必將形成“大數據驅動”的引領性大科學突破,催生新型的大健康產業。華大已在深圳、長沙、阜陽等城市開展全市范圍的孕婦無創產前檢測等民生項目,目前華大累計完成超過三百萬例的孕婦基因檢測。將來將擴展到更多省市,同時也將升級測序數據量,增加疾病防控種類。面對如此海量的基因數據,如何在確保數據安全和隱私保護的前提下進行大數據的挖掘利用,為大人群提供全方位全周期的服務,是華大面臨的核心要務。
此外,華大已經用測序、質譜和影像等技術方法對數千名員工進行了連續三年的貫穿組學監測、研究,初步證明了跨組學“4D 大數據”模式是解讀、監測健康與疾病狀態的最佳途徑。華大區塊鏈從自身實踐做起,為員工搭建了一套基于區塊鏈的跨組學數據安全共享系統,支撐個人生命數據的價值實現。這是華大區塊鏈的首個應用場景,后續也將推廣、升級到華大對外與政府、醫院在跨組學數據的科研、臨床和產業應用等方面的合作。
以下介紹華大區塊鏈在跨組學數據的應用場景:
(1) 通過生命組學工具(測序儀、質譜儀、影像設備、可穿戴設備等)收集全方位全周期的生命大數據,形成人人、實時、終身的生命健康檔案,形成數字化生命;
(2) 所有數據將加密處理,于國家基因庫進行統一存儲,確保數據硬件安全、物理安全和訪問安全;
(3) 用戶可通過前端 APP 授權個人數據被內部科研團隊、合作醫院、健康管理團隊等使用,所有的使用日志將以區塊鏈形式記錄,用戶可實時查詢、授權個人數據使用情況,實現用戶對個人數據的控制權,將數據價值還于個人;
(4) 對于授權數據使用或主動提供組學數據的用戶,華大以健康積分作為激勵;健康積分可用于各類健康促進服務(精準運動、精準營養等),實現個人生命數據價值的正向反饋。
基于區塊鏈技術的數據交互模式現已應用于對內的跨組學數據員工健康計劃以及對外的腫瘤關愛計劃,已實現近萬人的組學數據安全共享與價值實現。隨著華大業務覆蓋更多人群,該模式將重構個人組學數據的生產交互模式,真正實現“我的數據我掌控、我的健康我做主”。
4.2 區塊鏈+注冊申報:醫療器械申報全流程管理
華大智造是華大基因集團旗下定位于生產國產自主可控的生命數字化工具生產商。臨床注冊審批是國家食品藥品監督管理總局(CFDA)準予醫療器械與藥品入市許可的必要步驟。在傳統申報流程下,由于需要提交的材料較多,易出現報送信息不全、不準、不真。此外,由于審批、檢查流程環節眾多,信息泄漏的風險點不少,易導致商業核心機密泄漏。華大每年需要報送 CFDA 審批的國產儀器與試劑盒眾多,為加強華大內部設備試劑生產、臨床試驗數據、注冊申請材料等全流程追蹤管理,實現全程可溯源、信息可追蹤、過程可監管,我們正在搭建基于華大區塊鏈的臨床注冊申報管理平臺。未來所有注冊申報的數據及信息均將通過此平臺登記,防止出現報送信息不全、失真等問題,并減少數據泄漏風險。同時,華大將與 CFDA 探討建立合作關系,以區塊鏈模式及時共享數據,聯合實施審計監管,從而提高申報效率。
4.3 區塊鏈+罕見病公益:許一個沒有罕見病的未來
罕見病是指發病率極低的疾病,根據世界衛生組織(WHO)的定義,罕見病為患病人數占總人口的 0.65‰~1‰的疾病。華大基因于 2016 年成立了“華大基因罕見病公益基金”,為罕見病患者提供免費基因檢測及遺傳咨詢,幫助罕見病患者查找病因并促進相關科學研究。2017 年又與合作伙伴聯合成立了為全球重癥地貧血患兒永久免費進行 HLA 配型的“華基金”及為全球 14 歲以下的萊伯氏先天性黑蒙癥患者提供基因檢測的“光基金”。華大區塊鏈為罕見病相關的公益基金建立基于區塊鏈的管理平臺,確保資金用途、捐贈記錄、受捐人信息等都將通過區塊鏈進行存證,實現全程公開透明。同時由于罕見病例稀少,相關數據極其分散,對罕見病的診斷、醫療離不開包括患者、病友會、醫生、檢測機構、科研機構、制藥機構、公益基金會、媒體等多方互助才能把資源最優化,最大可能地應對罕見病。華大區塊鏈也將探索通過分布式架構促進罕見病相關方多方協作,同時確保數據隱私、促進數據共享、定義數據價值。
4.4 區塊鏈+互助保險:HPV 檢測保障計劃
宮頸癌是女性最常見的惡性腫瘤之一。近年來,我國宮頸癌發病呈現年輕化的趨勢,每年因宮頸癌死亡的女性約 3 萬人。早在上個世紀的 90 年代,科學家們就已經發現宮頸癌與 HPV(人乳頭瘤病毒)的感染密切相關,宮頸癌是目前唯一病因明確、可早發現、早預防的惡性腫瘤。為應對 HPV 感染現狀,降低宮頸癌發病率,呵護女性健康,華大基因近期研發出自取樣的 HPV 分型基因篩查檢測產品,啟動大規模的互聯網宮頸癌防控計劃,同時首期在員工內部試點 HPV 互助保障計劃,將基因科技與互聯網保險結合,所有購買 HPV 檢測試劑盒的費用都將作為互助基金,用于日后互助理賠。購買記錄、檢測結果、理賠金額等都將通過區塊鏈進行不可篡改地存證,并接受相關機構的監管,保障用戶權益。
4.5 區塊鏈+深度學習:從技術融合到生物智能
隨著基因數據的爆發性增長,深度學習等算法在基因組分析中的應用逐漸增多。將區塊鏈技術與深度學習等智能算法融合,預先明確算力提供者、算法提供者和數據提供者三方的權責并做好利益分配,才能有效促進基因大數據的挖掘。在區塊鏈上進行待訓練數據的身份與權屬認證,并通過智能合約發布訓練需求,激勵算法提供者貢獻智慧。算法提供者既可以在本地可信環境中訓練模型,還可通過區塊鏈接入第三方算力平臺。智能模型訓練完成后,其科研與產業應用價值可通過預先定義好的規則回饋給各方。華大區塊鏈創新性將區塊鏈技術用于匹配數據供需方,為數據挖掘引入廣泛的市場參與者,從而形成一個多方協作的算法市場與智能計算系統,既可為數據確權,又可最大化發揮數據價值,為最終實現生物智能奠定基礎。
4.6 區塊鏈+供應鏈:農產品智慧防偽溯源平臺
2017 年,國務院發布《關于積極推進供應鏈創新與應用的指導意見》,提到建立基于供應鏈的重要食品質量安全追溯機制。由于我國食品供應鏈的成熟度較低,物流等基礎設施仍薄弱,傳統的管理方法和溯源平臺無法在短時間內滿足民眾對食品安全和品質溯源的訴求。
為了解決這一問題,華大區塊鏈攜手華大農業,整合物聯網和基因檢測技術,打造農產品的智慧防偽溯源平臺。利用區塊鏈去中心化、數據不可篡改、公開透明、時間戳等特點,將農場、農戶、檢驗檢疫、加工貿易、銷售、物流倉儲等機構加入到聯盟鏈上,形成一個資金流、信息流、產品流的共享鏈條,做到來源可查,去向可追,責任可究。各個環節參與方以全節點形式參與到流程中,所有數據產生與交互都加密簽名后上鏈存證,充分解決供應鏈中由于信息不對稱導致的交易摩擦,監控管理缺失、數據欺詐導致的質量安全或假冒問題,為消費者提供透明可追溯的全流程信息,形成全新的農業生產管理方式。
擁抱生命大數據時代
區塊鏈技術的快速演進,并與實體經濟不斷融合創新,正在推動可信社會的建立,促進數據價值的流轉。人類基因組計劃完成已近 20 年,隨著組學工具的不斷成熟,海量的生命大數據正在不斷地被數字化和分析挖掘,也為生命時代的價值度量和交換提供了數據基礎。作為全球最大的基因組研發機構,華大基因已與全球 60 多個國家、4000 多家機構、13000 多名合作伙伴建立了廣泛的合作關系,共同向著“生優病少、健康長壽、溫飽不愁、環境友好“的大目標邁進。華大區塊鏈也緊密圍繞集團戰略,推動生命大數據共享交換的生態體系建設。
與任何新技術剛興起時一樣,區塊鏈在生命健康行業的落地應用依賴于技術進步、行業認同、政策法規等支持。為推動區塊鏈應用發展,現建議如下:
1. 推動區塊鏈與其他技術的融合
區塊鏈技術不是萬能的,也不是孤立存在的。區塊鏈技術廣泛應用于生命大數據領域,需要與云計算、數據庫、信息安全、密碼學等技術在硬件和軟件層面上不斷融合創新。
2. 依托聯盟,行業內廣泛合作
以基因數據為基礎的生命組學大數據,全球目前仍缺乏統一的共享標準和隱私保護準則。依托國家基因庫合作與聯盟體系的建設,積極推廣區塊鏈技術的應用,在實踐中積累經驗,形成示范效應。
3. 推進區塊鏈技術標準制定,并與產業標準并進
加快推進區塊鏈關鍵技術標準的制定,參與國際標準研制工作,并積極與生命健康行業的相關應用標準互動,推動產業應用標準落地。
4. 出臺扶持區塊鏈應用發展的政策
借鑒發達國家和地區的先進做法,區塊鏈的規模化應用得益于良好的發展環境與行業政策支持。及時出臺相關扶持政策,重點支持平臺建設與技術攻關,建立行業監管標準,促進技術長遠發展。
數化萬物,智在融合。生命因多樣而美麗,系統因協作而強大。華大以“造福自己、造福人類”的大目標為指引,用開放的心態擁抱未來,希望與合作伙伴共同探索出一條區塊鏈在生命健康行業的落地應用之路,攜手打造生命大數據安全共享和價值交互的全新生態。
評論
查看更多