在本文中,我們將仔細研究用于處理生理信號的算法的整體架構,并揭開其操作的神秘面紗。
第一波FDA批準的可穿戴數字健康監測器與智能手表等消費產品集成在一起,才剛剛問世。醫療傳感器技術繼續快速發展,使緊湊、經濟高效且越來越精確的生理傳感器能夠進入現成的可穿戴設備。這種轉變的真正驅動力之一是尖端機器學習和人工智能算法的可用性,這些算法可以從大量數據中提取和解釋有意義的信息。這包括嘈雜的數據和不太完美的信號(例如來自智能手表的ECG數據),這些信號被各種偽影破壞,這些偽影很難使用傳統算法進行處理,這些算法往往是確定性和基于規則的。
直到最近,解開來自這些傳感器的生理信號中的秘密以形成監管提交可接受的合理準確的決策是一項挑戰,而且通常是不可能的。機器學習和人工智能算法的進步現在使工程師和科學家能夠克服其中的許多挑戰。在本文中,我們將仔細研究用于處理生理信號的算法的整體架構,并揭開其操作的神秘面紗,將其轉變為基于數十年研究的更真實的工程。
為了說明簡單機器學習算法的強大功能,這里有一個在線視頻,描述了活動跟蹤器中加速度計的數據如何預測佩戴者的各種運動狀態或休息狀態。我們可以將這種方法擴展到更復雜的真實世界醫療信號,如ECG,并開發可以自動將ECG信號分類為正常或表現出心房顫動的算法。
開發機器學習算法包括兩個主要步驟。此工作流的第一步是特征工程,其中從感興趣的數據集中提取某些數字/數學特征并將其呈現給后續步驟。在第二步中,將提取的特征輸入到眾所周知的統計分類或回歸算法中,例如支持向量機或傳統神經網絡,這些算法經過適當配置,以提出經過訓練的模型,然后可用于新的數據集進行預測。一旦使用表示良好的標記數據集迭代訓練此模型,直到達到令人滿意的精度,就可以在新數據集上將其用作生產環境中的預測引擎。
那么,該工作流程如何查找ECG信號分類問題呢?對于本案例研究,我們轉向2017年PhysioNet Challenge數據集,該數據集使用真實世界的單導聯心電圖數據。目的是將患者的心電圖信號分為四類之一:正常、心房顫動、其他節律和太嘈雜。
預處理和特征工程
特征工程步驟可能是開發強大的機器學習算法中最困難的部分。這樣的問題不能簡單地被視為“數據科學”問題,因為在探索解決此問題的各種方法時,擁有生物醫學工程領域的知識以了解不同類型的生理信號和數據非常重要。MATLAB 等工具為領域專家帶來了數據分析和高級機器學習功能,使他們能夠更輕松地將“數據科學”功能(如高級機器學習功能)應用于他們正在解決的問題,從而專注于特征工程。在此示例中,我們使用先進的小波技術進行信號處理,以消除數據集中的噪聲和緩慢移動的趨勢,例如呼吸偽影,并從信號中提取各種感興趣的特征。
開發分類模型
統計和機器學習工具箱中的分類學習器應用程序對于剛接觸機器學習的工程師和科學家來說是一個特別有效的起點。在我們的示例中,一旦從信號中提取了足夠數量的有用和相關特征,我們使用此應用程序快速探索各種分類器及其性能,并縮小進一步優化的選項范圍。這些分類器包括決策樹、隨機森林、支持向量機和 K 最近鄰 (KNN)。這些分類算法使您能夠嘗試各種策略,并選擇為特征集提供最佳分類性能的策略(通常使用混淆矩陣或 ROC 曲線下面積等指標進行評估)。在我們的案例中,我們很快就在所有課程中達到了~80%的總體準確率,只需遵循這種方法(本次比賽的獲勝作品得分約為83%)。請注意,我們沒有花太多時間在特征工程或分類器調優上,因為我們的重點是驗證該方法。通常,花一些時間在特征工程和分類器調整上會導致分類準確性的顯著進一步提高。更高級的技術(如深度學習)也可以應用于此類問題,其中特征工程和提取以及分類步驟組合在一個訓練步驟中,盡管與傳統的機器學習技術相比,這種方法通常需要更大的訓練數據集才能正常工作。
挑戰、法規和未來承諾
雖然許多常用的可穿戴設備還沒有準備好取代FDA批準和醫學驗證的對應設備,但所有技術和消費趨勢都強烈指向這個方向。FDA開始在簡化法規和鼓勵監管科學發展方面發揮積極作用,特別是通過數字健康軟件預認證計劃以及設備開發中的建模和仿真等舉措。
從日常使用可穿戴設備中收集的人類生理信號成為新的數字生物標志物,可以提供我們健康狀況的全面圖景,現在比以往任何時候都更加真實,這在很大程度上是由于信號處理、機器學習和深度學習算法的進步。由 MATLAB 等工具支持的工作流使醫療設備的領域專家能夠應用和利用機器學習等數據科學技術,而無需成為數據科學專家。
審核編輯:郭婷
-
AI
+關注
關注
87文章
30946瀏覽量
269185 -
機器學習
+關注
關注
66文章
8420瀏覽量
132680
發布評論請先 登錄
相關推薦
評論