2018年,醫療人工智能行業的發展速度依舊迅猛。在今年第一季度,匯醫慧影、推想科技、深睿醫療、Airdoc、視見醫療等企業都宣布完成了新一輪的融資,金額幾乎都在億元級別。聯影也發布了自己的開放的智能AI平臺,全面滲透醫療AI領域。
雖然行業發展迅猛,但是有個問題一直制約著行業的發展,那就是國內還沒有一家公司的新一代醫療AI產品獲得醫療器械注冊證。
這一方面是由于醫療AI作為一種全新的產品,擁有一定的智能,但是之前并無審批此類產品的經驗和標準數據庫。另一方面,國內醫療AI企業的產品還在打磨階段,醫療是一個嚴謹的行業,事關民眾安全。
值得說明的是,之前拿了認證的產品大多是基于之前CAD產品審批方式獲得的,與最近流行的新一代醫療AI產品有些不同。
沒有認證就沒有市場準入資質,雖然各個創業公司有自己合理合法的營收渠道和高額的融資,但是AI公司數據、人才、算力、運營成本昂貴,如果以醫療AI產品為主營業務的公司遲遲拿不到市場準入資質,那公司的長遠發展必將面臨挑戰。
利用深度學習技術研發的醫療AI產品為何拿不到認證,問題出在哪里,獲得認證還需要解決那些問題,各家醫療AI公司,監管部門等機構做了哪些準備,中美的審批有何區別,本期將試著進行解讀。
中國為什么不能像美國那樣發放認證
2018年4月初,FDA批準通過了IDx公司研發的首個應用于一線醫療的自主式人工智能診斷設備——IDx-DR 的軟件程序,它可以在無專業醫生參與的情況下,通過查看視網膜照片對糖尿病性視網膜病變進行診斷。
這個看似簡單的診斷,IDx 卻整整走了21年。IDx 是一家專注于開發臨床自主診斷算法的公司,單就和 FDA 在如何評估系統并確保其準確性和安全性方面的溝通,IDx就花了7年。
西門子醫學影像分析首席專家周少華博士曾向記者介紹,美國FDA分三類監管醫療設備,其根據是設備的可能使用及其給病人帶來的風險。第一類class I是低風險設備如醫用手套;第二類class II是中等風險設備如CT機;第三類class III是最高風險設備如支架。
Al影像系統有兩種:computer-aided detection (CADe) 和 computer-assisted diagnostic (CADx) 。
CADe 用于檢測不正常狀況abnormalities,而CADx評估疾病的存在與否,如疾病的嚴重性、分類或預測。
FDA 對于監管CADe軟件有很多經驗,并提供510(k) 的指示標準,如何做臨床表現評價。但是,FDA歷來把CADx系統作為class III。
但是據了解目前獲得FDA審批的醫療AI 產品多是走的class II。也就是說通過降低門檻來過審批。而中國從目前的情形來看是將新一代醫療AI定位為三類醫療器械,所以審批上會有不同。
建議各家公司考慮認證三類醫療器械
匯醫慧影聯合創始人郭娜表示,美國近期批復的幾款AI產品全都是走的ClassII的認證流程,通過跟傳統CDSS(臨床決策支持系統)做等同對比證明安全有效性。中國藥監局的法規相對來說更嚴格,對臨床評價的路徑控制非常嚴格,按目前法規,基本上國內的AI產品都得走臨床試驗這條評價路徑,耗時會比較長。
目前藥監局沒有發出這種降低審批標準的信號,按新的分類目錄,直接給出診斷治療建議的輔助決策軟件都屬于三類,如果僅僅給出量化數值,像骨密度,那就是按二類醫療器械來管理,市場上大部分的AI產品都屬于三類。
2017年9月4日,CFDA發布的新版《醫療器械分類目錄》醫用軟件中包含的輔助診斷,主要是針對之前已經出現的輔助診斷產品,比如CAD系統等。但這類并不包含自動診斷系統,對最近流行起來的人工智能軟件產品的界定并不完善。
這個分類目錄是相關部門根據之前輔助診斷類產品的分類、審批、發證的經驗和問題重新制定的。而對于新一代醫療人工智能產品,之前并沒有先例可尋。現階段雖然有人工智能公司申報藥監局認證,但是目前還沒有一家公司拿到三類醫療器械。
同時,目前雅森、匯醫慧影、推想、深睿、Airdoc、依圖醫療等幾個大公司都在積極進行三類醫療器械的申報。依圖醫療表示,他們的全產品矩陣都在做三類認證。另外,Airdoc送檢了中國第一臺裝載待檢人工智能AI軟件的服務器。
用于審批的標準數據庫正在逐步建立
醫療人工智能產品沒有獲得審批的一部分原因是用于審批的標準數據庫還在建設中,但是各個地區、醫院的數據標準并不同。
一家公司在北京兩家大醫院做的臨床實驗即使完美,但是并不代表產品可以在某縣級醫院中使用,甚至由于過擬合的現象,導至在其他醫院無法使用。而如何驗證醫療AI產品的魯棒性(普遍適應性),建立標準測試數據庫是現階段監管部門正在做的事情。
目前的標準測試數據庫建設是按照病種進行的。據中檢院官方微信發布的信息顯示,2018年3月26日,標準測試數據集(眼底部分)建設完成。肺結節的標準數據庫建設方案也已經定稿,近期就可以建設完成。
參與標準測試數據庫建設的第二軍醫大學長征醫院影像醫學與核醫學科主任劉士遠介紹,標準測試數據庫建設為了保證公平性,使建立的數據庫能夠得到大多數企業和機構的認可,在建設過程中會遵循以下三個原則:
第一是廣泛性,數據要來自全國各地不同的醫院,不能只局限于北上廣深這些大城市的醫學數據。
第二是兼容性,以肺部圖像為例,目前建立標準測試數據庫的時候會考慮不同層厚的CT圖像,有5毫米圖像,也有1-2毫米圖像,甚至亞毫米圖像。
第三是醫學圖像的標記要標準化。劉士遠教授表示,搜集一定數量的圖像并不難,難的是為數據打標簽。
除了標準數據庫外,還需要注意的幾個問題
是否可以考慮先上市后臨床
目前大多數醫療人工智能公司的發展都卡在了審批這個地方。醫療軟件注冊審批的流程大概是這樣的:
從這個流程圖,我們可以看到,在獲得藥監局認證之前,要先獲得體系認證,體系認證需要3-6個月。三類醫療器械認證需要2-3年,在審批之前要等到標準數據庫的建立,數據庫的建立需要一定的周期。
從中檢院的官微發布的信息推測,他們是按照病種進行來建立數據庫,與 FDA 在如何評估系統并確保其準確性和安全性方面的溝通,IDx就花了7年時間相比,審批部門的速度已經非常快了(中間還有一個春節)。
但是每個公司涉及的病種一般在10個左右,算上臨床實驗的時間,審批的過程在3-4年的時間。
這個過程是由于醫療和AI本身的嚴謹、安全性質決定的,這是審批機構和企業無法改變的現實。可是又有多少企業可以等待這么長時間呢?我們是否可以考慮一種新的市場準入方式?
為了企業和行業的持續發展,在保證安全性和穩定性的前提下,是否可以學習藥企走先上市后臨床審批的方式,讓行業先發展起來。
(廣義上講,藥物上市后所開展的所有臨床研究均稱為上市后研究,狹義講,上市后臨床研究是由生產企業、醫療機構或社會團體自行組織與藥品有關的應用研究。)
回顧性數據為臨床提供支持
根據數據收集方式,我們可以將臨床研究分為前瞻性數據收集的研究和回顧性數據收集研究。
所謂前瞻性數據收集的研究就是指預先制定研究方案,并且根據研究方案收集未來的數據。回顧性數據收集的研究則是指制定研究方案后,回顧性地收集過去的數據。
換而言之,二者的區別主要在于到底手機的是將來的數據還是過去的數據。
前瞻性數據收集研究的優點是能較好地控制的數據質量,研究的說服力強,缺點是研究產出周期較長,花費較高;回顧性數據收集研究的優點是研究產出周期短,且花費極低。
目前,我們走的是前瞻性研究,為了鼓勵行業發展,當一些產品比如眼底、肺結節醫療AI產品獲批后,其他產品采用回顧性研究,為臨床提供支持,減少企業在臨床審批過程中的時間和費用。