根據(jù)能否清晰表述和有效轉(zhuǎn)移,可以把知識分為顯性知識(explicit knowledge)和隱性知識(tacit knowledge)。醫(yī)學(xué)知識,是經(jīng)過醫(yī)學(xué)實踐證實、科學(xué)分析或嚴謹研討過程后形成的結(jié)果或論斷,對特定的臨床專業(yè)或疾病人群具有重要指導(dǎo)意義,可界定為經(jīng)過科學(xué)實驗/試驗并經(jīng)同行評議后已發(fā)表或已被醫(yī)學(xué)界接受的結(jié)果、主張或認知。由于醫(yī)學(xué)(特別是現(xiàn)代醫(yī)學(xué))有嚴格的培養(yǎng)標(biāo)準和教育體系,醫(yī)學(xué)知識主要以顯性知識為主,即可以被記錄下來,并被他人直接加以使用的知
識
[
9
]。醫(yī)學(xué)研究產(chǎn)出的醫(yī)學(xué)文獻和臨床指南成為醫(yī)學(xué)知識的主要載體。然而,大多數(shù)已發(fā)表的電子文獻停留于人類可理解的自然語言表示模式,即非結(jié)構(gòu)化的格式(一般以PDF文檔格式存儲),機器無法理解與計算,導(dǎo)致大量隱含在醫(yī)學(xué)文獻中的知識主張、可在實踐中應(yīng)用的模型或規(guī)則不能得到有效管理與利用。
以“‘computable knowledge’AND‘biomedical OR medical’”為核心關(guān)鍵詞,通過系統(tǒng)的文獻檢索與分析歸納,這一概念從字面上主要有兩種表述,“可計算的醫(yī)學(xué)知識”(computable medial knowledge)和“醫(yī)學(xué)知識的可計算化”(making medical knowledge computable)。前者側(cè)重實現(xiàn)的結(jié)果,后者側(cè)重實現(xiàn)的過程。從本質(zhì)上來看,兩者表達的意思是相同的。我們認為,可計算醫(yī)學(xué)知識的基本概念包括兩個方面,一是知識的表示形式可計算化,二是知識在實踐中“可執(zhí)行”,兩者缺一不可。
表示形式主要有兩類:一是從非結(jié)構(gòu)化數(shù)據(jù)中生成知識單元(knowledge unit),表示為從自由文本中抽取的“主語-謂語-賓語”語義三元組(subject-predicate-object,SPO triple
)
[
10-11
];二是從結(jié)構(gòu)化數(shù)據(jù)中生成可計算的知識對象(computable knowledge objects),表示為從醫(yī)療大數(shù)據(jù)中生成的疾病預(yù)測模型,以及疾病診斷規(guī)則、計算機化的臨床指南
等[
7
,
12
]。
美國密歇根大學(xué)MCBK主要側(cè)重于后者,包括兩方面。一是構(gòu)建可計算的各類知識對象,通過計算機程序?qū)Ω黝愔R進行編程封裝,形成計算機能處理的知識對象。一個知識對象包括知識載體、與用戶交互的界面,以及有關(guān)知識的詳細說明3個部分。二是在一個大的知識管理平臺上實現(xiàn)對知識對象的共享和利用。例如,在統(tǒng)一的標(biāo)準下類似Apple的APP Store提供各類APP應(yīng)用的下載和使用,醫(yī)生、患者、公眾等都能夠直接使用這些知識對象。
以“動脈粥樣硬化性心血管疾病預(yù)測的中國模型”為例進行說明,作者不僅發(fā)表了學(xué)術(shù)論文(人讀的格式,如文字、圖片和公式
)
[
13
];在此基礎(chǔ)上還開發(fā)了可公開使用的網(wǎng)頁版計算器(web-based calculator
)
和手機APP程序,把疾病預(yù)測模型以機器可執(zhí)行的格式存儲并供用戶使用。
根據(jù)健康人或患者輸入的年齡、總膽固醇、高密度脂蛋白膽固醇、糖尿病等綜合指標(biāo)數(shù)據(jù),可計算出10年后個人ASCVD(arteriosclerotic cardiovascular disease,動脈硬化性心血管疾病)的發(fā)病風(fēng)險。基于網(wǎng)頁版計算器和手機APP程序這樣的機器可執(zhí)行的知識對象,用戶通過“填寫-計算-預(yù)測”產(chǎn)生了大量新的數(shù)據(jù),這些新的數(shù)據(jù)可進一步幫助改進預(yù)測模型的準確性,進而又形成了性能更佳的預(yù)測模型(即“新知識”)。最終,實現(xiàn)了“從數(shù)據(jù)到知識、從知識到實踐,從實踐再到數(shù)據(jù)”的循環(huán)。然而,目前,這樣的疾病預(yù)測模型散落于醫(yī)學(xué)科研機構(gòu)或醫(yī)療機構(gòu)中科研人員自建的網(wǎng)站,無法對于用戶實現(xiàn)“一站式獲取和大規(guī)模使用”。MCBK的目標(biāo)就是要建立規(guī)范統(tǒng)一的、標(biāo)準化的知識對象存儲和共享平臺。
除了上述介紹的源自結(jié)構(gòu)化數(shù)據(jù)的疾病預(yù)測模型作為可直接調(diào)用和運行(即“可執(zhí)行”)的知識對象外,來源于非結(jié)構(gòu)化文本的知識圖譜通常也作為計算機系統(tǒng)中用來形式化表示知識的一種工
具
[
14
]。知識圖譜在臨床實踐中的價值主要體現(xiàn)為在將知識圖譜和基于真實世界數(shù)據(jù)的電子病歷的結(jié)合應(yīng)用上。目前,將醫(yī)學(xué)知識圖譜與電子病歷相結(jié)合(即促使醫(yī)學(xué)知識“可執(zhí)行”)是醫(yī)學(xué)知識圖譜應(yīng)用的前沿研究課題。這樣的結(jié)合為臨床醫(yī)護人員帶來的益處主要包含3個方面:一是方便查詢醫(yī)學(xué)領(lǐng)域知識;二是邏輯化呈現(xiàn)患者數(shù)據(jù)和信息;三是輔助臨床決策,從而幫助提高診斷效率和準確率。
使用知識圖譜可以提升從文獻或大量臨床數(shù)據(jù)中檢索信息、查詢知識的能力。例如,利用大型開放式知識庫(如Wikipedia和SemMedDB)提供的有關(guān)每種疾病及其相關(guān)癥狀、檢查和治療的知識圖譜,將電子病歷中提取的與診斷相關(guān)的信息與之進行比對,可提高臨床診斷的效
率
[
15
]。采用結(jié)構(gòu)化圖譜方式取代傳統(tǒng)的敘述性文本對患者病情進行描述,可改進復(fù)雜患者數(shù)據(jù)或個人健康信息的表示和呈現(xiàn),減輕醫(yī)生的信息負擔(dān)和認知負擔(dān)。在臨床診療過程中,可通過將人讀的、自然語言描述的醫(yī)學(xué)證據(jù)和臨床指南轉(zhuǎn)化為機器可讀、可理解的知識圖譜,把已有的知識通過知識圖譜工具提供給臨床以作為診療決策的重要參
考[
16
]。醫(yī)學(xué)知識圖譜與先進的知識圖譜推理方法的結(jié)合可以極大地減輕臨床醫(yī)生的診斷壓力,減少誤診率并提高診斷效率。由于醫(yī)學(xué)的系統(tǒng)性,目前的醫(yī)學(xué)知識圖譜主要面向?qū)2。磥硇枰鼮橥暾蜏蚀_的全科醫(yī)學(xué)知識圖譜,并需要不斷改進知識圖譜推理算法,以期更好地與臨床決策支持相結(jié)
合[
17
]。
此外,與MCBK側(cè)重“醫(yī)學(xué)知識的表示形式可計算化,即從人讀的論文轉(zhuǎn)化為機器可執(zhí)行的程序”不同,有學(xué)者提出醫(yī)學(xué)證據(jù)合成(evidence synthesis)也需要引入可計算化的思路,以減輕人工負荷。根據(jù)統(tǒng)計,目前全球每天要進行75項臨床試驗和11項系統(tǒng)綜述,如何跟上海量醫(yī)學(xué)證據(jù)的發(fā)展,并將其轉(zhuǎn)化為臨床實踐是一個迫切需要解決的科學(xué)問
題
[
18
]。系統(tǒng)綜述和meta分析已被公認為是客觀評價和合成針對某一特定問題的研究證據(jù)的最佳手段,通常被視作最高級別的證據(jù)。2020年,醫(yī)學(xué)信息學(xué)領(lǐng)域的學(xué)者發(fā)表了“可計算的證據(jù)合成”(computable evidence synthesis)的概念,提出了直接利用結(jié)構(gòu)化數(shù)據(jù)促進醫(yī)學(xué)證據(jù)合成的觀
點[
19
]。
在臨床試驗過程中,有關(guān)試驗設(shè)計和實施的信息通常與試驗結(jié)果一起以期刊文章的形式發(fā)布。因此,當(dāng)前的醫(yī)學(xué)證據(jù)合成主要依賴于人工檢索書目數(shù)據(jù)庫并閱讀、篩選證據(jù),導(dǎo)致數(shù)據(jù)不夠完整,且?guī)в幸欢ǔ潭鹊钠校缫寻l(fā)表文章多為陽性結(jié)果。關(guān)于試驗涉及的臨床問題和干預(yù)措施的詳細信息,可通過在試驗注冊時預(yù)先指定的數(shù)據(jù)元素獲取,使得數(shù)據(jù)結(jié)果能夠以標(biāo)準化、結(jié)構(gòu)化的格式呈現(xiàn)。臨床試驗注冊平臺所提供的結(jié)構(gòu)化結(jié)果數(shù)據(jù)更具有及時性、完整性和易獲取的特點,且可以實現(xiàn)數(shù)據(jù)的自動更新和計算機可解釋。
因此,現(xiàn)在應(yīng)該重新反思證據(jù)合成的基本原理。隨著獲取不同形式的可計算試驗數(shù)據(jù)成為可能,將有助于系統(tǒng)綜述從耗時的試驗結(jié)果出版物篩選模式轉(zhuǎn)為主動積極的臨床試驗監(jiān)測模式,從證據(jù)積累模式轉(zhuǎn)變?yōu)樽C據(jù)優(yōu)先級排序的模式。與此概念相對應(yīng),2020年8月,可計算化出版(computable publishing)組織成立,通過開發(fā)臨床試驗結(jié)果報告器(clinical trials reporter)等工具,支持基于標(biāo)準的、機器可解釋的公共知識表達,尤其是與健康醫(yī)療和科學(xué)證據(jù)有關(guān)的公共知
識
[
20
]。
3 可計算醫(yī)學(xué)知識的前端表示模型
基于美國密歇根大學(xué)對可計算醫(yī)學(xué)知識的定義,只有通過計算機編程封裝知識對象之后,才能實現(xiàn)可計算,從這個角度來看,可計算醫(yī)學(xué)知識的最終表示方式都是程序代碼。然而,本節(jié)重點闡述如何表示封裝之前的可計算醫(yī)學(xué)知識,即可計算醫(yī)學(xué)知識的前端表示模型。
3.1 醫(yī)學(xué)規(guī)則與診療知識庫
在醫(yī)學(xué)教科書、醫(yī)學(xué)文獻中出現(xiàn)的大多醫(yī)學(xué)知識,均是以傳統(tǒng)IF(前件)-THEN(后果)規(guī)則的格式進行表示。以發(fā)燒為例,醫(yī)學(xué)知識中的診斷規(guī)則通常表示如下:如果患者體溫超過38℃,那么該患者處于發(fā)燒狀態(tài)。傳統(tǒng)的醫(yī)學(xué)規(guī)則包含前件和后果,前件為臨床的某種病癥,后果為某種特定的疾病、治療方案、或者結(jié)局等。在臨床實踐中,大多數(shù)醫(yī)護人員的疾病診斷及治療均是依賴現(xiàn)有醫(yī)學(xué)知識中累積的各種規(guī)則。把針對特定疾病的診療規(guī)則進行歸納、整理,最終形成該種疾病的診療知識庫。
隨著計算機技術(shù)的發(fā)展,計算機存儲和計算能力已經(jīng)遠超人腦的記憶思維能力,把傳統(tǒng)IF-THEN診療規(guī)則或者診療知識庫電子化、結(jié)構(gòu)化,就形成了計算機能夠存儲并理解的計算機化醫(yī)學(xué)規(guī)則或者知識庫。在文獻和醫(yī)學(xué)實踐中,基于專家系統(tǒng)方式實現(xiàn)的臨床決策支持系統(tǒng),就是依賴于這樣的醫(yī)學(xué)規(guī)則和知識庫。
3.2 數(shù)據(jù)驅(qū)動的疾病預(yù)測模型
傳統(tǒng)醫(yī)學(xué)實踐中,醫(yī)護人員是依據(jù)權(quán)威的醫(yī)學(xué)知識或者自身經(jīng)驗進行臨床疾病診斷、治療以及疾病管理決策,因此,不同醫(yī)療機構(gòu)以及醫(yī)護人員的醫(yī)療服務(wù)水平和患者的預(yù)后與醫(yī)護人員自身的醫(yī)療背景以及經(jīng)驗具有很大關(guān)聯(lián),差異性非常大。在計算機與信息技術(shù)高度發(fā)達、大數(shù)據(jù)與人工智能已經(jīng)深度融入醫(yī)學(xué)領(lǐng)域的當(dāng)今時代,臨床的診療及疾病管理決策已經(jīng)不單單是依靠現(xiàn)有領(lǐng)域知識和專家自身經(jīng)驗,基于傳統(tǒng)醫(yī)學(xué)研究臨床試驗中所收集的數(shù)據(jù)以及真實醫(yī)療實踐中累積的醫(yī)療大數(shù)據(jù)進行分析、挖掘,找出疾病的規(guī)律和特征,構(gòu)建疾病發(fā)生、發(fā)展以及患者預(yù)后的預(yù)測模型,將輔助醫(yī)護人員進行有效的、優(yōu)化的臨床決策。
數(shù)據(jù)驅(qū)動的疾病發(fā)生、發(fā)展及患者預(yù)后的預(yù)測模型,其輸入變量一般是患者的人口學(xué)信息、臨床病癥以及實驗室檢查檢驗的結(jié)果,其輸出變量一般是某種疾病或并發(fā)癥發(fā)生、某種預(yù)后發(fā)生的概率。將數(shù)據(jù)驅(qū)動的疾病預(yù)測模型進行系統(tǒng)實現(xiàn),并有效嵌入或者集成到日常的醫(yī)療服務(wù)工作流程中,就形成了一個自動化、智能的臨床決策支持工具,以輔助臨床醫(yī)護人員進行各種診療決策。一般來講,數(shù)據(jù)驅(qū)動的疾病預(yù)測工具應(yīng)與基于知識的決策支持工具融合使用,一是拓展了現(xiàn)有領(lǐng)域知識和專家經(jīng)驗,二是彌補了基于局部真實世界醫(yī)療大數(shù)據(jù)或者臨床試驗數(shù)據(jù)進行疾病建模帶來的局限性。
3.3 語義三元組:細粒度表示醫(yī)學(xué)知識主張
大量的生物醫(yī)學(xué)知識隱藏在自由文本中,自然語言處理技術(shù)對實體(如疾病、藥物、基因、蛋白質(zhì)等)和關(guān)系(如疾病治療、蛋白質(zhì)/藥物相互作用和藥物不良反應(yīng)事件)的抽取,有助于支撐生物醫(yī)學(xué)知識管理和發(fā)現(xiàn)等應(yīng)用,促進臨床醫(yī)生和實驗室科研人員更有效地獲取信息和生成新知識。可計算知識應(yīng)是結(jié)構(gòu)化的知識,從格式上可由計算機程序讀取。一種簡單的、可計算的知識表示是語義三元組。語義三元組由兩個概念組成,這兩個概念通過某些謂語(即動詞)相互關(guān)聯(lián),如“導(dǎo)致(causes)”和“治療(treats)”。如“布洛芬-引起-胃腸道出血”就是這樣一種語義三元組。語義三元組被稱為“思想的原子”,既可以具象地表示某一命題或主張,又具有不可再分性。例如,可以將藥物知識表示為三元
組
[
21
],以從PubMed文獻中抽取的三元組作為基準,將從FDA(Food and Drug Administration,美國食品藥品監(jiān)督管理局)藥物說明書中抽取的三元組與之對比,可識別新的且文獻中未報道過的醫(yī)學(xué)知
識[
22
];將電子病歷文本中的知識元表示為語義三元組,開展電子病歷潛在知識發(fā)現(xiàn)研
究[
23
]。基于“以三元組為知識單元,以不確定性為知識語境”的知識計算模型,開展矛盾性、沖突性知識發(fā)
現(xiàn)[
24
]。
在醫(yī)學(xué)領(lǐng)域,語義三元組抽取已具有較為成熟的技術(shù),其中,以美國國立醫(yī)學(xué)圖書館的“科學(xué)知識語義表示”項目開發(fā)的SemRep工具和SemMedDB知識庫為典型代表。SemRep是Semantic Representation的簡稱,是一個基于規(guī)則的自然語言處理工具。以一體化醫(yī)學(xué)語言系統(tǒng)(unified medical language system,UMLS)中標(biāo)準化的醫(yī)學(xué)概念、概念類型(如藥物、疾病)和概念之間的語義關(guān)系(如治療)為基礎(chǔ),從自然語言文本中抽取“主語-謂語-賓語”三元組。最新版UMLS收錄約380萬個概念、127種概念類型和54種語義關(guān)系。SemMedDB知識庫存儲基于SemRep工具,抽取PubMed文獻標(biāo)題和摘要形成的三元組以及其來源語
句
[
25
]。該庫每年發(fā)布一次,且不斷改進,包括對SemRep工具提取的錯誤概念和關(guān)系進行糾正。SemRep和SemMedDB支持了多種臨床決策和轉(zhuǎn)化應(yīng)用,包括醫(yī)療診斷、藥物再利用、基于文獻的發(fā)現(xiàn)和假設(shè)生成,有助于改善健康結(jié)局。目前,SemRep工具正在被重新設(shè)計,以提高其整體性能。SemRep和SemMedDB實現(xiàn)了大規(guī)模知識單元的抽取和存儲,是一個基礎(chǔ)庫,并且可進行二次開發(fā)。例如,英國學(xué)者最近開發(fā)了MELODI Presto系
統(tǒng)
,該系統(tǒng)提供基于Web網(wǎng)頁查詢SemMedDB中的三元組及其背后的支持語
句[
26
]。
3.4 納米出版模型(nanopublication)
近年來,生物語義學(xué)(biosemantics)領(lǐng)域的進展為細粒度表示醫(yī)學(xué)知識對象提供了啟示和借鑒,以荷蘭萊頓大學(xué)生物語義學(xué)專家Barend Mons教授及其團隊提出的納米出版模型為典型代
表
[
27-28
]。該模型并非專指納米領(lǐng)域,而是指借鑒納米之義,具有科學(xué)意義的、機器可讀的、最小的知識單元。納米出版物模型解決了由于科學(xué)論文和數(shù)據(jù)集的不斷增長而導(dǎo)致檢索、分析知識單元以及將科學(xué)結(jié)果與基礎(chǔ)數(shù)據(jù)聯(lián)系起來日益困難的問題,實現(xiàn)了將人讀的知識轉(zhuǎn)化為機器可讀的知識。
基本結(jié)構(gòu)包括三部分:①主張(assertion),即主-謂-賓三元組表示的科學(xué)論斷;②出處信息(provenance),表示提出主張或創(chuàng)建了事實性素材(如數(shù)據(jù)、圖表等)的作者、機構(gòu)、時間和地點等;③出版信息(publication Information),關(guān)于一個納米出版物本身的元數(shù)據(jù),包括納米出版物的創(chuàng)建者、創(chuàng)建日期和版本等。這三個組件缺一不可,保證了信息完整性,并能有效提升科研信息的復(fù)用可能。這三個部分的內(nèi)容均使用RDF格式進行描述,保證了機器可理解和可操作。
目前主要有三種進行中的應(yīng)用。一是科研工作者自行將個人研究成果發(fā)布為納米出版物(存儲于平臺http://nanopub.org/wordpress/);二是將已有關(guān)系型數(shù)據(jù)庫(如基因-疾病關(guān)聯(lián)知識庫DisGeNet)以納米出版物形式發(fā)
布
[
29
];三是支持目標(biāo)導(dǎo)向的大型項目,如藥物發(fā)現(xiàn)語義平臺Open PHACTS(Open Pharmaceutical Triple Store)項
目[
30
],是一個存儲和計算藥學(xué)概念三元組的倉儲。基于納米出版模型,建立試驗數(shù)據(jù)和科學(xué)結(jié)論的規(guī)范語義描述本體,并在大規(guī)模生物醫(yī)藥文獻集上構(gòu)建了藥學(xué)知識單元形成的網(wǎng)絡(luò),即知識圖譜。納米出版模型尚未在臨床醫(yī)學(xué)領(lǐng)域廣泛應(yīng)用,這也是我們計劃研究的主要內(nèi)容。
如果以納米出版模型作為知識單元,構(gòu)建知識單元的引用關(guān)系反映的知識演化,那么需要解決的問題是如何像科學(xué)論文那樣,構(gòu)建納米出版物的引用格式。2019年,有學(xué)者提出了可對單個納米出版物進行引用的納米引用格式(nanocitation),并設(shè)計了一個系統(tǒng)自動生成納米出版物的引文,解決了這一模型缺乏引文標(biāo)準的問題,在此基礎(chǔ)上可以設(shè)計文獻計量學(xué)指標(biāo),開展知識單元這一細粒度層面的分
析
[
31
]。為了充分發(fā)揮并利用可計算醫(yī)學(xué)知識的優(yōu)勢,最終需要一種全新的方法讓所有知識在開始生成時便適合于計
算[
32
]。例如,將傳統(tǒng)的人讀的科學(xué)出版物轉(zhuǎn)化為機器可讀的納米出版物,研究產(chǎn)出將不再僅僅是科學(xué)論文及相關(guān)的數(shù)據(jù)集,而是一組可計算格式的結(jié)果或主張,描述實驗過程和結(jié)果的自然語言文本(即學(xué)術(shù)論文)僅作為供人類可讀并參考的一種形式,對其進行處理后可產(chǎn)生更高階的信息,如系統(tǒng)綜述和臨床實踐指南。
3.5 knowlet模型:以知識子圖作為可編碼知識單元
提出納米出版模型的Barend Mons教授及其團隊同時提出,把所有持相同論斷的納米出版物中共同出現(xiàn)的論斷聚合為一個“基本論斷”,以減少冗
余
[
33
]。將圍繞一個中心概念(central concept)、路徑長度為1的三元組之組合作為一個knowlet。我們認為,knowlet是指知識圖譜中可以表示一個獨立知識單元的子圖,可將其譯為“知識子圖”。例如,圍繞“新冠”這一概念,作為起點或終點的所有關(guān)系,如癥狀、診斷、治療形成的三元組。隨著圍繞某一概念的論斷越來越多,與文本空間快速增長相比,知識子圖空間增長較小,例如,有大量的文本涉及的知識單元只有一個。知識子圖是一個獨立的數(shù)字對象和最小的知識單元,其本身可被發(fā)現(xiàn)、可訪問、可互操作以及可重用。
在上述5種醫(yī)學(xué)知識表示模型中,醫(yī)學(xué)診斷規(guī)則和數(shù)據(jù)驅(qū)動的疾病預(yù)測模型主要涉及結(jié)構(gòu)化數(shù)據(jù),以三元組為基礎(chǔ)的表示模型主要適用于非結(jié)構(gòu)化文本。實際上,規(guī)則也可以表示為三元組,例如,“心率”-“正常值”-“60~100次/分”就是“實體-屬性-值”表示的三元組;基于醫(yī)學(xué)數(shù)據(jù)、通過機器學(xué)習(xí)產(chǎn)生的決策樹,可以轉(zhuǎn)化為一系列的醫(yī)學(xué)規(guī)則,亦可理解為三元組的邏輯組合。知識圖譜的本質(zhì)是三元組因果關(guān)系圖譜,由“實體-屬性-值”或“實體-關(guān)系-實體”構(gòu)成。每個屬性-值對應(yīng)刻畫了實體的內(nèi)在特性;關(guān)系則連接兩個實體,刻畫了實體之間的外部關(guān)聯(lián)。
4 醫(yī)學(xué)知識“可執(zhí)行”的實現(xiàn)路徑
本文第2節(jié)提出了可計算醫(yī)學(xué)知識的兩個要素:一是可計算化的表示形式,二是機器可執(zhí)行。第3節(jié)和第4節(jié)分就分為圍繞上述兩個要素展開,其中,第3節(jié)是側(cè)重于知識對象封裝成軟件代碼之前如何表示的問題;而第4節(jié)側(cè)重于知識對象封裝成軟件代碼之后,如何提供服務(wù)的整個流程以及尚需要解決的問題。
北京大學(xué)健康醫(yī)療大數(shù)據(jù)國家研究院正在牽頭積極推動可計算醫(yī)學(xué)知識在中國的研究和實踐,并與該概念的提出者——密歇根大學(xué)學(xué)習(xí)型健康醫(yī)療體系研究中心Charles Friedman教授的團隊保持著密切合作。Charles Friedman教授團隊開發(fā)了一個用于可計算知識對象封裝、存儲、管理和調(diào)用的知識網(wǎng)格(knowledge grid,K-Grid)平
臺
。目前已經(jīng)實現(xiàn)原型系統(tǒng),并在持續(xù)研發(fā)中。北京大學(xué)健康醫(yī)療大數(shù)據(jù)國家研究院、浙江省北大信息技術(shù)高等研究院智慧醫(yī)療研究中心正在中國進行本地化開發(fā)與推廣。目前,該平臺中的知識對象主要來源于結(jié)構(gòu)化數(shù)據(jù),且以疾病預(yù)測模型為主。
上文介紹了荷蘭萊頓大學(xué)Barend Mons教授團隊提出的納米出版模型與知識子圖模型,主要來源于非結(jié)構(gòu)化文本。我們嘗試將這類知識對象也能編程封裝之后,在K-Grid平臺上實現(xiàn)調(diào)用和執(zhí)行。因此,為了更充分和全面地在我國設(shè)計和發(fā)起可計算醫(yī)學(xué)知識的研發(fā)和實踐,我們整合了上述兩條路徑(
圖1
)。

圖1 可計算醫(yī)學(xué)知識的兩條實現(xiàn)路徑(分別針對結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化文本)
知識生成與知識的可計算化處理是分開的、在不同階段進行的。本文重點討論將生成后的知識(臨床指南、醫(yī)學(xué)文獻、本地實驗/試驗后的分析結(jié)果等)實現(xiàn)可計算化這階段。
一是數(shù)據(jù)挖掘,形成計算機可直接調(diào)用和執(zhí)行(如直接計算出疾病風(fēng)險分值)的知識對象,用知識網(wǎng)格(K-Grid)管理,提供輔助診斷。例如,根據(jù)生化指標(biāo)判斷患者是否可診斷為慢性腎病合并貧血,根據(jù)若干指標(biāo)計算個人罹患肺癌風(fēng)險分值等。數(shù)據(jù)挖掘產(chǎn)生的規(guī)則或者模型屬于知識表示模型(如人工神經(jīng)網(wǎng)絡(luò)、決策樹等),還沒有形成可計算知識對象,需要K-Grid平臺上的工具對規(guī)則或者模型進行編程封裝之后,才能形成可計算知識對象;多種計算機語言(R或者Python)可供選擇進行預(yù)測模型的封裝。雖然R開發(fā)環(huán)境挖掘出來的模型本身就是可執(zhí)行的,但是如果想通過K-Grid平臺進行管理的話,還需要進一步編程封裝。這與文本挖掘產(chǎn)生知識三元組是一個平行的過程。
二是文本挖掘,形成結(jié)構(gòu)化的三元組,并納入三元組背后的證據(jù)和數(shù)據(jù),計算出置信度,采用類似Neo4j圖數(shù)據(jù)庫來管理,實現(xiàn)知識單元的查詢和輸出。例如,根據(jù)目前最佳證據(jù),治療某種疾病的藥物清單,該藥物清單可按照置信度排序,提供治療方式的自動推薦。
總之,無論是路徑一提供的輔助診斷,還是路徑二提供的輔助治療,均為臨床決策支持的范疇。下文分別介紹了在兩條實施路徑中,我們已完成的內(nèi)容以及需要繼續(xù)研發(fā)的內(nèi)容。
4.1 路徑一:從結(jié)構(gòu)化數(shù)據(jù)中生成的可計算醫(yī)學(xué)知識
當(dāng)前,作為中國首個“推動醫(yī)學(xué)知識可計算行動”的網(wǎng)
站
,已完成平臺的設(shè)計與研發(fā)(
圖2
)。選擇慢性疾病作為切入點,構(gòu)建了醫(yī)學(xué)知識模型與可計算編程規(guī)范。已建設(shè)醫(yī)學(xué)知識對象29個,多場景兼容應(yīng)用14個,全流程慢性腎臟疾病(chronic kidney disease,CKD)解決方案專題2個。為醫(yī)療機構(gòu)和醫(yī)學(xué)專家團隊提供創(chuàng)建并管理醫(yī)學(xué)知識模型的平臺,讓知識提供者能便捷分享最新研究成果;提供通用的模型API(application programming interface,應(yīng)用程序接口)接口,軟件工程師不需要掌握醫(yī)學(xué)知識即可對模型進行組合與部署,研發(fā)符合定制化業(yè)務(wù)流程的應(yīng)用;患者可通過已有應(yīng)用進行健康狀況自評與疾病風(fēng)險預(yù)測,醫(yī)護人員可以使用應(yīng)用輔助診療與科研。通過與北京大學(xué)醫(yī)學(xué)部、北京大學(xué)第一醫(yī)院、密歇根大學(xué)等多家醫(yī)療機構(gòu)與國內(nèi)外院校開展深度合作,推動了學(xué)習(xí)型智慧健康體系在中國的落地發(fā)展。

圖2 K-Grid-China可計算醫(yī)學(xué)知識智能應(yīng)用平臺示意圖
其主要功能是把原先需要醫(yī)護人員、醫(yī)療領(lǐng)域決策者或者醫(yī)學(xué)科研人員認真閱讀、深入理解才能具體掌握的醫(yī)學(xué)知識,轉(zhuǎn)變?yōu)榭捎嬎愕尼t(yī)學(xué)知識對象,以供各類醫(yī)學(xué)應(yīng)用大規(guī)模、并行、且實時地調(diào)用運行。該平臺的核心組件主要包含知識對象、知識對象庫、知識對象激活器以及服務(wù)四個部分(
圖2
)。
(1)知識對象(knowledge objects)。知識對象是經(jīng)編程封裝的模塊化、計算機可識別、可處理執(zhí)行的知識模塊。其來源可以是臨床指南(guideline)、期刊文獻以及數(shù)據(jù)驅(qū)動的疾病預(yù)測模型等。知識對象包含程序語言所組成的核心知識載體(knowledge payload)、用于與外界溝通的知識對象元數(shù)據(jù)(metadata)、該知識對象部署及相關(guān)服務(wù)的詳細說明(specification)。
(2)知識對象庫(digital library)。知識對象庫用來儲存與管理知識對象。一個知識網(wǎng)格平臺可以包含多個知識對象庫,知識對象庫之間相互關(guān)聯(lián),知識對象庫的基礎(chǔ)為一個網(wǎng)絡(luò)服務(wù)器(web server),加上對象檢索服務(wù)。
(3)知識對象激活器(activators)。知識對象激活器是一個用來處理患者健康數(shù)據(jù)、激活并部署知識對象、利用知識對象來提供服務(wù)的工具。激活器提供可平行擴展的工具來讓知識對象基于真實世界的患者數(shù)據(jù)進行計算推理,并給出運行結(jié)果。理想上激活器可以執(zhí)行以不同語言所編程封裝的知識載體,可將知識載體提供給其他應(yīng)用程序,也可讓某一知識載體本身提供服務(wù)。
(4)服務(wù)(services)。核心功能在于鏈接醫(yī)學(xué)應(yīng)用與知識對象,利用外界應(yīng)用的輸入數(shù)據(jù)激活相關(guān)的知識對象,并把運行結(jié)果反饋給外界應(yīng)用。
知識網(wǎng)格平臺與各個來源不同、類型相異的醫(yī)學(xué)知識相比較,就如共同的橋梁和獨立的小船,知識網(wǎng)格平臺為各種醫(yī)學(xué)知識提供了一個通用的平臺工具,讓各類醫(yī)學(xué)知識能夠通過該平臺以一個通用的標(biāo)準和模式為各類醫(yī)學(xué)應(yīng)用所調(diào)用,以期為學(xué)習(xí)型智慧健康醫(yī)療體系中知識到實踐一環(huán)提供基礎(chǔ)架構(gòu)。
在該路徑中,推進可計算的醫(yī)學(xué)知識研發(fā)與應(yīng)用還面臨著若干挑戰(zhàn)。一是將可計算的知識對象,例如,疾病預(yù)測模型應(yīng)用于不同的電子病歷系統(tǒng)涉及的標(biāo)準和互操作性問題;二是需要更好地追蹤和評估可計算醫(yī)學(xué)知識對患者診療結(jié)果的影響;三是如何將目前針對單一病種的可計算醫(yī)學(xué)知識實現(xiàn)方法和手段拓展到針對共病的醫(yī)學(xué)知識
等
[
34
]。
4.2 路徑二:從非結(jié)構(gòu)化文本中生成的可計算醫(yī)學(xué)知識
從文本信息中提取知識,開展知識計算一直是情報學(xué)的前沿問題,其核心在于找到合適的知識單元,即要解決什么是知識以及用什么來表示知識。現(xiàn)有研究表明,受計算機科學(xué)領(lǐng)域啟發(fā),以“實體-關(guān)系-實體”和“概念-屬性-值”三元組作為知識計算單元,具有理論上的合理性以及數(shù)據(jù)實現(xiàn)的可行
性
[
35
]。數(shù)字時代,文本大數(shù)據(jù)中隱藏著大量醫(yī)學(xué)知識,去除醫(yī)學(xué)文本冗余部分并提取結(jié)構(gòu)化知識單元是解決信息超載問題、實現(xiàn)大規(guī)模知識計算的關(guān)鍵。但仍有兩個科學(xué)問題需要解決。一是如何既完整又最小化(不可再分)地表示一個獨立的醫(yī)學(xué)知識單元,即如何在三元組及其邏輯組合形成的知識圖譜中,找到一個最小子圖,作為可計算醫(yī)學(xué)知識的基本單元,對其利用計算機語言進行編程實現(xiàn),通過計算機程序?qū)崿F(xiàn)與醫(yī)療數(shù)據(jù)之間的自動化對話;二是鑒于醫(yī)學(xué)知識的個體化和不確定性特征,需要明確醫(yī)學(xué)知識單元成立的依賴條件和證據(jù)來源,同時兼顧醫(yī)學(xué)知識表示的結(jié)構(gòu)化、完整性和不可再分性,才能將人讀的知識格式盡可能“無丟失”和“無冗余”地轉(zhuǎn)化為機器可讀且可執(zhí)行的知識格式。
以美國密歇根大學(xué)K-Grid原型為基礎(chǔ),參考荷蘭萊頓大學(xué)納米出版模型和知識子圖(knowlet)模型,本文提出從非結(jié)構(gòu)化文本中生成可計算醫(yī)學(xué)知識的語義表示模型(
圖3
)和主要實現(xiàn)路徑(
圖4
)。該模型兼顧醫(yī)學(xué)知識結(jié)構(gòu)化和可執(zhí)行兩個核心要點,考慮將置信度作為醫(yī)學(xué)知識執(zhí)行和應(yīng)用的必要條件,以“可編碼知識單元+置信度+可追蹤的證據(jù)來源”為基本組件,每個組件均以資源描述框架(resource description framework,RDF)格式進行描述。為實現(xiàn)知識之間的互操作,對每個可編碼知識單元分配一個可信任的統(tǒng)一資源標(biāo)識符。該模型將“知識單元”及其背后的數(shù)據(jù)和證據(jù)鏈接起來。

圖3 從非結(jié)構(gòu)化文本中生成的可計算醫(yī)學(xué)知識的語義表示模型

圖4 源于非結(jié)構(gòu)化文本的可計算醫(yī)學(xué)知識流程圖
該模型的關(guān)鍵要素主要包括三個方面。
(1)知識的結(jié)構(gòu)化問題。采用較為成熟的英文醫(yī)學(xué)自然語言處理工具和中英文醫(yī)學(xué)術(shù)語映射體系,解決中文醫(yī)學(xué)自然語言處理和三元組抽取問題,形成以主語-謂語-賓語三元組形式表示的結(jié)構(gòu)化主張。針對英文自然語言表述的醫(yī)學(xué)文獻、臨床指南、醫(yī)學(xué)百科和現(xiàn)有醫(yī)學(xué)知識庫等,利用一體化醫(yī)學(xué)語言系統(tǒng)(UMLS),優(yōu)化基于SemRep抽取的臨床相關(guān)“概念-關(guān)系-概念”三元組;對于召回率低的問題,考慮增加利用通用信息抽取工具,如OpenIE抽取“實體-屬性-值”三元組。同時,需要開展醫(yī)學(xué)證據(jù)、結(jié)局指標(biāo)與數(shù)值抽取,內(nèi)容包括臨床結(jié)局指標(biāo)(如有效率、應(yīng)答率等)、值及P-value。例如,從自然語言文本“2019年我國心血管疾病導(dǎo)致死亡人數(shù)約460萬,占全部死亡的43%”中可抽取出:①三元組:“心血管疾病-死亡占比-43%”;②依賴條件:中國人群;③證據(jù)來源:2019年全球疾病負擔(dān)報告(the global burden of disease study 2019,GBD 2019)。同時,探索基于臨床試驗注冊平臺數(shù)據(jù)開展證據(jù)合成的方法研究,以美國Clinicaltrials.gov、中國臨床試驗注冊平臺等為基礎(chǔ),利用其相對結(jié)構(gòu)化的數(shù)據(jù),自動生成“患者-干預(yù)-對照-結(jié)局”(population-interventions-comparisons-outcomes,PICO),對于注冊平臺上未報告結(jié)果的試驗,通過計算機軟件工具獲取書目數(shù)據(jù)庫(如PubMed)或網(wǎng)絡(luò)(如權(quán)威會議報道)報告結(jié)果。
(2)知識的置信度問題。針對現(xiàn)有的臨床治療類知識圖譜中三元組因缺乏置信度(confidence score)導(dǎo)致在真實世界臨床決策難以落地的瓶頸,需要對醫(yī)學(xué)知識三元組的置信度水平進行計算,但總體的置信度水平離不開每個證據(jù)的臨床結(jié)局。根據(jù)證據(jù)推理(evidential reasoning)理論,把不同的臨床證據(jù)的置信度進行合成,可計算得到該三元組的綜合置信度得分。通過舍棄置信度較低的知識,或找到置信度較低知識的條件來保障知識圖譜中三元組的質(zhì)量。
(3)知識的臨床決策支持應(yīng)用。基于中文一體化醫(yī)學(xué)語言系統(tǒng)(Chinese unified medical language system,CUMLS
)
[
36
]、國家衛(wèi)生健康委員會陸續(xù)發(fā)布的中文醫(yī)學(xué)術(shù)語表等,對構(gòu)建的醫(yī)學(xué)知識圖譜中各三元組中的概念和關(guān)系進行中英文映射,轉(zhuǎn)化為中文醫(yī)學(xué)知識圖譜三元組。探索實現(xiàn)醫(yī)學(xué)知識“可執(zhí)行”的機制,將醫(yī)學(xué)知識圖譜的子圖作為知識單元進行計算機語言編碼,并開發(fā)與真實世界電子病歷中數(shù)據(jù)對話的接口。基于帶有置信度的知識三元組,通過計算機編程封裝轉(zhuǎn)化為可計算知識對象以輔助臨床決策,如診斷預(yù)測、治療推薦等。通過在臨床工作流程中嵌入可計算知識對象、開發(fā)可計算知識和患者數(shù)據(jù)之間的對話機制,解決從知識到實踐,從實踐再到數(shù)據(jù)的循環(huán)式學(xué)習(xí),解決醫(yī)學(xué)知識圖譜在真實場景中落地應(yīng)用問題。
對于從非結(jié)構(gòu)化文本中抽取可計算醫(yī)學(xué)知識,結(jié)構(gòu)化和可執(zhí)行同樣是其兩個關(guān)鍵要素,也是兩個重要目標(biāo)。其中,結(jié)構(gòu)化是指從非結(jié)構(gòu)化醫(yī)學(xué)文本中生成結(jié)構(gòu)化的知識,并構(gòu)建適宜的表示和存儲模型,實現(xiàn)大規(guī)模存取;可執(zhí)行是指能與電子病歷(EMR)數(shù)據(jù)進行交互,并提供決策支持,實現(xiàn)大規(guī)模使用。在知識圖譜三元組的基礎(chǔ)上,提出增加通過證據(jù)推理融合計算總體置信度水平的思路,解決的知識應(yīng)用的關(guān)鍵瓶頸——不確定性。最終實現(xiàn)“從數(shù)據(jù)到知識、從知識到實踐、從實踐再到數(shù)據(jù)”的循環(huán)式學(xué)習(xí),促進醫(yī)學(xué)知識快速服務(wù)于臨床實踐。
參 考 文 獻
1
葉鷹, 馬費成. 數(shù)據(jù)科學(xué)興起及其與信息科學(xué)的關(guān)聯(lián)[J]. 情報學(xué)報, 2015, 34(6): 575-580. [百度學(xué)術(shù)]
2
Zhu L S, Zheng W J. Informatics, data science, and artificial intelligence[J]. JAMA, 2018, 320(11): 1103-1104. [百度學(xué)術(shù)]
3
Fortunato S, Bergstrom C T, B?rner K, et al. Science of science[J]. Science, 2018, 359(6379): eaao0185. [百度學(xué)術(shù)]
4
Milojevi? S. Quantifying the cognitive extent of science[J]. Journal of Informetrics, 2015, 9(4): 962-973. [百度學(xué)術(shù)]
5
馬費成. 情報學(xué)的進展與深化[J]. 情報學(xué)報, 1996, 15(5): 22-28. [百度學(xué)術(shù)]
6
文庭孝, 羅賢春, 劉曉英, 等. 知識單元研究述評[J]. 中國圖書館學(xué)報, 2011, 37(5): 75-86. [百度學(xué)術(shù)]
7
Friedman C P, Flynn A J. Computable knowledge: an imperative for Learning Health Systems[J]. Learning Health Systems, 2019, 3(4): e10203. [百度學(xué)術(shù)]
8
Williams M, Richesson R L, Bray B E, et al. Summary of third annual MCBK public meeting: mobilizing computable biomedical knowledge—accelerating the second knowledge revolution[J]. Learning Health Systems, 2021, 5(1): e10255. [百度學(xué)術(shù)]
9
Wyatt J, Scott P. Computable knowledge is the enemy of disease[J]. BMJ Health & Care Informatics, 2020, 27(2): e100200.[百度學(xué)術(shù)]
10
Kilicoglu H, Rosemblat G, Fiszman M, et al. Broad-coverage biomedical relation extraction with SemRep[J]. BMC Bioinformatics, 2020, 21(1): 188. [百度學(xué)術(shù)]
11
索傳軍, 蓋雙雙. 知識元的內(nèi)涵、結(jié)構(gòu)與描述模型研究[J]. 中國圖書館學(xué)報, 2018, 44(4): 54-72. [百度學(xué)術(shù)]
12
Flynn A J, Friedman C P, Boisvert P, et al. The Knowledge Object Reference Ontology (KORO): a formalism to support management and sharing of computable biomedical knowledge for learning health systems[J]. Learning Health Systems, 2018, 2(2): e10054. [百度學(xué)術(shù)]
13
Yang X L, Li J X, Hu D S, et al. Predicting the 10-year risks of atherosclerotic cardiovascular disease in Chinese population: the China-PAR project (prediction for ASCVD risk in China)[J]. Circulation, 2016, 134(19): 1430-1440. [百度學(xué)術(shù)]
14
Callahan T J, Tripodi I J, Pielke-Lombardo H, et al. Knowledge-based biomedical data science[J]. Annual Review of Biomedical Data Science, 2020, 3: 23-41. [百度學(xué)術(shù)]
15
Zhang D C, He D Q. Enhancing clinical decision support systems with public knowledge bases[J]. Data and Information Management, 2017, 1(1): 49-60. [百度學(xué)術(shù)]
16
覃露, 徐曉巍, 丁玲玲, 等. 面向決策支持的臨床指南知識表示方法研究[J]. 中華醫(yī)學(xué)圖書情報雜志, 2020, 29(2): 1-8. [百度學(xué)術(shù)]
17
朱超宇, 劉雷. 基于知識圖譜的醫(yī)學(xué)決策支持應(yīng)用綜述[J]. 數(shù)據(jù)分析與知識發(fā)現(xiàn), 2020, 4(12): 26-32. [百度學(xué)術(shù)]
18
Bastian H, Glasziou P, Chalmers I. Seventy-five trials and eleven systematic reviews a day: how will we ever keep up?[J]. PLoS Medicine, 2010, 7(9): e1000326. [百度學(xué)術(shù)]
19
Dunn A G, Bourgeois F T. Is it time for computable evidence synthesis?[J]. Journal of the American Medical Informatics Association, 2020, 27(6): 972-975. [百度學(xué)術(shù)]
20
Alper B S, Richardson J E, Lehmann H P, et al. It is time for computable evidence synthesis: the COVID-19 knowledge accelerator initiative[J]. Journal of the American Medical Informatics Association, 2020, 27(8): 1338-1339. [百度學(xué)術(shù)]
21
Elkin P L, Carter J S, Nabar M, et al. Drug knowledge expressed as computable semantic triples[J]. Studies in Health Technology and Informatics, 2011, 166: 38-47. [百度學(xué)術(shù)]
22
Malec S A, Boyce R D. Exploring novel computable knowledge in structured drug product labels[J]. AMIA Joint Summits on Translational Science Proceedings, 2020, 2020: 403-412. [百度學(xué)術(shù)]
23
溫有奎, 焦玉英. 基于語義三元組的電子病歷潛在知識發(fā)現(xiàn)研究[J]. 情報學(xué)報, 2011, 30(7): 675-681. [百度學(xué)術(shù)]
24
Li X Y, Peng S Y, Du J. Towards medical knowmetrics: representing and computing medical knowledge using semantic predications as the knowledge unit and the uncertainty as the knowledge context[J]. Scientometrics, 2021, 126(7): 6225-6251.[百度學(xué)術(shù)]
25
Kilicoglu H, Shin D, Fiszman M, et al. SemMedDB: a PubMed-scale repository of biomedical semantic predications[J]. Bioinformatics, 2012, 28(23): 3158-3160. [百度學(xué)術(shù)]
26
Elsworth B, Gaunt T R. MELODI Presto: a fast and agile tool to explore semantic triples derived from biomedical literature[J]. Bioinformatics, 2021, 37(4): 583-585. [百度學(xué)術(shù)]
27
Mons B, van Haagen H, Chichester C, et al. The value of data[J]. Nature Genetics, 2011, 43(4): 281-283. [百度學(xué)術(shù)]
28
Groth P, Gibson A, Velterop J. The anatomy of a nanopublication[J]. Information Services & Use, 2010, 30(1/2): 51-56.[百度學(xué)術(shù)]
29
Fabris E, Kuhn T, Silvello G. Nanocitation: complete and interoperable citations of nanopublications[C]// Proceedings of the Italian Conference on Digital Libraries. Cham: Springer, 2020: 182-187. [百度學(xué)術(shù)]
30
Williams A J, Harland L, Groth P, et al. Open PHACTS: semantic interoperability for drug discovery[J]. Drug Discovery Today, 2012, 17(21/22): 1188-1198. [百度學(xué)術(shù)]
31
Fabris E, Kuhn T, Silvello G. A framework for citing nanopublications[C]// Proceedings of the International Conference on Theory and Practice of Digital Libraries. Cham: Springer, 2019: 70-83. [百度學(xué)術(shù)]
32
Wong D, Peek N. Does not compute: challenges and solutions in managing computable biomedical knowledge[J]. BMJ Health & Care Informatics, 2020, 27(2): e100123. [百度學(xué)術(shù)]
33
Mons B. FAIR science for social machines: let’s share metadata knowlets in the Internet of FAIR data and services[J]. Data Intelligence, 2019, 1(1): 22-42. [百度學(xué)術(shù)]
34
Walsh K, Wroe C. Mobilising computable biomedical knowledge: challenges for clinical decision support from a medical knowledge provider[J]. BMJ Health & Care Informatics, 2020, 27(2): e100121. [百度學(xué)術(shù)]
35
杜建. 醫(yī)學(xué)知識不確定性測度的進展與展望[J]. 數(shù)據(jù)分析與知識發(fā)現(xiàn), 2020, 4(10): 14-27. [百度學(xué)術(shù)]
36
李丹亞, 胡鐵軍, 李軍蓮, 等. 中文一體化醫(yī)學(xué)語言系統(tǒng)的構(gòu)建與應(yīng)用[J]. 情報雜志, 2011, 30(2): 147-151. [百度學(xué)術(shù)]
38
Swierstra T, Efstathiou S. Knowledge repositories. In digital knowledge we trust[J]. Medicine, Health Care and Philosophy, 2020, 23(4): 543-547. [百度學(xué)術(shù)]
39
Efstathiou S, Nydal R, Laegreid A, et al. Scientific knowledge in the age of computation: explicated, computable and manageable?[J]. THEORIA: An International Journal for Theory, History and Foundations of Science, 2019, 34(2): 213-236.[百度學(xué)術(shù)]
40
Smalheiser N R. Rediscovering Don Swanson: the past, present and future of literature-based discovery[J]. Journal of Data and Information Science, 2017, 2(4): 43-64. [百度學(xué)術(shù)]
41
吳家睿. 確定的不確定性與不確定的確定性——治療疾病決策與控制傳染病決策之差異[J]. 醫(yī)學(xué)與哲學(xué), 2020, 41(8): 1-6, 70. [百度學(xué)術(shù)]
42
Andermann A, Pang T, Newton J N, et al. Evidence for Health II: overcoming barriers to using evidence in policy and practice[J]. Health Research Policy and Systems, 2016, 14: 17. [百度學(xué)術(shù)]
43
Zhang L X, Wang H B, Li Q Z, et al. Big data and medical research in China[J]. BMJ, 2018, 360: j5910. [百度學(xué)術(shù)]