
杜建
職稱:助理教授、副研究員
辦公地點(diǎn):北京大學(xué)醫(yī)學(xué)部醫(yī)學(xué)科技樓西樓5層
郵箱:dujian@bjmu.edu.cn
個人簡介
2017年獲南京大學(xué)信息資源管理博士學(xué)位。曾任職于北京協(xié)和醫(yī)學(xué)院醫(yī)學(xué)信息研究所,2019年11月入職北京大學(xué)醫(yī)學(xué)部。近5年,主持科技部重點(diǎn)研發(fā)計劃青年科學(xué)家項目、國家自然科學(xué)基金面上項目各1項。以第一/通訊作者在信息資源管理和生物醫(yī)學(xué)信息學(xué)領(lǐng)域國際期刊和會議Journal of the American Medical Informatics Association (JAMIA)、Science Bulletin、EClinicalMedicine、Information Processing and Management (IP&M)、Scientific Data、AMIA Annual Symposium等發(fā)表論文40余篇。擔(dān)任Nature 數(shù)據(jù)科學(xué)子刊Scientific Data編委,擔(dān)任Health Data Science,BMC Medical Informatics and Decision Making編委。入選“中國知網(wǎng)2024年度Top1%高被引學(xué)者”。
擔(dān)任中華醫(yī)學(xué)會醫(yī)學(xué)信息學(xué)分會委員、中華預(yù)防醫(yī)學(xué)會生物信息學(xué)分會委員、中國醫(yī)院協(xié)會醫(yī)院情報圖書專委會常委兼秘書長、中國醫(yī)院協(xié)會健康醫(yī)療大數(shù)據(jù)應(yīng)用管理專委會常委、中國科學(xué)學(xué)與科技政策研究會科學(xué)計量學(xué)與信息計量學(xué)專委會委員等。基于上述平臺開展健康信息學(xué)、健康醫(yī)療大數(shù)據(jù)和醫(yī)學(xué)科技政策的交叉研究。擔(dān)任人工智能與信息計量學(xué)AII Workshop大會(2020-2025)、知識實(shí)體抽取與評估EEKE Workshop(2021-2025)、NetSci 2025 Satellite Workshop程序委員會委員等。2017年獲中國科學(xué)技術(shù)情報學(xué)會首屆青年情報科學(xué)家獎,入選中國科協(xié)青年人才托舉工程。
主要研究方向
醫(yī)學(xué)自然語言處理
醫(yī)學(xué)知識圖譜與大語言模型
健康信息治理與循證公共衛(wèi)生決策
代表性科研項目
1. 科技部重點(diǎn)研發(fā)計劃青年科學(xué)家項目,2022YFF0712000,從生物醫(yī)學(xué)和流行病學(xué)研究數(shù)據(jù)中自動生成因果圖的系列工具研發(fā),2022/11-2025/10,200萬元,主持
2. 國家自然科學(xué)基金面上項目,72074006,不確定性科學(xué)知識表示與計量的理論、方法與應(yīng)用研究:以醫(yī)學(xué)為例,2021/1-2024/12,50萬元,主持
3. 國家自然科學(xué)基金青年項目,71603280,睡美人文獻(xiàn)及喚醒睡美人的王子文獻(xiàn)的識別方法與典型特征研究,2017/1-2019/12,17萬元,主持
代表作
1. Xie Shiyao, Zhao Wenjing, Deng Guanghui, He Guohua, He Na, Lu Zhenhua, Hu Weihua, Zhao Mingming, Du Jian*; Utilizing ChatGPT as a scientific reasoning engine to differentiate conflicting evidence and summarize challenges in controversial clinical questions. Journal of the American Medical Informatics Association, 2024,31(7):1551-1560.
2. He, Zixuan; Yang, Lan; Li, Xiaofan; Du, Jian*. Discrepancies in reported results between trial registries and journal articles for AI clinical research. EClinicalMedicine, 2025, 80: 103066
3. Xin Guo; Jiakang Huo; Wanwei Dai; Tong Wang; Han Xiao; Wenjing Zhao; Xuanyu Shi; Xueheng Wang; Yang Gao; Zhi Li; Rui Zhan; Wenli Xu; Jian Du*; Erdan Dong*. Global rehabilitation research equality index across health conditions during 1990–2019: an alignment analysis between bibliographic and epidemiological data. Science Bulletin, 2025, 70(7):1057-1061.
4. Wang, Shuang; He, Xin; Du, Jian*. Scientific commentaries are dealing with uncertainty and complexity in science. Information Processing & Management, 2024, 61(4): 103707
5. Shi, Xuanyu; Du, Jian*. Constructing a finer-grained representation of clinical trial results from ClinicalTrials.gov. Scientific Data, 2024, 11(1): 41.
6. Shuang Wang; Kai Zhang; Jian Du*. PubMed captures more fine-grained bibliographic data on scientific commentary than Web of Science: a comparative analysis. BMJ Health & Care Informatics, 2024;31:e101017.
7. Yongmei Bai; Xuanyu Shi; Jian Du*. A computable biomedical knowledge system: Toward rapidly building candidate-directed acyclic graphs. Journal of Evidence-Based Medicine, 2024; 17: 307–316.
8. Wang, Shuang; Du, Jian*. A comment-driven evidence appraisal approach to promoting research findings into practice when only uncertain evidence is available. Health Research Policy and Systems, 2023, 21(1): 25.
9. Li, Xiaoying; Peng, Suyuan; Du, Jian*. Towards medical knowmetrics: representing and computing medical knowledge using semantic predications as the knowledge unit and the uncertainty as the knowledge context. Scientometrics, 2021,126, (7):6225-6251.
10. Du, Jian; Tang, Xiaoli; Wu, Yishan. The effects of research level and article type on the differences between citation metrics and F1000 recommendations. Journal of the Association for Information Science and Technology, 2016, 67, (12):3008-3021.
發(fā)明專利
1. 杜建; 史軒宇; 白永梅; 基于知識圖譜的因果圖生成方法、系統(tǒng),2023-12-12, 中國,202311694543.3.
2. 杜建; 趙文靜; 未驗醫(yī)學(xué)知識的識別與處理方法、裝置及計算機(jī)可讀介質(zhì),2023-12-01, 中國,202311239773.0.
開發(fā)軟件/系統(tǒng)
1. CBK System是結(jié)構(gòu)化醫(yī)學(xué)知識系統(tǒng)(Computable Biomedical Knowledge System)的簡稱,是存儲、檢索和可視化Medline文獻(xiàn)數(shù)據(jù)庫中句子層級的三元組的軟件工具。該系統(tǒng)由北京大學(xué)健康醫(yī)療大數(shù)據(jù)國家研究院醫(yī)學(xué)知識計算實(shí)驗室開發(fā),定期更新美國國立醫(yī)學(xué)圖書館的Semantic Medline Database(SemMedDB)知識庫,提供基于web的醫(yī)學(xué)概念及其關(guān)系的檢索與下載服務(wù);含路徑推斷(X-Y-Z)模塊,支持頭尾概念之間機(jī)制路徑的發(fā)現(xiàn);含因果圖生成模塊,支持兩個臨床變量(或醫(yī)學(xué)概念)之間的混雜變量、中介變量和對撞變量的發(fā)現(xiàn);提供三元組數(shù)據(jù)集的csv格式下載,支持導(dǎo)入其他圖數(shù)據(jù)庫(如Neo4j),開展進(jìn)一步的圖數(shù)據(jù)科學(xué)研究和圖挖掘應(yīng)用。https://cbk.bjmu.edu.cn/
2. 醫(yī)學(xué)自然語言處理系統(tǒng)(Health Nature Language Processing System, HNLP System): https://hnlp.bjmu.edu.cn/
主講課程
2020-,《健康數(shù)據(jù)科學(xué)——醫(yī)學(xué)術(shù)語體系與文本挖掘》(4學(xué)時), 博士碩士研究生;
2021-,《開放數(shù)據(jù)獲取與醫(yī)學(xué)知識發(fā)現(xiàn)》(28學(xué)時),博士碩士研究生。
2024-,《玩兒轉(zhuǎn)PubMed數(shù)據(jù)庫探索網(wǎng)絡(luò)醫(yī)學(xué)》(18學(xué)時),本科生
2025-,《醫(yī)學(xué)人工智能通識——文本挖掘與大語言模型》(3學(xué)時),本科生
2023-,《人工智能與文獻(xiàn)挖掘》(20學(xué)時),北京大學(xué)臨床數(shù)據(jù)科學(xué)家繼續(xù)教育培訓(xùn)系列課程
獲2023年度醫(yī)學(xué)部機(jī)關(guān)直屬單位青年教師“科研成果進(jìn)課堂”教學(xué)比賽一等獎、最佳教案獎
獲北京大學(xué)第二十四屆青年教師教學(xué)基本功比賽(醫(yī)科類)三等獎