未經診斷和治療的HIV感染可能導致健康問題增加和病毒傳播。有人提出利用機器學習方法結合結構化數據來改善HIV診斷,但最近缺乏使用來自電子健康記錄(EHRs)的非結構化文本數據的提案。這項研究建議使用臨床註記的非結構化文本來將患者分類為懷疑或非懷疑患有HIV。通過分析真實的臨床註記,兩個大型語言模型(LLMs)在識別懷疑HIV病例方面表現優於傳統的機器學習算法,在不平衡數據集中的F1分數為94.7,在平衡數據集中為95.7。在生物醫學領域利用LLMs的非結構化文本顯示出改善HIV診斷並減少早期檢測機會被忽略的潛力。這個系統可以幫助醫生在診療期間決定哪些患者應接受HIV檢測。 PubMed DOI