原始文章

我們開發了一套用大型語言模型(LLMs)自動分類腫瘤臨床試驗和文獻的系統,在多個資料集和任務上都表現優異,準確率超過94%、F1-score超過92%,回應有效性最高達99.88%。雖然還有提示敏感度和運算資源的挑戰,但未來LLMs有望成為醫學文獻分類的重要工具。 PubMed DOI


站上相關主題文章列表

隨著人工智慧工具的普及,患者和醫療專業人員越來越依賴這些工具提供的醫療資訊。本研究評估了五個大型語言模型(LLaMA 1、PaLM 2、Claude-v1、GPT-3.5和GPT-4)在2044個腫瘤學相關問題上的表現。結果顯示,GPT-4在與人類基準比較中表現最佳,達到第50百分位以上。雖然GPT-4的準確率高達81.1%,但所有模型仍存在顯著錯誤率,顯示出持續評估這些AI工具的重要性,以確保其安全應用於臨床實踐。 PubMed DOI

這項研究探討大型語言模型(LLMs)在提升病人與臨床試驗(CTs)匹配的應用,並以資訊檢索為框架。研究開發了一個多階段檢索管道,結合BM25、Transformer排名器及LLM方法,數據來自TREC臨床試驗2021-23。結果顯示,微調的LLM在查詢形成、過濾及重新排名上表現優於傳統方法,提升了識別合格試驗的有效性。雖然LLMs具競爭力,但計算成本較高,效率降低。未來研究應聚焦於優化成本與檢索有效性之間的平衡。 PubMed DOI

這篇系統性回顧與統合分析探討大型語言模型(LLMs)在臨床腫瘤學的應用,分析了34項研究以評估其表現。研究發現,LLMs主要測試回答腫瘤學問題的能力,但因方法論和評估標準不同,表現上有顯著變異。模型能力、提示策略及特定腫瘤領域等因素影響這些變異。此外,LLMs缺乏標準化報告協議,造成方法論不一致。解決這些問題對提升研究可比性及促進LLM在臨床實踐中的應用至關重要。 PubMed DOI

這項研究著重於改善臨床試驗的患者配對過程,傳統上需手動審查電子健康紀錄,常導致患者錯失治療機會。近期大型語言模型的進展讓自動化配對成為可能,但現有研究多依賴有限的合成數據,未能反映真實醫療數據的複雜性。研究者對一個臨床試驗配對系統進行實證評估,使用實際的電子健康紀錄,並引入名為OncoLLM的自訂模型。結果顯示,OncoLLM的表現超越GPT-3.5,與醫生的效果相當,可能顯著提升患者配對效率,改善治療選擇的可及性。 PubMed DOI

這項研究探討了大型語言模型(LLMs),特別是GPT-4,在製作癌症臨床試驗教育內容的潛力,旨在提升患者的理解。研究從ClinicalTrials.gov獲取知情同意書,生成簡短摘要和多選題,並透過患者調查和眾包註釋來評估其有效性。結果顯示,摘要內容可讀且具資訊性,患者認為有助於理解臨床試驗並提高參與意願。雖然多選題的準確性高,但當要求提供未明確列出的資訊時,GPT-4的準確性較低。整體而言,研究顯示GPT-4能有效生成患者友好的教育材料,但仍需人類監督以確保準確性。 PubMed DOI

生成式人工智慧(GAI)技術,特別是大型語言模型(LLMs),在醫學領域的應用越來越普遍,尤其是在病人與臨床試驗配對方面。研究顯示,LLMs能有效匹配病人的健康紀錄與臨床試驗資格標準,並取得良好結果。雖然自動化配對有助於提升病人參與率和減輕醫療工作負擔,但也面臨挑戰,如可能帶來虛假希望、導航困難及需人類監督等問題。進一步研究對驗證LLM在腫瘤學中的安全性和有效性至關重要。 PubMed DOI

這篇綜述介紹大型語言模型在腫瘤醫學的應用,包括癌症篩檢、診斷、分期和治療建議等,展現其提升精準醫療的潛力。文章也點出幻覺、倫理和應用侷限等挑戰,並提出改進建議,期望推動LLMs在癌症照護上的發展。 PubMed DOI

這項研究發現,開源大型語言模型(LLM)在從腫瘤臨床試驗描述中萃取基因生物標記資訊,並將試驗資料結構化方面,表現比GPT-4等封閉模型更好。即使沒特別調整,開源模型就很厲害,經過微調後準確度還能再提升。這有助於病患媒合合適的臨床試驗。 PubMed DOI

這篇文獻回顧指出,大型語言模型(LLMs)已被用來提升病患與臨床試驗配對的效率,尤其是OpenAI的模型。雖然LLMs能大幅提升配對準確度與規模,但目前仍面臨可靠性、可解釋性及過度依賴合成資料等問題。未來應加強模型調校、採用真實世界資料,並提升可解釋性,才能真正發揮其潛力。 PubMed DOI

大型語言模型在腫瘤醫學有潛力協助臨床決策、資料整理及病患溝通,對醫師和病患都有幫助。不過,也有幻覺、泛化和倫理等問題需注意。LLMs應當作為輔助工具,幫助醫師提升癌症照護品質,而非取代醫師角色。 PubMed DOI