原始文章

這項研究比較了PubTator 3.0、BioBERT和大型語言模型在生醫文獻資訊擷取上的表現。PubTator 3.0和BioBERT在找基因、藥物等實體最準,而BioBERT在判斷實體間關聯性最強。整體來說,AI輔助的NLP技術有助於整合生醫知識,推動精準癌症治療發展。 PubMed


站上相關主題文章列表

隨著人工智慧工具的普及,患者和醫療專業人員越來越依賴這些工具提供的醫療資訊。本研究評估了五個大型語言模型(LLaMA 1、PaLM 2、Claude-v1、GPT-3.5和GPT-4)在2044個腫瘤學相關問題上的表現。結果顯示,GPT-4在與人類基準比較中表現最佳,達到第50百分位以上。雖然GPT-4的準確率高達81.1%,但所有模型仍存在顯著錯誤率,顯示出持續評估這些AI工具的重要性,以確保其安全應用於臨床實踐。 PubMed DOI

您開發了一個大型語言模型(LLM)輔助的系統,專門用於健康技術評估(HTA)的系統性文獻回顧(SLR)。這個系統包含五個模組,從文獻搜尋到數據總結,並具有人機協作的設計,能根據LLM與人類審查者的意見調整PICOs標準。經過四組數據評估,系統在摘要篩選中表現優異,達到90%的敏感度和82的F1分數,顯示出與人類審查者的高一致性。這個AI輔助系統有潛力簡化SLR過程,降低時間和成本,並提升證據生成的準確性。 PubMed DOI

本研究探討大型語言模型(LLMs)在膀胱癌管理中的表現。研究設計了100個臨床問題,評估六種LLMs的回應準確性。結果顯示,Claude-3.5-Sonnet以89.33%準確率最佳,ChatGPT-4為85.67%。GPT-3.5-Turbo經過兩階段訓練後,準確率從74.33%提升至100%。研究顯示,針對性訓練能顯著改善模型表現,並指出策略性改進可克服專業醫學應用中的限制。 PubMed DOI

這項研究評估大型語言模型(LLMs)在根據病患醫療紀錄生成早期乳腺癌治療選項的準確性。使用2024年初的多學科團隊會議紀錄,測試了三個AI模型:Claude3-Opus、GPT4-Turbo和LLaMa3-70B。結果顯示,Claude3-Opus準確率86.6%,GPT4-Turbo為85.7%,LLaMa3-70B則為75.0%。兩者在輔助內分泌和靶向治療上表現良好,但在輔助放射治療上則有高估的情況。研究建議需進一步探討這些模型在臨床上的實際應用。 PubMed DOI

這篇回顧探討大型語言模型(LLMs)在腫瘤學中自動提取非結構化臨床文本的應用,強調其在提升癌症研究和病人照護的潛力。回顧分析了自2000年以來的24項研究,發現大多數使用BERT變體,少數使用Chat-GPT。研究顯示,LLMs能有效提取數據,減少醫療人員的手動工作量,並建議可減輕行政負擔,讓醫護人員更專注於病人照護。未來需進一步研究其在臨床實踐中的整合及表現。 PubMed DOI

這項研究發現,讓 ChatGPT 直接讀取 NCCN 指南 PDF 並搭配提示語(PDF+Prompt),能大幅提升其在建議晚期非小細胞肺癌治療時的準確度和符合指引性,且回覆更清楚易懂。單靠提示語沒有效果。這表示,若大型語言模型能直接存取臨床指引,對腫瘤治療決策會更有幫助,但還需更多研究來驗證其他癌症和臨床情境的適用性。 PubMed DOI

近年AI和NLP技術大幅提升生命科學領域的文本分析效率,像NER、知識圖譜和大型語言模型各有優缺點,適合不同生物資料。選擇技術時要依應用需求調整。隨著科學文獻暴增,研究人員面臨更多機會與挑戰。 PubMed DOI

這篇綜述介紹大型語言模型在腫瘤醫學的應用,包括癌症篩檢、診斷、分期和治療建議等,展現其提升精準醫療的潛力。文章也點出幻覺、倫理和應用侷限等挑戰,並提出改進建議,期望推動LLMs在癌症照護上的發展。 PubMed DOI

這項研究發現,開源大型語言模型(LLM)在從腫瘤臨床試驗描述中萃取基因生物標記資訊,並將試驗資料結構化方面,表現比GPT-4等封閉模型更好。即使沒特別調整,開源模型就很厲害,經過微調後準確度還能再提升。這有助於病患媒合合適的臨床試驗。 PubMed DOI

研究團隊把GPT-4和專業腫瘤醫學工具結合,開發出能自主做臨床決策的AI代理。測試20個複雜癌症案例時,AI選對工具的機率有87.5%,臨床決策正確率91%,引用指引正確率75.5%。這套系統比單用GPT-4準確率高出許多,證明結合語言模型和專業工具能大幅提升癌症照護決策品質。 PubMed DOI