原始文章

這項研究探討了使用GPT-3.5-turbo模型來自動分類胸部CT報告中的肺癌TNM分期,重點在英語和日語報告。研究顯示,英語報告中使用完整TNM定義能達到最高準確性,並分析了T、N、M因素的具體準確性。提供定義顯著提升了每個因素的準確性,但日語報告在N和M分類的準確性較低。這些結果顯示多語言模型在放射學自動化TNM分類的潛力,且即使不額外訓練,提供定義也能改善表現。 PubMed DOI


站上相關主題文章列表

像GPT-4這樣的大型語言模型(LLMs)可以自動從原始的自由文本報告中高精度地生成胰臟導管腺癌(PDAC)的結構化摘要報告。GPT-4在創建摘要報告和分類腫瘤可切除性方面優於GPT-3.5。外科醫生使用人工智慧生成的報告比原始報告更準確和高效地確定可切除性。 PubMed DOI

這項研究比較了一個經過微調的大型語言模型(LLM)與放射科醫師在從放射學報告中識別肺癌預防治療患者方面的表現。LLM在分類患者方面表現出高準確度和敏感度,與放射科醫師相似,但處理時間更快。研究結果表明,LLM能夠有效地及時從醫療記錄中提取相關信息。 PubMed DOI

這項研究探討了GPT-4在識別日本放射學報告中胰臟癌的TNM分級的效果。研究分析了2020年4月至2022年6月的100份CT掃描報告,結果顯示GPT-4在T分類的準確率為73%,N分類91%,M分類93%。與兩位經驗豐富的放射科醫生的協議程度分別為T的0.45、N的0.79和M的0.83。雖然GPT-4對TNM分級有一定了解,但在這個特定情境下的表現仍被認為不足。 PubMed DOI

這項研究評估了一個經過微調的大型語言模型(LLM)在識別骨轉移患者的有效性,並與放射科醫師的手動標註進行比較。研究分析了15,456名患者的報告,LLM在711份報告中準確率達97.9%,敏感度分別為98.8%、94.7%和94.3%。雖然放射科醫師的準確率和敏感度稍高,但LLM的分類時間僅需105秒,遠低於醫師的2312秒和3094秒。總體來看,這個LLM在檢測骨轉移方面表現出色,且速度更快。 PubMed DOI

這項研究比較了ChatGPT大型語言模型(LLMs)與不同經驗的人類讀者在肺癌分期的表現。研究納入700名非小細胞肺癌患者,使用胸部CT和FDG PET/CT報告進行分析。結果顯示,GPT-4o的準確率為74.1%,優於其他模型和一位住院醫師,但仍低於專科訓練的放射科醫生。這表明,雖然LLMs在某些方面表現不錯,但在癌症分期等複雜任務中,專業醫療人員的角色仍然不可或缺。 PubMed DOI

這項研究探討如何利用自然語言處理(NLP)和生成語言模型(GLMs)從肺癌患者的病理報告中提取關鍵資訊。研究目的是評估這些模型在提取病理階段數據的有效性,並考慮在資源有限的情況下使用較小型GLMs的可行性。研究團隊從首爾國立大學醫院收集報告,確定42個關鍵詞進行腫瘤-淋巴結(TN)分類,並與臨床專家建立黃金標準。經過訓練,Deductive Mistral-7B模型在資訊提取上表現最佳,準確率達92.24%,TN分類準確率為0.9876,顯示針對性訓練能提升模型性能,對臨床決策有潛在幫助。 PubMed DOI

這項研究比較了兩種大型語言模型(LLMs),Gemini 和 GPTs,在乳腺癌患者的 PET/CT 報告中提取數據和生成結構化報告的表現。研究涵蓋131名患者,發現 GPTs 在數據挖掘上準確率更高,特別是原發病灶(89.6% vs. 53.8%)和轉移病灶(96.3% vs. 89.6%)。此外,GPTs 在疾病進展決策和語義相似度上也優於 Gemini。整體來看,GPTs 在臨床應用中顯示出更高的潛力。研究使用多種統計方法驗證結果,數據可向通訊作者索取。 PubMed DOI

本研究探討大型語言模型(LLMs),特別是GPT-3.5 turbo和GPT-4,如何提取肝細胞癌病理報告中的關鍵要素。考量到手動整理報告的困難,研究比較了LLMs與傳統的正則表達式(REGEX)方法的準確性。共分析了88份病理報告,重點在五個關鍵要素。結果顯示,LLMs和REGEX的提取準確性均相當,介於84.1%到94.8%之間。研究指出,LLMs有潛力顯著簡化提取過程,進而加速癌症研究的進展。 PubMed DOI

這項研究評估大型語言模型(LLMs)在分析乳腺癌病理報告的有效性,特別是識別病理完全反應(pCR)。研究者使用兩種方法:提取不同變壓器模型的嵌入和微調GPT-2模型,分析351名接受新輔助化療的女性患者。優化後的結果顯示,敏感度達95.3%,陽性預測值90.9%,F1分數93.0%。這顯示LLMs在提取臨床數據上優於傳統機器學習模型,並強調其在改善病人護理和乳腺癌管理的潛力,但仍需進一步驗證以確保結果的可靠性。 PubMed DOI

放射學中的結構化報告(SR)旨在提升報告質量,但採用率仍然不高。近期大型語言模型(LLMs)的進展,特別是GPT-3.5和GPT-4,顯示出自動化SR的潛力。這篇回顧探討了LLMs在放射報告中的應用,包括文檔編寫、翻譯、臨床評估和數據挖掘等四個領域。雖然LLMs能提升SR的效率與準確性,但在臨床實踐中整合時仍需克服算法透明度和訓練數據的挑戰。 PubMed DOI