原始文章

這項研究探討了使用GPT-3.5-turbo模型來自動分類胸部CT報告中的肺癌TNM分期,重點在英語和日語報告。研究顯示,英語報告中使用完整TNM定義能達到最高準確性,並分析了T、N、M因素的具體準確性。提供定義顯著提升了每個因素的準確性,但日語報告在N和M分類的準確性較低。這些結果顯示多語言模型在放射學自動化TNM分類的潛力,且即使不額外訓練,提供定義也能改善表現。 PubMed DOI


站上相關主題文章列表

這項研究探討了GPT-4在識別日本放射學報告中胰臟癌的TNM分級的效果。研究分析了2020年4月至2022年6月的100份CT掃描報告,結果顯示GPT-4在T分類的準確率為73%,N分類91%,M分類93%。與兩位經驗豐富的放射科醫生的協議程度分別為T的0.45、N的0.79和M的0.83。雖然GPT-4對TNM分級有一定了解,但在這個特定情境下的表現仍被認為不足。 PubMed DOI

這項研究評估了一個經過微調的大型語言模型(LLM)在識別骨轉移患者的有效性,並與放射科醫師的手動標註進行比較。研究分析了15,456名患者的報告,LLM在711份報告中準確率達97.9%,敏感度分別為98.8%、94.7%和94.3%。雖然放射科醫師的準確率和敏感度稍高,但LLM的分類時間僅需105秒,遠低於醫師的2312秒和3094秒。總體來看,這個LLM在檢測骨轉移方面表現出色,且速度更快。 PubMed DOI

這項研究比較了ChatGPT大型語言模型(LLMs)與不同經驗的人類讀者在肺癌分期的表現。研究納入700名非小細胞肺癌患者,使用胸部CT和FDG PET/CT報告進行分析。結果顯示,GPT-4o的準確率為74.1%,優於其他模型和一位住院醫師,但仍低於專科訓練的放射科醫生。這表明,雖然LLMs在某些方面表現不錯,但在癌症分期等複雜任務中,專業醫療人員的角色仍然不可或缺。 PubMed DOI

這項研究探討如何利用自然語言處理(NLP)和生成語言模型(GLMs)從肺癌患者的病理報告中提取關鍵資訊。研究目的是評估這些模型在提取病理階段數據的有效性,並考慮在資源有限的情況下使用較小型GLMs的可行性。研究團隊從首爾國立大學醫院收集報告,確定42個關鍵詞進行腫瘤-淋巴結(TN)分類,並與臨床專家建立黃金標準。經過訓練,Deductive Mistral-7B模型在資訊提取上表現最佳,準確率達92.24%,TN分類準確率為0.9876,顯示針對性訓練能提升模型性能,對臨床決策有潛在幫助。 PubMed DOI

這項研究評估了NotebookLM這款檢索增強生成大型語言模型(RAG-LLM)在肺癌分期中的有效性。透過整合日本肺癌分期指引的可靠外部知識,NotebookLM在100個虛構案例中達到86%的診斷準確率,表現優於金標準的GPT-4 Omni,後者在提供外部知識時準確率僅39%。NotebookLM在定位參考資料方面也表現出色,準確率高達95%。研究顯示,NotebookLM在臨床影像診斷中具備更高的可靠性與實用性,特別是在放射學領域。 PubMed DOI

這項研究比較了兩個大型語言模型(LLMs),GPT-4 和 Gemini,在分析放射學報告以識別腫瘤問題的表現。研究涵蓋205名患者,結果顯示GPT-4在準確率、精確度、召回率和F1分數上均優於Gemini,特別是在腫瘤狀態的判斷上也更準確。這顯示出大型語言模型,尤其是GPT-4,在腫瘤監測方面的潛力。 PubMed DOI

這項研究評估了專有與開放的大型語言模型(LLMs)在分析胰臟癌放射學報告的有效性,重點在於疾病的存在、位置及治療反應。研究分析了203份去識別化的報告,使用了GPT-4、GPT-3.5-turbo及開放模型如Gemma-7B和Llama3-8B。結果顯示,GPT-4在確定疾病狀態上準確率最高,達75.5%。開放模型在某些方面表現不如專有模型,但仍具潛力,特別是在專有模型無法使用時。這項研究為未來腫瘤學領域的LLM研究提供了重要資源。 PubMed DOI

這項研究評估大型語言模型(LLMs)在翻譯放射科報告的效果。由於合格翻譯者不足,這對病人護理造成挑戰。研究團隊將100份合成報告翻譯成九種語言,並使用十個LLM進行自動翻譯,結果由18位放射科醫生評估。發現GPT-4的翻譯品質最佳,特別是在英德、英希、英泰和英土語言對上表現突出。雖然LLMs在清晰度和一致性上表現良好,但醫學術語的準確性仍需改進。總體來說,LLMs能有效翻譯放射科報告,但不同模型和語言的表現有所差異。 PubMed DOI

本研究評估大型語言模型(LLMs)在將頭頸癌患者的CT報告轉換為結構化格式的有效性。分析150份報告,使用GPT-4轉換50份,經放射科醫生評估後發現有10處信息缺失。改進模板後,再轉換100份報告,結果顯示無新錯誤。研究結果顯示,LLMs能有效結構化放射學報告,可能提升其在臨床中的應用與接受度。 PubMed DOI

這項研究探討微調大型語言模型(LLMs)在自動化肺癌病理TN分期分類的應用,旨在克服傳統自然語言處理方法的缺點。研究比較了六個開源LLM,使用3,216份去識別化的肺癌外科病理報告進行評估。結果顯示,Orca2_13b模型表現最佳,分類準確度達0.934,生成理由的語義匹配率為0.864。這項研究顯示,生成式語言模型能顯著提升癌症分期的自動化,對臨床實踐和腫瘤數據管理有潛在好處。 PubMed DOI