原始文章

這項研究探討如何利用大型語言模型(LLMs)從日本的肺癌放射學報告中提取資訊並進行聚類分析。隨著自然語言處理在醫學領域的應用增加,研究針對非英語醫學數據集的挑戰進行探討。使用MedTxt-RR數據集,研究發現腫瘤大小在73.3%的報告中被準確識別,腫瘤位置和側別則在83%的報告中被識別。結果顯示,無監督的LLM方法在資訊提取和聚類上優於傳統監督方法,顯示出LLM在提升放射學報告效用的潛力。 PubMed DOI


站上相關主題文章列表

這項研究評估了一個開源的大型語言模型(LLM)在從急診腦部MRI報告中提取信息的表現。對比了放射科醫師和LLM在識別頭痛、異常發現以及MRI結果與頭痛之間因果關係方面的能力。LLM在這些任務中表現出高靈敏度和特異度,顯示其具有潛力在不需額外訓練的情況下從放射學報告中準確提取信息。 PubMed DOI

這項研究比較了一個經過微調的大型語言模型(LLM)與放射科醫師在從放射學報告中識別肺癌預防治療患者方面的表現。LLM在分類患者方面表現出高準確度和敏感度,與放射科醫師相似,但處理時間更快。研究結果表明,LLM能夠有效地及時從醫療記錄中提取相關信息。 PubMed DOI

這項研究探討小型大型語言模型(sLLM)在從病理報告中提取關鍵資訊的效果。使用三個版本的Llama 2模型,參數從70億到700億不等,並在零樣本和五樣本學習情境下進行評估。結果顯示,700億參數的模型在五樣本情境下表現優異,顯示sLLM能有效提升數據提取的效率與準確性。研究強調範例學習的重要性,並討論模型大小、準確性及處理時間的權衡,支持在臨床環境中應用先進語言模型,以改善病人護理和生物醫學研究。 PubMed DOI

這篇論文回顧了自然語言處理技術,特別是大型語言模型在放射科報告中提取結構化數據的應用。雖然放射影像使用普遍,但報告中的自由文本常未被充分利用。根據PRISMA-ScR指導方針,分析了2023年8月1日從五個資料庫中找到的34項研究。結果顯示,大多數研究集中在前變壓器和編碼器模型上,外部驗證時性能下降。LLMs可能增強信息提取的普遍適用性,但面臨外部驗證不足和報告粒度問題等挑戰。 PubMed DOI

這項研究評估了一個經過微調的大型語言模型(LLM)在識別骨轉移患者的有效性,並與放射科醫師的手動標註進行比較。研究分析了15,456名患者的報告,LLM在711份報告中準確率達97.9%,敏感度分別為98.8%、94.7%和94.3%。雖然放射科醫師的準確率和敏感度稍高,但LLM的分類時間僅需105秒,遠低於醫師的2312秒和3094秒。總體來看,這個LLM在檢測骨轉移方面表現出色,且速度更快。 PubMed DOI

這項研究開發了一個大型語言模型(LLM),能根據影像生成放射學印象,並評估其專業及語言表現。研究在上海總醫院進行,六位放射科醫生使用該模型並進行修正。LLM在20 GB醫學及一般文本數據上預訓練,並用1.5 GB數據微調,包含800份放射學報告。結果顯示,LLM的中位召回率為0.775,精確度0.84,F1分數0.772,表現良好。專家對其印象評價高,顯示其在放射學檢查中具專業性。 PubMed DOI

這項研究評估了專有與開放的大型語言模型(LLMs)在分析胰臟癌放射學報告的有效性,重點在於疾病的存在、位置及治療反應。研究分析了203份去識別化的報告,使用了GPT-4、GPT-3.5-turbo及開放模型如Gemma-7B和Llama3-8B。結果顯示,GPT-4在確定疾病狀態上準確率最高,達75.5%。開放模型在某些方面表現不如專有模型,但仍具潛力,特別是在專有模型無法使用時。這項研究為未來腫瘤學領域的LLM研究提供了重要資源。 PubMed DOI

這項研究評估大型語言模型(LLM)在提取與肺部微波腫瘤消融(MWA)相關的臨床資訊的效果。研究針對20名患者進行回顧性分析,檢視治療後最多12個月的放射學報告和診所筆記。使用LLM(GPT 3.5 Turbo 16k)識別四個關鍵臨床結果,結果經手動審查驗證。分析104份放射學報告和37份診所筆記,顯示LLM在識別這些結果上準確率高達85%到100%。研究顯示LLM能有效提取醫療數據中的臨床資訊,未來可能對介入放射學研究有幫助。 PubMed DOI

這項研究評估大型語言模型(LLMs)在翻譯放射科報告的效果。由於合格翻譯者不足,這對病人護理造成挑戰。研究團隊將100份合成報告翻譯成九種語言,並使用十個LLM進行自動翻譯,結果由18位放射科醫生評估。發現GPT-4的翻譯品質最佳,特別是在英德、英希、英泰和英土語言對上表現突出。雖然LLMs在清晰度和一致性上表現良好,但醫學術語的準確性仍需改進。總體來說,LLMs能有效翻譯放射科報告,但不同模型和語言的表現有所差異。 PubMed DOI

這項研究評估了四種大型語言模型(LLMs)在使用日本FDG-PET報告中的Lugano分類來分類惡性淋巴瘤階段的效果。研究中,GPT-4o的準確率最高,達75%,顯示出顯著一致性。其他模型如Claude 3.5 Sonnet、Gemma 2 27B和Llama 3 70B的準確率分別為61.3%、58.8%和57.5%。整體來看,GPT-4o在解讀臨床文本方面表現最佳,顯示出LLMs在標準化放射學數據的潛力,雖然即時臨床應用仍有限。 PubMed DOI