原始文章

這項研究探討了大型語言模型(LLMs),如ChatGPT-4o、ChatGPT-3.5和Google Gemini,在輔助放射學研究中的效能。進行了兩個實驗: 1. **生物統計學與數據視覺化**:測試LLMs在建議生物統計檢定和生成R程式碼的能力。ChatGPT-4o表現最佳,正確回答7個問題,且生成的程式碼錯誤較少。 2. **深度學習**:評估這些模型在生成影像分類模型的Python程式碼的能力。ChatGPT-4o和Gemini都能生成初始程式碼,並透過互動修正錯誤。 總體而言,LLMs對放射學研究有幫助,但使用者需驗證生成的程式碼以避免錯誤。 PubMed DOI


站上相關主題文章列表

結構化報告可以增進放射學工作流程,並促進醫師間的溝通。人工智慧在醫學領域的應用越來越普遍,大型語言模型(LLMs)被用於放射學的結構化報告。四個LLM模型被比較其知識和模板提議能力。LLMs在放射學中生成結構化報告方面顯示出潛力,但需要進一步的正式驗證。 PubMed DOI

大型語言模型(如ChatGPT)的出現,透過更好的上下文理解和高效訓練,改變了AI聊天機器人。LLMs在各領域展現人類水準,可提升診斷效率和準確性。然而,仍有限制需克服,本文討論緩解策略和LLMs在多模應用中的潛力,以提升監督設置效率。 PubMed DOI

大型語言模型(LLMs)已經改變了科技,不僅在自然語言處理領域,也在其他領域有所影響。這些模型在龐大的數據集上進行了廣泛的預訓練,可以處理各種任務而無需額外的微調,包括在專業領域如放射學。LLMs的通用聊天機器人可提升放射科醫師的工作效率。LLMs正快速演進,應對挑戰,並納入多模態輸入。本篇提供概念知識和實用指導,針對有興趣利用LLMs的放射科醫師,提供了對該主題的概述,總結了放射學特定方面的發展。 PubMed DOI

機器學習和自然語言處理技術進步,如ChatGPT,能提供自然語言回應和知識查詢。研究發現ChatGPT在放射線治療問題上表現良好,但仍有一致性挑戰。LLMs未來將對社會和臨床實踐產生更大影響,尤其在放射腫瘤學領域。 PubMed DOI

研究比較四個大型語言模型在簡化放射學報告以提高患者閱讀易懂性的表現。結果顯示,所有模型都成功簡化報告,但在提供背景資料後效果更好。這顯示這些模型在幫助患者理解放射學報告方面有潛力。 PubMed DOI

研究評估了大型語言模型在醫療保健領域的應用,尤其是在改善患者護理方面。使用MIMIC-III數據庫的電子健康記錄,測試了這些模型在識別特定疾病患者方面的效能。GPT-4在辨識COPD、CKD、PBC和Cancer Cachexia患者方面表現優異,而ChatGPT和LLaMA3則稍遜。儘管LLMs有潛力,但在臨床應用前仍需解決錯誤、解釋不足和倫理問題。進一步研究將有助於提升模型訓練和設計,以更好地應用於醫療保健。 PubMed DOI

大型語言模型(LLMs)正在改變自然語言處理(NLP)領域,為放射科醫師提供提升工作的機會。NLP是人工智慧的一個分支,透過演算法分析文本數據。近期的進展,如注意力機制和變壓器架構,讓像GPT-4和Gemini這樣的模型能生成類似人類的文本,並分析大量資料。 不過,LLMs也有其限制,例如依賴訓練數據的質量,可能會產生不準確的輸出。儘管如此,LLMs在放射學的應用逐漸受到重視,幫助醫師提取有價值的見解,改善工作流程,最終提升病患護理品質。 PubMed DOI

這項研究評估了多種大型語言模型(LLMs)在冠狀動脈疾病(CAD)診斷中的表現,特別是根據CAD-RADS 2.0指引進行比較。結果顯示,ChatGPT 4o的準確率最高,達到100%,接著是ChatGPT 4和Claude 3 Opus,準確率為96.6%。其他模型的準確率也不錯,介於90%到93.3%之間。這些結果顯示LLMs在改善CAD的放射報告和病人照護方面的潛力,並強調進一步研究其視覺診斷能力的重要性。 PubMed DOI

這項研究分析了大型語言模型(LLMs),特別是OpenAI的GPT-3.5和GPT-4,在醫學生放射學考試中的表現。使用151道選擇題,結果顯示GPT-3.5的正確率為67.6%,而GPT-4則達到88.1%(p<0.001),表現明顯優於前者。GPT-4在各類問題上都表現良好,顯示其在醫學教育中的潛力。不過,研究也提醒使用者要警惕LLMs可能提供錯誤答案的風險。總體來看,LLMs在放射學教育上有提升的可能性。 PubMed DOI

這項研究評估了八種公開的大型語言模型(LLMs)在24個神經放射學臨床情境中提供影像建議的表現。評估模型包括GPT-4、ChatGPT、Bard、Bing Chat、Llama 2等。結果顯示,GPT-4表現最佳,提供23個最佳建議,其次是ChatGPT有20個,而Llama 2僅有5個最佳建議。這項研究強調了大型語言模型在臨床影像利用上的潛力,並探討了評估其表現的挑戰,具有重要意義。 PubMed DOI