原始文章

這篇評論著重於放射學中臨床評估人工智慧(AI)的各種結果指標,幫助醫師理解並應用這些指標。除了常見的二元分類和檢測性能指標,還探討了多類別分類、生成式AI模型的評估,以及大型語言模型。評論也提到以病人為中心的結果測量,目的是提供清晰易懂的解釋,協助醫師在放射學中有效運用多樣的AI評估工具。 PubMed DOI


站上相關主題文章列表

這項研究顯示生成式人工智慧,特別是OpenAI的GPT-4 Turbo API,在提升放射學訓練方面的潛力。研究發現,這個AI模型能檢測到的差異明顯多於專業放射科醫師,顯示其在傳統審查中可能被忽略的改進空間。雖然AI在差異檢測上表現優異,但在評分一致性上仍有改進空間。生成的教學要點在85%的案例中被認為適當,顯示其教育價值。未來研究可著重於提高模型準確性及評分者一致性,並探討AI反饋對實習生的長期影響。 PubMed DOI

這篇文章全面介紹了大型語言模型(LLMs)的進展及其在放射學的潛在應用。文獻回顧了醫學領域中LLMs的研究,特別關注其在臨床環境中的相關性與限制。文章強調了幾項重要研究,並指出放射科醫師參與LLM技術的重要性。了解各種應用及病人安全、倫理和數據保護的挑戰,對於負責任地將LLMs整合進臨床實踐至關重要。 PubMed DOI

人工智慧(AI)正逐漸進入臨床實踐,特別是在乳腺影像檢查如乳房攝影中。雖然AI能透過篩選檢查結果來簡化流程,但許多使用者仍不清楚其具體好處。目前,AI在乳房攝影的診斷品質已達到與放射科醫師相當的水平,但在斷層合成影像的應用較少。大部分AI技術仍在開發中,只有乳房攝影的第二意見應用較成熟。建議使用者在實施前,仔細評估這些AI應用的成熟度及實際效益。 PubMed DOI

這項研究評估了大型語言模型(LLMs),特別是ChatGPT-4和NotebookLM,使用METhodological RadiomICs Score(METRICS)工具來檢視放射組學研究的方法學質量。分析了2024年發表的48篇開放存取文章,結果顯示ChatGPT-4的中位數得分為79.5%,優於NotebookLM(61.6%)和人類專家(69.0%),且差異顯著。雖然LLMs在評估速度上較快,但仍需改進,以便更接近人類專家的評估結果。 PubMed DOI

人工智慧(AI)正逐漸融入胸部放射學,展現出在解讀胸部X光片、篩檢肺癌及肺栓塞分流等方面的有效性。未來還有許多應用待探索,如過濾正常X光片和監控讀片錯誤。不過,成功實施AI需要針對性能評估、IT整合及持續監控制定策略。挑戰包括對放射科醫師的教育、管理風險及數據獲取差異。此外,下一代大型語言模型(LLMs)有潛力改變胸部放射學,但仍需進一步研究其可行性。 PubMed DOI

這項研究探討了一個專門的多模態生成式人工智慧模型在胸部X光片解讀上的影響,評估其診斷準確性和臨床價值。該模型基於42家醫院18年的X光片報告數據訓練,並在多個公共數據集上測試。 主要發現包括: - 模型對氣胸和皮下氣腫的檢測敏感度分別為95.3%和92.6%。 - 報告接受率:人工智慧模型70.5%、放射科醫師73.3%、GPT-4Vision僅29.6%。 - 人工智慧模型的報告獲得最高一致性和質量評分,顯示其可靠性優於GPT-4Vision。 總結來說,這項研究顯示專門的人工智慧模型在放射學診斷中具備顯著潛力。 PubMed DOI

隨著影像檢查普及,腎細胞癌被診斷的案例增加,分辨腎臟良性或惡性病灶變得更重要。AI技術(像機器學習、深度學習)已廣泛應用於腎臟病灶的偵測與分類,協助診斷和個人化治療。雖然AI展現潛力,但仍面臨資料差異、可解釋性及發表偏差等挑戰。 PubMed DOI

這篇綜述分析67篇AI應用於MRI的研究,發現AI能加快掃描和判讀速度、自動分割影像,提升工作效率。常用技術有ResNet、U-Net等卷積神經網路。雖然AI表現不錯,但因外部驗證不足、資料集不一致,臨床應用還有限。未來需更多標準化研究,才能讓AI安全有效地用在臨床MRI。 PubMed DOI

這篇回顧整理了102篇AI在研究所醫學教育的應用,主要來自北美,聚焦放射科、外科和急診。AI被用於評量、招募和臨床決策,大家對AI的看法也越來越正面。不過,目前研究還有偏誤和異質性高等問題,未來還需要更多研究來補足不足。 PubMed DOI

這篇研究系統性回顧了自動醫學放射報告生成的深度學習方法,分析78篇重要文獻,涵蓋資料集、模型、評估指標等,並整理從傳統到大型語言模型的發展趨勢。文中也提出未來研究方向,期望推動AI放射報告生成的標準化與進步。 PubMed DOI