原始文章

這項研究探討了使用具視覺能力的GPT-4V進行醫學影像分類,特別是癌症組織病理學。傳統方法需大量標註數據和計算資源,而上下文學習則能從提示中學習,無需更新參數,這在醫學影像領域尚未普遍應用。研究評估了GPT-4V在結直腸癌組織亞型分類、結腸息肉亞型分類及淋巴結切片乳腺腫瘤檢測的表現,結果顯示其表現可與專門神經網絡媲美,甚至在樣本數量有限時更佳。這顯示通用AI模型在醫療影像分析中的潛力,特別對於缺乏技術專業知識的醫療人員。 PubMed DOI


站上相關主題文章列表

討論了GPT-4等大型語言模型對外科腫瘤學的影響,提供更先進的語言理解與生成能力。LLMs整合到醫學人工智慧框架,可即時支援癌症護理,但需注意倫理、隱私及效力問題。醫護人員、AI開發者與監管機構需合作,負責任地運用LLMs,有助於提升外科腫瘤學領域的病人護理與安全。 PubMed DOI

深度學習應用在病理圖像可提升腫瘤醫學精準度,減輕專家負擔。然而,訓練模型需要耗時且昂貴的標記數據。研究指出使用GPT-4等大型語言模型,能從非結構化病理報告中提取結構化數據,無需重新訓練。結果顯示模型生成的數據與人類高度一致,未來或可應用在提取真實數據供機器學習使用。 PubMed DOI

研究發現,大型語言模型在醫療保健領域有潛力,尤其在識別轉移性癌症患者方面。GPT-4表現最佳,提示和推理步驟清晰簡潔效果更好。即使改變輸入標記,GPT-4仍保持高準確性。建議透過策略性提示設計,GPT-4或許可取代專門模型,提升醫療應用。 PubMed DOI

研究比較了GPT-4等大型語言模型和傳統監督式模型在臨床註記中提取資訊的表現。結果顯示,對於標籤不平衡的任務,大型語言模型可能比監督式模型更有效。雖然大型語言模型減少了標註數據的需求,但監督式模型搭配詳細標註仍能提供相當結果。使用大型語言模型可加速臨床自然語言處理研究,減少對精心策劃數據集的需求,潛在增進臨床研究中自然語言處理變數的應用。 PubMed DOI

研究探討大型語言模型如ChatGPT在乳癌管理上的應用,發現準確性有差異。儘管有潛力,但需注意準確性不一致和依賴提示等挑戰,強調驗證和監督的重要性。 PubMed DOI

研究比較了GPT-4與傳統監督式模型在臨床註記中提取資訊的表現,結果顯示GPT-4在乳癌病理報告分類上表現優異,甚至超越其他LLMs和監督式模型。GPT-4的零-shot分類能力對標籤不平衡的任務特別有效。雖然LLMs減少了標註需求,但簡單模型配合大量標註資料也能達到相當效果。GPT-4有潛力加速臨床自然語言處理研究,減少標註需求,促進臨床研究中使用自然語言處理變數。 PubMed DOI

近期人工智慧的進步,特別是大型語言模型如GPT-4Vision (GPT-4V),擴展了醫學影像解讀的潛力。一項研究評估了GPT-4V在分類組織病理影像的準確性,並與傳統的卷積神經網絡(CNN)進行了比較。研究使用了1520張來自患有神經退行性疾病的患者的影像,結果發現GPT-4V能夠準確識別染色技術和組織來源,但在特定病變識別方面表現不佳。研究還指出,GPT-4V的影像解讀受到文本上下文的影響,導致一些診斷不準確。然而,透過少量樣本學習,能顯著提升GPT-4V的診斷能力,使其與CNN模型YOLOv8的表現相當。這種方法對神經病理學有潛力,因為取得大量標記數據集通常相當困難。 PubMed DOI

這項研究評估大型語言模型(LLMs)在解釋乳腺影像報告及提供臨床建議的表現,分為兩個步驟: 1. **文本評估**:比較十個LLMs與放射科醫師在100道BI-RADS選擇題上的準確率。Claude 3.5 Sonnet表現最佳(90%),超過一般放射科醫師(78%)和乳腺放射科醫師(82%)。 2. **視覺評估**:測試五個多模態LLMs在100張乳腺超音波影像上的表現,Claude 3.5 Sonnet以59%準確率領先。 研究顯示,雖然LLMs在文本評估中表現良好,但視覺診斷能力有限,需在放射科醫師監督下使用,以避免誤診。 PubMed DOI

GPT-4 Vision(GPT-4V)是多模態人工智慧的一大進步,能從圖像生成文字,無需專門訓練。這使得 ChatGPT 轉型為大型多模態模型,並在放射學中展現潛力,特別是在提升工作流程和決策支持方面。測試結果顯示,GPT-4V 能有效分類圖像、計算數量及解讀手寫文字,但在檢測骨折和解釋複雜圖表上表現不佳。雖然它在放射學任務中顯示潛力,但仍需進一步訓練以確保安全使用,並強調人類專業知識的重要性。 PubMed DOI

這項研究評估大型語言模型(LLMs)在分析乳腺癌病理報告的有效性,特別是識別病理完全反應(pCR)。研究者使用兩種方法:提取不同變壓器模型的嵌入和微調GPT-2模型,分析351名接受新輔助化療的女性患者。優化後的結果顯示,敏感度達95.3%,陽性預測值90.9%,F1分數93.0%。這顯示LLMs在提取臨床數據上優於傳統機器學習模型,並強調其在改善病人護理和乳腺癌管理的潛力,但仍需進一步驗證以確保結果的可靠性。 PubMed DOI