原始文章

這項研究比較三款主流視覺生成式AI(GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro)在辨識與分級肺腺癌組織學型態的表現。結果發現,Claude-3.5-Sonnet的分級準確率最高,穩定性也不錯,且結合臨床資料後,預後預測效果佳。整體來說,生成式AI,尤其是Claude-3.5-Sonnet,對肺腺癌病理評估和預後有很大幫助。 PubMed DOI


站上相關主題文章列表

這項研究評估大型語言模型(LLMs)在解釋乳腺影像報告及提供臨床建議的表現,分為兩個步驟: 1. **文本評估**:比較十個LLMs與放射科醫師在100道BI-RADS選擇題上的準確率。Claude 3.5 Sonnet表現最佳(90%),超過一般放射科醫師(78%)和乳腺放射科醫師(82%)。 2. **視覺評估**:測試五個多模態LLMs在100張乳腺超音波影像上的表現,Claude 3.5 Sonnet以59%準確率領先。 研究顯示,雖然LLMs在文本評估中表現良好,但視覺診斷能力有限,需在放射科醫師監督下使用,以避免誤診。 PubMed DOI

這篇論文探討基因數據在疾病診斷與治療中的重要性,特別是癌症研究,並指出將這些數據整合進臨床護理的挑戰,如電子健康紀錄的結構、保險成本及基因結果的可解釋性。研究也提到人工智慧(AI)和大型語言模型(LLMs)在解決這些問題上的潛力。儘管AI在醫學研究中的成功有限,但基於大量數據訓練的LLMs在基因分析上顯示出希望。研究評估了GPT模型在基因表達數據的預測能力,並與傳統機器學習方法進行比較,以探討其在預測癌症亞型的潛力。 PubMed DOI

這項研究探討了OpenAI的GPT-4進階數據分析(ADA)在分析重症監護病房病人胸部X光片的有效性。研究使用了43,788份病人報告,要求GPT-4進行多種分析,包括繪圖和預測模型。三位具機器學習經驗的科學家評估了GPT-4的輸出,結果顯示其視覺化和統計分析大多準確,但也有錯誤。GPT-4的機器學習模型AUC為0.75,與人類模型相近(0.80),準確率也相似。研究建議大型語言模型可增強放射學數據分析,但仍需注意準確性限制。 PubMed DOI

這項研究評估了AI語言模型Claude 3 Opus在生成腎臟病理影像診斷描述的表現。研究團隊整理了100張影像,涵蓋各種常見腎臟疾病。雖然Claude 3 Opus在語言流暢性上得分不錯(3.86),但在臨床相關性(1.75)、準確性(1.55)、完整性(2.01)和整體價值(1.75)方面表現不佳。不同疾病類型的表現差異明顯,病理學家的評分一致性高,但準確性和完整性則中等。研究顯示AI生成的描述雖流暢,但準確性和臨床相關性仍需改進,未來應探討數據來源的限制並與其他模型比較。 PubMed DOI

這項研究比較了兩個大型語言模型(LLMs),GPT-4 和 Gemini,在分析放射學報告以識別腫瘤問題的表現。研究涵蓋205名患者,結果顯示GPT-4在準確率、精確度、召回率和F1分數上均優於Gemini,特別是在腫瘤狀態的判斷上也更準確。這顯示出大型語言模型,尤其是GPT-4,在腫瘤監測方面的潛力。 PubMed DOI

精準腫瘤學在非小細胞肺癌(NSCLC)中依賴生物標記檢測,但面臨基因組訓練不足和報告不一致等挑戰。研究評估了不同版本的ChatGPT在生成下一代測序報告及治療建議的能力,並引入生成式AI表現分數(G-PS)來衡量準確性和幻覺的出現。結果顯示,GPT-4的表現優於GPT-3.5,準確性更高且幻覺較少。這項研究顯示生成式AI在精準腫瘤學中的潛力,未來應重視其準確性和幻覺問題。 PubMed DOI

這項研究評估了四個大型語言模型(LLMs)在前列腺癌治療相關的資訊檢索和風險評估任務中的表現,特別針對第四期患者。研究使用350份模擬報告,並針對三個風險評估任務和七個資訊檢索任務進行評估。結果顯示,所有模型在資訊檢索任務中表現良好,但在風險評估上差異明顯,ChatGPT-4-turbo表現最佳。儘管結果令人鼓舞,研究仍提醒可能的誤解會影響臨床決策,並呼籲進一步研究以驗證結果的普遍性。 PubMed DOI

這項研究探討了GPT-4的進階數據分析(ADA)套件在自動創建機器學習模型方面的表現,目的是預測膠質瘤的分子類型。研究使用了615名新診斷患者的MRI掃描數據,並比較了GPT-4與傳統手工模型的準確性。結果顯示,GPT-4在某些數據集上表現優異,但在不同膠質瘤類型的預測上仍面臨挑戰,特別是在IDH突變類型的準確性上。整體而言,GPT-4展現了自動開發機器學習模型的潛力,但也顯示出處理不平衡數據集的困難。 PubMed DOI

這項研究顯示生成式人工智慧在自動化將非結構化病理報告轉為結構化格式方面的有效性,特別針對台北醫學大學醫院的乳腺癌報告。研究人員使用ChatGPT大型語言模型,透過Streamlit網頁應用程式達到99.61%的準確率,並顯著縮短處理時間,優於傳統方法。雖然目前僅限於單一機構及乳腺癌報告,但未來計畫將擴展至其他癌症類型並進行外部驗證,以確保系統的穩健性。總體而言,這顯示人工智慧能有效提升病理報告處理效率,促進生物醫學研究的進步。 PubMed DOI

這篇研究發現,GPT-4o-mini和ERNIE-4.0-Turbo-8K在根據放射科報告給肺結節追蹤建議時,準確率都超過九成,表現和專業醫師差不多,錯誤建議也很少。雖然這些AI有潛力協助放射科決策,但實際應用前還是要嚴格驗證和監督,確保病人安全。 PubMed DOI