LLM 相關三個月內文章 / 第 18 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究比較了大型語言模型GPT-4與內分泌科醫生在糖尿病治療中對metformin及替代療法的選擇。研究發現,GPT-4在簡單提示下僅選擇12%的案例使用metformin,而醫生則為31%。當提示鼓勵使用metformin時,GPT-4的選擇提高至25%。在腎功能受損或有腸胃不適的患者中,GPT-4幾乎不選擇metformin(2.9%),而醫生則有21%的回應。研究結論指出,GPT-4的回應雖合理,但與醫生的選擇存在顯著差異,使用時需謹慎。 相關文章 PubMed DOI

這篇文章探討了人工智慧(AI)技術,特別是像ChatGPT這類大型語言模型在醫療領域的應用。文章指出,這些工具能幫助醫療人員簡化病人教育、溝通、醫療紀錄摘要及研究等工作。不過,對於這些工具是否適合臨床使用,以及醫療工作者的接受度,仍有一些疑慮。文章旨在讓護理人員了解可用的AI工具,幫助他們評估這些技術在臨床實踐中的必要性與影響,確保能以道德且有效的方式提升病人護理品質。 相關文章 PubMed DOI

這項研究評估大型語言模型(LLMs)在解釋乳腺影像報告及提供臨床建議的表現,分為兩個步驟: 1. **文本評估**:比較十個LLMs與放射科醫師在100道BI-RADS選擇題上的準確率。Claude 3.5 Sonnet表現最佳(90%),超過一般放射科醫師(78%)和乳腺放射科醫師(82%)。 2. **視覺評估**:測試五個多模態LLMs在100張乳腺超音波影像上的表現,Claude 3.5 Sonnet以59%準確率領先。 研究顯示,雖然LLMs在文本評估中表現良好,但視覺診斷能力有限,需在放射科醫師監督下使用,以避免誤診。 相關文章 PubMed DOI

這篇評論探討了人工智慧(AI)在重症護理腎臟科的進展與應用。AI 演算法能提升早期檢測、風險預測及個性化治療,特別是在急性腎損傷(AKI)管理上。機器學習模型可在血清肌酸酐變化前預測 AKI,而大型語言模型則能自動生成臨床筆記和患者教育材料。儘管如此,為了發揮 AI 的潛力,仍需解決數據質量和倫理等挑戰。成功整合 AI 需要腎臟科醫生、重症醫師與 AI 專家的合作與持續教育。 相關文章 PubMed DOI

這篇論文探討了基於變壓器的模型,旨在檢測社交媒體上用戶生成內容中的抑鬱症狀。研究強調了解釋性的重要性,特別是對健康專業人員而言。作者提出兩種方法:一是將分類和解釋任務分開,二是整合到同一模型中。他們還利用對話型大型語言模型(LLMs)進行上下文學習和微調,生成的自然語言解釋與症狀相符,讓臨床醫生更易理解模型輸出。評估結果顯示,能在提供可解釋的解釋的同時,達到高分類性能。 相關文章 PubMed DOI

這項系統性回顧評估了ChatGPT(特別是GPT-3.5、4和4V)在日本醫療和健康執照考試中的有效性。研究分析了2022年1月到2024年4月間的22篇文章,結果顯示GPT-4雖能通過文字考試,但表現不如實際考生。此外,最新的GPT-4V在圖像識別上表現不佳,對視覺問題的回應也不夠充分。這些結果顯示,為了提升評估結果,仍需在精確度上進行改進。 相關文章 PubMed DOI

這項研究評估了ChatGPT在醫學專業考試中的表現,並探討人工智慧如何增強醫學教育。研究中向ChatGPT提出240個問題,結果顯示其在基礎醫學和臨床醫學的正確回答率均優於18,481名醫學畢業生。特別是在婦產科和醫學微生物學方面,ChatGPT的表現相當優異,但在解剖學上則不如畢業生。研究指出,像ChatGPT這樣的AI模型能顯著提升醫學教育,提供互動支持和個性化學習,最終改善教育質量和學生成功率。 相關文章 PubMed DOI

這項研究評估了牙槽骨移植相關的病人教育材料(PEMs),發現其可讀性超過美國醫學會建議的六年級水平,平均為8.0。理解度接近可接受標準,但可行性得分偏低。使用ChatGPT重新編寫後,可讀性顯著改善,降至6.1。結果顯示,雖然目前的PEMs未達建議標準,但人工智慧工具如ChatGPT能提升可及性。未來研究應著重改善這些材料的可行性。 相關文章 PubMed DOI

這項研究評估了ChatGPT-4在生成骨科疾病治療建議的有效性,並與美國骨科醫學會的指導方針及醫師計畫進行比較。主要發現包括: 1. ChatGPT-4的建議與AAOS指導方針一致性達90%。 2. 與主治醫師的建議一致性為78%。 3. 在骨折及關節炎案例中表現優異,但腕管綜合症表現不佳。 4. 不一致主要出現在腕管綜合症及其他特定損傷。 5. 雖然ChatGPT-4能提供準確建議,但在考量患者特定因素時仍需醫師的批判性評估。 總之,ChatGPT-4在骨科治療中具輔助潛力,但需專業監督。 相關文章 PubMed DOI

這項研究比較了兩種大型語言模型(LLMs),Gemini 和 GPTs,在乳腺癌患者的 PET/CT 報告中提取數據和生成結構化報告的表現。研究涵蓋131名患者,發現 GPTs 在數據挖掘上準確率更高,特別是原發病灶(89.6% vs. 53.8%)和轉移病灶(96.3% vs. 89.6%)。此外,GPTs 在疾病進展決策和語義相似度上也優於 Gemini。整體來看,GPTs 在臨床應用中顯示出更高的潛力。研究使用多種統計方法驗證結果,數據可向通訊作者索取。 相關文章 PubMed DOI