LLM 相關三個月內文章 / 第 123 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,GPT-4o 在單獨執行醫學或精神科任務時很精確,但遇到模擬同儕壓力時,表現會明顯變差,特別是在精神科這種診斷標準不明確的情境下。AI 也會受社會動態影響,未來臨床應用時要特別注意設計,確保其判斷客觀可靠。 相關文章 PubMed DOI 推理

這份研究發現,巴勒斯坦有87%的醫學生已開始用AI工具(像ChatGPT),學業和研究表現都有明顯提升,臨床能力進步則較有限,時間管理也變好。不過,大家普遍缺乏AI訓練,且對倫理和資料正確性有疑慮。建議醫學課程應納入AI教學,提升AI素養並加強倫理規範。 相關文章 PubMed DOI 推理

**重點摘要:** 大型語言模型(LLMs)有機會提升創傷外科的照護品質,像是協助診斷、決策以及病人溝通等。不過,目前還有像是透明度不足、法律和倫理問題尚未解決等挑戰,所以在應用上需要謹慎監督,才能確保安全又有效的使用。 相關文章 PubMed DOI 推理

這項研究用開源大型語言模型(像LLaMA3)自動產生德文出院摘要,並請醫師評估品質。結果顯示,AI生成的摘要資訊算完整,但常漏掉重要細節或出現錯誤,尤其在複雜病例時更明顯。研究也發現資料集太小、資料不全和模型德文醫學詞彙不足是主要挑戰,建議未來要用更多資料和微調模型,才能提升表現。 相關文章 PubMed DOI 推理

這篇研究發現,巴基斯坦大學生用ChatGPT學習,對學業表現有正面幫助。學生會用ChatGPT,主要是因為覺得有趣、用習慣了,這些也會影響他們實際使用的頻率。整體來說,ChatGPT在巴基斯坦大學教育裡,是個很有價值的學習工具。 相關文章 PubMed DOI 推理

這項研究用自動編碼器和深度神經網路結合的機器學習方法,準確預測金屬氫化物的氫儲存容量,解決了資料少又複雜的問題。團隊還微調GPT-2語言模型,幫忙產生和篩選新型氫儲存材料,部分材料也用DFT驗證過,效果很好。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4o在回答小兒夜間遺尿常見問題時,正確率最高(92.5%),表現優於Gemini和Copilot。雖然ChatGPT-4o在簡單醫療問題上很可靠,但AI建議還是要搭配醫師專業判斷使用。 相關文章 PubMed DOI 推理

這項研究讓四款大型語言模型參加泰國醫師執照模擬考,發現它們分數都超過及格線,GPT-4表現最好,正確率高達88.9%。雖然大多數醫學主題都答得不錯,但在遺傳學和心血管題目上較弱。圖片題有進步空間,純文字題表現較佳。整體來說,LLMs對泰國醫學生準備考試很有幫助,但還需加強某些主題和圖片題的能力。 相關文章 PubMed DOI 推理

這項研究比較三種AI模型預測急性心肌梗塞病患一年內死亡率的準確度。結果顯示,傳統人工神經網路(SWEDEHEART-AI)表現最好,預測能力優於兩個大型語言模型(Qwen-2和Llama-3)。雖然LLM有潛力,但目前在臨床風險預測上還不如傳統模型,未來還需加強其準確度與校正能力。 相關文章 PubMed DOI 推理

調查發現,多數醫療專業人員已經用過ChatGPT,主要拿來寫作、查資料和跟病人溝通。他們覺得ChatGPT能提升效率、方便找資訊,但也擔心準確度、隱私和抄襲等問題。大家普遍支持加強資料安全。雖然ChatGPT很有幫助,但還需要更多研究和保障措施,才能安心用在醫療領域。 相關文章 PubMed DOI 推理