LLM 相關三個月內文章 / 第 113 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

研究發現,ChatGPT-4 和 Google Gemini 回答腳踝扭傷問題時,比 Google Search 更詳細、正確,但內容較難懂。外科醫師認為 ChatGPT-4 整體表現最佳。未來這些 AI 有機會成為病患教育的好幫手,但資訊可能對部分人來說太複雜。 相關文章 PubMed DOI 推理

這項研究比較五種AI模型用三種工具評鑑質性研究的表現,發現AI普遍有「Yes偏誤」,GPT-4較謹慎。專有模型間一致性高於開源模型,CASP工具一致性最高。AI在需要細膩判斷的標準上表現較差。建議未來加強AI訓練、訂定倫理規範,並以人機協作提升評鑑品質。 相關文章 PubMed DOI 推理

美國頂尖心臟科醫院的衛教資料常寫得太難,病人看不懂。用GPT-4改寫後,內容變得更簡單,符合小六程度,資訊也沒走樣,有時還更完整。GPT-4有機會幫助病人更懂健康資訊,但還需要進一步研究確認安全和效果。 相關文章 PubMed DOI 推理

這項研究發現,經過微調的大型語言模型在日本臨床紀錄中辨識疾病名稱時,比傳統模型更穩定、表現下滑也較少。這顯示在日文這類資源較少的語言裡,LLMs在臨床應用上更可靠。 相關文章 PubMed DOI 推理

這篇論文討論把像 ChatGPT 這類大型語言模型用在語言治療教育和臨床的好處與風險。雖然 LLMs 能幫忙診斷和減少文書工作,但也可能帶來錯誤資訊、文化不敏感和倫理疑慮。作者強調,目前教育上還沒教會學生怎麼正確、負責任地用這些工具,建議課程要加入倫理、批判思考和案例討論,讓學生能安全又有效地運用 LLMs。 相關文章 PubMed DOI 推理

這項研究用保護隱私的大型語言模型(PP-LLM),從電子病歷擷取更多臨床資訊,來補強肌肉骨骼MRI的檢查申請單。結果顯示,經PP-LLM增強後的申請單,臨床細節更完整,影像檢查建議也更準確、一致,甚至比非專科放射科醫師還優秀。這代表醫院導入LLM,有助提升MRI檢查的適當性和病患照護品質。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4o在給運動員睡眠建議時,整體表現比Google Gemini好,尤其是當問題問得比較細時。兩個AI在收到明確提問時建議品質都會提升,但還是常漏掉一些重要的睡眠知識。總結來說,AI可以輔助提供睡眠建議,但內容還是要專家把關,輸入越具體效果越好。 相關文章 PubMed DOI 推理

這篇研究用100萬則Reddit貼文,發現用LLM嵌入向量(像是BERT、RoBERTa等)配合簡單深度學習模型,預測五大人格特質的表現比zero-shot方法高45%。LLM本身就能抓到關鍵心理語言資訊,加入人工特徵沒明顯提升。模型規模越大效果越好,但計算成本也會增加。整體來說,LLM嵌入向量在自動化人格評估上穩定又有效,未來可考慮微調模型來進一步提升效度。 相關文章 PubMed DOI 推理

近十年來,全自動腹部CT影像判讀技術大幅進步,特別是在影像分析、器官分割和疾病偵測上。文章回顧各腹部器官的AI應用,並提到foundation models和大型語言模型等新技術。雖然臨床導入還有挑戰,但這些AI有望優化放射科流程、減輕醫師負擔,提升病患照護品質。 相關文章 PubMed DOI 推理

這項研究發現,只要給GPT-4更詳細、結構化的提示語,就能大幅提升它在診斷低收入國家常見眼科疾病的準確率(從60.4%提升到90.1%)。這代表在資源有限的地方,只要善用好提示語,AI就能更有效協助醫療診斷。不過,還需要更多研究來確認這方法是否適用於其他AI或醫學領域。 相關文章 PubMed DOI 推理