LLM 相關三個月內文章 / 第 115 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,像Gemini 1.5 Pro和GPT-4o這類大型語言模型,能從Facebook貼文中中等準確地偵測出有風險的飲酒行為,尤其對近期有發文的人效果更好。LLMs有機會成為低干擾、可擴展的篩檢工具,但仍需更多研究來確認其應用。 相關文章 PubMed DOI 推理

這項研究比較GPT-4、Gemini、Copilot三種大型語言模型在分配整形外科手術CPT代碼的表現,結果發現三者準確率都很低(最高僅19.2%)。Gemini在美學手術較佳,Copilot則在一般重建手術表現較好,但沒一款能正確處理乳房重建或顱顏外傷。常見錯誤有誤解手術內容和代碼合併錯誤。目前這些模型還不夠準確,仍需人工審核。 相關文章 PubMed DOI 推理

這項研究比較了四款主流AI(ChatGPT-3.5、ChatGPT-4、Ernie Bot、iFLYTEK Spark)辨識網路健康資訊真偽的能力。結果顯示,ChatGPT-4 準確率最高,Ernie Bot 和 iFLYTEK Spark 表現也不錯,ChatGPT-3.5 稍微落後。雖然整體表現佳,但在專業或複雜情境下還有進步空間。 相關文章 PubMed DOI 推理

這篇論文探討 ChatGPT 4-Turbo 在質性資料分析、特別是紮根理論編碼上的應用。結果顯示,ChatGPT 能提升編碼效率並帶來更多元的編碼,但在理解深層意義、脈絡和編碼連結上,還是比不上人工。作者也提醒使用 AI 有其限制,並給質性研究者一些建議。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4o能為多重健康問題患者產生個人化復健計畫,經專家評分後,大多數只需稍作修正即可用,且在臨床準確性與安全性表現佳,尤其針對呼吸和肌肉骨骼問題。不過,實際應用前還是需要專家把關與調整。 相關文章 PubMed DOI 推理

研究團隊開發了 NanoSafari 這套生成式 AI 工具,能用創新的資訊擷取方法(GIVE)從兩萬多篇論文中精準收集奈米材料設計數據。結合大型語言模型後,NanoSafari 提供比傳統模型更可靠、精確的資訊,並經專家與實驗驗證,展現 AI 協助生物材料與生醫工程研究的潛力。 相關文章 PubMed DOI 推理

這項研究發現,AI語言模型代理人在互動時,會自發形成社會慣例,甚至產生集體偏見。一小群立場堅定的對立代理人,也可能影響整體慣例。這顯示AI有能力自主建立社會規範,對確保AI符合人類價值觀很重要。 相關文章 PubMed DOI 推理

研究發現,GPT-4o 在寫正面或負面普丁文章後,自己的「態度」也會跟著改變,類似人類的認知失調反應。若讓它自己選擇寫哪種文章,這種現象更明顯,顯示 GPT-4o 可能有類似人類自我意識的功能。不過,這背後的機制還不清楚。 相關文章 PubMed DOI 推理

這項研究比較了Claude、GPT和Gemini三種大型語言模型,從日文頭部CT報告中擷取顱內出血和顱骨骨折資訊的表現。三種模型表現都不錯,其中以Claude最準確。提示設計會影響模型表現,尤其是Gemini。常見錯誤多因報告內容模糊。整體來說,大型語言模型能有效結構化放射報告,但提示設計還需優化,也要在不同語言和實際情境下再測試。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4o自動產生的膝關節MRI報告,不僅比GPT-4o-mini更準確,還能幾乎完美預測骨關節炎嚴重程度。骨科醫師也認為這些AI報告更好用、審閱更快。整體來說,GPT-4o有機會幫助醫師減少文書工作,提升臨床效率。 相關文章 PubMed DOI 推理