LLM 相關三個月內文章 / 第 92 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究用生成式AI(像是ChatGPT、Gemini、Copilot)來擴充教育文本資料集,讓資料量從1,079筆增加到7,982筆。研究用不同資料處理方法和子資料集,訓練超過1.5萬個機器學習模型。結果發現,用AI擴充資料能有效提升模型準確度。 相關文章 PubMed DOI 推理

這項研究比較四款AI聊天機器人回答數位微笑設計問題的表現。ChatGPT-4最準確,Copilot品質最好且會標註資料來源,ChatGPT-3.5雖然較易讀但還是不夠簡單。整體來說,這些AI資訊正確但可讀性差、缺乏透明度,對病患衛教幫助有限,未來需加強內容清楚度和資料來源標示。 相關文章 PubMed DOI 推理

雖然超過一半醫學研究人員寫論文時有用像 ChatGPT 這類大型語言模型,但近兩千篇放射線醫學期刊文章中,只有 1.7% 有主動揭露使用 LLMs。大多數揭露只用在小幅度編輯,且多來自非英語國家。揭露率沒隨時間增加,也沒影響審稿速度。這顯示 LLMs 使用被低報,可能跟污名化、政策不明或標準不一有關,呼籲要有更明確的揭露規範和更開放的研究文化。 相關文章 PubMed DOI 推理

這項研究發現,三年級醫學生在放射線學考試(尤其是影像判讀和臨床推理)表現明顯優於ChatGPT-4o。雖然AI有一定能力,但在專業判讀和臨床整合上,還有很大進步空間,暫時還追不上人類學生。 相關文章 PubMed DOI 推理

這項研究把文字、圖譜、化學式、圖片和描述等多種藥物資訊結合起來,並用不同的資料融合方法來提升藥物交互作用(DDI)的偵測準確度。結果發現,特別是用中階融合策略時,預測效果明顯優於現有方法。研究也分析了預測失誤的原因,對未來改進和臨床用藥安全都有幫助。 相關文章 PubMed DOI 推理

這篇研究發現,雖然語言模型沒有嗅覺,但它們能從文字中還原出人類對氣味的感知。簡單模型較擅長捕捉氣味相似性,進階模型如 GPT-4o 則更能模擬語意上的氣味關聯。這顯示語言中其實蘊含感官經驗,語言模型有助於認知科學探索語言與感知的關係。 相關文章 PubMed DOI 推理

這項研究比較了大型語言模型(LLMs)、嵌入技術和傳統文字比對方法在判斷放射科報告變更重要性上的表現。結果顯示,LLMs,特別是Qwen3-235B-A22B模型,最接近專家評分,優於其他方法。LLMs有助於準確找出臨床重要變更,提升同儕審查效率與品質。 相關文章 PubMed DOI 推理

這項研究發現,AI聊天機器人能有效產生醫學影像選擇題,其中以Claude 3表現最佳,但多數題目僅考記憶,缺乏高層次思考。雖然AI可幫教師省時,題目品質仍需專家把關,並協助設計更能評量進階認知的題目。 相關文章 PubMed DOI 推理

研究發現,ChatGPT在急診模擬情境下,問診和同理心表現比醫師更好,減輕病人疑慮的能力也較強;臨床準確度則和醫師差不多。病人覺得ChatGPT的說明和可信度跟醫師一樣。這顯示AI結合醫師,有機會提升急診醫療品質。 相關文章 PubMed DOI 推理

這項初步研究發現,AI(特別是ChatGPT)在撰寫皮膚科門診書信時,正確性和速度都比傳統醫師-秘書方式好,但信件內容較複雜、冗長,可讀性較差。Heidi寫得最快、結構清楚但有時會漏細節。傳統方式雖然最容易閱讀,但正確性最低。AI有助提升效率和正確性,但可讀性、可靠性和資料安全還需再研究,才能真正應用在臨床上。 相關文章 PubMed DOI 推理