LLM 相關三個月內文章 / 第 99 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,GPT-4和GPT-4o在台灣SPTEMD醫學考題(不含圖片題)上的正確率都超過95%,明顯優於GPT-3.5的66%。兩者在中英文題目表現都很穩定,且已達醫學考試標準。未來建議進一步探討AI在醫學教育和考試上的應用方式。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4能快速產出內容正確、易讀又符合最新指引的泌尿系統癌症衛教資料,還能準確翻譯成多國語言。AI生成的資料比原本更清楚,閱讀門檻也較低,只要有專業人員審核,就能幫助病人更容易取得和理解相關資訊。 相關文章 PubMed DOI 推理

這篇論文提出 HELP-ME 三階段架構,能系統性評估並保護醫療大型語言模型的病患隱私,不會影響模型效能。它用提示詞檢測隱私問題,並透過混淆技術保護資料。實驗證明,HELP-ME 在真實醫療資料上能有效守護隱私,同時維持高診斷準確率,是醫療 LLMs 的實用安全方案。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT、Gemini 和 Claude 都能把線上病患衛教資料簡化到更容易閱讀的程度,字數也變少,且正確性和易懂性大致良好。不過,Gemini 和 Claude 偶爾會有錯誤,所以還是需要人工審查。未來建議針對更進階或專門醫療的模型再做研究。 相關文章 PubMed DOI 推理

這項研究發現,AI(特別是ChatGPT)在預測黑色素瘤患者前哨淋巴結活檢結果上,比傳統預測圖更準確。結合AI和傳統方法後,預測能力還能再提升。未來AI若持續進步,有望讓預測更精確,幫助臨床決策。 相關文章 PubMed DOI 推理

國際調查發現,藥學系學生普遍愛用像ChatGPT這類AI工具,因為方便又好用,但也擔心價格、習慣依賴、倫理問題和資源不均。超過兩成學生坦言作業太依賴AI,卻只有一成重視法律和倫理訓練。不同國家和性別的接受度也有差異。研究呼籲藥學教育要加強倫理指引、資源公平和AI課程規劃。 相關文章 PubMed DOI 推理

這項研究開發了「AI-數位生活平衡量表(AI-DLBS)」,用來評估AI和數位科技對心理、社交、身體及學業的影響。量表由ChatGPT-4協助設計,並在土耳其大學生中驗證,結果顯示信效度高,有六大面向。AI-DLBS可協助心理健康專業人員評估科技風險,但建議未來在不同族群中再進一步驗證。 相關文章 PubMed DOI 推理

這項研究比較多款大型語言模型在自動化 pharmacometrics 任務的表現,發現 Claude 3.5 Sonnet 在產生模型圖、參數表和報告上最準確且易用。ChatGPT 4o 雖能模擬,但遇到複雜模型會卡關。整體來說,LLMs 有助於簡化工作流程,但還是需要專家把關結果。 相關文章 PubMed DOI 推理

大型語言模型能幫助放射科減輕工作量,但還有像是亂編內容和資訊來源不明的問題。結合RAG技術能提升可靠性,但面對大量或複雜資料時還需改進。本文回顧LLMs最新進展及放射科應用案例,並提出未來研究方向。 相關文章 PubMed DOI 推理

ChatGPT 3.5 用來測驗近十年整形外科住院醫師考題(不含圖片),正確率只有約 46%,明顯低於住院醫師平均。它在基本知識和乳房、醫美題目表現較好,但遇到需要複雜推理或手部、下肢相關題目就比較弱。整體來說,ChatGPT 現階段還不適合拿來做臨床決策或考試準備。 相關文章 PubMed 推理