LLM 相關三個月內文章 / 第 102 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究用開源大型語言模型(像LLaMA3)自動產生德文出院摘要,並請醫師評估品質。結果顯示,AI生成的摘要資訊算完整,但常漏掉重要細節或出現錯誤,尤其在複雜病例時更明顯。研究也發現資料集太小、資料不全和模型德文醫學詞彙不足是主要挑戰,建議未來要用更多資料和微調模型,才能提升表現。 相關文章 PubMed DOI 推理

這篇研究發現,巴基斯坦大學生用ChatGPT學習,對學業表現有正面幫助。學生會用ChatGPT,主要是因為覺得有趣、用習慣了,這些也會影響他們實際使用的頻率。整體來說,ChatGPT在巴基斯坦大學教育裡,是個很有價值的學習工具。 相關文章 PubMed DOI 推理

這項研究用自動編碼器和深度神經網路結合的機器學習方法,準確預測金屬氫化物的氫儲存容量,解決了資料少又複雜的問題。團隊還微調GPT-2語言模型,幫忙產生和篩選新型氫儲存材料,部分材料也用DFT驗證過,效果很好。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4o在回答小兒夜間遺尿常見問題時,正確率最高(92.5%),表現優於Gemini和Copilot。雖然ChatGPT-4o在簡單醫療問題上很可靠,但AI建議還是要搭配醫師專業判斷使用。 相關文章 PubMed DOI 推理

這項研究讓四款大型語言模型參加泰國醫師執照模擬考,發現它們分數都超過及格線,GPT-4表現最好,正確率高達88.9%。雖然大多數醫學主題都答得不錯,但在遺傳學和心血管題目上較弱。圖片題有進步空間,純文字題表現較佳。整體來說,LLMs對泰國醫學生準備考試很有幫助,但還需加強某些主題和圖片題的能力。 相關文章 PubMed DOI 推理

這項研究比較三種AI模型預測急性心肌梗塞病患一年內死亡率的準確度。結果顯示,傳統人工神經網路(SWEDEHEART-AI)表現最好,預測能力優於兩個大型語言模型(Qwen-2和Llama-3)。雖然LLM有潛力,但目前在臨床風險預測上還不如傳統模型,未來還需加強其準確度與校正能力。 相關文章 PubMed DOI 推理

調查發現,多數醫療專業人員已經用過ChatGPT,主要拿來寫作、查資料和跟病人溝通。他們覺得ChatGPT能提升效率、方便找資訊,但也擔心準確度、隱私和抄襲等問題。大家普遍支持加強資料安全。雖然ChatGPT很有幫助,但還需要更多研究和保障措施,才能安心用在醫療領域。 相關文章 PubMed DOI 推理

這項研究開發了一個微調過的大型語言模型,能自動從Reddit家暴相關社群的女性貼文中,辨識她們的資訊需求。研究團隊用真實和AI生成的資料解決樣本不足和類別不均問題,並將貼文分成8類(如法律、安置、庇護所等)。這個模型在準確率和F1-score都比GPT-3.5、GPT-4等基準模型好,也比人工判讀快很多,有助醫療人員更快掌握家暴倖存者需求,提供即時協助。 相關文章 PubMed DOI 推理

**重點整理:** OpenAI-o1 具備更優秀的推理能力,在 15 題日本醫師執照考試題目中表現優於 GPT-4(正確率 100% 對 80%;辨識禁忌選項的正確率 87% 對 73%),但由於樣本數較少,這些結果僅供初步參考。 相關文章 PubMed DOI 推理

這項研究發現,基本版 ChatGPT 在生物醫學文獻搜尋的表現不如 Google 和 PubMed,即使加上插件或自訂功能也還有不少限制。每種搜尋情境都有不同挑戰,顯示對話式 AI 雖有潛力,但目前還不夠成熟,未來在科學研究應用前需要更全面的評估。 相關文章 PubMed DOI 推理