LLM 相關三個月內文章 / 第 25 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究探討了人工智慧技術,特別是ChatGPT和Gemini,在提供病人醫療資訊(PFI)方面的效果,專注於手部手術。研究發現,雖然AI生成的內容與傳統資料在準確性上無顯著差異,但手外科醫生認為傳統資料在全面性和清晰度上更佳。非醫療參與者則偏好AI生成的文本。整體來說,兩者的資訊都適合病人理解,但AI內容仍需改進以符合醫療標準。持續研究對於提升病人教育和術後護理溝通非常重要。 相關文章 PubMed DOI 推理

這項研究評估了十四個大型語言模型(LLMs)在不同臨床情境中推薦抗生素的表現。研究使用標準化提示,針對60個案例的藥物選擇、劑量和治療持續時間進行評估。結果顯示,ChatGPT-o1的準確率最高,達71.7%,劑量正確性達96.7%。而在治療持續時間方面,Gemini表現最佳(75.0%)。不過,各模型在複雜案例中的表現差異明顯,顯示出在臨床應用前仍需謹慎驗證。 相關文章 PubMed DOI 推理

最近生成對抗網絡(GANs)和大型語言模型(LLMs)的進展,提升了醫療數據的生成與增強,對機器學習應用至關重要,尤其在數據隱私受到關注的情況下。研究評估了多種合成數據生成(SDG)方法的有效性,並以隨機森林為基準,分析其在下游任務中的表現。結果顯示,統計方法如synthpop在各種情況下表現優於深度學習方法,特別是在小型數據集上。研究強調特徵與目標變量的相關性對模型效用影響更大,synthpop顯示出更高的穩健性。 相關文章 PubMed DOI 推理

這項研究評估大型語言模型(LLMs)在根據病患醫療紀錄生成早期乳腺癌治療選項的準確性。使用2024年初的多學科團隊會議紀錄,測試了三個AI模型:Claude3-Opus、GPT4-Turbo和LLaMa3-70B。結果顯示,Claude3-Opus準確率86.6%,GPT4-Turbo為85.7%,LLaMa3-70B則為75.0%。兩者在輔助內分泌和靶向治療上表現良好,但在輔助放射治療上則有高估的情況。研究建議需進一步探討這些模型在臨床上的實際應用。 相關文章 PubMed DOI 推理

這項研究探討如何將電子健康紀錄(EHRs)與自然語言處理(NLP)及大型語言模型(LLMs)結合,以改善醫療數據管理和病人照護。研究使用MIMIC III數據集,採用GPT-3.5、GPT-4等模型生成符合HIPAA要求的合成病人紀錄。結果顯示,基於關鍵字的方法在隱私保護上風險較低,且保持良好性能,建議未來可考慮使用虛擬的PHI來提升實用性與隱私保護。 相關文章 PubMed DOI 推理

馬丁是茱莉亞的哥哥,因此他和茱莉亞有相同的兄弟姐妹。由於茱莉亞有兩個姐妹,馬丁也有兩個姐妹。因此,馬丁有兩個姐妹。 相關文章 PubMed DOI 推理

這項研究評估了兩個AI模型,ChatGPT-4o和ChatGPT-4,為一位20歲女性肥胖者制定1800卡路里的飲食計畫,並與2022年土耳其飲食指南(TDG-2022)比較。結果顯示,兩者的菜單與建議不一致,卡路里含量低於標準,且關鍵營養素如脂肪、碳水化合物、鉀和鈣的含量也未達標。總體而言,這些AI模型在飲食規劃上有重大限制,無法取代營養師的專業建議,使用時需謹慎。 相關文章 PubMed DOI 推理

這項研究探討了一種自動化的問題類型編碼模型,特別是「穩健優化雙向編碼器表示法」,用於分析兒童虐待受害者的法醫訪談和法庭證詞。模型在大型數據集上訓練,顯示出95%的可靠性,與人工編碼者的協議相當。進一步分析發現,人工編碼者在識別問題時容易出錯,修正後模型的可靠性提升至98%。研究結果顯示,自動編碼是一種省時且準確的手段,訓練好的模型可供研究人員和實務工作者使用。 相關文章 PubMed DOI 推理

這項研究評估了三款AI聊天機器人—ChatGPT、Gemini和Llama—對早洩問題的回應,分析了它們對25個常見問題的回答。可讀性透過FRES和FKGL分數評估,質量則用修改版DISCERN (mDISCERN)和EQIP分數來衡量。結果顯示,三者的可讀性相似,但在質量上,Llama得分最高(72.2),Gemini次之(67.6),ChatGPT最低(63.1),差異顯著。mDISCERN方面,ChatGPT中位數為2,Gemini和Llama均為3,顯示資訊質量的明顯差異。總體來看,Llama在質量上表現最佳。 相關文章 PubMed DOI 推理

大型語言模型(LLMs)在心理健康評估中的應用日益普遍,但對其準確性和公平性仍有疑慮,特別是社會偏見和某些族群的代表性不足。本研究聚焦於厭食症和暴食症,特別是男性,尤其是同性戀男性在這方面的研究常被忽視。研究發現,ChatGPT-4在健康相關生活品質的評估中對男性存在顯著性別偏見,男性分數低於女性,卻缺乏實證支持。這些結果顯示LLM在心理健康評估中可能存在偏見,強調需理解並減少這些偏見,以確保診斷和治療的負責任使用。 相關文章 PubMed DOI 推理