LLM 相關三個月內文章 / 第 14 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究開發了一個聊天機器人,目的是協助從全人口基因篩檢中獲得正面結果,並運用大型語言模型。隨著基因檢測需求上升,這項研究希望透過科技創新來解決專家短缺的問題。 聊天機器人透過三步驟的提示工程創建,並在兩個假設情境中進行評估,專家們根據五點量表對八個標準進行打分。結果顯示,總分為3.88,語調和可用性最佳(各4.25分),但程式準確性最低(3.25分)。未來研究將專注於改進提示和設計混合型聊天機器人,以提升基因服務的品質。 相關文章 PubMed DOI

這項研究評估了ChatGPT在提供慢性鼻竇炎(CRS)資訊的有效性,並與醫療指導方針進行比較。研究中提出六個CRS相關問題,結果顯示ChatGPT的回答大致符合現有文獻,但仍有不一致之處。可讀性測試顯示資訊複雜度不同,平均可讀性分數為40.42%。雖然各類別之間可讀性無顯著差異,研究建議ChatGPT可作為醫療資訊的資源,但使用者需謹慎對待其準確性。最後以4級證據評級顯示中等可靠性。 相關文章 PubMed DOI

越來越多患者在網上尋找健康資訊,尤其是像佩羅尼氏病這種敏感疾病。大型語言模型(LLM)聊天機器人展現了提供資訊的潛力,但對於PD的準確性和可讀性仍不明朗。研究評估了四個LLM在回答PD查詢時的資訊質量,結果顯示在有提示的情況下,資訊質量提升至高水平,但平均閱讀水平為12.9年級,超過大多數患者的理解能力。雖然LLM在患者教育上有潛力,但仍需臨床背景和人類提示來提升效果,並需教育患者與醫生如何有效互動。 相關文章 PubMed DOI

這項研究評估了大型語言模型(LLMs)在藥物審查中的表現,特別是劑量錯誤、藥物相互作用及基因組學建議的能力。研究測試了四個LLM,發現ChatGPT在劑量方案上表現良好,但對simvastatin的問題有例外。所有LLM都能識別warfarin的相互作用,但錯過metoprolol和verapamil的相互作用。Claude-Instant在治療監測上提供適當建議,而Gemini在基因組學上表現不錯。研究指出,LLM在藥物審查中有潛力,但整合進醫療系統對病人安全至關重要。 相關文章 PubMed DOI

大型語言模型(LLMs),像是GPT-3.5-turbo和GPT-4,對醫療專業人員有潛在的協助能力,但可能帶有訓練數據中的偏見,影響其在醫療情境中的有效性。本研究分析這些模型在預測住院、費用和死亡率時的表現,發現它們對白人族群的預測較高,且在困難醫療情況下過於樂觀。這些偏見反映了醫療不平等,強調了進一步研究的必要性,以減少語言模型中的偏見,確保所有病患都能獲得公平和準確的醫療結果。 相關文章 PubMed DOI

準確預測ADMET(吸收、分佈、代謝、排泄和毒性)特性對藥物開發非常重要,能幫助選擇具良好藥物動力學及降低毒性的化合物。目前的ADMET數據集因樣本數量少及代表性不足而受限。為了解決這些問題,我們提出了一個多代理數據挖掘系統,利用大型語言模型識別14,401個生物測試的實驗條件,並整合不同來源的數據,最終創建了PharmaBench,包含156,618條原始條目,旨在支持藥物發現相關的AI模型開發。 相關文章 PubMed DOI

這項研究評估了GPT-3.5這種大型語言模型在自動標記產科事件報告的效果。分析了370份住院產科報告,並以人類標註作為金標準。結果顯示,該模型的敏感度達85.7%,特異度為97.9%,使用了79個標籤,而人類僅用了49個。模型的標籤解釋也有60.8%獲得審核者認可。總體來看,GPT-3.5能提升事件報告系統的數據利用效率,並可能改善病人安全。 相關文章 PubMed DOI

這項研究探討大型語言模型(LLMs)在診斷罕見遺傳疾病中的應用,特別是基於表型的基因優先排序。研究比較了五種LLMs,結果顯示GPT-4的表現最佳,能在前50個預測中準確識別17.0%的診斷基因,但仍低於傳統方法。雖然較大的模型通常表現較好,先進技術如檢索增強生成並未提升準確性,但精緻的提示改善了任務完整性。整體而言,這些發現顯示LLMs在基因組分析中的潛力與限制,對臨床應用有重要影響。 相關文章 PubMed DOI

單間室膝關節置換術(UKR)在末期單間室膝關節骨關節炎患者中越來越受重視,但選擇合適候選者仍有爭議。本研究探討了ChatGPT等自然語言處理程式在評估患者接受全膝關節置換術(TKR)或UKR資格的有效性。結果顯示,ChatGPT與73位外科醫生的意見僅有15.6%不合,且在識別UKR候選者方面的敏感性達0.91,正確預測值為0.87。此外,ChatGPT在決策中表現出更高的信心。研究顯示,ChatGPT能有效協助外科決策。 相關文章 PubMed DOI

這項研究評估了ChatGPT(GPT-3.5)在2021年ASPS整形外科在職考試中的表現,使用了不同的提示和檢索增強生成(RAG)技術。結果顯示,當以「住院醫師」身份回應時,準確率最高為54%,而RAG的使用並未顯著改善表現,準確率僅微幅提升至54.3%。整體而言,ChatGPT的表現位於第10百分位,顯示出需要進一步微調及採用更先進的方法,以提升AI在複雜醫療任務中的有效性。 相關文章 PubMed DOI