LLM 相關三個月內文章 / 第 70 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究評估了ChatGPT在小兒重症監護病房(PICU)中,對父母問題的回應品質。研究針對三位不同病況的病人,檢視八個常見問題的回答。六位醫師根據準確性、完整性、同理心和可理解性進行評估。結果顯示,ChatGPT的回應普遍高品質,準確性和同理心得分均為5.0,且97%的問題得到完整回答。研究顯示,ChatGPT能有效融入病人特異性資訊,顯示其在醫療溝通中的潛力。 相關文章 PubMed DOI

這項研究探討大型語言模型(LLMs),如ChatGPT和Claude3-Opus,在牙科教育及實踐中的應用,特別是它們在韓國牙科執照考試(KDLE)的表現。評估涵蓋了GPT-3.5、GPT-4和Claude3-Opus,考題來自2019至2023年。結果顯示,Claude3-Opus表現優於其他模型,除了2019年時ChatGPT-4最佳。Claude3-Opus和ChatGPT-4通過了及格分數,但ChatGPT-3.5未能通過。所有LLMs的得分仍低於人類牙科學生,僅約85.4%。研究建議,雖然LLMs尚未達到人類水平,但仍可在牙科領域提供有價值的支持。 相關文章 PubMed DOI

這項研究提出了一種新方法,旨在從大規模血液轉錄組數據中找出最佳候選基因,特別針對BloodGen3庫中的M14.51模組。研究人員利用大型語言模型(如GPT-4和Claude)進行高通量篩選,根據六個標準對基因進行評分。最終,谷胱甘肽過氧化物酶4(GPX4)被確認為最佳候選基因,因其在調節氧化壓力及作為藥物靶點的潛力。這項研究展示了結合AI分析與人類專家驗證的先進工作流程,強調了GPX4在生物標記發現中的潛力,但仍需進一步驗證其廣泛適用性。 相關文章 PubMed DOI

現成的大型語言模型(LLMs)在準確性上常反映互聯網上的不準確資訊,對於常見的肌肉骨骼疾病,治療建議的錯誤率高達30%。這顯示出諮詢專家的必要性。定制的LLMs則能整合各醫學領域的專業知識,方法包括: 1. **提示工程**:設計特定提示以獲得更佳回應。 2. **檢索增強生成(RAG)**:從目標數據集中檢索相關資訊。 3. **微調**:調整模型以理解醫療術語。 4. **代理增強**:利用軟體協調多個LLMs,優化輸出並引入人類監督。 這些定制的LLMs幫助醫生在數位環境中重新掌握權威,確保醫療專業知識的準確性。 相關文章 PubMed DOI

這項研究評估了優化與未優化的大型語言模型(LLMs)在骨科領域的表現。研究團隊建立了一個專門的知識庫,並針對三十個骨科問題,向不同版本的GPT-4、ChatGLM和Spark LLM提問,結果由三位骨科醫生評估。結果顯示,優化版的表現明顯優於未優化版,GPT-4的質量、準確性和全面性分別提高了15.3%、12.5%和12.8%;ChatGLM則提高了24.8%、16.1%和19.6%;Spark LLM的提升幅度也相當可觀。這顯示優化知識庫能有效提升LLMs在特定領域的表現。 相關文章 PubMed DOI

食道旁膈疝氣(PEH)的最佳治療方案仍有爭議,特別是微創手術中是否使用網狀材料。針對此議題,進行了一項調查,292位主要來自歐洲的外科醫生參與。調查結果顯示,對於使用網狀材料的共識主要集中在特定情況下,如疝氣涉及超過50%胸腔內胃、大於4公分的膈隙、膈肌萎縮及重做手術的情況。疝氣大小、膈隙寬度、膈肌狀況及重做手術需求是影響決策的關鍵因素。 相關文章 PubMed DOI

法國的放射學最近有了顯著進展,主要得益於研究和臨床實踐的創新。當地機構在診斷影像學和介入放射學方面推出了新技術和人工智慧應用,特別是在癌症診斷、雙能量和光子計數電腦斷層掃描等領域。這些創新不僅提高了診斷準確性,還擴展了微創治療的選擇,改善了病患的治療結果。法國在放射學研究上的領導地位,讓其能更好地應對醫療挑戰,提升全球病患的護理品質。 相關文章 PubMed DOI

本研究評估三種大型語言模型(LLMs)在心血管藥物開發文獻篩選中的有效性,重點包括: 1. **表現**:分析每個LLM在識別和總結心血管藥物相關文獻的能力。 2. **成本**:探討使用這些LLMs的財務影響,並與傳統文獻回顧方法比較時間和資源的節省。 3. **提示工程權衡**:研究不同提示設計對模型輸出的影響,及其對文獻篩選效率的影響。 本研究旨在揭示LLMs在心血管藥物開發中的潛力,促進更明智的決策和加速新療法上市。 相關文章 PubMed DOI

大型語言模型(LLMs)的使用需了解其優勢與限制,特別是與訓練任務相關的部分。研究指出,影響LLM準確性的三個關鍵因素為任務的概率、目標輸出的概率及輸入的概率。對五個LLM(如GPT-3.5、GPT-4等)進行的測試顯示,這些概率確實影響其表現,但也出現意外的失敗模式,例如GPT-4在低概率任務上的表現不佳。因此,使用LLM處理低概率任務時需謹慎,並應將其視為獨立系統評估,而非類似人類的實體。 相關文章 PubMed DOI

這項研究針對美國日益嚴重的癡呆症問題,估計目前有670萬人受影響,預計到2060年將翻倍。中度到重度癡呆症患者因焦慮和步態不穩,跌倒風險增加。現有社交輔助機器人無法有效應對焦慮情緒,研究旨在建立情緒智慧模型,促進患者與機器人之間的同理互動。研究將收集數據、開發模型、設計同理心對話系統,並在社區中測試效果。該項目於2023年10月獲得資金支持,預計2024年開始數據收集。 相關文章 PubMed DOI