LLM 相關三個月內文章 / 第 4 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究探討人工智慧(AI)在改善傳染病臨床決策中的角色,特別是抗生素處方的指導。透過系統性文獻回顧,評估了AI技術在抗微生物管理中的有效性。結果顯示,十七項研究中,機器學習作為臨床決策支持系統(CDSS)能有效預測抗藥性並優化抗生素使用;而六項大型語言模型的研究則顯示處方錯誤率較高,需精確提示才能獲得準確回應。研究強調傳染病專家的重要性,並指出AI需經過嚴格驗證才能有效整合進臨床實踐。 相關文章 PubMed DOI 推理

慢性腎臟病(CKD)是全球公共健康的重大挑戰,導致心血管疾病和死亡率上升。為了改善CKD管理,這篇回顧分析了2014至2024年間41篇文章,探討人工智慧(AI)在早期檢測、風險預測、治療建議及病人護理中的應用。研究顯示,AI能有效提升病人結果,但實施過程中面臨數據質量、模型準確性及工作流程整合等挑戰。成功整合AI需醫療界、研究者及監管機構的合作,以確保病人安全和法律合規。 相關文章 PubMed DOI 推理

這項研究探討使用OpenAI的Whisper模型來檢測超鼻音,這是一種與軟顎咽部不足(VPI)相關的語音障礙,對心理社會和功能影響重大。傳統診斷方法需專業技術和設備,資源有限時難以取得。 研究人員調整Whisper模型進行二元分類,並在包含184個音頻錄音的數據集上訓練,結果顯示測試準確率達97%,F1分數為0.97,超越傳統機器學習方法。Whisper模型在各種錄音條件下表現優異,所需訓練數據量少,顯示其在超鼻音檢測中的可擴展性和效率,能有效優化臨床資源配置。 相關文章 PubMed DOI 推理

這項研究探討了大型語言模型(LLMs),如ChatGPT-4、Bing和Bard,對肝臟病學臨床問題的回答效果。研究於2023年9月進行,涵蓋144個多選題和開放式問題。結果顯示,ChatGPT-4在多選題的準確率為62.3%,開放式問題則為44.4%,均為最高;Bing和Bard的表現則較低。值得注意的是,ChatGPT-4和Bing回答了所有問題,而Bard有11.8%的問題無法回應。研究建議需進一步探討如何在臨床和教育中最佳利用這些模型。 相關文章 PubMed DOI 推理

這項研究評估了OpenAI的ChatGPT-4在提供心房顫動相關資訊的準確性。研究使用108個結構化問題,涵蓋治療選擇和生活方式調整,由三位心臟科醫師根據準確性、清晰度和臨床相關性評估其回答。結果顯示,ChatGPT-4在「生活方式調整」和「日常生活與管理」表現良好,但在較複雜的問題上則表現不佳。整體而言,雖然它在簡單主題上有潛力,但對於需要深入臨床見解的複雜問題仍有局限。 相關文章 PubMed DOI 推理

這項研究評估了大型語言模型(LLM),特別是ChatGPT 4o,生成的國家牙科考試風格問題的質量,並與人類專家設計的問題進行比較。研究於2024年6月進行,30名高年級牙科學生參與,從教科書中生成44個問題,最終選出20個LLM組問題,另一組則由兩位專家設計。分析重點在難度、區分指數和干擾項效率。結果顯示,LLM組的問題在難度和區分指數上表現優於人類組,但差異不顯著。總體來看,LLM生成的問題質量與人類專家相當。 相關文章 PubMed DOI 推理

這項研究回顧了大型語言模型(LLMs)在生成病人教育材料(PEMs)的應用。研究人員根據JBI指導方針,從五個資料庫中篩選出69項相關研究,並提取了21個變數,分為五個主題。主要發現包括:美國的研究最多,最常用的LLM是ChatGPT-4、3.5和Bard,大多數研究集中在評估生成回應的準確性和可讀性,只有三項研究使用外部知識庫,且大部分提示為英語。總體而言,這項回顧顯示LLMs在創建有效病人教育材料方面的潛力,並指出評估框架和多語言應用的不足。 相關文章 PubMed DOI 推理

知識圖譜在藥物發現中越來越重要,因為它整合了多種生物醫學數據,並促進新假說的產生。這篇文章回顧了現有的藥物發現知識圖譜,並比較了它們的實體、關係和數據來源。雖然知識圖譜對研究至關重要,但在數據整合和一致性上仍面臨挑戰。未來應專注於標準化數據來源和建模,並納入化學結構及表觀遺傳信息等多樣數據。此外,利用大型語言模型的進展,能讓知識圖譜對非專家更友好易懂。 相關文章 PubMed DOI 推理

這項研究評估了全球大型語言模型(LLMs)和中文領域的LLMs在回答近視相關問題的表現。測試的模型包括ChatGPT-3.5、ChatGPT-4.0、Google Bard等,還有華佗GPT、MedGPT等中文模型。共評估39個問題,專家用3分制評分。結果顯示,ChatGPT-3.5、百度ERNIE 4.0和ChatGPT-4.0在準確性上表現最佳,且ChatGPT系列在全面性和同理心方面也表現不錯。整體來看,無論是全球還是中文模型,都能有效解決近視問題,特別是全球模型表現優異。 相關文章 PubMed DOI 推理

大型推理模型如OpenAI的GPT系列和DeepSeek的R1,顯示了人工智慧在自然語言處理上的重大進展。這些模型能理解和生成類似人類的文本,應用範圍廣泛,從聊天機器人到內容創作。它們的力量來自於龐大的參數和訓練數據,但常被誤解為具有人類理解能力,實際上只是基於模式生成回應。此外,它們在上下文理解和常識推理上仍有局限,且表現依賴於訓練數據的質量。總之,應理性看待這些模型的潛力與限制。 相關文章 PubMed DOI 推理