LLM 相關三個月內文章 / 第 5 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究探討了大型語言模型(LLMs),如ChatGPT-4、Bing和Bard,對肝臟病學臨床問題的回答效果。研究於2023年9月進行,涵蓋144個多選題和開放式問題。結果顯示,ChatGPT-4在多選題的準確率為62.3%,開放式問題則為44.4%,均為最高;Bing和Bard的表現則較低。值得注意的是,ChatGPT-4和Bing回答了所有問題,而Bard有11.8%的問題無法回應。研究建議需進一步探討如何在臨床和教育中最佳利用這些模型。 相關文章 PubMed DOI 推理

這項研究評估了OpenAI的ChatGPT-4在提供心房顫動相關資訊的準確性。研究使用108個結構化問題,涵蓋治療選擇和生活方式調整,由三位心臟科醫師根據準確性、清晰度和臨床相關性評估其回答。結果顯示,ChatGPT-4在「生活方式調整」和「日常生活與管理」表現良好,但在較複雜的問題上則表現不佳。整體而言,雖然它在簡單主題上有潛力,但對於需要深入臨床見解的複雜問題仍有局限。 相關文章 PubMed DOI 推理

這項研究評估了大型語言模型(LLM),特別是ChatGPT 4o,生成的國家牙科考試風格問題的質量,並與人類專家設計的問題進行比較。研究於2024年6月進行,30名高年級牙科學生參與,從教科書中生成44個問題,最終選出20個LLM組問題,另一組則由兩位專家設計。分析重點在難度、區分指數和干擾項效率。結果顯示,LLM組的問題在難度和區分指數上表現優於人類組,但差異不顯著。總體來看,LLM生成的問題質量與人類專家相當。 相關文章 PubMed DOI 推理

這項研究回顧了大型語言模型(LLMs)在生成病人教育材料(PEMs)的應用。研究人員根據JBI指導方針,從五個資料庫中篩選出69項相關研究,並提取了21個變數,分為五個主題。主要發現包括:美國的研究最多,最常用的LLM是ChatGPT-4、3.5和Bard,大多數研究集中在評估生成回應的準確性和可讀性,只有三項研究使用外部知識庫,且大部分提示為英語。總體而言,這項回顧顯示LLMs在創建有效病人教育材料方面的潛力,並指出評估框架和多語言應用的不足。 相關文章 PubMed DOI 推理

知識圖譜在藥物發現中越來越重要,因為它整合了多種生物醫學數據,並促進新假說的產生。這篇文章回顧了現有的藥物發現知識圖譜,並比較了它們的實體、關係和數據來源。雖然知識圖譜對研究至關重要,但在數據整合和一致性上仍面臨挑戰。未來應專注於標準化數據來源和建模,並納入化學結構及表觀遺傳信息等多樣數據。此外,利用大型語言模型的進展,能讓知識圖譜對非專家更友好易懂。 相關文章 PubMed DOI 推理

這項研究評估了全球大型語言模型(LLMs)和中文領域的LLMs在回答近視相關問題的表現。測試的模型包括ChatGPT-3.5、ChatGPT-4.0、Google Bard等,還有華佗GPT、MedGPT等中文模型。共評估39個問題,專家用3分制評分。結果顯示,ChatGPT-3.5、百度ERNIE 4.0和ChatGPT-4.0在準確性上表現最佳,且ChatGPT系列在全面性和同理心方面也表現不錯。整體來看,無論是全球還是中文模型,都能有效解決近視問題,特別是全球模型表現優異。 相關文章 PubMed DOI 推理

大型推理模型如OpenAI的GPT系列和DeepSeek的R1,顯示了人工智慧在自然語言處理上的重大進展。這些模型能理解和生成類似人類的文本,應用範圍廣泛,從聊天機器人到內容創作。它們的力量來自於龐大的參數和訓練數據,但常被誤解為具有人類理解能力,實際上只是基於模式生成回應。此外,它們在上下文理解和常識推理上仍有局限,且表現依賴於訓練數據的質量。總之,應理性看待這些模型的潛力與限制。 相關文章 PubMed DOI 推理

這篇文章探討人工智慧在乳牛養殖的應用,特別是電腦視覺系統(CVS)和大型語言模型(LLMs)。CVS能非侵入性地同時監控多隻牛,並透過演算法識別個體特徵。LLMs則能整合各種數據,包括非結構化文本,提升數據分析能力。文章也提到在多模態機器學習中,結合不同數據來源進行表型預測的挑戰。總的來說,CVS和LLMs的結合有潛力改善乳牛的健康監測和農場管理。 相關文章 PubMed DOI 推理

這項研究評估了兩個大型語言模型(LLMs),ChatGPT-4.0 和 ERNIE Bot-4.0,在外科住院醫師考試問題上的表現,並與人類住院醫師進行比較。分析了596個問題,結果顯示兩者在正確性上無顯著差異,但ERNIE Bot-4.0的表現始終優於ChatGPT-4.0。在210個有提示的問題中,ERNIE Bot-4.0的表現顯著優於ChatGPT-4.0及人類住院醫師,並在住院醫師的分數中排名前95%。總體來看,ERNIE Bot-4.0在此情境中表現更佳。 相關文章 PubMed DOI 推理

這項研究探討如何將大型語言模型(LLMs)與知識圖譜結合,來有效篩選可能的緊急病人訊息,目的是提升病人安全,促使病人尋求即時護理。研究分析了1,020條來自范德堡大學醫療中心的訊息,並開發了四種緊急篩選模型。結果顯示,使用知識圖譜進行全球檢索的模型表現最佳,準確率達0.99,敏感性0.98,特異性0.99,顯著優於其他模型。研究建議進一步擴展知識圖譜並評估其對病人結果的影響。 相關文章 PubMed DOI 推理