LLM 相關三個月內文章 / 第 78 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

目前的研究主要探討ChatGPT在模擬病人詢問中的準確性,但對於其在醫療領域的廣泛應用卻缺乏深入研究。大多數研究重複相似實驗,限制了進展。要讓ChatGPT在醫療上發揮真正影響,需解決病人照護中的挑戰,如行政負擔和病人溝通等。建議建立一個結構化框架,包含問題識別、績效指標、跨領域合作、政策發展、財務支持及績效評估,以促進人工智慧的創新應用,改善醫療服務與病人結果。 相關文章 PubMed DOI

肥大細胞活化症候群(MCAS)的診斷越來越普遍,雖然有一套廣泛接受的聯盟標準,但也出現了其他替代標準。本研究評估這些替代標準的診斷特異性和一致性,結果顯示替代標準的診斷變異性較大且精確度較低,可能導致不相關的診斷。研究指出,這引發了對MCAS過度診斷的擔憂,並可能忽略更合適的診斷。 相關文章 PubMed DOI

這項研究探討了先進的人工智慧模型,特別是ChatGPT和Google的Gemini AI,在眼科領域的應用潛力。研究比較了這些模型與眼科住院醫師的表現,使用了600道來自以色列住院醫師考試的問題。結果顯示,Gemini Advanced的準確率最高,達66%,其次是ChatGPT-4的62%。這項研究強調了AI在醫學教育中的輔助角色,並指出需要進一步改進,以提升其在不同子專科的有效性,對改善病人護理具有潛力。 相關文章 PubMed DOI

虛擬助手能模仿人類對話,對提升醫療保健,特別是血管外科,潛力巨大。它們可協助醫生與病人進行診斷、管理疾病,並處理行政事務。隨著血管疾病增加,這些數位工具能減輕醫療人員的負擔。隨著人工智慧和自然語言處理的進步,像GPT-4的模型能推動虛擬助手的發展,促進多學科護理。然而,實施時需考量設計、安全性及倫理等問題,以確保技術的公平與有效使用。本文將探討虛擬助手在血管外科的應用及其優缺點。 相關文章 PubMed DOI

這篇回顧探討大型語言模型和AI聊天機器人在血管外科的應用,強調它們在臨床、研究和教育中的潛力。這些技術能增進病人溝通和簡化數據分析,但評估其優缺點非常重要。文章也提到目前實施上的限制,並建議未來整合的方向。總之,研究強調仔細評估的必要性,以確保AI在醫療中的使用能提升病人結果並有效支持醫療人員。 相關文章 PubMed DOI

這篇論文提出了一個評估大型語言模型(LLMs)在生物醫學知識編碼的框架,特別針對抗生素研究。框架分為三個步驟:流暢性、提示對齊和語義一致性,並評估事實知識和回應的具體性。研究涵蓋了ChatGPT、GPT-4和Llama 2等十一個模型,透過生成化合物定義和確定化合物與真菌關係的任務進行評估。結果顯示,雖然流暢性有所提升,但事實準確性仍有待加強,對LLMs作為生物醫學知識庫的可靠性提出了疑慮,並強調需要更系統的評估方法。 相關文章 PubMed DOI

這項研究探討大型語言模型(LLMs)在評估科學報告及臨床試驗方法學的有效性。研究比較了LLMs與人類評審的準確率,結果顯示人類的準確率高達89%至75%,而LLMs的準確率則較低,PRISMA介於63%到70%之間。雖然結合LLM的評分能提升準確率,但仍不及人類。研究指出,人類與AI合作能提高效率,特別是在較簡單的任務上,但對於複雜的評估則效果有限。 相關文章 PubMed DOI

ChatGPT在模擬口腔外科考試方面展現出其作為教育工具的潛力。它能根據特定情境生成臨床問題,模仿實際考試的結構,並提供後續問題和反饋,增強互動學習體驗。這種模擬不僅能幫助外科實習生準備考試,還能作為自我評估的平台,促進課程發展。即時反饋有助於使用者識別改進空間,深化對關鍵概念的理解。總之,ChatGPT可能成為外科教育的重要資源,促進知識獲取和臨床推理技能的提升。 相關文章 PubMed DOI

監測癲癇患者的發作控制指標對病情管理非常重要,但手動從電子健康紀錄中提取資訊耗時。本研究利用自然語言處理(NLP)自動提取癲癇發作的日期和頻率,使用預訓練模型RoBERTa_for_seizureFrequency_QA,結合正則表達式,從波士頓兩家醫院的臨床筆記中提取資料。研究涵蓋1,773名患者,結果顯示NLP模型在提取發作日期和頻率方面表現良好,顯示此方法可促進癲癇研究的進行。 相關文章 PubMed DOI

MedConceptsQA的推出為評估大型語言模型(LLMs)在醫療代碼和概念理解上提供了重要基準。這個基準涵蓋了診斷、程序和藥物相關的問題,並依難易程度分類。評估結果顯示,許多預訓練的臨床LLMs表現不佳,接近隨機猜測。相比之下,像GPT-4的模型表現顯著提升,超過最佳臨床模型Llama3-OpenBioLLM-70B,提升幅度達9-11%。這顯示通用型LLMs在醫療概念解釋上的潛力,暗示臨床模型需進一步發展。該基準已對外公開,供後續研究使用。 相關文章 PubMed DOI