LLM 相關三個月內文章 / 第 65 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究評估了三個大型語言模型(LLMs)—ChatGPT、ERNIE Bot 和 ChatGLM—在回答乳腺癌相關問題的表現,特別針對中國的情境。分析了60個腫瘤科醫生提出的問題,結果顯示: - ChatGPT 提供了最多的全面回答,佔66.7%。 - 三個模型在乳腺癌治療問題上的準確率都很低,平均僅44.4%。 - ERNIE Bot 的回答較短。 - 可讀性評分無顯著差異。 總體來看,這些模型可作為乳腺癌資訊工具,但在專業治療問題上不可靠,應在醫療專業人員指導下使用。 相關文章 PubMed DOI

隨著醫學領域對ChatGPT的興趣增加,了解其在解剖學教育中的潛力與限制變得重要。本研究透過34個問題評估ChatGPT的準確性與有效性,結果顯示它能有效幫助醫學生理解解剖結構的臨床意義,並成功解釋缺血性心臟病的解剖基礎。雖然生成的解剖圖像準確性不足,但它能創建測驗、總結講座內容,並合理分析解剖問題。總體而言,ChatGPT在解剖學教育中具潛力,能輔助學習而非取代教師。 相關文章 PubMed DOI

生成式人工智慧(GAI)技術有望顯著改變臨床病理學的工作流程,主要應用於教育、數據挖掘、決策支持等方面。這篇評論探討了GAI在臨床化學、微生物學等子專科的具體案例,並指出了偏見、幻覺等潛在挑戰,以及整合到現有工作流程中的困難。強調人類監督的重要性,以確保病人結果的意義。總之,GAI在提升醫療服務上潛力巨大,但需謹慎考量其局限性和用戶接受度。 相關文章 PubMed DOI

當代大型語言模型(LLMs)在處理電子健康紀錄(EHRs)中的非結構化數據方面展現潛力,特別是在心理健康領域。英國國民健康服務(NHS)面臨心理健康護理的長等待名單,每月有數十萬轉診需要分流。透過LLMs分析臨床筆記,可以推薦合適的護理團隊,減少等待時間並改善分流決策。本研究提出三種基於LLM的方法,能在單一GPU上運行,適合NHS的資源限制,並維護臨床數據的保密性。相關代碼可在GitHub上獲得。 相關文章 PubMed DOI

這項研究探討了使用ChatGPT重寫術後護理指導的效果,目的是讓病人和照護者更容易理解。原本的指導內容過於複雜,平均閱讀水平在七到八年級,而建議的水平是六年級。結果顯示,只有一個六年級的版本達標,四年級的版本則都不合格。雖然可理解性隨著閱讀水平降低而改善,但四年級版本的可行性下降。研究發現,ChatGPT能有效降低閱讀水平,增強病人理解能力,且不影響安全性。建議撰寫時可要求低一到兩個年級,以達最佳效果。 相關文章 PubMed DOI

這篇論文探討了一種利用大型語言模型來增強生物醫學關係提取的方法,特別是Gemini和GPT-4。研究中使用GPT-4生成增強的訓練數據,並將這些數據與不同模型的輸出結合,透過集成學習提升預測準確性。此外,Gemini的回應也用來微調BioNLP-PubMed-Bert分類模型。結果顯示,在BioCreative VIII Track 01挑戰的評估數據集上,精確度、召回率和F1分數都有所提升。想了解更多,可以透過提供的網址查詢。 相關文章 PubMed DOI

這項研究探討了ChatGPT在神經學診斷中的輔助潛力。研究人員使用神經學專家的合成數據,評估ChatGPT對各種神經疾病的診斷準確性。結果顯示,ChatGPT的準確率介於68.5%到83.83%之間,與專家神經科醫生的81.66%相當,且高於一般醫生的57.15%。這顯示人工智慧工具如ChatGPT有助於提升臨床診斷的準確性,特別是在神經學領域,未來有望改善醫療實踐和診斷過程。 相關文章 PubMed DOI

這項研究探討小型語言模型(SLM)在乳腺癌護理決策中的潛力,並針對大型語言模型(LLM)面臨的挑戰進行分析。研究人員根據德國乳腺癌指導方針,開發了名為BC-SLM的開源模型,並在臨床前模擬中評估其準確性。研究涉及20個虛構病人檔案,BC-SLM與多學科腫瘤委員會(MTB)的一致性率為86%,顯示出良好的初步臨床準確性。這項研究為SLM在腫瘤學的應用提供了有希望的證據,並強調了決策過程的透明度和數據安全性。 相關文章 PubMed DOI

這項研究探討了社會人口因素、對ChatGPT的態度及台灣註冊護理師的自我導向學習之間的關係。隨著醫療進步和護理人力短缺,自我導向學習對護理專業至關重要。研究透過社交媒體向超過1,000名護理師發放問卷,330名參與者中,許多人在醫院工作且有豐富經驗,近一半使用過ChatGPT。結果顯示,工作經驗和對ChatGPT的認知是自我導向學習的重要預測因子,建議醫療管理者在整合ChatGPT時,應量身訂做培訓以改善學習成果。 相關文章 PubMed DOI

這篇文章探討大型語言模型(如Claude、Bard、GPT-3.5和GPT-4)中嵌入的價值觀如何影響初級醫療的倫理決策。研究使用Schwartz的價值觀理論,評估這些模型的價值觀輪廓,並與超過53,000名受訪者的數據進行比較。結果顯示,每個模型的價值觀獨特,偏向普遍主義和自我導向,可能反映西方中心的偏見。這些模型的建議顯示出其內在價值觀對決策的影響,因此在臨床應用前需謹慎考量,並調整以符合多元文化觀點。 相關文章 PubMed DOI