LLM 相關三個月內文章 / 第 53 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究評估了七個大型語言模型(LLMs)在模擬英國醫學考試問題上的表現,使用了423道考題。測試的模型包括ChatGPT-3.5、ChatGPT-4、Bard等。結果顯示,ChatGPT-4表現最佳,準確率達78.2%,其次是Bing和Claude。研究指出,LLMs在醫學教育中有潛力,但在依賴它們進行訓練前,仍需解決一些限制,並建議進一步研究專科特定的LLMs及其在醫學課程中的應用。 相關文章 PubMed DOI

這項研究評估了ChatGPT-4對酒精使用障礙(AUD)問題的回應品質。研究開發了64個問題,結果顯示ChatGPT-4的回應中有92.2%是基於證據的,但只有12.5%提供了外部資源推薦。不過,對於特定地點的問題,所有回應都能指引使用者到合適的資源,如NIAAA治療導航器。此外,85.9%的後續回應也包含支持性文件。整體來看,ChatGPT-4在提供AUD資訊方面展現了良好的能力,可能成為尋求相關資訊者的有用線上資源。 相關文章 PubMed DOI

這項研究探討了利用自然語言處理(NLP)技術,特別是ChatGPT,來提升放射科報告的產出效率。研究人員分析了1,000條來自MIMIC胸部X光數據庫的記錄,並使用Claude.ai提取關鍵字,再透過ChatGPT生成報告。結果顯示,Bart和XLM模型的報告與醫生撰寫的相似度高達99.3%,而其他模型表現較差。研究強調選擇合適的NLP模型對於提升放射科報告的效率和準確性至關重要。 相關文章 PubMed DOI

這項研究探討大型語言模型(LLMs)中的醫學知識,並評估整合統一醫學語言系統(UMLS)對診斷決策的影響。研究目標包括評估LLMs的醫學知識、UMLS對診斷預測的影響,以及人類評估與UMLS指標的相關性。結果顯示,GPT-3.5在UMLS路徑的完成度上優於其他模型,且整合UMLS知識能提升預測性能,但傳統評估指標與人類專家評估的相關性較弱。研究強調需針對特定任務調整UMLS,並尋找更符合人類判斷的評估指標。 相關文章 PubMed DOI

這項研究評估了ChatGPT在回答結腸直腸癌篩檢問題的有效性,旨在提升病患的認知與遵循篩檢計畫的意願。研究中,專家和非專家對ChatGPT的回答進行評分,結果顯示專家對準確性的評分為4.8(滿分6分),而完整性則較低,為2.1(滿分3分)。病患對回答的評價則普遍正面,認為其完整性、可理解性和可信度高達97-100%。整體而言,ChatGPT在提供CRC篩檢資訊上表現良好,顯示出提升病患認知的潛力。 相關文章 PubMed DOI

這項研究比較了三個人工智慧平台的診斷準確性,包括ChatGPT 4.0、Google Bard和WebMD的症狀檢查工具,與耳科醫生的診斷進行對比。研究結果顯示,這些AI平台的診斷準確率偏低,ChatGPT 4.0為22.45%,Google Bard為12.24%,WebMD僅5.10%。Fleiss' kappa值顯示AI與醫生的診斷協議不佳,強調了AI在醫療領域的局限性,並指出人類專業知識在臨床診斷中的重要性。 相關文章 PubMed DOI

這項研究調查了患者使用OpenAI的ChatGPT作為線上健康資訊的情況。結果顯示,21.5%的受訪者使用ChatGPT來獲取健康資訊,使用者多為年輕人,且擁有高級學位的比例較低。他們常用此工具來判斷是否需要看醫生或尋找替代療法。大多數人認為ChatGPT的實用性與其他健康資訊來源相當,甚至更高。雖然使用者對資訊的準確性有疑慮,但仍有不少人表示根據這些資訊改變了健康行為。這顯示AI生成的健康資訊對患者行為的影響日益增強,醫生可藉此引導患者更有效地使用這類技術。 相關文章 PubMed DOI

這項研究評估了ChatGPT-4對前列腺癌常見問題的回答質量。研究人員制定了八個問題,並由四位評審使用多種工具評估AI的回答。結果顯示,ChatGPT-4的可理解性得分很高,但可讀性卻顯示「難以閱讀」,平均達到11年級的水平。雖然大部分參考文獻都來自可信來源,但仍有兩個例子被識別為參考幻覺。總體來看,ChatGPT-4在患者教育中提供了一般可靠的回答,但在可讀性和準確性上仍需改進。 相關文章 PubMed DOI

這項研究評估了一個生成式人工智慧平台,旨在自動化根據泌尿科期刊文章創建社交媒體貼文。研究期間收集了100篇貼文,並開發了一個免費的GPT工具來生成包含標題摘要、關鍵發現等內容的貼文。三位醫師評估了生成貼文的準確性和適當性。結果顯示,76.6%的貼文符合準確性標準,且學術醫師和一般公眾均偏好GPT生成的貼文。研究結論認為,生成式人工智慧能有效自動化創建準確且受歡迎的社交媒體貼文,適用於學術界和大眾。 相關文章 PubMed DOI

這項初步研究探討個體在閱讀時如何處理語意,透過分析眼動和腦電圖(EEG)數據,並結合大型語言模型(LLMs)。研究聚焦於閱讀理解任務,參與者閱讀不同關鍵字相關性的單詞。研究結果顯示,與關鍵字相關的單詞獲得的眼動注視次數顯著高於低相關性單詞,達到60%以上的驗證準確率。這項研究對於理解人類認知及發展閱讀輔助技術具有重要意義。 相關文章 PubMed DOI