LLM 相關三個月內文章 / 第 67 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究探討健康專業教育學生對生成式人工智慧的看法及其對學術誠信的影響。研究由五位教職員進行,近400名學生參與了線上調查。結果顯示,雖然大部分學生意識到生成式人工智慧可能威脅成績評量,但許多人認為在學習和複習中使用這些工具是可接受的。研究生雖然在使用這些應用程式,但對學術誠信的風險認知不夠清晰。作者建議教職員應提供適當使用生成式人工智慧的具體指導。 相關文章 PubMed DOI

這項研究指出,使用大型語言模型如GPT-4能有效提升公眾對口腔癌預防和早期檢測的認識。研究人員評估了GPT-4對60個口腔癌相關問題的回答能力,結果顯示標準版和自訂版的表現都不錯,大部分回答獲得高分。雖然兩者的中位數分數略有差異,但統計分析顯示表現無顯著差異。研究強調,GPT-4能提供有用的資訊,但仍無法取代醫療專業人士的專業知識,應作為輔助資源使用。 相關文章 PubMed DOI

這項研究評估了ChatGPT在腫瘤學考試問題上的準確性,使用了單次學習的方法。研究中將600道來自國家放射腫瘤學在職考試的選擇題輸入到ChatGPT 4o和3.5中。結果顯示,ChatGPT 4o的正確率為72.2%,而3.5則為53.8%。在不同問題類別中,特別是關鍵研究和治療建議方面,ChatGPT的表現較弱。儘管有些限制,最新版本的ChatGPT顯示出顯著改進,未來在腫瘤學醫學訓練和決策中可能成為有價值的資源。 相關文章 PubMed DOI

這項研究比較了大型語言模型(LLMs)與醫生創建的幽門螺旋桿菌病人教育材料(PEMs)的質量。研究發現,雖然所有英文PEMs在準確性和可理解性上達到標準,但完整性不足。醫生創建的PEMs準確性最高,而LLM生成的中文PEMs在準確性和完整性上表現較差。病人對中文PEMs的評價普遍較好,但沒有任何PEMs達到六年級閱讀水平。總體來看,LLMs在病人教育上有潛力,但仍需改進以適應不同語言環境。 相關文章 PubMed DOI

這項研究評估了ChatGPT(4.0版)在生成與常見視網膜疾病相關回應的表現,依據美國眼科醫學會的指導方針進行。研究包含130個問題,涵蓋12個領域,專家評估回應的相關性和準確性。結果顯示,ChatGPT的平均得分為4.9分,與指導方針高度一致,但外科管理得分最低。回應可讀性較低,需大學以上理解能力,且在診斷和治療選擇上有錯誤。整體而言,雖然顯示潛力,但仍需臨床醫師監督及改進。 相關文章 PubMed DOI

這項研究探討有效溝通如何依賴於對詞彙意義的共同理解。研究人員記錄癲癇患者的自發對話,並開發一個框架,將說話者和聆聽者的腦部活動對齊到大型語言模型(LLM)定義的共享空間。結果顯示,LLM的情境嵌入能更好地捕捉說話者與聆聽者之間的神經對齊,超越傳統的語法或發音模型。這項研究強調了LLM在理解人類溝通複雜性方面的潛力。 相關文章 PubMed DOI

這項研究評估了三種大型語言模型(LLMs)—GPT-4、GPT-4o 和 Gemini Advanced—在解讀心電圖(ECGs)的表現,並與心臟科醫生及急診醫學專家的表現進行比較。研究結果顯示,心臟科醫生的表現始終優於這些模型,急診醫學專家在常規心電圖評估中也超越了GPT-4o。雖然GPT-4o在某些挑戰性案例中展現潛力,但整體準確性和一致性仍不及人類專家,顯示在臨床應用中使用這些模型存在風險。 相關文章 PubMed DOI

這項研究評估了兩個大型語言AI模型,Claude 3 Opus和Claude 3.5 Sonnet,在放射影像和臨床歷史下的診斷表現。測試分為三種條件:僅臨床歷史、臨床歷史加影像發現,以及臨床歷史加關鍵影像。結果顯示,Sonnet的表現普遍較佳,尤其在條件3中,正確診斷率達30.1%。統計分析顯示,加入關鍵影像和臨床歷史能顯著提高診斷準確性。總體而言,提供全面資料能提升這兩個AI模型的診斷能力。 相關文章 PubMed DOI

這項研究評估了ChatGPT在回答藥物相關問題的有效性,並與傳統藥物資訊資源的答案進行比較。在39個問題中,ChatGPT僅有10個(26%)的回答令人滿意,常見問題包括缺乏直接回應、準確性和完整性。雖然29%的回答有參考資料,但這些資料都是虛構的。研究結果建議醫療專業人員和患者在使用ChatGPT查詢藥物資訊時要特別小心。 相關文章 PubMed DOI

美國昆蟲學會(ESA)每年舉辦的學生辯論賽,2023年的主題是「應對昆蟲學中的新興議題」。辯論圍繞兩個議題:一是科學寫作中是否需披露人工智慧大型語言模型的使用,二是蜜蜂與本地授粉者在北美食品安全中的優先順序。四支學生隊伍經過五個月的準備,在馬里蘭州的會議上進行現場辯論。這活動不僅促進了對昆蟲學重要議題的討論,也強調了科學溝通與食品安全的複雜性。 相關文章 PubMed DOI