LLM 相關三個月內文章 / 第 35 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

最近,人工智慧(AI)在青光眼管理上有很大潛力,能提升篩檢效果和診斷準確性,但整合過程中面臨挑戰,如數據標註繁瑣、診斷標準不一致及測試不足,這些都可能影響演算法的適用性。此外,AI的「黑箱」特性也讓醫療人員感到疑慮。未來可透過聯邦學習增強數據隱私,並利用多樣化數據改善演算法,還有智慧型手機的應用潛力。解決這些挑戰將有助於提升青光眼護理的品質。 相關文章 PubMed DOI

這項研究利用生成式人工智慧,特別是大型語言模型,來深入了解參加正念減壓(MBSR)計畫的乳腺癌患者。這個為期六週的課程包含冥想、身體掃描、哈達瑜伽和行走冥想,每次兩小時。25名參與者中,大多數對課程表示高度滿意。透過生成式人工智慧,研究能深入分析參與者的反饋,並識別不同的子群體。整體來看,MBSR計畫對許多人有助於管理乳腺癌相關的心理壓力。 相關文章 PubMed DOI

這篇論文探討大型語言模型(LLMs)在不同上下文中的價值表達穩定性,並分析了認知能力、知識和模型大小等因素。研究涵蓋21個來自六個家族的LLM,重點在於人際和個體層級的穩定性。主要發現包括:某些模型(如Mixtral和GPT-3.5)在價值表達上較為穩定,而模擬特定個性時,模型的穩定性會下降。研究建議未來需進一步探討LLMs如何模擬多樣化的人格,並發展更全面的評估方法。論文為理解LLMs的價值穩定性提供了基礎,並附上研究代碼。 相關文章 PubMed DOI

人工智慧(AI)正逐漸進入放射學,提升病人旅程的各個階段。系統性文獻回顧顯示,AI技術已在排程、影像獲取及重建等方面發揮作用,能降低CT輻射劑量並縮短MRI獲取時間,同時保持影像品質。AI還能協助檢測骨折或結節,並透過大型語言模型優化報告流程。雖然AI有潛力提升放射學效率和診斷準確性,但成功實施需與現有技術無縫整合,並提供有效性證據。未來,AI可能顯著改變放射科醫師的角色,提升病人護理品質。 相關文章 PubMed DOI

這項研究比較了使用生成預訓練變壓器(GPT)與傳統方法開發的臨床與專業技能評估(CPSA)項目的有效性、考官看法及成本。研究對象為最後一年醫學生,開發了兩組各六個案例,其中一個是用GPT創建的。分析239名學生的表現,結果顯示兩者在難度和區分能力上無顯著差異。考官反饋認為GPT案例具挑戰性和現實性,且使用GPT可節省57%的成本。研究顯示GPT能以較低成本產生相似質量的CPSA項目,未來可探討其在其他臨床領域的應用。 相關文章 PubMed DOI

致癌物的識別與分類對癌症流行病學非常重要,但現有系統如IARC和NTP面臨文獻增長的挑戰。為此,我們開發了CarD-T框架,利用變壓器技術有效識別潛在致癌物。CarD-T在已知致癌物的PubMed摘要上進行訓練,並成功識別了60%的已確立致癌物,還提名了約1500個潛在致癌物。與GPT-4相比,CarD-T在召回率和F1分數上表現更佳,並能評估致癌性矛盾證據。總之,CarD-T是識別致癌物的強大工具,提升公共健康應對能力。 相關文章 PubMed DOI

這篇論文提出一種新方法,利用大型語言模型(LLMs)、AI代理和開放地理數據,提升城市騎乘安全。方法包括分析城市風險和現有騎乘設施的數據,並透過數據預處理和提示工程,創建友好的系統,提供騎乘安全見解。過程分為數據準備、代理協調和決策執行三步,確保開源工具有效整合,促進城市規劃者和騎士的可及性。研究顯示結合LLMs和AI代理的潛力,能改善騎乘實踐和城市交通規劃。 相關文章 PubMed DOI

這項研究評估了先進大型語言模型(LLMs)在醫學考試中的視覺能力,特別是GPT-4和Google的Gemini。研究比較了它們在台灣專科醫師考試(肺部與重症醫學)的表現,並以僅處理文本的GPT-3.5為基準。結果顯示,GPT-4的表現持續優於Gemini和GPT-3.5,經常超過60的及格門檻,接近人類考生的水準。相對而言,Gemini的表現較低,而GPT-3.5得分最低,顯示出新模型在解讀複雜醫療資訊方面的優勢。 相關文章 PubMed DOI

這項研究針對外語學習者在學習英語詞彙時的挑戰,透過語義標註的語料庫,建立了一份高頻詞義清單,主要來自當代美國英語和英國國家語料庫。研究人員利用BERT模型進行準確的語義標註,篩選出5000個關鍵詞義。這份清單有三大優勢:在不同語料庫中穩定覆蓋、高頻項目識別準確,且條目數較少,明確指出對初學者最相關的詞義。這項研究為語言學習者提供了重要資源。 相關文章 PubMed DOI

這項研究評估了三個聊天機器人—ChatGPT、Bing Chat 和 AskOE—在骨科手術治療問題上的回應品質。專家對每個機器人的回應進行評分,結果顯示 AskOE 在臨床正確性、完整性等方面表現最佳,受到評審者的偏好。雖然 ChatGPT 和 AskOE 都有錯誤,但 AskOE 的表現更為可靠,顯示其在醫療領域的潛在價值。 相關文章 PubMed DOI