LLM 相關三個月內文章 / 第 43 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究評估了ChatGPT-3.5和ChatGPT-4在牙科學生對牙周手術知識的有效性,共有134名學生參加。結果顯示,ChatGPT-3.5的平均回應時間為3.63秒,準確度得分21.51分;而ChatGPT-4的回應時間較長,為12.49秒,得分20分。雖然兩者的準確性未達學生水平,但ChatGPT-4的開放式回答與教師評估一致,顯示其在學生學習及臨床評估中的潛力。 相關文章 PubMed DOI

這項研究分析了一個為心理健康支持設計的大型語言模型(LLM)是否存在偏見,透過模擬醫生與病人的對話進行。研究使用數位標準化病人(DSPs),保持中立並了解其社會人口特徵。結果顯示,449次對話中LLM的回應並無顯著偏見,且能理解DSPs的關切,改善對話語氣。總體來說,研究未發現LLM有實質偏見,對於心理健康支持的LLM偏見理解有所貢獻。 相關文章 PubMed DOI

這份案例報告探討了如何利用ChatGPT來開發職業治療的輔助技術,針對一位66歲的輕度認知障礙女性。職業治療師設計了兩個電腦程式,協助她進行日常生活活動,並將ChatGPT作為設計工具,而非直接與客戶互動。在八週的介入過程中,客戶在診所和家中使用這些程式,結果顯示她在日常活動的表現和獨立性上有明顯改善。研究建議,ChatGPT可成為職業治療師創建有效輔助技術的重要資源。 相關文章 PubMed DOI

這項研究評估了ChatGPT在急性燒傷護理常見問題上的回答效果,並與美國燒傷協會的指導方針進行比較。研究設計了十二個問題,由三位燒傷外科醫生評分。結果顯示,ChatGPT的平均得分為4.56分(滿分5分),顯示其回答品質高且與指導方針一致。研究指出,ChatGPT能準確且全面地處理燒傷管理,未來可能成為醫療決策和病人教育的重要工具,對臨床實踐和研究有重大意義。 相關文章 PubMed DOI

這項研究評估了ChatGPT在回答乳房重建問題上的有效性,並與醫療提供者進行比較。研究指出整形外科中病患與醫師溝通的挑戰,並探討了像ChatGPT這樣的人工智慧工具在改善互動上的潛力。 研究中向ChatGPT3、ChatGPT4、整形外科醫生及高級實踐提供者提出十個問題,評估其回應的準確性、同理心和可讀性。結果顯示,ChatGPT在同理心上得分較高,但可讀性低於醫療提供者,準確性則無顯著差異。 總體而言,研究建議ChatGPT可增強整形外科病患溝通,特別在同理心方面,但可讀性問題需改善,以達最佳效果。 相關文章 PubMed DOI

這項研究評估了四個AI聊天機器人(ChatGPT、Microsoft Copilot、Google Gemini和Meta AI)生成的心臟導管插入術患者教育材料的質量。結果顯示,ChatGPT在DISCERN分數、質量和可理解性上表現最佳,而Meta AI則是質量最低。整體來看,這些AI聊天機器人能成為患者獲取心臟導管插入術資訊的有用資源,因為它們的可及性和回應質量都相當不錯。 相關文章 PubMed DOI

這項研究評估了三個人工智慧程式—ChatGPT、Bing 和 Bard—在回答有關鏡片、白內障和屈光手術問題的表現。從美國眼科醫學會的教育材料中收集了70個問題。結果顯示,ChatGPT 正確回答了35個問題(50%),Bing 正確回答了43個(61.4%),而 Bard 則正確回答了50個(71.4%)。Bard 的準確率顯著高於 ChatGPT(P = 0.009)。雖然這些人工智慧工具能提供有用資訊,但使用者仍需對其回答的準確性保持謹慎。 相關文章 PubMed DOI

這項研究探討了人工智慧生成的影像在呈現麻醉科醫師的種族和族裔多樣性方面的準確性。研究分析了美國和歐洲麻醉醫學會的數據,使用了ChatGPT DALL-E 2和Midjourney兩個AI模型來創建影像。結果顯示,AI生成的影像與實際人口數據有顯著差異,主要描繪麻醉醫師為白人,且男性醫師更常被描繪為白人。研究指出AI模型在性別、種族和年齡上存在偏見,強調需改進訓練數據以提升醫療領域的多樣性和包容性。 相關文章 PubMed DOI

發展心理學家指出,社會認知能力對人類智慧和文化發展至關重要,這影響了我們如何參與和貢獻文化。人工智慧(AI)研究常忽略這一點,因此我們建議將心理學原則納入AI研究,以理解代理如何學習文化。我們借鑒Michael Tomasello和Jerome Bruner的研究,強調文化環境對智慧的影響,並提出一系列社會認知概念。為此,我們推出了The SocialAI學校,這是一個可自訂的實驗工具,支持強化學習代理和大型語言模型,促進社會智慧的研究。欲了解更多,請訪問我們的網站:https://sites.google.com/view/socialai-school。 相關文章 PubMed DOI

這篇手稿介紹了PheNormGPT,這是一個專門從臨床文本中提取和標準化關鍵發現的框架。它利用大型語言模型,特別是OpenAI的GPT-3.5 Turbo和GPT-4,來識別並將表型數據映射到人類表型本體的概念。這個框架結合了微調和獨特的少量學習策略,根據特定需求自訂範例選擇。在BioCreative VIII Track 3競賽中,PheNormGPT專注於從畸形學的身體檢查記錄中提取遺傳表型,並取得了優異的成績,標準匹配的F1分數為0.82,精確匹配的F1分數為0.72,並獲得第一名。 相關文章 PubMed DOI