LLM 相關三個月內文章 / 第 37 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

本研究旨在評估小兒耳鼻喉科的病人教育材料閱讀水平,並利用人工智慧簡化這些材料。研究團隊從美國耳鼻喉科醫學會網站獲取相關資料,並與七家兒童醫院的材料進行比較。結果顯示,AAO-HNS的材料平均閱讀水平為10.71,經過ChatGPT調整後降至7.9,顯示人工智慧能有效降低閱讀難度。然而,只有一家醫院的材料低於建議的六年級水平,顯示大部分材料仍超過建議標準。 相關文章 PubMed DOI

癲癇持續狀態(SE)的治療在過去二十年幾乎沒有進展,主要因為新藥開發成本高且風險大。藥物再利用成為解決這一問題的可行方案,因為它開發時間短、成本低且成功率高。本文探討如何結合生物學知識與計算方法來促進SE的藥物再利用,並提到利用現有藥物如ketamine和celecoxib,以及人工智慧工具生成潛在藥物清單。儘管面臨知識產權和監管挑戰,藥物再利用仍提供了一種實用的解決方案。這份摘要基於2024年4月的研討會報告。 相關文章 PubMed DOI

在2022年11月,AI 聊天機器人 ChatGPT 因能解答複雜問題,特別是在醫學領域,受到廣泛關注。它在醫學教育上展現潛力,並在英語醫學執照考試中表現不錯,但在非英語國家的考試中則表現不佳。本研究將評估 ChatGPT 在不同語言醫學執照考試中的表現及其在醫學教育的潛力,並透過 PubMed、Web of Science 和 Scopus 等資料庫進行系統性回顧和分析。研究過程將由兩位獨立審查員進行,並由第三位解決爭議,已在 PROSPERO 註冊。 相關文章 PubMed DOI

本研究比較了開源人工智慧大型語言模型(LLMs)在撰寫脈衝鈦鋁石榴石(p-Tm:YAG)激光系統性回顧的準確性,與一篇由內尿路學專家撰寫的基準系統性回顧進行對比。四個LLMs(ChatGPT3.5、Vercel、Claude和Mistral-7b)被要求撰寫相關內容。結果顯示,人類撰寫的系統性回顧準確性顯著高於LLMs,得分分別為96%和86.8%。雖然ChatGPT3.5的表現最佳,但整體準確性仍低於專家。研究指出,LLMs在臨床應用中需有人監督,因為其在技術性主題上的準確性仍不足。 相關文章 PubMed DOI

這項研究探討了語言選擇和翻譯品質對GPT-4在放射學診斷問題回答準確性的影響。分析了146個來自日本放射學考試的問題,並由兩位認證放射科醫師提供答案。結果顯示,GPT-4在英文翻譯的表現最佳,其次是日文、中文和德文。翻譯品質與正確回答數量有顯著關聯,尤其在英文翻譯表現不如日文時,專業翻譯的問題得分更高。研究強調高品質翻譯對提升GPT-4準確性的重要性,特別是對非母語英語使用者。 相關文章 PubMed DOI

這項研究評估大型語言模型(LLM)對醫師診斷推理的影響,與傳統資源相比。研究於2023年11月29日至12月29日進行,參與者來自多所學術機構的醫師,分為兩組:一組使用LLM和傳統資源,另一組僅用傳統資源。結果顯示,LLM組的中位診斷推理分數為76%,略高於傳統組的74%,但差異不顯著(P = .60)。不過,LLM的單獨表現比傳統資源高出16個百分點(P = .03),顯示人工智慧在臨床實踐中的潛力。 相關文章 PubMed DOI

這項研究調查了中國醫學生對AI聊天機器人的使用情況及看法,採用統一技術接受與使用理論(UTAUT)進行分析。全國性調查中,共有693名來自57所大學的學生參與。結果顯示,僅28.72%的學生使用AI聊天機器人學習,最受歡迎的是ChatGPT,主要用於快速獲取醫學資訊和提升學習效率。影響使用意圖的因素包括社會影響、感知風險等。儘管學生對AI聊天機器人持正面看法,但意圖與實際使用之間存在差距,顯示需改善醫學教育中AI技術的可及性與支持。 相關文章 PubMed DOI

本研究探討了ChatGPT對學術期刊英文摘要品質的影響,特別針對來自台灣、日本、中國和南韓的作者。雖然自2022年底以來ChatGPT被廣泛使用,但對其影響的深入分析仍然不足。我們分析了2020至2023年間發表於*Medicine (Baltimore)*的摘要,結果顯示GPT摘要與非GPT摘要之間無顯著差異,但從2020到2023年,各國摘要品質都有明顯提升,台灣的進步最為顯著。研究強調了人工智慧在學術寫作中的潛力,並呼籲進一步探討其對學術交流的長期影響。 相關文章 PubMed DOI

有效的科學知識傳遞對醫學研究和醫療保健非常重要。近期科技進步,特別是像ChatGPT這樣的語言模型,展現了在醫學寫作上的潛力。本研究評估了ChatGPT-3.5在多項醫學寫作任務中的表現,結果顯示其能顯著提升寫作過程,改善詞彙和語法。然而,研究也強調了人類介入的重要性,以確保內容的準確性和相關性。雖然AI能提高寫作效率,但醫療專業人員仍需進行審查,確保醫學溝通的高標準。 相關文章 PubMed DOI

這項研究評估了四個大型語言模型(LLMs)對父母詢問早產兒視網膜病(ROP)的回應。整理了60個常見問題,三位專家評估其回應的適當性和完整性。研究發現,ChatGPT-4的適當性得分最高(100%),但文本結構較複雜,需大學程度理解。相對而言,Gemini被認為最易讀,而Microsoft Copilot在可讀性指標上表現優異。總體來看,ChatGPT-4提供最準確的回應,但可能讓某些父母難以理解,Gemini和Microsoft Copilot則更易於理解。 相關文章 PubMed DOI