LLM 相關三個月內文章 / 第 27 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究開發了MedScaleNER框架,旨在透過基於測量的護理改善病人結果,特別是在非結構化的中文醫學文獻中識別醫學量表相關實體。由於標註數據有限,命名實體識別(NER)面臨挑戰。該框架結合大型語言模型(LLMs)和提示策略,成功識別量表名稱及測量項目。初步實驗顯示,GLM-4-0520與MedScaleNER結合後,達到59.64%的宏觀F1分數,顯示出顯著的改進,並為未來的研究提供了寶貴的見解。 相關文章 PubMed DOI 推理

本研究探討大型語言模型(LLMs)在膀胱癌管理中的表現。研究設計了100個臨床問題,評估六種LLMs的回應準確性。結果顯示,Claude-3.5-Sonnet以89.33%準確率最佳,ChatGPT-4為85.67%。GPT-3.5-Turbo經過兩階段訓練後,準確率從74.33%提升至100%。研究顯示,針對性訓練能顯著改善模型表現,並指出策略性改進可克服專業醫學應用中的限制。 相關文章 PubMed DOI 推理

這項研究評估了大型語言模型(LLMs),如ChatGPT 3.5、ChatGPT 4.0和Gemini,對自體免疫疾病臨床問題的回答效果。共提出46個問題,並由專家根據五個質量維度進行評估。結果顯示,ChatGPT 4.0在所有維度上表現優於其他兩者,平均得分為199.8,顯示其在相關性、正確性、完整性、有用性和安全性方面的顯著優勢。整體而言,ChatGPT 4.0在提供準確且有用的醫療資訊上,顯示出更高的效能,顯示大型語言模型在醫療服務中的潛力。 相關文章 PubMed DOI 推理

ProteinMPNN 是一個幫助設計蛋白質的工具,能識別特定三維結構的氨基酸序列。我們對其進行了修改,目的是創造對細胞毒性 T 淋巴細胞不那麼明顯的蛋白質,因為這些細胞透過 MHC-I 路徑來識別蛋白質。我們引入了結合直接偏好優化(DPO)的方法,並預測 MHC-I 肽的呈現,成功設計出具有較少 MHC-I 表位的蛋白質,且不影響其結構完整性。詳細的源代碼可在這裡找到:https://github.com/hcgasser/CAPE_MPNN。 相關文章 PubMed DOI 推理

這項研究分析了ChatGPT對七份與土耳其兒童相關的社會調查報告的回應,重點探討缺失、風險因素、保護因素、社會工作介入計畫及機構建議。使用MAXQDA22進行質性內容分析,發現三個主要主題: 1. **報告評估**:ChatGPT全面評估報告,指出缺失並提出改進建議。 2. **風險與保護因素**:將風險和保護因素分類,包括個人特徵、家庭動態等。 3. **社會工作介入計畫**:強調制定計畫前需確立目標,並對機構提出建議。 研究建議未來可探討人工智慧對社會工作專業人士的影響。 相關文章 PubMed DOI 推理

這項研究探討了使用遮蔽語言模型(MLM)在醫院特定領域的適應性,並應用於基於BERT的模型來分類神經放射學報告。分析了來自國王學院醫院和蓋伊與聖托馬斯信託醫院的超過200,000份MRI報告。結果顯示,經過適應的模型性能顯著提升,最佳訓練數據達到97.0%和95.5%的準確率。Llama-3.0 70B模型表現最佳,準確率分別為97.1%和94.0%。研究建議在臨床環境中使用醫院特定的模型適應,並指出LLM可作為有效替代方案。 相關文章 PubMed DOI 推理

這項研究探討了基於人工智慧的聊天機器人ChatGPT-4在口腔黏膜病變鑑別診斷中的有效性。研究收集了因口腔黏膜活檢而轉診的患者數據,並將病變描述輸入ChatGPT以生成診斷,與專家診斷進行比較。結果顯示,聊天機器人的診斷與專家之間有顯著相關性,且能高敏感性識別惡性病變。整體而言,ChatGPT-4在識別可疑惡性病變方面表現出色,顯示出其在口腔醫學中的輔助潛力。 相關文章 PubMed DOI 推理

這篇手稿介紹了一種新穎的行為與社會研究方法,利用即時資訊串流和人工智慧進行研究。文中詳述了Samply軟體的擴展,結合事件數據、行動調查和實驗。研究中,透過Chat-GPT演算法修改新聞標題,並利用Samply Stream API發送給參與者。結果顯示,大多數參與者未遇到技術問題,且不同版本的新聞可讀性無顯著差異。參與者對錯誤資訊的熟悉度低於其他版本,顯示資訊操控的有效性。這種方法在公共意見、醫療、行銷等領域有廣泛應用潛力。 相關文章 PubMed DOI 推理

這項研究評估了ChatGPT在醫學計算的表現,結果顯示約三分之一的答案不正確。為了提升準確性,研究人員測試了三種增強方法,包括檢索增強生成、代碼解釋器和專門的計算工具(OpenMedCalc),共進行了10,000次試驗。結果顯示,使用這些專門工具後,準確性顯著提升,LLaMa和基於GPT的模型的不正確回應分別減少了5.5倍和13倍。這顯示整合特定任務工具能改善大型語言模型在臨床計算的表現。 相關文章 PubMed DOI 推理

這項研究探討了三種生成式人工智慧工具—ChatGPT、Gemini 和 Copilot—在本科機械工程教育中的有效性,涵蓋了800個問題。雖然這些工具在理論題上表現不錯,但在數值問題上遇到挑戰,特別是需要深入理解的部分。Copilot 的準確率最高,達60.38%。研究還進行了學生調查和訪談,顯示對人工智慧在數值任務中的可靠性有擔憂。研究建議教育者調整評估方法,以負責任地整合人工智慧,提升學習效果。 相關文章 PubMed DOI 推理