Evaluation of the reliability, usefulness, quality and readability of ChatGPT's responses on Scoliosis.
對於脊柱側彎的 ChatGPT 回應的可靠性、有用性、質量和可讀性的評估。 Eur J Orthop Surg Traumatol 2025-03-18

這項研究評估了ChatGPT對脊柱側彎問題的回答在可靠性、有用性、品質和可讀性方面的表現。選擇了十六個常見問題，由兩位專家評分。結果顯示，可靠性平均得分4.68，有用性得分4.84，整體品質得分4.28，評價普遍正面。雖然一般資訊的回答表現不錯，但針對治療和個人化問題的回答仍需加強。可讀性方面，回答需具備高中三年級到大學程度的閱讀能力。總體來說，ChatGPT提供的脊柱側彎資訊可靠，但在特定問題上仍需謹慎使用。相關文章 PubMed DOI 推理

How to Design, Create, and Evaluate an Instruction-Tuning Dataset for Large Language Model Training in Health Care: Tutorial From a Clinical Perspective.
如何設計、創建和評估大型語言模型在醫療領域訓練的指導調整數據集：來自臨床視角的教程。 J Med Internet Res 2025-03-18

高品質的數據對醫療保健至關重要，能確保準確診斷和有效治療。這份教程專注於醫療應用中的指令調整數據集（ITDs），幫助醫療人員理解如何設計、創建和評估這些數據集。主要內容包括識別數據來源、設計有效數據集的特徵，以及製作高品質的範例。教程還探討三種數據集構建方法：完全手動、完全合成和混合方法，並強調元數據選擇和人類評估的重要性。最終，這份指南旨在促進AI在醫學領域的發展。相關文章 PubMed DOI 推理

Prompt Framework for Extracting Scale-Related Knowledge Entities from Chinese Medical Literature: Development and Evaluation Study.
從中文醫學文獻中提取與規模相關的知識實體的提示框架：開發與評估研究。 J Med Internet Res 2025-03-18

這項研究開發了MedScaleNER框架，旨在透過基於測量的護理改善病人結果，特別是在非結構化的中文醫學文獻中識別醫學量表相關實體。由於標註數據有限，命名實體識別（NER）面臨挑戰。該框架結合大型語言模型（LLMs）和提示策略，成功識別量表名稱及測量項目。初步實驗顯示，GLM-4-0520與MedScaleNER結合後，達到59.64%的宏觀F1分數，顯示出顯著的改進，並為未來的研究提供了寶貴的見解。相關文章 PubMed DOI 推理

Enhanced Artificial Intelligence in Bladder Cancer Management: A Comparative Analysis and Optimization Study of Multiple Large Language Models.
膀胱癌管理中增強人工智慧的應用：多個大型語言模型的比較分析與優化研究。 J Endourol 2025-03-18

本研究探討大型語言模型（LLMs）在膀胱癌管理中的表現。研究設計了100個臨床問題，評估六種LLMs的回應準確性。結果顯示，Claude-3.5-Sonnet以89.33%準確率最佳，ChatGPT-4為85.67%。GPT-3.5-Turbo經過兩階段訓練後，準確率從74.33%提升至100%。研究顯示，針對性訓練能顯著改善模型表現，並指出策略性改進可克服專業醫學應用中的限制。相關文章 PubMed DOI 推理

A comparative analysis of large language models on clinical questions for autoimmune diseases.
自體免疫疾病臨床問題的大型語言模型比較分析。 Front Digit Health 2025-03-18

這項研究評估了大型語言模型（LLMs），如ChatGPT 3.5、ChatGPT 4.0和Gemini，對自體免疫疾病臨床問題的回答效果。共提出46個問題，並由專家根據五個質量維度進行評估。結果顯示，ChatGPT 4.0在所有維度上表現優於其他兩者，平均得分為199.8，顯示其在相關性、正確性、完整性、有用性和安全性方面的顯著優勢。整體而言，ChatGPT 4.0在提供準確且有用的醫療資訊上，顯示出更高的效能，顯示大型語言模型在醫療服務中的潛力。相關文章 PubMed DOI 推理

Tuning ProteinMPNN to reduce protein visibility via MHC Class I through direct preference optimization.
透過直接偏好優化調整 ProteinMPNN 以降低蛋白質在 MHC Class I 中的可見性。 Protein Eng Des Sel 2025-03-18

ProteinMPNN 是一個幫助設計蛋白質的工具，能識別特定三維結構的氨基酸序列。我們對其進行了修改，目的是創造對細胞毒性 T 淋巴細胞不那麼明顯的蛋白質，因為這些細胞透過 MHC-I 路徑來識別蛋白質。我們引入了結合直接偏好優化（DPO）的方法，並預測 MHC-I 肽的呈現，成功設計出具有較少 MHC-I 表位的蛋白質，且不影響其結構完整性。詳細的源代碼可在這裡找到：https://github.com/hcgasser/CAPE_MPNN。相關文章 PubMed DOI 推理

The Touch of Artificial Intelligence in Social Work: Analysis of Social Investigation Reports in Child Welfare with ChatGPT.
人工智慧在社會工作中的影響：使用 ChatGPT 分析兒童福利社會調查報告。 J Evid Based Soc Work (2019) 2025-03-18

這項研究分析了ChatGPT對七份與土耳其兒童相關的社會調查報告的回應，重點探討缺失、風險因素、保護因素、社會工作介入計畫及機構建議。使用MAXQDA22進行質性內容分析，發現三個主要主題： 1. **報告評估**：ChatGPT全面評估報告，指出缺失並提出改進建議。 2. **風險與保護因素**：將風險和保護因素分類，包括個人特徵、家庭動態等。 3. **社會工作介入計畫**：強調制定計畫前需確立目標，並對機構提出建議。研究建議未來可探討人工智慧對社會工作專業人士的影響。相關文章 PubMed DOI 推理

Impact of hospital-specific domain adaptation on BERT-based models to classify neuroradiology reports.
醫院特定領域適應對基於 BERT 模型分類神經放射學報告的影響。 Eur Radiol 2025-03-18

這項研究探討了使用遮蔽語言模型（MLM）在醫院特定領域的適應性，並應用於基於BERT的模型來分類神經放射學報告。分析了來自國王學院醫院和蓋伊與聖托馬斯信託醫院的超過200,000份MRI報告。結果顯示，經過適應的模型性能顯著提升，最佳訓練數據達到97.0%和95.5%的準確率。Llama-3.0 70B模型表現最佳，準確率分別為97.1%和94.0%。研究建議在臨床環境中使用醫院特定的模型適應，並指出LLM可作為有效替代方案。相關文章 PubMed DOI 推理

Assessing the performance of an artificial intelligence based chatbot in the differential diagnosis of oral mucosal lesions: clinical validation study.
評估基於人工智慧的聊天機器人在口腔黏膜病變鑑別診斷中的表現：臨床驗證研究。 Clin Oral Investig 2025-03-18

這項研究探討了基於人工智慧的聊天機器人ChatGPT-4在口腔黏膜病變鑑別診斷中的有效性。研究收集了因口腔黏膜活檢而轉診的患者數據，並將病變描述輸入ChatGPT以生成診斷，與專家診斷進行比較。結果顯示，聊天機器人的診斷與專家之間有顯著相關性，且能高敏感性識別惡性病變。整體而言，ChatGPT-4在識別可疑惡性病變方面表現出色，顯示出其在口腔醫學中的輔助潛力。相關文章 PubMed DOI 推理

Samply Stream API: The AI-enhanced method for real-time event data streaming.
Samply Stream API：增強型 AI 實時事件數據流方法。 Behav Res Methods 2025-03-18

這篇手稿介紹了一種新穎的行為與社會研究方法，利用即時資訊串流和人工智慧進行研究。文中詳述了Samply軟體的擴展，結合事件數據、行動調查和實驗。研究中，透過Chat-GPT演算法修改新聞標題，並利用Samply Stream API發送給參與者。結果顯示，大多數參與者未遇到技術問題，且不同版本的新聞可讀性無顯著差異。參與者對錯誤資訊的熟悉度低於其他版本，顯示資訊操控的有效性。這種方法在公共意見、醫療、行銷等領域有廣泛應用潛力。相關文章 PubMed DOI 推理

LLM 相關三個月內文章 / 第 59 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

LLM 相關三個月內文章 / 第 59 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

可選擇其它分類: 一週新進文章腎臟科一般醫學 SGLT2i GLP1