Comparative Analysis of Artificial Intelligence-Generated and Human-Written Personal Statements in Emergency Medicine Applications.
急診醫學申請中人工智慧生成與人類撰寫個人陳述的比較分析 Cureus 2025-07-30

這項研究發現，用AI（ChatGPT）寫的個人陳述，無論在寫作表現、個人特質展現，還是對面試決策的影響，都和真人寫的幾乎分不出來。這讓人開始懷疑個人陳述在住院醫師申請流程中的價值，也顯示未來可能要用更有效的方法來評估申請者的適合度。相關文章 PubMed DOI 推理

Exploring the role of DeepSeek-R1, ChatGPT-4, and Google Gemini in medical education: How valid and reliable are they?
探討 DeepSeek-R1、ChatGPT-4 與 Google Gemini 在醫學教育中的角色：其效度與信賴度如何？ Pak J Med Sci 2025-07-30

這項研究比較中國DeepSeek-R1、美國ChatGPT-4和Google Gemini 1.5 Pro在醫學選擇題上的表現，三者正確率都超過八成，表現相近。DeepSeek-R1不僅有潛力，價格也較親民，還是開放型，適合當作美國主流AI在醫學教育上的替代選擇。相關文章 PubMed DOI 推理

Road of Large Language Model: Source, Challenge, and Future Perspectives.
大型語言模型之路：來源、挑戰與未來展望 Research (Wash D C) 2025-07-30

這篇論文回顧大型語言模型的發展，重點在新興能力、人類價值一致性、檢索增強生成及特定領域應用，並特別提到 DeepSeek 等最新進展，同時分析現階段挑戰與未來發展方向。相關文章 PubMed DOI 推理

Corrigendum to "Leveraging large language models to predict antibody biological activity against influenza A hemagglutinin" [Comput Struct Biotechnol J 27 (2025) 1286-1295].
「更正啟事：運用大型語言模型預測抗體對流感A型血凝素生物活性的研究」[Comput Struct Biotechnol J 27 (2025) 1286-1295] Comput Struct Biotechnol J 2025-07-30

這是一則針對 DOI: 10.1016/j.csbj.2025.03.038 這篇文章的更正通知。相關文章 PubMed DOI 推理

Comparing the effectiveness of generative AI technology in commonly asked scoliosis questions.
常見脊柱側彎問題中生成式 AI 技術效能之比較 J Child Orthop 2025-07-30

研究比較了ChatGPT、Google Gemini和Microsoft Copilot在回答家長常見脊柱側彎問題的表現。四位骨科醫師評分後，ChatGPT表現最好（4.0/5），明顯優於Gemini和Copilot（皆為3.1）。整體來說，這些AI都能提供不錯的資訊，目前以ChatGPT最可靠。相關文章 PubMed DOI 推理

A foundation model for human-AI collaboration in medical literature mining.
醫學文獻挖掘中人類與 AI 協作的基礎模型 ArXiv 2025-07-30

LEADS 是專為醫學文獻訓練的 AI 模型，能協助系統性回顧的搜尋、篩選和資料擷取，表現比一般大型語言模型更好。臨床醫師和研究人員用 LEADS 不只更準確、召回率高，還能省下很多時間，證明專業 AI 模型能大幅提升循證醫學的效率和品質。相關文章 PubMed 推理

Forecasting from Clinical Textual Time Series: Adaptations of the Encoder and Decoder Language Model Families.
臨床文本時間序列的預測：編碼器與解碼器語言模型家族的調整與應用 ArXiv 2025-07-30

這篇研究提出用大型語言模型（LLM）從臨床病例報告中擷取有時間標記的資訊來預測臨床事件。結果顯示，編碼器模型在事件預測較好，解碼器模型則適合早期存活預測。特別是把資料按時間順序整理，能大幅提升預測效果，強調時間結構化在臨床應用的重要性。相關文章 PubMed 推理

Automated Survey Collection with LLM-based Conversational Agents.
以大型語言模型（LLM）為基礎的對話式代理人進行自動化問卷調查收集 ArXiv 2025-07-30

作者開發了一套用對話式AI自動打電話做調查的系統，能自己訪談、記錄並分析受訪者回答。實測40次，AI擷取答案的正確率高達98%，即使語音轉錄有小錯也不影響。參與者覺得AI客服講話清楚又有趣。這方法有望讓醫療電話調查更省人力、規模化。相關文章 PubMed 推理

LEAVS: An LLM-based Labeler for Abdominal CT Supervision.
LEAVS：一種基於LLM的腹部電腦斷層(CT)標註工具 ArXiv 2025-07-30

作者開發了 LEAVS 工具，能用大型語言模型從腹部 CT 報告中自動萃取異常類型、確定性和緊急程度等結構化標籤，涵蓋九個器官七種異常。LEAVS 準確率高（F1 分數 0.89），比現有方法更好，緊急程度標註也接近人工。這些標籤可用來訓練影像模型偵測腹部異常，程式碼和標註資料也已公開。相關文章 PubMed 推理

A Large-Language Model Framework for Relative Timeline Extraction from PubMed Case Reports.
用於從 PubMed 病例報告中擷取相對時間軸的大型語言模型框架 ArXiv 2025-07-30

作者開發了一套系統，能把病例報告的文字轉成有結構的時間序列資料，方便分析。他們比較人工和大型語言模型（LLM）的標註結果，發現LLM在事件辨識上表現普通，但在標註事件時間點上跟人工很接近。這研究為未來用病例報告做病程時間序列分析打下基礎。相關文章 PubMed 推理

LLM 相關三個月內文章 / 第 55 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

LLM 相關三個月內文章 / 第 55 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

可選擇其它分類: 一週新進文章腎臟科一般醫學 SGLT2i GLP1