Large Language Models Can Extract Metadata for Annotation of Human Neuroimaging Publications.
大型語言模型可用於提取人類神經影像學文獻的註釋中繼資料 bioRxiv 2025-06-04

最新的商業大型語言模型（像GPT-4o），在神經影像的中繼資料標註上，表現幾乎跟專業人員一樣好（zero-shot下得分0.91–0.97），錯誤率也差不多，很多分歧其實不是錯誤。這代表LLM很適合大規模自動標註。作者也建議大家建立並分享標註基準資料集，方便未來測試。相關文章 PubMed DOI 推理

Development and Technical Validation of an Integrated Risk Calculator for Acute Coronary Syndrome Using ChatGPT-Assisted Coding.
利用 ChatGPT 協助編碼開發與技術驗證整合性急性冠心症風險計算器 Cureus 2025-06-04

這項研究開發了一個網頁工具，把ACS常用的三種風險評分整合在同一介面，並用AI協助設計。結果顯示，這工具評分和現有系統一致，減少重複輸入、提升效率。證明AI輔助、醫師主導的軟體開發在心血管風險評估上可行又準確，但還需要更多臨床驗證。相關文章 PubMed DOI 推理

Scientific hypothesis generation by large language models: laboratory validation in breast cancer treatment.
大型語言模型於科學假說生成之應用：乳癌治療的實驗室驗證 J R Soc Interface 2025-06-04

研究人員用GPT-4提出乳癌新藥物組合，選用多種原本非治療癌症的FDA核准藥物，兩兩搭配後進行細胞實驗。結果發現，有些AI建議的組合效果比現有治療還好，顯示大型語言模型在新藥開發和科學假說產生上很有潛力。相關文章 PubMed DOI 推理

Looking into the Future of ChatGPT and Its Cultural Consideration from Filipino Nurse Scientists' Perspectives: A Narrative-Focused Group Discussion.
從菲律賓護理科學家觀點探討 ChatGPT 的未來及其文化考量：一項敘事式焦點團體討論 Creat Nurs 2025-06-04

這份研究發現，菲律賓護理科學家認為ChatGPT有助於提升醫療照護，但強調使用時要顧及文化敏感度、語言和資料取得等在地需求，同時也需要新的技能和倫理規範，確保AI應用既安全又包容。相關文章 PubMed DOI 推理

Is it a pediatric orthopaedic urgency or not? Can ChatGPT answer this question?
這個標題的繁體中文(zh-TW)翻譯如下：「這是小兒骨科的緊急狀況嗎？ChatGPT 能回答這個問題嗎？」 J Orthop Surg Res 2025-06-03

這項研究發現，ChatGPT在協助家長判斷小兒骨科症狀是否需要急診或門診時，大多能給出正確且實用的建議。雖然偶爾會有小錯誤，但整體表現不錯。研究認為，ChatGPT可作為衛教和分流的輔助工具，但不能取代醫師專業判斷，未來還需持續優化和監督。相關文章 PubMed DOI 推理

Comparative analysis of AI chatbot (ChatGPT-4.0 and Microsoft Copilot) and expert responses to common orthodontic questions: patient and orthodontist evaluations.
AI 聊天機器人（ChatGPT-4.0 與 Microsoft Copilot）與專家對常見齒顎矯正問題回答的比較分析：病患與齒顎矯正醫師的評估 BMC Oral Health 2025-06-03

這項研究發現，無論是病患還是矯正牙醫，都認為專家的回答最專業、最值得信賴。雖然 ChatGPT-4.0 有些題目表現不錯，但整體還是比不上專家；Microsoft Copilot 的表現則最弱。總結來說，AI 聊天機器人目前在矯正牙科領域，還無法完全取代專業醫師的建議。相關文章 PubMed DOI 推理

Evaluating AI chatbots in penis enhancement information: a comparative analysis of readability, reliability and quality.
AI 聊天機器人在陰莖增大資訊中的評估：可讀性、可靠性與品質的比較分析 Int J Impot Res 2025-06-03

這項研究比較了ChatGPT-4、Gemini Pro和Llama 3.1三款AI聊天機器人在陰莖增大資訊上的表現。結果顯示，Llama 3.1在資訊可靠性和品質上表現最佳，但三款AI的回答都偏難懂，沒有提供容易理解的答案。相關文章 PubMed DOI 推理

EMTeC: A corpus of eye movements on machine-generated texts.
EMTeC：機器生成文本之眼動資料庫 Behav Res Methods 2025-06-03

EMTeC 資料庫收錄 107 位英語母語者閱讀由各種大型語言模型產生文章時的眼動追蹤數據，包含原始與處理後資料、模型內部資訊及語言學標註。這些資料有助於閱讀行為研究、模型可解釋性分析和演算法開發，所有資源都可在 GitHub 免費取得。相關文章 PubMed DOI 推理

Evaluating the Diagnostic Accuracy of ChatGPT-4.0 for Classifying Multimodal Musculoskeletal Masses: A Comparative Study with Human Raters.
ChatGPT-4.0 在分類多模態肌肉骨骼腫塊之診斷準確性的評估：與人工評分者之比較研究 Rofo 2025-06-03

研究發現，ChatGPT-4.0在判讀肌肉骨骼腫瘤影像時，主要診斷正確率低於人類專家（44%比87%），但若加上次要診斷，差距縮小（71%比94%）。雖然準確度還不及專家，但因為速度快又隨時可用，未來有機會成為放射科的輔助工具。相關文章 PubMed DOI 推理

Promoting patient health literacy in burn care through artificial intelligence language learning models: A study of text analysis and simplification.
透過人工智慧語言學習模型提升燒傷照護中病人健康素養：文本分析與簡化之研究 Burns 2025-06-03

這項研究發現，Microsoft Copilot、Gemini 和 Meta AI 能把燒燙傷衛教資料簡化到國中六到八年級的閱讀程度，有助於讓醫療資訊更容易被一般民眾理解。不過，內容還是需要醫師或臨床人員審查，確保正確性和適合度。相關文章 PubMed DOI 推理

LLM 相關三個月內文章 / 第 75 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

LLM 相關三個月內文章 / 第 75 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

可選擇其它分類: 一週新進文章腎臟科一般醫學 SGLT2i GLP1