Evaluating the Performance of Reasoning Large Language Models on Japanese Radiology Board Examination Questions.
以推理為主的大型語言模型在日本放射科專科醫師考試題目上的表現評估 Acad Radiol 2025-05-18

這項研究發現，OpenAI 的推理型語言模型在日本放射科專科考題上表現比基礎模型好，但運算成本和處理速度都比較高。雖然正確率提升不少，但要考慮到費用和時間的增加。相關文章 PubMed DOI 推理

Self-Determination Theory Informed Research for Promoting Physical Activity:Contributions, Debates, and Future Directions.
以自我決定理論（Self-Determination Theory）為基礎的身體活動促進研究：貢獻、爭議與未來方向 Psychol Sport Exerc 2025-05-18

這篇文章說明自我決定理論（SDT）能有效提升運動和身體活動的動機，主要靠增加自主性和支持心理需求。雖然SDT介入對健康行為有幫助，但效果多半只有小到中度。文中也提到SDT理論本身還有爭議，未來可結合新科技和行為科學來加強成效。相關文章 PubMed DOI 推理

LITERAS: Biomedical literature review and citation retrieval agents.
LITERAS：生物醫學文獻回顧與引文檢索代理 Comput Biol Med 2025-05-18

現有LLM文獻檢索工具常出現錯誤或捏造引用。LITERAS是一套開源多代理人系統，能高準確度搜尋並引用PubMed/MEDLINE的生醫文獻，引用準確率高達99.82%，表現優於Sonar等工具，且只引用同儕審查期刊。LITERAS大幅減少幻覺現象，優先引用新文獻，能產出更完整的文獻回顧，是AI輔助學術寫作的可靠選擇。相關文章 PubMed DOI 推理

Can Large Language Models Serve as Reliable Tools for Information in Dentistry? A Systematic Review.
大型語言模型能作為牙科資訊的可靠工具嗎？—系統性回顧 Int Dent J 2025-05-18

這篇系統性回顧發現，大型語言模型（LLMs）在牙醫教育有潛力幫助學生學習，但常出現不可靠或虛構的資料來源，且來源透明度不足。雖然LLMs可作為輔助工具，但建議要小心使用，並需進一步研究及和可靠資料整合。相關文章 PubMed DOI 推理

The 'Negotiator': Assessing artificial intelligence (AI) interview preparation for graduate radiographers.
「Negotiator」：評估人工智慧（AI）於放射師畢業生面試準備的應用 J Med Imaging Radiat Sci 2025-05-18

這項研究評估AI面試工具"The Negotiator"對放射師畢業生的幫助。結果發現，這工具能提供結構化的面試練習，有助提升表達和自信，但在專業標準和臨床內容上還需加強。評分者意見不一，顯示工具尚待優化。整體來說，The Negotiator具潛力，但還需進一步改進和研究。相關文章 PubMed DOI 推理

Artificial intelligence in pediatric dental trauma: do artificial intelligence chatbots address parental concerns effectively?
兒童牙科外傷中的人工智慧：人工智慧聊天機器人能有效回應家長的疑慮嗎？ BMC Oral Health 2025-05-17

這項研究發現，ChatGPT 3.5和Google Gemini在回答家長兒童牙齒外傷問題時，表現差不多。Gemini的答案較可靠，ChatGPT 3.5則較容易懂，實用性兩者相近。不過，AI只能提供初步資訊，還是要諮詢專業牙醫。相關文章 PubMed DOI 推理

Biomedical text normalization through generative modeling.
透過生成式建模進行生物醫學文本正規化 J Biomed Inform 2025-05-17

這項研究比較了多種大型語言模型（LLM）方法，把電子病歷的非結構化醫療文本標準化成臨床術語。結果發現，檢索增強生成（RAGnorm）方法表現最穩定、準確度最高，即使沒訓練資料也很有效。這類檢索型LLM在生醫文本標準化上很有潛力，值得持續發展與應用。相關文章 PubMed DOI 推理

Speech translation for multilingual medical education leveraged by large language models.
利用大型語言模型提升多語言醫學教育的語音翻譯 Artif Intell Med 2025-05-17

這項歐盟 Interact-Europe 計畫，針對腫瘤學教育教材，開發並評估專為醫學領域設計的語音和機器翻譯系統，把英文訓練影片翻成法文、西班牙文、德文和斯洛維尼亞文。研究比較三種醫療機器翻譯模型，發現大型語言模型（LLMs）翻譯品質可比傳統系統。團隊也公開一個大型腫瘤學訓練影片資料集供大家研究。相關文章 PubMed DOI 推理

A comparison of performance of DeepSeek-R1 model-generated responses to musculoskeletal radiology queries against ChatGPT-4 and ChatGPT-4o - A feasibility study.
DeepSeek-R1 模型在肌肉骨骼放射學問題回應表現與 ChatGPT-4 及 ChatGPT-4o 之比較－一項可行性研究 Clin Imaging 2025-05-17

這項研究發現，ChatGPT-4 和 4o 在回答肌肉骨骼放射學問題時，表現比 DeepSeek R1 好很多，答案更準確、結構清楚，參考資料也比較可靠。特別是針對最新研究，ChatGPT-4o 最值得信賴；相較之下，DeepSeek R1 常出錯，還會給假資料，還需要再加強。相關文章 PubMed DOI 推理

3DBench: A scalable benchmark for object and scene-level instruction-tuning of 3D large language models.
3DBench：用於3D大型語言模型物件與場景層級指令微調的可擴展性基準 Neural Netw 2025-05-17

目前針對多模態大型語言模型處理點雲資料的評測標準很有限，難以全面評估模型的空間理解與推理能力。為此，作者提出3DBench，涵蓋十項物件與場景任務，並分為表達、感知、推理三類。作者也建立了超過23萬筆3D指令問答資料集，並設計Bench-model來提升表現。程式碼和資料已開源於GitHub。相關文章 PubMed DOI 推理

LLM 相關三個月內文章 / 第 155 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

LLM 相關三個月內文章 / 第 155 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

可選擇其它分類: 一週新進文章腎臟科一般醫學 SGLT2i GLP1