Localized large language model TCNNet 9B for Taiwanese networking and cybersecurity.
台灣網路與網路安全的區域性大型語言模型 TCNNet 9B。 Sci Rep 2025-03-21

這篇論文介紹了TCNNet-9B，專為台灣網路產業設計的繁體中文語言模型。它基於Yi-1.5-9B架構，並利用多元網路資料進行預訓練和微調，涵蓋網路知識、DIY指南、設備推薦及當地網路安全法規。經過嚴格評估，TCNNet-9B在問答準確率上提升2.35倍，專業知識理解增強37.6%，產品推薦相關性提高29.5%。其有效性也在Hi5智能銷售顧問系統中得到驗證，顯示出針對特定領域調整大型語言模型的重要性。相關文章 PubMed DOI 推理

Validating large language models against manual information extraction from case reports of drug-induced parkinsonism in patients with schizophrenia spectrum and mood disorders: a proof of concept study.
驗證大型語言模型對於從精神分裂症範疇及情緒障礙患者的藥物誘發帕金森症病例報告中手動信息提取的有效性：一項概念驗證研究。 Schizophrenia (Heidelb) 2025-03-21

這項概念驗證研究顯示，大型語言模型（LLMs）能自動將非結構化的病例報告轉換為臨床評分。我們使用標準化的臨床評分量表，並評估LLM對其輸出的信心，以改善提示策略並確保結果的可重複性。針對藥物引起的帕金森症病例報告，研究結果顯示LLM提取的數據與臨床評分者手動提取的結果相當接近，準確率高達90%。相關文章 PubMed DOI 推理

Assessing the ability of ChatGPT to generate French patient-facing information to improve patient understanding in hand surgery.
評估 ChatGPT 生成法語病人面向資訊的能力，以改善病人在手外科的理解。 Ann Chir Plast Esthet 2025-03-20

這項研究探討了人工智慧技術，特別是ChatGPT和Gemini，在提供病人醫療資訊（PFI）方面的效果，專注於手部手術。研究發現，雖然AI生成的內容與傳統資料在準確性上無顯著差異，但手外科醫生認為傳統資料在全面性和清晰度上更佳。非醫療參與者則偏好AI生成的文本。整體來說，兩者的資訊都適合病人理解，但AI內容仍需改進以符合醫療標準。持續研究對於提升病人教育和術後護理溝通非常重要。相關文章 PubMed DOI 推理

Comparing Large Language Models for antibiotic prescribing in different clinical scenarios: which perform better?
比較大型語言模型在不同臨床情境下的抗生素處方：哪一種表現更佳？ Clin Microbiol Infect 2025-03-20

這項研究評估了十四個大型語言模型（LLMs）在不同臨床情境中推薦抗生素的表現。研究使用標準化提示，針對60個案例的藥物選擇、劑量和治療持續時間進行評估。結果顯示，ChatGPT-o1的準確率最高，達71.7%，劑量正確性達96.7%。而在治療持續時間方面，Gemini表現最佳（75.0%）。不過，各模型在複雜案例中的表現差異明顯，顯示出在臨床應用前仍需謹慎驗證。相關文章 PubMed DOI 推理

Utility-based Analysis of Statistical Approaches and Deep Learning Models for Synthetic Data Generation With Focus on Correlation Structures: Algorithm Development and Validation.
基於效用的統計方法和深度學習模型在合成數據生成中的分析：關注相關結構的算法開發與驗證。 JMIR AI 2025-03-20

最近生成對抗網絡（GANs）和大型語言模型（LLMs）的進展，提升了醫療數據的生成與增強，對機器學習應用至關重要，尤其在數據隱私受到關注的情況下。研究評估了多種合成數據生成（SDG）方法的有效性，並以隨機森林為基準，分析其在下游任務中的表現。結果顯示，統計方法如synthpop在各種情況下表現優於深度學習方法，特別是在小型數據集上。研究強調特徵與目標變量的相關性對模型效用影響更大，synthpop顯示出更高的穩健性。相關文章 PubMed DOI 推理

Large Language Models as Decision-Making Tools in Oncology: Comparing Artificial Intelligence Suggestions and Expert Recommendations.
大型語言模型作為腫瘤學中的決策工具：比較人工智慧建議與專家推薦。 JCO Clin Cancer Inform 2025-03-20

這項研究評估大型語言模型（LLMs）在根據病患醫療紀錄生成早期乳腺癌治療選項的準確性。使用2024年初的多學科團隊會議紀錄，測試了三個AI模型：Claude3-Opus、GPT4-Turbo和LLaMa3-70B。結果顯示，Claude3-Opus準確率86.6%，GPT4-Turbo為85.7%，LLaMa3-70B則為75.0%。兩者在輔助內分泌和靶向治療上表現良好，但在輔助放射治療上則有高估的情況。研究建議需進一步探討這些模型在臨床上的實際應用。相關文章 PubMed DOI 推理

Robust privacy amidst innovation with large language models through a critical assessment of the risks.
在大型語言模型創新中的穩健隱私：對風險的批判性評估。 J Am Med Inform Assoc 2025-03-20

這項研究探討如何將電子健康紀錄（EHRs）與自然語言處理（NLP）及大型語言模型（LLMs）結合，以改善醫療數據管理和病人照護。研究使用MIMIC III數據集，採用GPT-3.5、GPT-4等模型生成符合HIPAA要求的合成病人紀錄。結果顯示，基於關鍵字的方法在隱私保護上風險較低，且保持良好性能，建議未來可考慮使用虛擬的PHI來提升實用性與隱私保護。相關文章 PubMed DOI 推理

Artificial intelligence learns to reason.
人工智慧學會推理。 Science 2025-03-20

馬丁是茱莉亞的哥哥，因此他和茱莉亞有相同的兄弟姐妹。由於茱莉亞有兩個姐妹，馬丁也有兩個姐妹。因此，馬丁有兩個姐妹。相關文章 PubMed DOI 推理

Can artificial intelligence (AI) chatbot tools be used effectively for nutritional management in obesity?
人工智慧 (AI) 聊天機器人工具能否有效用於肥胖的營養管理？ Nutr Health 2025-03-20

這項研究評估了兩個AI模型，ChatGPT-4o和ChatGPT-4，為一位20歲女性肥胖者制定1800卡路里的飲食計畫，並與2022年土耳其飲食指南（TDG-2022）比較。結果顯示，兩者的菜單與建議不一致，卡路里含量低於標準，且關鍵營養素如脂肪、碳水化合物、鉀和鈣的含量也未達標。總體而言，這些AI模型在飲食規劃上有重大限制，無法取代營養師的專業建議，使用時需謹慎。相關文章 PubMed DOI 推理

Automated question type coding of forensic interviews and trial testimony in child sexual abuse cases.
兒童性虐待案件中法醫訪談和審判證詞的自動化問題類型編碼。 Law Hum Behav 2025-03-20

這項研究探討了一種自動化的問題類型編碼模型，特別是「穩健優化雙向編碼器表示法」，用於分析兒童虐待受害者的法醫訪談和法庭證詞。模型在大型數據集上訓練，顯示出95%的可靠性，與人工編碼者的協議相當。進一步分析發現，人工編碼者在識別問題時容易出錯，修正後模型的可靠性提升至98%。研究結果顯示，自動編碼是一種省時且準確的手段，訓練好的模型可供研究人員和實務工作者使用。相關文章 PubMed DOI 推理

LLM 相關三個月內文章 / 第 54 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

LLM 相關三個月內文章 / 第 54 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

可選擇其它分類: 一週新進文章腎臟科一般醫學 SGLT2i GLP1