這項研究評估了醫療領域大型語言模型(LLMs)在遵循MI-CLEAR-LLM檢查表的表現,旨在提升報告的透明度與可重複性。透過系統性搜尋PubMed,找到159篇2022年11月到2024年6月間發表的相關文章。 主要發現包括: - 100%報告LLM名稱,96.9%報告版本,91.8%報告製造商。 - 54.1%報告訓練數據截止日期,6.3%記錄網路資訊訪問。 - 15.1%清楚記錄隨機性管理。 - 49.1%提供提示措辭,34.0%討論提示結構。 - 13.2%報告測試數據獨立性,56.6%提供網路數據網址。 總體而言,雖然基本識別報告良好,但隨機性、提示細節及測試數據獨立性等關鍵方面仍需加強。改善遵循檢查表可提升未來研究的透明度與可靠性。 PubMed DOI