Structuring medication signeturs as a language regression task: comparison of zero- and few-shot GPT with fine-tuned models.
將藥物簽名結構化作為語言回歸任務：零次和少次 GPT 與微調模型的比較。 JAMIA Open 2024-06-25

這項研究比較了不同語言模型在從電子健康記錄中提取藥物劑量信息方面的表現。結果顯示，GPT-4在準確標註藥物使用說明方面優於其他模型。該研究指出，像GPT-4這樣的大型語言模型有潛力自動化從醫療文本來源中提取有價值信息，減少手動標註的需求。 PubMed DOI

A pilot feasibility study comparing large language models in extracting key information from ICU patient text records from an Irish population.
一項針對愛爾蘭人群 ICU 患者文本記錄中提取關鍵信息的大型語言模型比較的初步可行性研究。 Intensive Care Med Exp 2024-08-15

這項研究探討大型語言模型（LLMs）在生成重症監護病房（ICU）病人出院摘要的表現，分析了匿名臨床筆記。三個模型中，GPT-4 API的表現最佳，準確識別41.5%的關鍵臨床事件，ChatGPT和Llama 2則分別為19.2%和16.5%。雖然GPT-4在資訊組織和清晰度上表現優異，但仍有小錯誤，且所有模型在敘事連貫性和重要數據的捕捉上存在挑戰。總體來看，這些LLM在生成出院摘要上有潛力，但仍需改進。 PubMed DOI

Pilot Study of Large Language Models as an Age-Appropriate Explanatory Tool for Chronic Pediatric Conditions.
大型語言模型作為適齡解釋工具在慢性兒科疾病中的初步研究。 medRxiv 2024-08-16

這項初步研究顯示，針對慢性病兒童的病患教育資源有明顯不足，並評估大型語言模型（LLMs）在提供適合發展階段解釋的能力。研究結果發現，兩個常用的LLMs能夠生成準確且有效的回應，幫助兒科病患理解複雜的醫療資訊。這顯示LLMs可能成為提升病患理解與參與臨床環境的重要工具。 PubMed DOI

Diagnostic Accuracy of a Custom Large Language Model on Rare Pediatric Disease Case Reports.
自訂大型語言模型在罕見兒童疾病病例報告中的診斷準確性。 Am J Med Genet A 2024-09-13

診斷罕見兒科疾病相當具挑戰性，因為這些疾病的表現複雜。本研究評估了三種大型語言模型（LLMs）的診斷表現：GPT-4、Gemini Pro，以及一個整合Human Phenotype Ontology的自訂模型（GPT-4 HPO），針對61個罕見疾病進行分析。結果顯示，GPT-4的準確率為13.1%，而GPT-4 HPO和Gemini Pro均為8.2%。特別是GPT-4 HPO在鑑別診斷和疾病分類上表現較佳。這些結果顯示大型語言模型在診斷支持上有潛力，但仍需改進以便更好地融入臨床實踐。 PubMed DOI

Automated Mass Extraction of Over 680,000 PICOs from Clinical Study Abstracts Using Generative AI: A Proof-of-Concept Study.
使用生成式人工智慧自動提取超過680,000個PICOs於臨床研究摘要中的概念驗證研究。 Pharmaceut Med 2024-09-26

這項研究探討了利用生成式人工智慧（GenAI）自動提取PICO（人口、介入、比較、結果）元素的方法，對於系統文獻回顧（SLRs）非常重要。考量到歐盟健康技術評估法規的要求，研究評估了GenAI在此任務上的可行性和效率。研究人員從PubMed檢索了682,667篇隨機對照試驗的摘要，使用OpenAI的GPT-4o進行處理，PICO元素提取在三小時內完成，平均每1,000篇摘要處理時間為200秒。驗證結果顯示，GPT-4o準確提取了98%的PICO元素，顯示GenAI能顯著提升SLRs的效率，幫助製藥開發者更好地應對健康技術評估。 PubMed DOI

Information Extraction from Clinical Texts with Generative Pre-trained Transformer Models.
使用生成預訓練變壓器模型從臨床文本中提取信息。 Int J Med Sci 2025-03-03

本研究評估了GPT-3.5和GPT-4在從非結構化臨床文本中提取資訊的效果。使用了病人特徵、病史和臨床檢測結果的資料，並透過簡單提示進行查詢。結果顯示，GPT-4在性別資訊提取上準確率達95%，優於GPT-3.5的70%；但在身體質量指數（BMI）方面，GPT-3.5的78%表現更佳。研究建議整合特定任務的定義進入提示中，以提升提取效果，並鼓勵專業人士設計有效提示，監控大型語言模型的表現。 PubMed DOI

Can large language models assist with pediatric dosing accuracy?
大型語言模型能否協助提高兒科劑量的準確性？ Pediatr Res 2025-03-08

在兒科護理中，藥物計算錯誤仍然是一大挑戰。本研究探討大型語言模型（LLMs）如ChatGPT-4o和Claude-3.0在減少這些錯誤的效果，並與經驗豐富的護理人員進行比較。結果顯示，LLMs的準確率達100%，而護理人員為93.14%。此外，LLMs的計算速度也顯著更快。研究建議進一步探索這些模型在醫療環境中的應用潛力，以提升藥物安全性和臨床效率。 PubMed DOI

Large Language Models for Pediatric Differential Diagnoses in Rural Health Care: Multicenter Retrospective Cohort Study Comparing GPT-3 With Pediatrician Performance.
大型語言模型在鄉村醫療中對兒科鑑別診斷的應用：多中心回顧性隊列研究比較 GPT-3 與兒科醫生的表現。 JMIRx Med 2025-03-19

這項研究探討了一個微調過的GPT-3模型在農村醫療環境中對兒科病例診斷的有效性，因為這些地區專家資源有限。研究分析了路易斯安那州中部的500個兒科就診案例，發現模型準確率達87.3%，敏感度和特異度分別為85%和90%，與兒科醫生的91.3%相當。模型在不同年齡組和常見病症中表現穩定，但對罕見診斷的準確率稍低。總體來說，這個微調的GPT-3模型可作為農村兒科護理的可靠診斷工具，但仍需在不同人群中進一步驗證。 PubMed DOI

Use of an Untrained Large Language Model for Antibiotic Prescription in Pediatric Infectious Diseases at Primary Care Settings: A Study From the Italian Society for Pediatric Infectious Diseases.
未經訓練的大型語言模型於基層醫療環境中兒科感染症抗生素處方之應用：義大利兒科感染症學會研究 Pediatr Infect Dis J 2025-05-13

重點整理：雖然AI正在改變醫學領域，但在小兒科方面的研究還很少。這項研究發現，一個免費、未經專門訓練的大型語言模型，針對13種常見小兒感染情境，能夠提供可靠的抗生素處方建議。 PubMed DOI

AI-Powered Drug Classification and Indication Mapping for Pharmacoepidemiologic Studies: Prompt Development and Validation.
用於藥物流行病學研究的 AI 驅動藥物分類與適應症對應：提示開發與驗證 JMIR AI 2025-06-12

這項研究發現，GPT-4o等大型語言模型能根據實際用藥情境（如劑量）準確判斷藥物的ATC分類，表現比傳統搜尋方法更好（92.5%對82.5%）。LLM不僅準確、取得容易，還能考慮情境資訊，對藥物流行病學研究很有幫助。 PubMed DOI

原始文章

站上相關主題文章列表