Accuracy, Reliability, and Comprehensibility of ChatGPT-Generated Medical Responses for Patients With Nonalcoholic Fatty Liver Disease.
ChatGPT生成的非酒精性脂肪肝病患者醫學回應的準確性、可靠性和易讀性。 Clin Gastroenterol Hepatol 2024-03-25

非酒精性脂肪肝病（NAFLD）是全球嚴重健康問題，目前沒有特效藥物，調整生活方式很重要。為了應對NAFLD，需要創新方法來支持長期改變。現在稱為代謝功能障礙相關性脂肪肝。AI聊天機器人如ChatGPT可以提供個人化支持和教育，有助於增進醫療資源。研究評估ChatGPT對NAFLD問題回答的正確性和完整性，以了解對患者疾病和生活方式問題的回應。 PubMed DOI

A systematic evaluation of the performance of GPT-4 and PaLM2 to diagnose comorbidities in MIMIC-IV patients.
GPT-4和PaLM2在MIMIC-IV患者中診斷合併症表現的系統評估。 Health Care Sci 2024-06-28

研究用醫院病歷數據評估GPT-4和PaLM2的診斷準確度，結果發現GPT-4達93.9%，PaLM2為84.7%。顯示人工智慧可協助減少診斷錯誤，但仍需人類監督。整合AI到醫療面臨道德、責任和監管挑戰。 PubMed DOI

Evaluation of large language models as a diagnostic aid for complex medical cases.
大型語言模型作為複雜醫學案例診斷輔助的評估。 Front Med (Lausanne) 2024-07-05

研究比較了大型語言模型（LLMs）在臨床案例診斷上的表現，發現GPT4比GPT3.5更準確且提供更專業的診斷列表。然而，兩者仍有可能漏掉最可能的診斷。研究建議LLMs像GPT4可擴展診斷考慮範圍，但需改進以更符合疾病發生率和文獻。 PubMed DOI

The potential and pitfalls of using a large language model such as ChatGPT, GPT-4, or LLaMA as a clinical assistant.
使用大型語言模型如ChatGPT、GPT-4或LLaMA作為臨床助手的潛力與陷阱。 J Am Med Inform Assoc 2024-07-17

研究評估了大型語言模型在醫療保健領域的應用，尤其是在改善患者護理方面。使用MIMIC-III數據庫的電子健康記錄，測試了這些模型在識別特定疾病患者方面的效能。GPT-4在辨識COPD、CKD、PBC和Cancer Cachexia患者方面表現優異，而ChatGPT和LLaMA3則稍遜。儘管LLMs有潛力，但在臨床應用前仍需解決錯誤、解釋不足和倫理問題。進一步研究將有助於提升模型訓練和設計，以更好地應用於醫療保健。 PubMed DOI

Feasibility of Artificial Intelligence Powered Adverse Event Analysis: Using a Large Language Model to Analyze Microwave Ablation Malfunction Data.
人工智慧驅動的不良事件分析的可行性：使用大型語言模型分析微波消融故障數據。 Can Assoc Radiol J 2024-08-22

本研究評估大型語言模型（LLM），特別是GPT-4，是否能有效分析介入放射學（IR）微波消融裝置的安全事件數據。研究收集了2011年至2023年的安全數據，並由人類審核者進行分類。GPT-4的分類準確率在訓練集達96.0%，驗證集86.4%，測試集87.3%。最終生成的摘要與人類解讀相似，顯示LLM在處理IR安全數據方面的潛力，成為臨床醫生的有用工具。 PubMed DOI

Toward an Explainable Large Language Model for the Automatic Identification of the Drug-Induced Liver Injury Literature.
朝向可解釋的大型語言模型以自動識別藥物誘發肝損傷文獻。 Chem Res Toxicol 2024-08-27

藥物引起的肝損傷（DILI）是藥物安全性的重要議題，也是急性肝衰竭的主要原因。傳統的文獻搜尋方法因藥物相互作用的複雜性而效率不高，且手動整理容易出錯。近期，利用大型語言模型（LLMs）如LLaMA-2，研究人員開發了專門用於DILI分析的模型，並在CAMDA 2022的數據集上達到97.19%的準確率，顯示出LLMs在文獻識別上的潛力，可能簡化監管審查流程。 PubMed DOI

Extraction and classification of structured data from unstructured hepatobiliary pathology reports using large language models: a feasibility study compared with rules-based natural language processing.
使用大型語言模型從非結構化肝膽病理報告中提取和分類結構化數據：與基於規則的自然語言處理的可行性研究比較。 J Clin Pathol 2024-09-20

本研究探討大型語言模型（LLMs），特別是GPT-3.5 turbo和GPT-4，如何提取肝細胞癌病理報告中的關鍵要素。考量到手動整理報告的困難，研究比較了LLMs與傳統的正則表達式（REGEX）方法的準確性。共分析了88份病理報告，重點在五個關鍵要素。結果顯示，LLMs和REGEX的提取準確性均相當，介於84.1%到94.8%之間。研究指出，LLMs有潛力顯著簡化提取過程，進而加速癌症研究的進展。 PubMed DOI

Artificial Intelligence, Large Language Models, and Digital Health in the Management of Alcohol-Associated Liver Disease.
人工智慧、大型語言模型與數位健康在酒精相關肝病管理中的應用。 Clin Liver Dis 2024-10-03

人工智慧（AI）在診斷和管理酒精相關肝病（ALD）上展現出極大潛力。透過機器學習，醫療人員能分析大量醫療數據，找出疾病模式並預測進展。大型語言模型（LLMs）的進步也有助於早期檢測及制定個性化治療方案。不過，整合這些AI工具時需謹慎，必須解決相關的倫理問題，並確保有充分的證據支持其實際應用。這樣的負責任做法能最大化AI的優勢，同時降低對病人護理的潛在風險。 PubMed DOI

Evaluating the positive predictive value of code-based identification of cirrhosis and its complications utilizing GPT-4.
利用 GPT-4 評估基於代碼識別肝硬化及其併發症的正確預測值。 Hepatology 2024-10-08

這項研究評估了大型語言模型（LLMs），特別是GPT-4，在識別肝硬化患者方面的有效性，並與傳統診斷代碼和手動病歷審查進行比較。研究分析了3,788名肝硬化住院病人的出院摘要，結果顯示LLMs的準確性顯著高於基於代碼的分類，肝硬化及其併發症的正確預測值（PPV）介於87.8%到98.8%之間。這表明LLMs能更準確地識別肝硬化患者，可能減少對繁瑣病歷審查的需求，提高分類的可靠性。 PubMed DOI

Utilizing a domain-specific large language model for LI-RADS v2018 categorization of free-text MRI reports: a feasibility study.
利用特定領域的大型語言模型進行自由文本 MRI 報告的 LI-RADS v2018 分類：可行性研究。 Insights Imaging 2024-11-22

這項研究開發了一個大型語言模型（LLM），用於根據MRI報告自動分類肝臟觀察，依據LI-RADS v2018指導方針。研究分析了291個肝臟觀察，並將其分為訓練、驗證和測試集。結果顯示，模型在LI-RADS分類上有中等一致性（κ = 0.54），對於惡性腫瘤的識別也有不錯的表現。使用LLM後，放射科醫師的工作量減少了45%，顯示出該模型在臨床應用中的潛力，能有效提升數據整理效率。 PubMed DOI

原始文章

站上相關主題文章列表