Evaluating the Feasibility of ChatGPT in Healthcare: An Analysis of Multiple Clinical and Research Scenarios.
評估 ChatGPT 在醫療保健領域的可行性：對多種臨床和研究情境的分析。 J Med Syst 2023-12-31

討論了大型語言模型（LLM）如ChatGPT在醫療保健領域的應用和限制。儘管AI語言模型展現印象深刻能力，但在現實中，特別是在複雜領域如醫學中，仍存在不確定性。論文探討了在臨床實踐、科學寫作、醫學潛在濫用及討論公共衛生議題方面使用ChatGPT的可行性。強調了在醫學領域中教育人們正確使用和了解AI語言模型的必要性和風險。 PubMed DOI

ChatGPT: Is this version good for healthcare and research?
這個版本對於醫療保健和研究是否合適？ Diabetes Metab Syndr 2023-11-22

人工智慧和深度學習的進步讓OpenAI Inc.開發了ChatGPT，一個對話式聊天機器人。研究探討了ChatGPT在醫療保健和醫學研究領域的表現。結果顯示ChatGPT能提供快速答案，但可能有錯誤和限制，建議醫務人員在使用時要小心核實資訊。 PubMed DOI

ChatGPT and large language model (LLM) chatbots: The current state of acceptability and a proposal for guidelines on utilization in academic medicine.
ChatGPT 和大型語言模型 (LLM) 聊天機器人：在學術醫學中的可接受性現狀及利用指南的提議。 J Pediatr Urol 2023-10-02

研究了學術醫學領域的語言模型，提出了使用ChatGPT的指南：不要讓ChatGPT當作者、確保作者了解ChatGPT、不完全依賴ChatGPT寫作、驗證ChatGPT內容、使用ChatGPT需編輯、科學手稿中使用ChatGPT要透明。建議學術作者在使用ChatGPT時要考慮倫理並保持誠信。 PubMed DOI

ChatGPT's Response Consistency: A Study on Repeated Queries of Medical Examination Questions.
ChatGPT 的回應一致性：對醫學檢查問題重複查詢的研究。 Eur J Investig Health Psychol Educ 2024-03-29

研究比較了ChatGPT 3.5和ChatGPT 4回答醫學考試問題的表現，結果發現ChatGPT 4在準確度（85.7% vs. 57.7%）和一致性（77.8% vs. 44.9%）方面有明顯進步。這顯示ChatGPT 4在醫學教育和臨床決策上更可靠。但人類醫療服務仍然不可或缺，使用AI時應持續評估。 PubMed DOI

ChatGPT as a Tool for Medical Education and Clinical Decision-Making on the Wards: Case Study.
ChatGPT作為醫學教育和臨床決策工具在病房上的應用：案例研究。 JMIR Form Res 2024-05-08

大型語言模型（LLMs）如ChatGPT-3.5在醫學教育中有應用，可填補知識空白、協助鑑別診斷、挑戰假設、支援決策、改善護理管理，甚至進行困難對話、倫理教學。儘管有擔憂，但已有行為準則指導使用。ChatGPT對病房學習有潛力，但仍需進一步研究。 PubMed DOI

Assessing Generative Pretrained Transformers (GPT) in Clinical Decision-Making: Comparative Analysis of GPT-3.5 and GPT-4.
評估生成式預訓練轉換器(GPT)在臨床決策中的應用：GPT-3.5與GPT-4的比較分析。 J Med Internet Res 2024-06-27

研究比較了ChatGPT-3.5和ChatGPT-4在醫療決策中的表現，結果顯示GPT-4優於GPT-3.5。資深醫師給予較高評分，尤其在倫理問題上。AI有助於醫師，但不應取代人類專業知識，需進一步研究整合到臨床環境中的方法。 PubMed DOI

The potential and pitfalls of using a large language model such as ChatGPT, GPT-4, or LLaMA as a clinical assistant.
使用大型語言模型如ChatGPT、GPT-4或LLaMA作為臨床助手的潛力與陷阱。 J Am Med Inform Assoc 2024-07-17

研究評估了大型語言模型在醫療保健領域的應用，尤其是在改善患者護理方面。使用MIMIC-III數據庫的電子健康記錄，測試了這些模型在識別特定疾病患者方面的效能。GPT-4在辨識COPD、CKD、PBC和Cancer Cachexia患者方面表現優異，而ChatGPT和LLaMA3則稍遜。儘管LLMs有潛力，但在臨床應用前仍需解決錯誤、解釋不足和倫理問題。進一步研究將有助於提升模型訓練和設計，以更好地應用於醫療保健。 PubMed DOI

Comparison of the Usability and Reliability of Answers to Clinical Questions: AI-Generated ChatGPT versus a Human-Authored Resource.
臨床問題答案的可用性和可靠性比較：AI 生成的 ChatGPT 與人類撰寫的資源。 South Med J 2024-08-02

這項研究評估了ChatGPT對臨床問題的回答，與人類撰寫的網站Pearls4Peers.com進行比較，重點在可用性和可靠性。研究發現，ChatGPT的回答質量有顯著差異，約14%的回答被認為不實用，13%不準確。與人類來源相比，ChatGPT在可用性和可靠性方面的表現均不佳，超過30%的情況下表現不如人類。總體來看，這顯示在臨床決策中使用ChatGPT需謹慎。 PubMed DOI

Evaluating cognitive performance: Traditional methods vs. ChatGPT.
評估認知表現：傳統方法 vs. ChatGPT。 Digit Health 2024-08-19

這項研究探討了ChatGPT（GPT-3.5和GPT-4）在評估認知表現的有效性，對象包括正常認知者和中風倖存者。90名參與者接受了記憶、數字處理、語言流暢度和抽象思維的評估。主要發現顯示GPT-3.5在記憶和語言評估上與醫生的評估存在顯著差異，但透過優化方法可改善這些差異。GPT-4的表現更接近醫生評分，顯示其在認知評估中有進一步提升的潛力。整體而言，ChatGPT作為醫療評估的輔助工具顯示出潛力。 PubMed DOI

Comparing ChatGPT and a Single Anesthesiologist's Responses to Common Patient Questions: An Exploratory Cross-Sectional Survey of a Panel of Anesthesiologists.
比較 ChatGPT 與單一麻醉醫師對常見病人問題的回應：一項麻醉醫師小組的探索性橫斷面調查。 J Med Syst 2024-08-22

這項研究探討了人工智慧聊天機器人ChatGPT在麻醉學領域回應病人問題的效果。研究將ChatGPT的回應與認證麻醉醫師的回應進行比較，使用100個虛構臨床情境的麻醉問題。結果顯示，ChatGPT的整體質量評分與麻醉醫師相似，但同理心評分較高。不過，ChatGPT在科學共識一致性上表現不佳，且潛在傷害的比率較高。研究結論指出，雖然ChatGPT在醫療領域有潛力，但仍需改進以降低風險，並建議進一步研究其在複雜臨床情境中的有效性。 PubMed DOI

原始文章

站上相關主題文章列表