Performance and exploration of ChatGPT in medical examination, records and education in Chinese: Pave the way for medical AI.
ChatGPT 在醫學檢查、記錄和教育中的表現和應用：為醫學人工智慧鋪平道路。 Int J Med Inform 2023-08-14

研究發現ChatGPT在理解中文醫學知識上表現良好，對醫學發展有潛力。測試顯示在中英文醫學數據集上，ChatGPT在準確性、口語流暢度和幻覺減少方面表現優異。GPT-4比GPT-3.5更出色，尤其在出院摘要邏輯和團體學習方面，符合中國臨床醫學研究生課程標準。儘管挑戰重重，ChatGPT有望推動醫學人工智慧的發展。 PubMed DOI

ChatGPT performance in the medical specialty exam: An observational study.
ChatGPT 在醫學專科考試中的表現：一項觀察性研究。 Medicine (Baltimore) 2023-11-08

研究評估了ChatGPT在過去5次醫學專業考試中的表現，分析了成功率和排名。ChatGPT回答各種問題，成功率不同，排名從第1787名到第4428名。在短問題和單選多選擇題上表現較佳，但仍落後於人類專家。研究引起對ChatGPT在醫療服務潛力的好奇。 PubMed DOI

Chat GPT as a Neuro-Score Calculator: Analysis of a Large Language Model's Performance on Various Neurological Exam Grading Scales.
Chat GPT作為神經評分計算器：對大型語言模型在各種神經檢查評分尺度上表現的分析。 World Neurosurg 2023-12-16

研究評估了ChatGPT在使用不同評分系統（如GCS、ICH和H&H）來評估患者的神經檢查能力。結果顯示，ChatGPT在計算分數方面有潛力，但處理複雜或模糊描述時準確性有限。總的來說，在醫學領域中，ChatGPT展現了一定的應用價值。 PubMed DOI

A descriptive study based on the comparison of ChatGPT and evidence-based neurosurgeons.
基於比較 ChatGPT 與以證據為基礎的神經外科醫師的描述性研究。 iScience 2023-09-16

研究評估了ChatGPT在神經外科領域的應用，發現GPT-3.5像資歷較低醫師，GPT-4.0則像資歷高醫師。雖然ChatGPT還不及經驗豐富醫師，但未來改進或許會提升其效能。 PubMed DOI

ChatGPT's performance in dentistry and allergy-immunology assessments: a comparative study.
ChatGPT在牙科和過敏免疫學評估中的表現：一項比較研究。 Swiss Dent J 2023-10-06

研究比較了ChatGPT 3和ChatGPT 4在牙科及過敏/臨床免疫學自我評估問題上的表現。結果顯示，ChatGPT 4表現比ChatGPT 3好，尤其在過敏/臨床免疫學領域。使用預設模型明顯提升了ChatGPT 3的表現，並在牙科評估中也提升了ChatGPT 4的表現。這顯示ChatGPT在不同醫學領域的能力差異。在醫療保健等關鍵領域使用大型語言模型時，需謹慎因存在限制和風險。 PubMed DOI

Large Language Model-Based Neurosurgical Evaluation Matrix: A Novel Scoring Criteria to Assess the Efficacy of ChatGPT as an Educational Tool for Neurosurgery Board Preparation.
基於大型語言模型的神經外科評估矩陣：一個新穎的評分標準，用於評估 ChatGPT 作為神經外科委員會考試準備教育工具的效果。 World Neurosurg 2023-12-21

研究使用AI模型ChatGPT來提升神經外科委員會教育，發現ChatGPT在回答問題時表現準確且符合神經外科主題，但與傳統解釋有些許不同。結果顯示像ChatGPT這樣的AI在醫學教育有潛力，但仍需進一步研究以提升整合和表現，以達到更好的學習成效和病人照護品質。 PubMed DOI

ChatGPT's dance with neuropsychological data: A case study in Alzheimer's disease.
ChatGPT 與神經心理學數據的互動：阿茲海默症案例研究。 Ageing Res Rev 2023-12-16

人工智慧如ChatGPT正改變醫學與科學。研究比較ChatGPT與神經心理學家對阿茲海默症患者測試數據的解釋，發現ChatGPT準確但缺乏標準化分數，神經心理學家則能確定問題。ChatGPT雖能解釋測試，卻無法精確找出認知障礙性質，尤其在阿茲海默症患者身上。 PubMed DOI

Can ChatGPT outperform a neurosurgical trainee? A prospective comparative study.
ChatGPT 是否能勝過神經外科住院醫師？一項前瞻性比較研究。 Br J Neurosurg 2024-02-02

這項研究比較了一個大型語言模型ChatGPT在全國選拔面試中與人類神經外科申請者的表現。ChatGPT的表現不如人類參與者，顯示在醫療整合方面有改進的潛力。儘管目前人工智慧表現有限，但人類與AI系統之間的合作對未來醫療有希望。 PubMed DOI

Evaluating the competency of ChatGPT in MRCP Part 1 and a systematic literature review of its capabilities in postgraduate medical assessments.
評估 ChatGPT 在 MRCP Part 1 的能力及其在研究生醫學評估中的能力的系統文獻回顧。 PLoS One 2024-07-31

研究顯示，ChatGPT在英國研究生醫學考試中的表現有明顯差異。ChatGPT-3.5在MRCP Part 1考試中得66.4%，而ChatGPT-4則提升至84.8%，兩者均超過及格標準。不過，ChatGPT-3.5在九場考試中有八場未通過，平均分數低於及格標準5.0%；相對地，ChatGPT-4在十一場考試中通過九場，平均分數高出13.56%。儘管成績進步，但兩者仍有產生錯誤資訊的問題，這對其在醫學教育中的應用造成挑戰。 PubMed DOI

A retrospective evaluation of the potential of ChatGPT in the accurate diagnosis of acute stroke.
ChatGPT 在急性中風準確診斷中的潛力之回顧性評估。 Diagn Interv Radiol 2024-09-02

這項研究評估了人工智慧工具ChatGPT-4V在急性中風診斷中的有效性，透過分析530張MRI影像，包括266例中風和264例正常病例。主要發現顯示，ChatGPT-4V在識別中風影像的準確率為88.3%，正常影像為90.1%。在檢測擴散限制方面，準確率為79.5%，但對於受影響半球的識別僅為26.2%。總體而言，該工具的診斷敏感性為79.57%，特異性為84.87%，顯示其在中風診斷中輔助醫療專業人員的潛力。 PubMed DOI

原始文章

站上相關主題文章列表