原始文章

這項研究評估了大型語言模型(LLMs),特別是GPT-3.5和GPT-4,在院前篩檢急性缺血性中風(AIS)和大血管阻塞(LVO)的效果。研究在茂名市人民醫院進行,分析了400份急診病歷。結果顯示,GPT-4在AIS和LVO的篩檢準確率上均優於GPT-3.5,特別是在神經推理和事實正確性方面表現更佳。整體來看,GPT-4有潛力成為急救醫療服務中有效的決策支持工具,可能改善及時介入的效果。 PubMed DOI


站上相關主題文章列表

研究發現ChatGPT在理解中文醫學知識上表現良好,對醫學發展有潛力。測試顯示在中英文醫學數據集上,ChatGPT在準確性、口語流暢度和幻覺減少方面表現優異。GPT-4比GPT-3.5更出色,尤其在出院摘要邏輯和團體學習方面,符合中國臨床醫學研究生課程標準。儘管挑戰重重,ChatGPT有望推動醫學人工智慧的發展。 PubMed DOI

人工智慧,特別是ChatGPT,被提及可輔助中風患者機械溶栓的臨床判斷。杜蘭大學醫療中心研究指出,ChatGPT與醫師意見一致率為54.3%,但8.8%出現錯誤。雖然ChatGPT有潛力協助臨床判斷,但不能全然依賴。或許可提升臨床醫師工作效率。 PubMed DOI

研究發現ChatGPT語言模型在中風患者中預測功能性結果表現優異,特別是對於治療效果好、閉塞遠、時間短的患者。將這樣的人工智慧模型應用在臨床上,有助於提升中風患者的護理品質。 PubMed DOI

研究使用GPT-4語言模型,成功應用於急性中風病灶定位。模型準確處理病史和檢查文本,提供準確的臨床推理。在病灶定位方面表現優異,但偶爾出現錯誤。總結來說,GPT-4有潛力成為神經學中實用的臨床工具。 PubMed DOI

研究比較了GPT-4和GPT-3.5在提取神經放射學報告中缺血性中風患者機械溶栓術數據的表現。結果發現,GPT-4比GPT-3.5更準確,處理所有報告且無需進一步處理即可正確提取94.0%的數據項目,而GPT-3.5僅有63.9%的準確率。總結來說,GPT-4在提取正確程序數據方面更有效。 PubMed DOI

人工智慧和大型語言模型(LLMs)在醫療保健領域有應用,像是進階燒傷急救(ABLS)計畫。研究比較了三種LLMs(ChatGPT-3.5、ChatGPT-4、Google Bard)在ABLS考試中的表現,結果顯示ChatGPT-4表現最好,得分90%,比Bard好很多。LLMs在急診護理中有潛力,但應該輔助人類判斷。 PubMed DOI

研究比較了ChatGPT、GPT-3.5和GPT-4在急診科環境中的診斷能力。結果顯示,GPT-4在內科緊急情況的診斷上比GPT-3.5和住院醫師表現更好,尤其在心血管、內分泌和消化系統疾病方面。這顯示GPT-4有潛力成為急診科中有用的診斷工具。 PubMed DOI

這項研究探討了ChatGPT(GPT-3.5和GPT-4)在評估認知表現的有效性,對象包括正常認知者和中風倖存者。90名參與者接受了記憶、數字處理、語言流暢度和抽象思維的評估。主要發現顯示GPT-3.5在記憶和語言評估上與醫生的評估存在顯著差異,但透過優化方法可改善這些差異。GPT-4的表現更接近醫生評分,顯示其在認知評估中有進一步提升的潛力。整體而言,ChatGPT作為醫療評估的輔助工具顯示出潛力。 PubMed DOI

這項研究評估了人工智慧工具ChatGPT-4V在急性中風診斷中的有效性,透過分析530張MRI影像,包括266例中風和264例正常病例。主要發現顯示,ChatGPT-4V在識別中風影像的準確率為88.3%,正常影像為90.1%。在檢測擴散限制方面,準確率為79.5%,但對於受影響半球的識別僅為26.2%。總體而言,該工具的診斷敏感性為79.57%,特異性為84.87%,顯示其在中風診斷中輔助醫療專業人員的潛力。 PubMed DOI

這項研究評估了大型語言模型(LLMs)在急性缺血性中風(AIS)患者的手術記錄中提取數據的有效性。分析了382份手術記錄,重點在30份,以指導LLMs提取關鍵特徵。六種LLMs的表現良好,平均準確率達95.09%,整體準確率為78.05%。GLM4和GPT-4在進階特徵提取上表現突出,準確率分別為84.03%和82.20%。LLMs的數據處理速度也顯著快於醫師,顯示出在AIS治療中改善臨床數據管理的潛力。 PubMed DOI