原始文章

這項研究探討了ChatGPT 4.0作為手部疾病初步診斷工具的有效性,涵蓋了觸發指、杜普伊特氏攣縮、腕管症候群等疾病。結果顯示,GPT-4.0對大多數疾病的診斷準確率超過95%,但拇指掌腕關節骨關節炎的準確率僅60%。在97%的案例中,GPT-4.0建議患者尋求醫療協助。研究也分析了其使用的術語,發現某些疾病之間有重疊。總體來看,GPT-4.0作為診斷輔助工具有潛力,但仍需進一步研究以提升準確性。 PubMed DOI


站上相關主題文章列表

研究評估了ChatGPT在回答手部骨科問題時的表現,結果顯示在準確性和完整性方面表現良好。儘管ChatGPT能提供正確資訊,但患者不宜完全依賴網路AI,仍需諮詢專業醫師。 PubMed DOI

研究發現,ChatGPT 在手部外科自我評估考題中表現一般,對文字問題回答率高於圖片問題。儘管提供額外解釋,但信心與正確性不一定成正比。總括而言,ChatGPT 表現不佳,不建議單獨依賴。在使用時應謹慎,因其仍有限制。 PubMed DOI

研究評估在整形外科手部診所使用OpenAI的ChatGPT作為臨床助手,發現其在診斷病例上有78%的準確度,但處理複雜病理和識別故意錯誤有困難。在指導患者管理和提供治療建議方面表現也受到評價。儘管在診斷上成功率高,但整體建議實用性有待改進。 PubMed DOI

這項研究評估了ChatGPT在手腕關節炎相關程序中提供資訊的質量與一致性。研究人員向ChatGPT-3.5提出32個標準化問題,並進行三次詢問。三位評審對回應進行醫學準確性評估,結果顯示可靠性高(ICC為0.97),質量良好(DISCERN評分60),但可讀性需大學程度。75%的回應被認為適當,尤其是近端行腕骨切除術和全腕關節融合術的可靠性較高。雖然ChatGPT能提供有用資訊,但使用時需謹慎,並了解其局限性。 PubMed DOI

這項研究探討了GPT-4作為手外科門診的諮詢助手,模擬了10種常見手部疾病的病人情境。GPT-4進行病史訪談,並利用提示工程技術協助診斷。專業手外科醫生用李克特量表評估其表現,平均得分為4.6,顯示在病史記錄上表現不錯。研究建議GPT-4可能成為病人照護的有用工具,但仍需進一步研究以確認其在真實臨床環境中的有效性。 PubMed DOI

這項研究探討如何在管理第五掌骨下端骨折時,整合ChatGPT-4 plus,並將其治療建議與整形外科醫生及專家小組的意見進行比較。結果顯示,各組的管理計畫中等可靠(組內相關係數為0.61)。影響手術決策的關鍵因素包括臨床上出現的剪刀現象、伸展缺損及影像學證據顯示的關節內延伸。研究結果顯示,人工智慧能提升臨床診斷與治療決策的準確性。 PubMed DOI

這項研究評估了ChatGPT-4在處理足部和踝部病變的診斷能力,提供了八個臨床案例,並由三位專科骨科醫生進行評分。結果顯示,ChatGPT-4的平均得分為22.0分(滿分25分),對Morton神經瘤的案例得分最高(24.7分),而腓骨肌腱撕裂的案例得分最低(16.3分)。雖然它在診斷和治療建議上表現優異,但在提供全面資訊和替代治療選項方面仍有不足。不過,它並未提出虛構的治療方案,顯示出其可靠性。總體來看,ChatGPT-4可成為醫生提供病人教育的有用工具。 PubMed DOI

這項研究比較了兩個自然語言處理程式,Isabel 和 ChatGPT-4,在診斷手部及周邊神經損傷的效果。研究中,將16個手部案例的臨床資料輸入這兩個系統。結果顯示,Isabel 正確率為44%,中位排名第二,而 ChatGPT-4 則達到88%的準確率,中位排名第一。大多數手外科醫生偏好 ChatGPT-4 的診斷清單。研究強調,醫生在診斷時應結合臨床判斷與人工智慧工具。 PubMed DOI

這項研究評估了ChatGPT 3.5和4.0生成的病人教育材料(PEMs)在可讀性上的表現,針對常見手部疾病進行分析。研究發現,ChatGPT 4.0在啟發階段後,有28%的內容達到六年級閱讀水平,而3.5則沒有生成合適的內容。整體來看,4.0在所有可讀性指標上均優於3.5,顯示出其在提升病人教育和健康素養方面的潛力,未來隨著進一步改進,這一潛力將更為明顯。 PubMed DOI

這項研究評估了ChatGPT 4o在美國手外科學會(ASSH)自我評估問題上的表現,並與先前版本比較。研究使用2008至2013年的ASSH考試數據,透過OpenAI的API進行統計分析。結果顯示,ChatGPT 4o在增強技術的幫助下,表現與人類考生相當,明顯超越ChatGPT 3.5,且測試的可靠性很高。這些發現顯示,人工智慧,特別是ChatGPT,能有效支持醫學教育和臨床實踐,達到與人類專家相似的評估水平。 PubMed DOI