原始文章

這項研究比較了兩個人工智慧模型,ChatGPT-4.0 和 Llama 2,在甲狀腺癌診斷與治療的臨床決策輔助上。研究者根據NCCN指引,從58頁中提出167個問題,並標準化詢問這兩個模型。結果顯示,兩者在整體得分和準確性上並無顯著差異,顯示出有限但相似的能力來協助甲狀腺癌的管理。 PubMed DOI


站上相關主題文章列表

研究發現AI程式ChatGPT在協助患者和醫師管理甲狀腺結節上有正面效果。ChatGPT對患者提問的回答大多正確可靠,治療方法也被認為正確、安全且實用。ChatGPT可作為甲狀腺結節患者的有用資源,但不可取代主治醫師的地位。 PubMed DOI

研究使用ChatGPT進行甲狀腺結節風險評估,顯示在預測惡性風險方面有一定潛力,但仍需更多研究驗證臨床應用。整合ChatGPT到臨床工作流程中,有助於提升甲狀腺結節風險評估和病人護理的效果。 PubMed DOI

透過ChatGPT的協助,我們成功開發了一個深度學習模型,用來分析甲狀腺結節的超音波影像和細針穿刺活檢(FNAB)結果。研究共有1,061位參與者,模型在測試中達到0.81的準確度,對良性和惡性甲狀腺病理的區分表現出高精確度和召回率,平衡的F1分數為0.86。這研究顯示了人工智慧,包括ChatGPT,在醫學影像分析深度學習模型上的潛力。 PubMed DOI

最新的自然語言處理和機器學習技術,像是ChatGPT,可能會在醫療保健領域帶來革新。ChatGPT是OpenAI在2022年11月推出的,引起全球矚目。研究顯示,ChatGPT在根據NCCN指南為頭頸癌提供治療建議方面表現出潛力,雖然仍有一些不準確之處。AI模型與醫學專家的合作至關重要,才能運用AI進行個人化的癌症護理。 PubMed DOI

研究評估了ChatGPT-v4在甲狀腺結節管理指南上的效果。結果顯示,它在糾正錯誤回答方面有潛力,但也有一些不一致性。在多重選擇問題上表現較為穩定。總的來說,ChatGPT可能成為甲狀腺結節管理的臨床輔助工具,但在不同類型問題上表現有差異。 PubMed DOI

一項研究評估了聊天機器人ChatGPT在卵巢癌管理方面的表現,並與國家綜合癌症網絡(NCCN)的指引進行比較。研究生成了10個問題,涵蓋風險因素、手術及醫療管理等。結果顯示,NCCN的準確且完整回答為48%,未提示的GPT為64%,經過提示的GPT為66%。GPT-4在風險因素和手術管理上表現優於NCCN,但在醫療管理上較弱。雖然不準確回答比例低,但使用聊天機器人時仍需謹慎。 PubMed DOI

這項研究評估了大型語言模型(LLMs),特別是ChatGPT-3.5和New Bing Chat,在模擬醫生角色管理甲狀腺結節的表現。研究中提出145個病人的問題,並與初級醫生和資深醫生的回答進行比較。結果顯示,這兩個LLMs在某些問題上表現接近初級醫生,但整體準確性較低。雖然ChatGPT-3.5在特定問題上表現較好,但New Bing Chat在甲狀腺結節的決策準確性較高。總體而言,這些LLMs尚未達到人類醫生的臨床決策能力。 PubMed DOI

這項研究評估了ChatGPT在提供甲狀腺癌資訊的準確性和充分性,包括管理方式及情感支持。結果顯示,ChatGPT對甲狀腺癌的資訊掌握良好,正確率達76.66%,但在案例管理上表現不佳,建議多為一般性而非個別化。在情感支持方面,則提供了實用的指導,幫助患者及照顧者適應新診斷。總體來看,ChatGPT在資訊提供上能力中等,但情感支持方面表現有效。這是首個針對ChatGPT在此醫療背景下能力的研究。 PubMed DOI

這項研究評估了 ChatGPT 和 Google Bard 兩個大型語言模型在婦科癌症管理問題上的表現。結果顯示,這兩個模型對於一些常見問題的回答大多準確,如子宮頸癌篩檢和 BRCA 相關問題。然而,面對更複雜的案例時,它們的表現較差,常缺乏對地區指導方針的了解。儘管如此,這些模型仍能提供病人和照護者在管理和後續步驟上的實用建議。結論指出,LLMs 雖無法取代專業醫療建議,但可作為輔助工具,提供資訊和支持。 PubMed DOI

這項研究評估了兩個版本的 ChatGPT—4o 和 4.0—在提供復發性和轉移性頭頸部鱗狀細胞癌 (HNSCC) 治療建議的表現。結果顯示,兩者主要提供手術、緩和醫療或系統性治療的一般建議。ChatGPT 4o 的反應速度比 4.0 快 48.5%。雖然兩者在臨床建議的質量上表現良好,但仍需經驗豐富的醫師進行驗證,因為有時會建議不符合當前指導方針的選項。因此,這些 AI 模型可作為輔助工具,但不應取代臨床判斷。 PubMed DOI