LLM 相關三個月內文章 / 第 25 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究評估了兩個大型語言模型,ChatGPT-4 和 Google Gemini,針對視網膜脫落問題的可讀性和準確性。分析了13個不同難度的問題,並由十位專家評分。結果顯示,Google Gemini 較易理解,但 ChatGPT-4 在正確答案上表現更佳,尤其是困難問題。ChatGPT-4 在八個問題上優於 Google Gemini,且在簡單和困難問題上都獲得更高評分。整體而言,這兩個 AI 工具有效提供準確的醫療資訊,建議可增強醫療護理。 相關文章 PubMed DOI

子宮頸癌和乳腺癌對女性健康影響深遠,常因污名化和錯誤資訊導致診斷延遲。為評估ChatGPT對這些癌症的回答準確性,進行了一項線上調查,並與十位醫生的回答進行比較。結果顯示,ChatGPT在準確性上表現優於醫生,但在一致性和可讀性方面仍有待加強。整體而言,ChatGPT在提供初步資訊上具潛力,但未來需改善其可靠性和一致性,以更好地協助有健康問題的個體。 相關文章 PubMed DOI

這項研究探討了慢性鼻竇炎合併鼻息肉的單克隆抗體研究中,利益衝突(COI)的揭露情況。研究分析了2019至2021年間的76篇相關文獻,發現有30篇文章收到了行業支付,但其中70%的文章未揭露COI。未揭露的平均支付金額為4,890美元,顯示出作者中有71.4%未聲明潛在的COI。這些結果顯示,COI的揭露與實際支付之間存在明顯差距,強調了對於COI揭露的教育與實踐需要進一步改善。 相關文章 PubMed DOI

這項研究介紹了iLLMAC,一個經過指令調整的大型語言模型,專注於利用游離DNA(cfDNA)進行癌症檢測。iLLMAC在1,135名癌症患者和1,106名對照組的血漿cfDNA數據上訓練,癌症診斷的AUROC達0.866,肝細胞癌(HCC)檢測則達0.924。隨著末端動機數量增加,性能提升,使用64個末端動機時,癌症診斷AUROC達0.886,HCC檢測AUROC達0.956。外部測試中,iLLMAC仍表現優異,顯示出基於LLM的指令調整在cfDNA癌症檢測中的潛力。 相關文章 PubMed DOI

這段文字探討自然語言在人工與機器互動中的新角色,特別是在生物化學任務上,如性質預測和分子挖掘。作者提出「對話式分子設計」,讓使用者能用自然語言描述和編輯分子。為此,他們開發了ChatMol,一個結合實驗數據和化學知識的生成式預訓練模型。研究證明這種方法的有效性,並提供了未來在分子發現中自然語言互動的見解,相關資源也在GitHub上公開。 相關文章 PubMed DOI

這項研究分析了五種大型語言模型(LLMs)在識別顱面外科手術的CPT代碼的有效性,包括Perplexity.AI、Bard、BingAI、ChatGPT 3.5和ChatGPT 4.0。由於CPT編碼複雜且耗時,尤其在專業編碼人員短缺的情況下,研究旨在評估這些AI模型的效率和準確性。結果顯示,雖然整體準確性差異不大,但ChatGPT 4.0在複雜代碼上表現較佳,而Perplexity.AI和Bard在簡單代碼上更可靠。研究建議這些AI可減輕手動編碼負擔,並提升CPT編碼的資源效率,支持將其整合進臨床流程。 相關文章 PubMed DOI

這項研究評估了人工智慧工具ChatGPT-4V在急性中風診斷中的有效性,透過分析530張MRI影像,包括266例中風和264例正常病例。主要發現顯示,ChatGPT-4V在識別中風影像的準確率為88.3%,正常影像為90.1%。在檢測擴散限制方面,準確率為79.5%,但對於受影響半球的識別僅為26.2%。總體而言,該工具的診斷敏感性為79.57%,特異性為84.87%,顯示其在中風診斷中輔助醫療專業人員的潛力。 相關文章 PubMed DOI

這項研究評估了OpenAI的ChatGPT在波蘭醫學考試中的表現,特別是3.5和4.0版本。分析196道選擇題後,發現3.5版本的正確率為50.51%,而4.0版本提升至77.55%,超過及格線56%。值得注意的是,3.5版本對正確答案的信心較高,而4.0版本則在準確性上表現一致。不同醫學領域的表現差異不大。總體來看,ChatGPT 4.0在醫學教育和評估中展現了潛力,未來版本如5.0預期會有更好表現。 相關文章 PubMed DOI

這項研究評估了ChatGPT-4在腎臟科專業意見上的一致性,並將其回應與平台X的社群投票結果進行比較。經過兩輪測試,涵蓋271個問題,結果顯示第一輪一致性為60.2%(κ = 0.42),第二輪稍微提升至63.1%(κ = 0.46)。內部一致性高達90.4%(κ = 0.86),在穩態調節、腎結石和藥理學等領域表現較佳(κ = 0.53)。總體來看,ChatGPT-4在腎臟科的主流意見重現上有適度能力,但表現因主題而異,顯示出AI在醫療決策中的潛力與限制。 相關文章 PubMed DOI

這項研究評估了ChatGPT-4對原發性甲狀旁腺功能亢進症問題的回答準確性與品質。兩位內分泌科醫生獨立評分,結果顯示診斷的準確性和完整性都很高,治療建議的表現也不錯。整體來看,80%的回答屬於高品質,20%為中等品質。這顯示ChatGPT在醫療領域處理相關問題上具潛力,但使用時仍需注意其限制與風險。 相關文章 PubMed DOI