LLM 相關三個月內文章 / 第 75 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

最新的商業大型語言模型(像GPT-4o),在神經影像的中繼資料標註上,表現幾乎跟專業人員一樣好(zero-shot下得分0.91–0.97),錯誤率也差不多,很多分歧其實不是錯誤。這代表LLM很適合大規模自動標註。作者也建議大家建立並分享標註基準資料集,方便未來測試。 相關文章 PubMed DOI 推理

這項研究開發了一個網頁工具,把ACS常用的三種風險評分整合在同一介面,並用AI協助設計。結果顯示,這工具評分和現有系統一致,減少重複輸入、提升效率。證明AI輔助、醫師主導的軟體開發在心血管風險評估上可行又準確,但還需要更多臨床驗證。 相關文章 PubMed DOI 推理

研究人員用GPT-4提出乳癌新藥物組合,選用多種原本非治療癌症的FDA核准藥物,兩兩搭配後進行細胞實驗。結果發現,有些AI建議的組合效果比現有治療還好,顯示大型語言模型在新藥開發和科學假說產生上很有潛力。 相關文章 PubMed DOI 推理

這份研究發現,菲律賓護理科學家認為ChatGPT有助於提升醫療照護,但強調使用時要顧及文化敏感度、語言和資料取得等在地需求,同時也需要新的技能和倫理規範,確保AI應用既安全又包容。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT在協助家長判斷小兒骨科症狀是否需要急診或門診時,大多能給出正確且實用的建議。雖然偶爾會有小錯誤,但整體表現不錯。研究認為,ChatGPT可作為衛教和分流的輔助工具,但不能取代醫師專業判斷,未來還需持續優化和監督。 相關文章 PubMed DOI 推理

這項研究發現,無論是病患還是矯正牙醫,都認為專家的回答最專業、最值得信賴。雖然 ChatGPT-4.0 有些題目表現不錯,但整體還是比不上專家;Microsoft Copilot 的表現則最弱。總結來說,AI 聊天機器人目前在矯正牙科領域,還無法完全取代專業醫師的建議。 相關文章 PubMed DOI 推理

這項研究比較了ChatGPT-4、Gemini Pro和Llama 3.1三款AI聊天機器人在陰莖增大資訊上的表現。結果顯示,Llama 3.1在資訊可靠性和品質上表現最佳,但三款AI的回答都偏難懂,沒有提供容易理解的答案。 相關文章 PubMed DOI 推理

EMTeC 資料庫收錄 107 位英語母語者閱讀由各種大型語言模型產生文章時的眼動追蹤數據,包含原始與處理後資料、模型內部資訊及語言學標註。這些資料有助於閱讀行為研究、模型可解釋性分析和演算法開發,所有資源都可在 GitHub 免費取得。 相關文章 PubMed DOI 推理

研究發現,ChatGPT-4.0在判讀肌肉骨骼腫瘤影像時,主要診斷正確率低於人類專家(44%比87%),但若加上次要診斷,差距縮小(71%比94%)。雖然準確度還不及專家,但因為速度快又隨時可用,未來有機會成為放射科的輔助工具。 相關文章 PubMed DOI 推理

這項研究發現,Microsoft Copilot、Gemini 和 Meta AI 能把燒燙傷衛教資料簡化到國中六到八年級的閱讀程度,有助於讓醫療資訊更容易被一般民眾理解。不過,內容還是需要醫師或臨床人員審查,確保正確性和適合度。 相關文章 PubMed DOI 推理