LLM 相關三個月內文章 / 第 76 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,GPT-4在回答眼眶疾病問題時表現優於醫學生,但還不及眼科醫師。隨著持續訓練,GPT-4等大型語言模型有望成為醫學生和醫師的輔助工具。 相關文章 PubMed DOI 推理

這項研究發現,雖然WildfireGPT這類通用AI聊天機器人取得方便、適合討論,但在預測野火火災輻射能(FRP)時,精確度明顯不如專業的TabNet模型。TabNet能結合最新天氣數據,預測效果更好。結果顯示,專業任務還是要用專業模型,單靠通用AI有風險。 相關文章 PubMed DOI 推理

這項研究提出用「句子驚奇度」和「句子相關性」來評估整句話的理解難度,並用多語言大型語言模型計算。結果發現,這些句子層級的指標比傳統的逐字分析更能準確預測閱讀速度,也更能解釋不同語言的閱讀困難。這些方法不僅好懂,表現也更好,有助於深入了解人類如何理解句子,並推動語言模型與認知科學的結合。 相關文章 PubMed DOI 推理

這個網頁電子學習工具用GPT-4-turbo模擬牙科病患對話,幫助牙醫系學生練習牙髓病診斷。學生用三個月後,覺得診斷信心和技能都有進步,大多數人也推薦繼續使用,顯示AI互動學習對牙醫教育很有幫助。 相關文章 PubMed DOI 推理

大型語言模型(像GPT-4、Gemini、Copilot)能把生殖遺傳學的衛教資料簡化到國中一年級左右的閱讀程度。雖然這些模型都能提升可讀性,但GPT-4在保留正確性和完整性上表現最好。不過,專家審查和病患回饋還是很重要,才能確保資訊正確且實用。研究團隊也開發了免費的PEM簡化和可讀性分析工具,方便臨床使用。 相關文章 PubMed DOI 推理

最新研究發現,通用型大型語言模型(LLMs)在整理電子病歷資料上,比專門醫療LLMs更精準。把這些LLM整理出的資料用在放射治療病人的存活預測模型後,預測準確度和風險分層都明顯提升,也讓模型更好理解,幫助醫師避免對壽命有限的病人做不必要的治療。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT在手外科論文審稿品質上表現比真人審稿者更好,但它的發表決策常和期刊不同。若有嚴格監督,ChatGPT能提升審稿流程,但還是需要人工把關,避免出錯。 相關文章 PubMed DOI 推理

這項研究比較 ChatGPT、Gemini、Copilot 和 Claude 四款大型語言模型在回答上眼瞼整形手術問題的表現。結果顯示,ChatGPT 在醫學正確性和臨床相關性上表現最好,尤其在術後照護方面最突出。不過,所有模型的回答都偏向學術性,對一般民眾來說可能太難懂。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4 在回答口腔病變臨床選擇題時,整體正確率達 87.4%,簡單題最高、困難題最低。雖然表現不錯,但建議只能當作輔助工具,不能單獨用來做診斷,還是要有臨床醫師把關比較安全。 相關文章 PubMed DOI 推理

研究人員用大型語言模型分析電子健康紀錄,開發出一套早期偵測胰臟癌的預測工具。這個模型的準確度(AUROC最高0.89)比傳統方法好,還能找出沒有家族史或基因風險的高危險群。顯示這種AI工具有機會幫助更早發現胰臟癌患者。 相關文章 PubMed DOI 推理