LLM 相關三個月內文章 / 第 83 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,ChatGPT和Gemini在判斷及表達答案信心時,和人類一樣容易過度自信,但它們不像人類會根據過去表現調整信心,顯示後設認知能力有限。 相關文章 PubMed DOI 推理

Longevity Games Interview Simulator 利用AI(如GPT-4o、Claude-3.7)幫助大學生在模擬情境下練習訪談長者,提升訪談技巧、同理心及倫理意識。工具內含問題設計、指引、小測驗和反思練習。初步試用顯示護理系學生自信和準備度明顯提升,也適合其他教育場合,並鼓勵教師自行開發類似AI工具。 相關文章 PubMed DOI 推理

Barthes 認為作者只是把現有文化元素重新組合,這跟大型語言模型(LLM)產生文本的方式很像。既然健康專業教育和學術界的寫作多是機械性工作,這些任務其實可以交給 LLMs 處理,讓研究人員更專注在原創和創意貢獻上。 相關文章 PubMed DOI 推理

傳統NLP方法在醫療文本NER表現不佳,精確度有限。BERT、ClinicalBERT等transformer模型明顯提升效果,F1分數超過97%。目前多數研究來自中美,這對像巴西SUS等醫療系統整合NER技術很有幫助。持續追蹤NER技術進展對醫療應用相當重要。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4產生的全膝關節置換術衛教資料,品質和可靠性跟人類專家差不多,但內容較難懂、親近性較低。目前還不建議直接用ChatGPT-4來寫病人衛教資料,除非能提升可讀性。建議AI開發者和醫療人員合作,讓AI產出的衛教資訊更貼近民眾需求。 相關文章 PubMed DOI 推理

這篇論文用模型預測美國、瑞典、印度和中國未來可能遇到的結構性問題,強調財政壓力和社會支出增加,而非Turchin預測的政治危機。作者認為,勞動人口減少會帶來財政危機和社會緊張,尤其中國最明顯。論文也展示AI工具如何比較不同預測模型,並擴大分析到西方以外國家。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4在回答眼眶疾病問題時表現優於醫學生,但還不及眼科醫師。隨著持續訓練,GPT-4等大型語言模型有望成為醫學生和醫師的輔助工具。 相關文章 PubMed DOI 推理

這項研究發現,雖然WildfireGPT這類通用AI聊天機器人取得方便、適合討論,但在預測野火火災輻射能(FRP)時,精確度明顯不如專業的TabNet模型。TabNet能結合最新天氣數據,預測效果更好。結果顯示,專業任務還是要用專業模型,單靠通用AI有風險。 相關文章 PubMed DOI 推理

這項研究提出用「句子驚奇度」和「句子相關性」來評估整句話的理解難度,並用多語言大型語言模型計算。結果發現,這些句子層級的指標比傳統的逐字分析更能準確預測閱讀速度,也更能解釋不同語言的閱讀困難。這些方法不僅好懂,表現也更好,有助於深入了解人類如何理解句子,並推動語言模型與認知科學的結合。 相關文章 PubMed DOI 推理

這個網頁電子學習工具用GPT-4-turbo模擬牙科病患對話,幫助牙醫系學生練習牙髓病診斷。學生用三個月後,覺得診斷信心和技能都有進步,大多數人也推薦繼續使用,顯示AI互動學習對牙醫教育很有幫助。 相關文章 PubMed DOI 推理