LLM 相關三個月內文章 / 第 111 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,ChatGPT-4.0對肺癌及手術常見問題的回答,經胸腔外科醫師評分後,在正確性、清楚度和準確性上表現都很優秀,尤其手術相關問題更佳。雖然ChatGPT適合當作病人教育工具,但臨床決策還是要和醫師直接討論,不能完全取代專業建議。 相關文章 PubMed DOI 推理

最新系統性回顧發現,GPT-4在眼科專科考題的正確率達73%,明顯優於GPT-3.5的54%。GPT-4答文字題表現較佳(77%),圖片題則較弱(55%),英文和非英文環境下表現差不多。不同主題正確率落差大,最高是General Medicine(80%),最低是Clinical Optics(55%)。整體來說,GPT-4雖有進步,但圖片分析和語言穩定性還需加強。 相關文章 PubMed DOI 推理

這篇研究詳細介紹癌症中心如何建立和管理專屬腫瘤醫學的AI治理模式。該中心一年內監控了26個AI模型、2個AI試點,並審查33個風險預測工具。論文分享了實用治理工具和快速審查流程,也討論實際案例與經驗,並指出尚待解決的問題,期望為其他機構導入AI於癌症照護提供參考。 相關文章 PubMed DOI 推理

這篇研究比較多種先進的文字嵌入模型,評估它們在建築專業術語分類上的表現。結果發現,模型規模大不一定效果最好,強調針對特定領域調整模型很重要。研究也開放了評測工具,方便後續研究使用。 相關文章 PubMed DOI 推理

這篇回顧分析156篇LLM在臨床和外科的研究,發現多數屬於概念驗證階段,應用於資料擷取、臨床建議、報告產生和病人聊天機器人。常見模型有ChatGPT、BERT等。僅四分之一認為LLM已準備好臨床應用,多數強調還需更多驗證。模型和評估方式差異大,建議建立標準化框架以確保安全有效整合。 相關文章 PubMed DOI 推理

這個研究用AI來評分藥學OSCE,結果發現AI的準確率超過93%,而且比老師評分還要穩定、不會有太大差異。AI評分39位學生只花不到五分鐘,效率遠勝人工,展現出AI在客觀性和速度上的明顯優勢。 相關文章 PubMed DOI 推理

這項研究提出一種新型深度學習架構,能從胸腔X光自動產生放射科報告,強調解釋性與準確性。模型先用多標籤分類找出透明的關鍵字,再結合自動調整和頻率策略處理罕見詞,最後由大型語言模型生成高品質報告。實驗結果顯示,這方法在IU-XRay和MIMIC-CXR資料集上表現優於現有技術,提升自動化報告的可靠性與可解釋性。 相關文章 PubMed DOI 推理

這篇研究提出 ShareBERT,透過重複利用 embedding matrix 來學習 hidden layers,大幅壓縮 BERT 參數到 500 萬(縮小 21.9 倍),但準確率還有 95.5%,而且沒用 knowledge distillation。這方法在不同模型和任務上都很穩定,也能跟其他壓縮技術搭配,特別適合資源有限的裝置。程式碼在:https://github.com/jchenghu/sharebert 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT在提供女性健康資訊時,大多能給出正確又容易理解的答案,尤其用對話方式問效果更好。不過,答案品質還是會受提問方式影響。未來若有醫療專業設計的提問指引,AI健康資訊會更可靠、更方便取得。 相關文章 PubMed DOI 推理

這項研究用ChatGPT 3.5製作口腔癌篩檢說明單,給布達佩斯的無家者看。23位參與者覺得AI寫的內容大致能懂,也願意讓AI用在醫療,但覺得用詞太專業、句子太長,還有些內容有刻板印象。整體來說,說明單對他們來說還是太難懂。參與者也願意一起改進內容,讓資訊更清楚、更吸引人。 相關文章 PubMed DOI 推理