LLM 相關三個月內文章 / 第 70 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究比較五款主流大型語言模型在植牙專業問題和臨床案例上的表現,發現Gemini-2.0-flash-Thinking在準確性和臨床支援上表現最好。研究建議,牙科臨床應用時應根據實際需求挑選最合適的模型。 相關文章 PubMed DOI 推理

這篇論文提出用大型語言模型自動生成圖片間差異的文字描述,從未標註圖片創造偽標註資料,讓 CIR 在半監督、領域適應等情境下都能有效運作。這方法不只提升效能,也突破傳統監督式或 zero-shot 的限制,在 CIR 基準測試上表現最佳。 相關文章 PubMed DOI 推理

傳統臨床試驗招募流程又慢又沒效率,這篇論文提出用知識圖譜和大型語言模型來自動化初步篩選,包括問卷產生、資格評估和回覆問題。這方法不只準確率高(摘要回覆達90%),也符合法規和倫理,能大幅提升招募速度和效率。 相關文章 PubMed DOI 推理

研究發現,像 GPT-4 這類大型語言模型,在「獨裁者遊戲」這種社會情境下,常會模仿人類的利他行為,但在非社會任務時則偏向自利。只要提示內容強調參與者需求,模型就更容易展現利他反應,顯示 LLMs 能根據指令調整行為,模擬出人類的利他表現。 相關文章 PubMed DOI 推理

這項研究推出GutGPT,一個專為腸胃道疾病設計的AI聊天模型,利用超過19萬筆高品質醫學問答資料訓練而成。GutGPT在診斷準確率和同理心表現都比現有16種模型更好,專家測試診斷率提升近10%,公開資料集提升超過22%。未來有望成為協助醫師和病患管理腸胃疾病的好幫手。 相關文章 PubMed DOI 推理

研究用60題牙髓治療問題測試5款AI聊天機器人,結果ChatGPT-4.0表現最好,正確率最高且穩定(整體82.5%,基礎題95%)。Copilot Pro最差,Gemini和ChatGPT-3.5中等,Gemini有進步但Copilot Pro表現下滑。整體來說,臨床決策支援以ChatGPT-4.0最可靠,其他AI遇到複雜問題時表現較不穩定。 相關文章 PubMed DOI 推理

這項研究開發的「SBDH-Reader」工具,運用GPT-4o和提示工程,能準確從臨床紀錄中擷取六種社會與行為健康資料(如就業、住房、婚姻狀態、物質使用等),F1分數高達0.94–0.99,且不需額外訓練模型。設計彈性高,方便醫療院所有效收集病人重要資訊,實用性很強。 相關文章 PubMed DOI 推理

這項研究用DAIC-WOZ資料集和PHQ-8問卷,測試多種大型語言模型預測憂鬱症狀的能力。結果顯示,GPT-4o在準確率和F1分數上表現最佳,展現LLMs用於文字篩檢憂鬱症的潛力。不同模型對特定症狀偵測各有強項,未來還需進一步研究和微調,才能更好應用在心理健康篩檢上。 相關文章 PubMed DOI 推理

這篇論文提出 ToothMaker,是首個用擴散模型生成牙科X光影像的框架。它能分開處理影像風格和牙齒結構,並結合大型語言模型和超圖神經網路,讓生成的X光影像更真實、多樣。這些影像能有效提升牙科分割和視覺問答的表現,也能減少人工標註的需求。程式碼將於 GitHub 公開。 相關文章 PubMed DOI 推理

這篇論文提出「PIIP」新架構,能有效處理多尺度影像。它針對高解析度影像分配較少參數,降低運算量又維持甚至提升效能。PIIP 結合預訓練模型與創新特徵互動機制,應用在多種視覺和多模態任務都優於現有方法,運算成本也大幅減少。以 InternViT-6B 為例,準確率提升 1–2%,但只需原本 40–60% 運算量。原始碼已開放。 相關文章 PubMed DOI 推理