LLM 相關三個月內文章 / 第 10 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

初步研究發現,ChatGPT在兒童牙科診斷和治療規劃的正確率達80%,和部分有經驗的牙醫師差不多,僅比其他兩位醫師低一點(90%)。整體表現沒有明顯差異,顯示ChatGPT有潛力成為兒童牙科的輔助工具,但還需要更多研究來確認。 相關文章 PubMed DOI 推理

2025 年有研究用「蛋任務」測試 ChatGPT-4o 的創造力,發現它雖然能產生比人類更多點子,但大多還是很普通,跟人類一樣有創意偏見,也不太會分辨哪些想法真的有創意。這代表生成式 AI 雖然能幫忙發想,但還是需要人類來挑選最有創意的點子。 相關文章 PubMed DOI 推理

這項研究提出「Panda Act」機器人系統,結合大型語言模型和多模態模型,讓機器人不用額外訓練就能執行新任務。系統會自動產生 Python 程式碼,協調視覺和聽覺,提升機器人適應新情境和環境變化的能力。 相關文章 PubMed DOI 推理

這項研究用合成的腎臟囊腫CT報告,測試五種大型語言模型依Bosniak分級分類囊腫的能力。GPT-4表現最好,few-shot提示下準確率達99%,其他模型也因加入範例而進步。不過,所有模型在Bosniak IIF這類邊界案例上表現較差。整體來說,LLMs有潛力協助標準化分類,但臨床應用還需更多驗證。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4o 和 DeepSeek 在未成熟恆牙牙髓治療問題上的答案比 Gemini Advanced 更準確、內容也更完整,但 Gemini 回答速度最快。DeepSeek 的答案最容易懂,ChatGPT-4o 最難讀。研究建議臨床使用 AI 聊天機器人時,除了答案品質,也要考慮可讀性和回覆速度。 相關文章 PubMed DOI 推理

我們打造了一個專門針對輻射防護教育的聊天機器人,協助醫療人員持續學習。透過精選知識庫和模型優化,能穩定回答放射生物學等相關問題。嵌入模型和相似度門檻設定,讓使用者能快速取得正確、可靠的資訊,不用自己慢慢查資料。 相關文章 PubMed DOI 推理

這項研究發現,五種大型語言模型在批改醫學簡答題時,表現有時能媲美專家,但準確度會因題目、模型和是否參考專家標準而不同。沒有單一模型在所有情境下都最優,且用專家標準不一定有幫助。LLMs雖有潛力協助醫學教育自動評分,但實際應用還是需要專業人員把關。 相關文章 PubMed DOI 推理

這項研究發現,現有AI模型在外科考試表現仍不及專科醫師,最佳的Llama-3也僅接近住院醫師水準,且遇到難題時表現下滑。AI目前適合當作學習輔助,但在高風險醫療決策上,還無法取代專家判斷。 相關文章 PubMed DOI 推理

ARplorer 是一款結合 Python 和 Fortran 的新工具,能自動化並加速探索化學反應途徑。它融合量子力學、規則式方法和大型語言模型,能有效搜尋多步驟反應機制。透過主動學習和平行篩選,大幅提升搜尋效率,已在多種複雜反應中展現高效能,非常適合高通量篩選和催化劑開發。 相關文章 PubMed DOI 推理

這項研究用先進語言模型(ESM),不用傳統序列比對,就能辨識和分類metagenome裡未知的CRISPR-Cas蛋白。結果發現7種新Cas12a亞型和特殊CRISPR基因座,並證實這些蛋白有多樣結構和DNA切割偏好。這方法大幅加快新型Cas蛋白的發現,讓CRISPR生技應用更有發展空間。 相關文章 PubMed DOI 推理