LLM 相關三個月內文章 / 第 59 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,ChatGPT在青少年特發性脊柱側彎術後照護問題的回答較Google Gemini準確,但兩者在適用性、完整性和溝通能力上差不多。骨科醫師對AI評價高於住院醫師。AI有助於衛教和減輕醫師負擔,但在可靠性和安全性上還有疑慮,目前只能當作初步參考,不能單獨用於臨床決策。未來需多專業合作,才能安全導入骨科照護。 相關文章 PubMed DOI 推理

這項研究比較人類和ChatGPT-4o寫的Cochrane評論白話摘要,讓專家和一般人評分資訊豐富度、可讀性和細節。結果發現,AI寫的摘要在各方面都比人類寫的更好、更容易閱讀,也更受歡迎。評審幾乎分不出哪些是AI寫的。整體來說,ChatGPT-4o產生的摘要表現不輸人類,甚至更優秀。 相關文章 PubMed DOI 推理

這是一則針對 DOI: 10.3389/fmed.2025.1565275 這篇文章的更正通知。 相關文章 PubMed DOI 推理

這份研究調查吉達市420位醫學生,發現多數人知道並用過ChatGPT,成績越好的學生用得越多、態度也更正面。大家普遍認為ChatGPT對學習和研究有幫助,但也擔心隱私和資料安全。研究建議未來要進一步探討如何負責任地把AI工具融入醫學教育。 相關文章 PubMed DOI 推理

這篇研究用大型語言模型(LLM)來萃取可解釋的規則,預測不同分子修飾的Fe-terpyridine MOF催化劑在C(sp³)-H活化反應的表現。結果發現,帶有吸電子或有配位能力官能基的對位苯甲酸鹽能提升催化效果,主要是透過調整催化劑的電子狀態。LLM推導的規則經驗證,準確率達82.6%,展現LLM在催化研究上的潛力。 相關文章 PubMed DOI 推理

這項研究發現,大型生成式語言模型(像Llama2)只要透過簡單的提示設計,就能準確從未結構化的臨床紀錄中擷取資訊,不需人工標註或微調。在零樣本或少量樣本下,GPT模型表現比沒微調的BERT好,有時甚至勝過已微調的BERT,特別適合內容較簡略的紀錄。這顯示GPT模型分析電子病歷既有效又省人力。 相關文章 PubMed DOI 推理

這項研究比較四款主流自動語音辨識系統在救護現場模擬下的表現。雖然 Google 臨床 ASR 整體最好,但在「呼吸道」和「瞳孔」等關鍵醫療資訊上,所有系統都表現不佳。結果顯示,目前 ASR 技術在吵雜、緊急的救護現場還不夠穩定,還需要再改進,暫時不適合用來即時做臨床紀錄。 相關文章 PubMed DOI 推理

LongHealth 基準測試專門評估大型語言模型在處理真實臨床紀錄時的表現。研究發現,雖然部分模型在資訊擷取上還不錯,但在辨識遺漏資訊這方面都不理想,還沒達到臨床安全標準。這個公開的基準測試有助於推動醫療 AI 的改進與發展。 相關文章 PubMed DOI 推理

這篇研究用高解析度Orbitrap質譜儀,搭配特定電壓和自訂分析腳本,成功分離出能判斷甲基分支位置的診斷離子,不用複雜衍生化。方法已在標準品和蜘蛛樣本驗證,還發現新雄性特有甲基醚。這技術也適用於相關醇類分析,但靈敏度略低。 相關文章 PubMed DOI 推理

這項研究發現,OpenAI 的 GPT-4o Mini、GPT-4o 和 GPT-o1 在西班牙醫學考試表現都很優秀,甚至超越頂尖考生,GPT-o1 正確率最高。不過,遇到圖片題和專業題還是會卡關。GPT-o1 也比較會修正錯誤。總結來說,這些 AI 很適合輔助考試和臨床訓練,但還是需要專業醫師把關。 相關文章 PubMed DOI 推理