LLM 相關三個月內文章 / 第 120 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這篇論文推出了 MedReadMe 資料集,裡面有人工作業的可讀性評分和醫療文本中複雜片段的標註。作者分析了 650 種語言特徵,測試多種可讀性指標,發現只要計算專業術語的數量,就能大幅提升預測準確度。資料集和程式碼都會公開,方便大家後續研究。 相關文章 PubMed DOI 推理

這篇論文提出 ReadMe++,是一個包含五種語言、9,757 句並經人工標註可讀性的多語言資料集。這資料集能幫助語言模型在不同領域和語言下評估可讀性,提升模型的泛用性和穩健性。實驗證明,用 ReadMe++ 訓練的模型在跨領域和跨語言的表現都很優秀。資料集和相關 Python 套件都會公開。 相關文章 PubMed DOI 推理

DeepSeek-R1 是開源 AI 模型,和 ChatGPT 不同,它用規則型強化學習,沒經過監督式微調,技術和推理任務表現更好,決策過程也較透明。ChatGPT 則在一般和創意任務較強。兩者各有優缺點,還有資料品質、透明度、隱私和就業等挑戰。未來 AI 會朝多模態和大資料集發展,提升實用性和體驗。 相關文章 PubMed DOI 推理

這篇研究發現,Ken Liu翻譯時會依故事調整風格,展現靈活與文學感;而ChatGPT-4o則風格一致、偏重敘事,雖然清楚但主題深度較弱。研究也提出分析框架,強調人類創意結合AI效率對翻譯有幫助,但譯者和教育者仍需持續調整。 相關文章 PubMed DOI 推理

這篇論文提出用ChatGPT搭配結構化提示語來做內容分析,驗證結果顯示,ChatGPT在辨識量化和質性方法的表現很不錯,但對混合方法和定義不清的分類較弱。這方法能提升編碼效率,也證明AI在內容分析有潛力,但分類要夠明確才有效。整體來說,ChatGPT在這應用上實用性高。 相關文章 PubMed DOI 推理

這項研究比較 GPT-3.5 和 Bard 兩款免費 AI,在大腸鏡篩檢間隔建議上的表現。結果發現 GPT-3.5 準確度雖然比 Bard 高,但兩者和專家指引的符合度都不理想。目前這些 AI 還不適合單獨用來給大腸鏡篩檢建議。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4o用白話文解釋胸腰椎骨折MRI報告,內容大多正確且容易懂,對病人很有幫助。雖然偶爾會因原始報告細節不足而有小錯誤,但整體來說,GPT-4o有助於提升病人對MRI結果的理解,實用性高。 相關文章 PubMed DOI 推理

這項研究發現,大型語言模型(LLMs)能有效協助分析護理師論壇貼文,與人工解讀有約八成相符,且能挖掘更細緻的子主題,有時還能發現人類忽略的重點。LLMs有助於自動化和強化質性研究,但在主題評估上仍有待改進。 相關文章 PubMed DOI 推理

這項研究發現,無論有沒有用 Anki 閃卡額外訓練,GPT-4 在急診醫學專科考試的表現都差不多,且都比 GPT-3.5 好很多。自訂版 GPT-4 並沒有提升答題正確率,代表預設的 GPT-4 已經很適合用來準備急診醫學考試,不需要再額外訓練。 相關文章 PubMed DOI 推理

這篇研究提出KOTI方法,將提示模板插入臨床紀錄的關鍵字附近,能有效提升分類表現,特別是在標註資料很少時。跟傳統把提示放在文本最後相比,KOTI在zero-shot和few-shot情境下,對GatorTron、ClinicalBERT等編碼器模型效果更好,但對解碼器模型則較不穩定。這顯示提示插入位置很關鍵,KOTI有助於資料有限時提升分類準確度。 相關文章 PubMed DOI 推理