LLM 相關三個月內文章 / 第 20 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這篇文獻回顧分析了多囊性卵巢症候群(PCOS)女性使用各種數位科技工具(如App、網路平台、社群媒體等)來獲取知識、自我管理及尋求社會支持的經驗。雖然這些工具有助於自我管理,但在資訊可靠度、功能、互動性及文化適切性等方面仍有待加強。建議未來設計更貼近使用者需求,並讓PCOS女性參與開發。 相關文章 PubMed DOI 推理

DeepSeek-R1 是一款開源大型語言模型,醫療診斷表現和 GPT-4 差不多,正確診斷率分別為 35% 和 39%。不過,DeepSeek-R1 把正確診斷列入鑑別診斷的機率較低,且清單較長但多元。整體來說,DeepSeek-R1 準確度不輸 GPT-4,且有開源優勢,但在診斷排序上還有進步空間。 相關文章 PubMed DOI 推理

AI正快速改變生物醫學資料分析,能自動產生程式碼和視覺化結果,大幅提升效率與透明度。未來應以人為本,讓AI輔助專家決策,而非只讓人類配合AI。這帶來更強大、互動且易解釋的視覺化,但也會遇到信任、透明度和專業角色轉變等挑戰。 相關文章 PubMed DOI 推理

這篇論文提出 AttrDD,一種專為視覺-語言模型設計的階層式少量樣本微調框架。它先用微調後的模型縮小到最容易混淆的幾個類別,再用大型語言模型產生屬性描述來細分。這種兩階段、以屬性為主的方法,搭配輕量級 adapter,不只提升微調效率,在多項基準測試上也優於現有方法。 相關文章 PubMed DOI 推理

這篇論文提出 CoS-PIL,一個輕量級影像情境辨識框架,不用微調大型多模態語言模型,只靠設計好的提示語和逐步推理流程,預測影像中的動詞、名詞和角色。它還用 chain-of-interest predictor 萃取關鍵資訊,提升辨識準確率。實驗結果在 SWiG 基準上表現優於現有方法。程式碼已開源。 相關文章 PubMed DOI 推理

這份指南回顧並比較三種心理學構念的向量化方法:用單字清單、問卷和有標記範例。作者指出,若要分析不同文本類型,建議用單字清單;若文本和問卷內容接近,則用問卷;有大量標記資料時,則用標記範例。指南也提醒研究者注意嵌入模型的特性和潛在方法問題。 相關文章 PubMed DOI 推理

這篇研究發現,用GPT-4o等大型語言模型產生的子宮頸癌選擇題,品質和臨床醫師出的差不多,難易度也相近,臨床醫師不太能分辨題目來源。不過,醫師出的題目在高層次思考上還是比較強,專家也比較能分辨AI題目。總結來說,AI能有效輔助出題,但複雜題目還是需要專業醫師把關。 相關文章 PubMed DOI 推理

研究發現,AI產生的醫學選擇題在難度和鑑別度上跟人類寫的差不多,整體品質也很高。不過,AI出的干擾選項效果比新手差一點,但跟專家差不多。總結來說,AI能出不錯的題目,但還是需要人類幫忙審查,才能讓選項更有品質。 相關文章 PubMed DOI 推理

研究發現,ChatGPT-4已能寫出接近高影響力期刊標準的科學論文討論與結論段落,專家評分僅略低於人類,且多數認為大幅修訂後可發表。不過,AI仍有過度套用模式及產生錯誤或虛構文獻的疑慮。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT回答眼瞼手術常見問題時,內容大致正確且有幫助,但用詞偏高中程度,部分病患可能覺得難懂。不同問題類型的可讀性差不多。總結來說,ChatGPT能提供實用資訊,但答案不一定完全正確,也未必人人都看得懂。 相關文章 PubMed DOI 推理