LLM 相關三個月內文章 / 第 67 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

最新研究發現,像 ChatGPT-4 Omni 這類大型語言模型,在 CPT 和歐洲處方考試的表現跟醫學生差不多,甚至更厲害,特別是在知識和開藥技巧上。這些 AI 還能揪出題目寫不清楚的地方,不只適合當教學工具,也有助於改進考題品質。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4能產生品質不錯、難度適中的解剖學選擇題,學生普遍覺得題目清楚好懂。不過,AI出的題目多偏向記憶型,較難評量高階思考能力。整體來說,GPT-4有潛力協助出題,但還是需要專家審核,才能確保題目涵蓋進階認知層級。 相關文章 PubMed DOI 推理

這項研究用 teacher-student 深度學習架構,從電子病歷放射科報告中抓出癌症相關資訊。teacher 模型先在私院資料訓練,再標註公開或合成資料,讓 student 模型學習。結果發現,student 用同領域公開資料訓練效果最好,用不同領域或合成資料就不理想,顯示有關聯的公開資料對模型轉移和隱私保護很關鍵。 相關文章 PubMed DOI 推理

**重點整理:** 作者們運用多種生成式AI模型,從WHO的疾病爆發新聞報告中萃取出詳細的流行病學資料,並將這些資訊整理成一個名為eKG的知識圖譜。這個全新的資料集和相關工具,讓全球疾病爆發的分析與監測更加進階,也為公共衛生研究帶來新的機會。 相關文章 PubMed DOI 推理

這篇論文推出 M³-20M 超大多模態分子資料集,收錄超過兩千萬個分子,規模比以往大71倍,結合 SMILES、2D/3D 結構、分子性質和文字描述(部分由 GPT-3.5 產生)。實驗證明,用這資料集訓練的模型在分子生成和性質預測上表現更好,對 AI 輔助藥物設計很有幫助。資料集連結:https://github.com/bz99bz/M-3 相關文章 PubMed DOI 推理

用多家醫院資料訓練的深度學習模型,常會學到分辨資料來源而非真正的臨床特徵,導致模型偏誤、泛化能力變差。這種「來源混淆偏誤」在NLP特別明顯。作者提出TAPER和DAPPER兩種新方法,能降低模型辨識資料來源的能力,提升模型在不同資料分布下的穩健性,為解決臨床AI偏誤提供新方向。 相關文章 PubMed DOI 推理

這項研究比較四款免費AI聊天機器人回答肝癌相關問題的表現,發現它們雖然能提供大致正確且無偏見的資訊,但在資料來源、治療細節和說明清楚度上有差異。AI回答可作為參考,但仍需專業醫師把關,不能取代醫療建議。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4o在日本牙體技術師考試的基礎知識題表現不錯,但遇到專業、需要看圖或操作的題目就比較不行。它在牙科材料題的正確率最高,但在矯正和兒童牙科技術題表現較差。整體來說,ChatGPT-4o適合當牙科學習輔助工具,但影像辨識和操作模擬能力還要再加強。 相關文章 PubMed DOI 推理

這項研究用機器學習模型來比對英文和韓文健康問卷的語意相似度,目的是讓不同語言的健康資料更容易統一和標準化。研究發現,SBERT-LaBSE模型在跨語言比對上表現最好。這方法有助於整合多語言健康問卷,但還需要更多資料和領域來驗證。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4在單髁膝關節置換手術資訊的正確性和細節上勝過Google,但用詞較難懂,病人可能不易理解;Google雖然內容簡單易讀,但正確性和細節較不足。未來若能優化AI醫療資訊工具,將有助於提升病人教育與安全。 相關文章 PubMed DOI 推理