LLM 相關三個月內文章 / 第 54 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究探討自訂生成預訓練變壓器(cGPTs)在眼科的應用,分析了22個相關模型。發現55%為一般用途,青光眼是最常見的子專科。超過一半的cGPTs擁有超出標準GPT-4的知識。指令的相容性評估中位數為3.5,顯示出中等到強烈的代表性,且指令字數與評分有顯著相關性。研究指出cGPTs在對話調整和信息檢索上有潛力,但也需注意可能的安全風險。總體來看,cGPTs在醫療上可能提供更專業的解決方案,但仍需進一步研究。 相關文章 PubMed DOI

對於ChatGPT在腹股溝疝氣修補手術的建議評估,專家與非專家的回應質量差異明顯。專家的評分較低(中位數2),而非專家的評分較高(中位數2),且這差異具統計意義(p < 0.001)。此外,聊天機器人提供的參考資料中,有一半是虛假的。儘管如此,受訪者對神經網絡在臨床決策中的潛力持樂觀態度,並普遍反對限制其醫療應用。因此,建議不要將大型語言模型作為臨床決策的主要資訊來源。 相關文章 PubMed DOI

這項研究評估了ChatGPT在中國國家醫學執照考試中的表現,特別是GPT-3.5和GPT-4.0版本。研究發現,GPT-4.0的及格率為72.7%,明顯高於GPT-3.5的54%。此外,GPT-4.0的回答變異性較低,且在15個醫學子專科中有14個超過準確性門檻,顯示其在醫學教育和臨床實踐中的潛在應用價值。總體而言,GPT-4.0在準確性和一致性上表現更佳,值得進一步探索。 相關文章 PubMed DOI

這篇評論探討了在醫療領域使用像 ChatGPT 這類 AI 模型進行寫作輔助所面臨的倫理問題。儘管技術先進,但仍有不準確、缺乏上下文理解等問題。此外,隱私、數據安全、透明度、偏見和著作權等議題也令人擔憂。評論強調遵循規範和透明度的重要性,若能妥善管理這些挑戰,AI 模型將能在寫作上提供有價值的支持。 相關文章 PubMed DOI

這項研究評估了ChatGPT-4在回答有關尺側韌帶(UCL)損傷的問題時的有效性,並與Google進行比較。研究發現,ChatGPT-4的學術來源比例高達90%,而Google僅50%。兩者在常見問題上有40%的重疊,但在數字回答中,只有20%的答案完全相同。ChatGPT-4的答案準確性顯著高於Google,顯示其在提供臨床相關資訊方面的潛力。不過,在完全應用於臨床前,仍需進一步驗證。 相關文章 PubMed DOI

這項研究探討大型語言模型(LLMs)在臨床筆記段落識別的應用,旨在克服傳統監督方法的限制。研究將段落識別設為問答任務,並評估不同的LLMs,結果顯示GPT-4的F1分數最高,達到0.77,表現優異。最佳的開源模型Tulu2-70b得分為0.64,與GPT-3.5相當。研究指出,雖然微調模型在大數據集上表現穩定,但增加段落識別範例能提升性能。總體而言,LLMs,特別是GPT-4,已接近實際應用於臨床筆記段落識別,並可透過微調進一步改善。 相關文章 PubMed DOI

這項研究探討藥學學生使用ChatGPT的短期學習效果。學生被隨機分為兩組:介入組(15名學生)使用ChatGPT及其他學習工具,對照組(16名學生)則只用其他工具。前測顯示兩組能力無顯著差異(p = 0.28)。研究結束後,調整後的平均分數差異僅0.5分,顯示ChatGPT的效果不明顯。不過,介入組中有較多學生分數顯著提升(4名),對照組只有1名。結論指出,ChatGPT有潛力影響學習,但樣本量不足以顯示顯著效果。 相關文章 PubMed DOI

這項研究探討了人工智慧大型語言模型(AI-LLM)在改善手部和手腕影像學報告可讀性上的效果。研究分析了300份報告,並要求AI用簡單語言解釋。結果顯示,AI生成的報告可讀性顯著提升,達到八年級以下的閱讀水平。X光報告的準確性評分為4.1,CT和MRI則為3.9。雖然AI有少量不準確內容,但整體上顯示出AI-LLM在幫助病人理解醫學影像結果方面的潛力。 相關文章 PubMed DOI

這項研究評估了三個大型語言模型(LLMs)—GPT-3.5、GPT-4 和 Google Gemini(Bard)在回答60道乳腺癌護理相關的多選題的表現。結果顯示,GPT-4的準確率最高,正確回答了95%的問題,接著是GPT-3.5的90%和Google Gemini的80%。研究還發現,來自公共數據庫的問題與乳腺放射科醫師新制定的問題在答案準確性上並無顯著差異,顯示LLMs在乳腺癌護理方面有良好的應用潛力,但仍需進一步訓練以提升表現。 相關文章 PubMed DOI

這項研究評估了大型語言模型(LLMs),特別是Open AI的GPT-4.0和Microsoft Bing的GPT-4,在將非結構化的乳房超音波報告轉換為結構化格式的有效性。研究分析了100份報告,結果顯示GPT-4.0在生成結構化報告、準確分配BI-RADS分類及提供管理建議方面均優於Bing。此外,GPT-4.0在預測良性和惡性特徵的能力也較佳,但仍不及資深放射科醫師。這顯示GPT-4.0在醫療報告處理上具有潛力。 相關文章 PubMed DOI