LLM 相關三個月內文章 / 第 46 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

抗體在免疫防禦和治療中扮演重要角色,其效能透過親和力成熟過程增強。傳統技術測量抗體結合親和力困難,因此我們提出了AntiFormer,一個基於圖形的語言模型,能更準確預測抗體親和力。AntiFormer經過廣泛評估,表現優於現有方法,能快速提供準確預測。它在SARS-CoV-2患者樣本中識別出強中和抗體,並分析流感疫苗反應,揭示年輕人和老年人之間的免疫反應差異。這項研究強調了大克隆型類別在免疫調節中的重要性,顯示AntiFormer在抗體診斷和治療上的潛力。 相關文章 PubMed DOI

大型語言模型(LLMs)在臨床診斷支持上展現了潛力。本研究比較了Bing、ChatGPT和Gemini三個LLMs在處理複雜臨床案例的表現,並評估了一個新開發的評分標準。結果顯示,Gemini的表現最佳,且評分工具的可靠性高,觀察者間變異性低。研究強調不同情境下模型表現的差異,並指出在實施前需評估診斷模型的有效性,為AI在臨床應用的整合提供了新的討論基礎。 相關文章 PubMed DOI

這項研究評估了ChatGPT-4o在模擬歐洲介入放射學委員會(EBIR)考試的表現,正確率達67.0%。GPT-4o還為醫學生和EBIR考生生成不同難度的考題。四位參與者的表現顯示,醫學生在學生級別考題得分46.0%,EBIR持有者在學生級別得74.0%。所有參與者對學生級別考題的正確回答率在82.0%至92.0%之間,顯示其訓練效果良好,且僅有0.3%的考題被認為不合理。總體來看,GPT-4o在模擬EBIR考試及生成考題方面表現出色。 相關文章 PubMed DOI

這項研究評估了 ChatGPT 和 Google Bard 兩個大型語言模型在婦科癌症管理問題上的表現。結果顯示,這兩個模型對於一些常見問題的回答大多準確,如子宮頸癌篩檢和 BRCA 相關問題。然而,面對更複雜的案例時,它們的表現較差,常缺乏對地區指導方針的了解。儘管如此,這些模型仍能提供病人和照護者在管理和後續步驟上的實用建議。結論指出,LLMs 雖無法取代專業醫療建議,但可作為輔助工具,提供資訊和支持。 相關文章 PubMed DOI

這項研究探討了ChatGPT的預測能力,特別是GPT-3.5-turbo和GPT-4,針對韓國敗血症聯盟數據庫的數據,預測成人ICU患者的院內死亡率。研究分析了4,786名患者的7天死亡率和4,025名患者的30天死亡率。結果顯示,GPT-4在7天死亡率的預測上表現較佳,AUROC達0.70-0.83,而GPT-3.5則為0.51-0.70。對於30天死亡率,GPT-4的AUROC範圍為0.51-0.59,顯示出一定的預測潛力。 相關文章 PubMed DOI

這項研究顯示生成式人工智慧,特別是OpenAI的GPT-4 Turbo API,在提升放射學訓練方面的潛力。研究發現,這個AI模型能檢測到的差異明顯多於專業放射科醫師,顯示其在傳統審查中可能被忽略的改進空間。雖然AI在差異檢測上表現優異,但在評分一致性上仍有改進空間。生成的教學要點在85%的案例中被認為適當,顯示其教育價值。未來研究可著重於提高模型準確性及評分者一致性,並探討AI反饋對實習生的長期影響。 相關文章 PubMed DOI

您的研究強調病人教育在心臟衰竭管理中的重要性,並探討像ChatGPT這樣的AI聊天機器人的潛力。您比較了ChatGPT的回應與頂尖心臟病學機構的教育材料,評估了可讀性和可行性。 研究發現,雖然ChatGPT的回應較長且複雜,但可讀性得分仍具競爭力。然而,其可行性得分較低,顯示資訊雖全面,但對病人來說應用不易。 這項研究強調AI在病人教育中的潛力,但也指出需進一步研究以提升這些工具的可靠性和有效性,才能被認可為可信資源。整體而言,您的工作為技術與醫療教育的交集提供了重要見解。 相關文章 PubMed DOI

斜視是常見的眼科疾病,病人教育對於知情決策很重要。本研究比較了三個AI聊天機器人(ChatGPT、Bard、Copilot)和一個可靠網站(AAPOS)在回答斜視相關問題的表現。結果顯示,AAPOS在準確性上表現最佳,其次是Bard、Copilot和ChatGPT。Bard在可理解性和可行性方面得分最高,而AAPOS則在可讀性上最容易理解。情感分析顯示,Bard和Copilot在病人教育上有潛力,但AAPOS在準確性和可讀性上仍優於這些聊天機器人。 相關文章 PubMed DOI

這項研究探討了ChatGPT-4在文獻回顧中的有效性,特別是在醫療法律背景下醫生與病人之間的關係。分析了由GPT-4生成的文獻回顧與人類研究者撰寫的回顧,並根據準確性、反應時間等標準進行比較。結果顯示,GPT-4在反應時間和知識廣度上表現優異,但在深入理解和情境相關性上較弱。研究強調,雖然GPT-4可作為初步工具,但仍需專家評估以提升學術成果的準確性和情境豐富性,特別是在醫學研究領域。 相關文章 PubMed DOI

這項研究探討耳鼻喉科住院醫師選拔中,人工智慧模擬的決策是否受到人口統計偏見影響。研究使用OpenAI的GPT-4和GPT-4o模擬選拔委員會的決策,結果顯示RSC成員在種族、性別和性取向上存在偏見,特別偏好與自己相似的申請者。最新的ChatGPT-4o則顯示出對黑人女性和LGBTQIA+申請者的偏好,強調在選拔過程中需注意和減少這些偏見,以確保未來醫療人力的多樣性和代表性。 相關文章 PubMed DOI