LLM 相關三個月內文章 / 第 118 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究探討了GPT-4在識別日本放射學報告中胰臟癌的TNM分級的效果。研究分析了2020年4月至2022年6月的100份CT掃描報告,結果顯示GPT-4在T分類的準確率為73%,N分類91%,M分類93%。與兩位經驗豐富的放射科醫生的協議程度分別為T的0.45、N的0.79和M的0.83。雖然GPT-4對TNM分級有一定了解,但在這個特定情境下的表現仍被認為不足。 相關文章 PubMed DOI

這項研究評估了ChatGPT在回應泌尿科病人訊息的有效性,結果顯示其回應中有47%適合用於病人溝通。分析指出,對於簡單問題,56%的回應被認為可接受;但對於較複雜的問題,只有34%被認可。評估標準包括準確性、完整性、有幫助性、可理解性及潛在傷害。總體來看,雖然ChatGPT能協助管理病人訊息,減輕醫療團隊負擔,但表現會因問題複雜度而異。隨著技術進步,預期其回應品質會進一步提升。 相關文章 PubMed DOI

抗體在免疫防禦和治療中扮演重要角色,其效能透過親和力成熟過程增強。傳統技術測量抗體結合親和力困難,因此我們提出了AntiFormer,一個基於圖形的語言模型,能更準確預測抗體親和力。AntiFormer經過廣泛評估,表現優於現有方法,能快速提供準確預測。它在SARS-CoV-2患者樣本中識別出強中和抗體,並分析流感疫苗反應,揭示年輕人和老年人之間的免疫反應差異。這項研究強調了大克隆型類別在免疫調節中的重要性,顯示AntiFormer在抗體診斷和治療上的潛力。 相關文章 PubMed DOI

大型語言模型(LLMs)在臨床診斷支持上展現了潛力。本研究比較了Bing、ChatGPT和Gemini三個LLMs在處理複雜臨床案例的表現,並評估了一個新開發的評分標準。結果顯示,Gemini的表現最佳,且評分工具的可靠性高,觀察者間變異性低。研究強調不同情境下模型表現的差異,並指出在實施前需評估診斷模型的有效性,為AI在臨床應用的整合提供了新的討論基礎。 相關文章 PubMed DOI

這項研究評估了ChatGPT-4o在模擬歐洲介入放射學委員會(EBIR)考試的表現,正確率達67.0%。GPT-4o還為醫學生和EBIR考生生成不同難度的考題。四位參與者的表現顯示,醫學生在學生級別考題得分46.0%,EBIR持有者在學生級別得74.0%。所有參與者對學生級別考題的正確回答率在82.0%至92.0%之間,顯示其訓練效果良好,且僅有0.3%的考題被認為不合理。總體來看,GPT-4o在模擬EBIR考試及生成考題方面表現出色。 相關文章 PubMed DOI

這項研究評估了 ChatGPT 和 Google Bard 兩個大型語言模型在婦科癌症管理問題上的表現。結果顯示,這兩個模型對於一些常見問題的回答大多準確,如子宮頸癌篩檢和 BRCA 相關問題。然而,面對更複雜的案例時,它們的表現較差,常缺乏對地區指導方針的了解。儘管如此,這些模型仍能提供病人和照護者在管理和後續步驟上的實用建議。結論指出,LLMs 雖無法取代專業醫療建議,但可作為輔助工具,提供資訊和支持。 相關文章 PubMed DOI

這項研究探討了ChatGPT的預測能力,特別是GPT-3.5-turbo和GPT-4,針對韓國敗血症聯盟數據庫的數據,預測成人ICU患者的院內死亡率。研究分析了4,786名患者的7天死亡率和4,025名患者的30天死亡率。結果顯示,GPT-4在7天死亡率的預測上表現較佳,AUROC達0.70-0.83,而GPT-3.5則為0.51-0.70。對於30天死亡率,GPT-4的AUROC範圍為0.51-0.59,顯示出一定的預測潛力。 相關文章 PubMed DOI

這項研究顯示生成式人工智慧,特別是OpenAI的GPT-4 Turbo API,在提升放射學訓練方面的潛力。研究發現,這個AI模型能檢測到的差異明顯多於專業放射科醫師,顯示其在傳統審查中可能被忽略的改進空間。雖然AI在差異檢測上表現優異,但在評分一致性上仍有改進空間。生成的教學要點在85%的案例中被認為適當,顯示其教育價值。未來研究可著重於提高模型準確性及評分者一致性,並探討AI反饋對實習生的長期影響。 相關文章 PubMed DOI

您的研究強調病人教育在心臟衰竭管理中的重要性,並探討像ChatGPT這樣的AI聊天機器人的潛力。您比較了ChatGPT的回應與頂尖心臟病學機構的教育材料,評估了可讀性和可行性。 研究發現,雖然ChatGPT的回應較長且複雜,但可讀性得分仍具競爭力。然而,其可行性得分較低,顯示資訊雖全面,但對病人來說應用不易。 這項研究強調AI在病人教育中的潛力,但也指出需進一步研究以提升這些工具的可靠性和有效性,才能被認可為可信資源。整體而言,您的工作為技術與醫療教育的交集提供了重要見解。 相關文章 PubMed DOI

斜視是常見的眼科疾病,病人教育對於知情決策很重要。本研究比較了三個AI聊天機器人(ChatGPT、Bard、Copilot)和一個可靠網站(AAPOS)在回答斜視相關問題的表現。結果顯示,AAPOS在準確性上表現最佳,其次是Bard、Copilot和ChatGPT。Bard在可理解性和可行性方面得分最高,而AAPOS則在可讀性上最容易理解。情感分析顯示,Bard和Copilot在病人教育上有潛力,但AAPOS在準確性和可讀性上仍優於這些聊天機器人。 相關文章 PubMed DOI