LLM 相關三個月內文章 / 第 38 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究評估了GPT-4在預測體外受精(IVF)妊娠結果的準確性,結果顯示其預測準確率為0.79,接收者操作特徵曲線下面積(AUROC)為0.89,均優於原始研究的0.78和0.87。這顯示GPT-4能有效創建和增強IVF成功的預測模型,可能有助於縮短數據科學家與醫療專業人員的距離。不過,仍需進一步研究,使用更大且多樣的數據集來確認這些結果,並擴大其在輔助生殖中的應用。 相關文章 PubMed DOI

這項研究評估了不同人工智慧聊天機器人在心臟科專科考試中的表現,並與人類研究員進行比較。研究使用了88道選擇題,結果顯示所有36名研究員都通過考試,且中位數準確率高達98%。相比之下,聊天機器人的表現參差不齊,只有Jasper quality達到最低通過率73%。大多數聊天機器人的Top-1準確率僅47%,Top-2為67%。只有Jasper quality和ChatGPT plus 4.0通過考試。結果顯示,現階段的聊天機器人在醫學考試中表現不佳,但未來可能會有改進的潛力。 相關文章 PubMed DOI

全球心理健康危機顯示出對可及且有效介入措施的需求,生成式AI聊天機器人如ChatGPT逐漸成為解決方案。針對十九位使用者的訪談研究顯示,他們在使用這些聊天機器人時感受到高參與感和正面效果,包括改善人際關係及從創傷中癒合。研究中識別出四個主題:情感避風港、洞察指導、連結的喜悅,以及AI與人類治療的比較。雖然有些主題與傳統聊天機器人相符,但生成式AI的特性也顯現出來。參與者呼籲改善安全措施及人性化的記憶能力,顯示生成式AI在心理健康支持上有潛力,但仍需進一步研究其安全性與有效性。 相關文章 PubMed DOI

這項研究旨在提升神經生物銀行(NBB)中非結構化神經病理數據的可尋找性、可及性、互操作性和可重用性,並探討大型語言模型(LLMs)的應用。研究針對822名帕金森病捐贈者,開發以腦區和病理發現為中心的數據模型,促進數據轉換為通用數據元素,增進神經科學社群的數據共享。試點研究顯示,LLMs在結構化非結構化報告方面的提取質量可與人工整理相媲美,為PD研究提供了重要資源,並有助於整合臨床和遺傳信息,深化對帕金森病的理解。 相關文章 PubMed DOI

這項研究探討從隨機對照試驗(RCT)中提取樣本大小的挑戰,目的是改善搜尋功能並自動化系統性回顧。研究人員標註了847篇高影響力醫學期刊的RCT,並訓練了一個命名實體識別(NER)模型來提取樣本大小。結果顯示,最佳模型能準確預測64.7%的樣本大小,而GPT-4o模型的預測準確率達90.8%。研究認為,訓練NER模型是可行的,而大型語言模型如GPT-4o也能達到類似效果,但成本較高。 相關文章 PubMed DOI

隨著醫療保健對先進分析的需求增加,合成健康數據的使用變得愈加重要,尤其是在獲取真實健康數據的挑戰下。大型語言模型(LLMs)的進展為生成合成健康數據提供了新機會,但也帶來潛在風險。本文綜述了合成健康數據生成(SHDG)及LLM的研究,探討生成對抗網絡等機器學習模型的現狀與局限性。SHDG面臨的挑戰包括評估指標、數據效率、健康公平等,雖然LLMs在某些方面顯示潛力,但深入研究其優缺點仍然至關重要。 相關文章 PubMed DOI

這項研究評估了兩個AI聊天機器人,ChatGPT-3.5和Google Bard,提供的青光眼手術資訊的質量與可讀性。研究發現,ChatGPT-3.5的適當回答率高達96%,而Google Bard則為68%。不過,在可讀性方面,Google Bard的回答更易於理解,Flesch可讀性評分顯示其得分為57.6,遠高於ChatGPT-3.5的22.6。這顯示出準確性與可讀性之間的權衡,強調了清晰且準確的醫療資訊對患者的重要性,並呼籲進一步研究AI工具在醫療領域的有效性。 相關文章 PubMed DOI

這項研究評估了大型語言模型ChatGPT-4在回答與*Helicobacter pylori*相關問題的表現。研究人員根據臨床指導方針設計提示,並由專家評估回應。結果顯示,ChatGPT-4在回答的長度和一致性上表現良好,專家共識中等。雖然專家對其準確性和實用性評價高,但一般人覺得可理解性較低,醫學生則評價較好。總體來看,ChatGPT-4在此領域顯示潛力,可能成為醫學生的有用資源,但仍需進一步研究以確認其對大眾的有效性。 相關文章 PubMed DOI

基因工程,特別是CRISPR技術的引入,徹底改變了生物醫學研究,讓精確基因修改成為可能。不過,利用這些技術需要深入了解CRISPR及其實驗背景。為此,我們提出CRISPR-GPT,這是一個結合專業知識的大型語言模型,旨在簡化基因編輯實驗設計。CRISPR-GPT能協助選擇CRISPR系統、設計引導RNA、推薦傳遞方法等,並計劃驗證實驗。我們展示了它對非專家研究者的實用性,並探討了自動化基因編輯的倫理與監管影響,強調負責任的實踐。 相關文章 PubMed DOI

這項研究全面探討大型語言模型(LLMs)在生物醫學與健康資訊學(BHI)的應用,強調其變革潛力及面臨的倫理與實際挑戰。透過分析1,698篇研究,發現LLMs在臨床決策支持、病患互動及醫療文件分析等領域的應用顯著增加,預期能提升診斷準確性。研究也揭示機構間的合作動態,特別是在心理健康和神經系統疾病的管理上,顯示出個人化醫療的潛力。儘管LLMs展現出巨大潛力,仍需重視倫理影響及模型驗證挑戰,以確保其在臨床上的有效性。 相關文章 PubMed DOI