LLM 相關三個月內文章 / 第 113 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究的目的是評估大型語言模型(LLM)在理解和推理關鍵醫療事件方面的能力,特別是拔管(extubation)。研究人員專注於LLM對表格數據的理解及識別變數重要性的能力。此外,研究還探討了將LLM與現有機器學習模型(如XGBoost)結合使用的潛力,以提升醫療決策的能力。 相關文章 PubMed DOI

您的研究強調了全面評估大型語言模型(LLMs)的重要性,透過結合多個任務和多樣化的評估者來達成。您對四個LLM在八個不同任務上的表現進行評估,並邀請了17位來自不同領域的評估者,這樣的做法讓我們對LLM的性能有更深入的了解。這種方法不僅展示了模型的能力,還突顯了任務和評估者的多樣性如何影響結果,可能提供對LLM熟練度的更細緻見解,並幫助識別其在不同情境下的優劣。 相關文章 PubMed DOI

在希臘進行的研究探討了AI應用程式ChatGPT 4.0在193位不同醫療專科醫生中的實用性與滿意度。參與者與專為其部門設計的聊天機器人互動,並用1到5分評分。結果顯示,普通外科和心臟科醫生的滿意度較低(2.73到2.80),而生物病理學和骨科醫生則較高(4.00到4.46)。這反映出不同專科的需求差異,並指出改善的空間。儘管有些限制,ChatGPT 4.0仍顯示出在醫療領域的潛力,未來有望進一步整合與發展。 相關文章 PubMed DOI

最近大型語言模型(LLMs)在醫療領域的應用引起了廣泛關注,特別是在理解兒童情感方面。本文介紹了一個新框架,結合YOLOv7進行物體檢測和GPT-3.5 Turbo語言模型解讀兒童的藝術表達。透過分析藝術治療圖像,YOLOv7能識別物體,而GPT-3.5則解釋草圖所傳達的情感。實驗結果顯示該框架在物體檢測和情感解釋上表現優異,為父母和治療師提供了寶貴的見解,幫助他們更好地支持兒童。 相關文章 PubMed DOI

系統性回顧和統合分析是循證醫學的重要步驟,對於制定指導方針至關重要。這些過程雖然能夠有效總結研究知識,但因為耗時且勞動密集,更新不易,可能會影響其相關性。為了解決這個問題,我們提出一個框架,利用大型語言模型和自然語言處理技術,來提升系統性回顧的效率,特別是在診斷測試準確性方面。這個框架能自動化篩選階段,減少時間和資源的需求,同時保持回顧的質量,讓系統性回顧能更快回應新證據,提升臨床實用性。 相關文章 PubMed DOI

這個專案開發了一個網路自然語言處理工具,幫助使用者理解西班牙語的同意書和臨床試驗公告。工具基於一個包含14,465個技術術語和70,547個來自可靠資料庫的詞彙庫。團隊從60個CTAs、CFs和病人資訊文件中提取實體,並利用ChatGPT定義新術語,經專家驗證後發現28.99%的定義需修正。測試結果顯示,嚴格匹配F1分數為82.91%,放鬆匹配為94.65%。這個工具可在線訪問,網址是:http://claramed.csic.es/demo。 相關文章 PubMed DOI

這篇論文介紹了一個聊天機器人,目的是提升對MAUDE資料庫中醫療器材不良事件的訪問與理解。這個聊天機器人運用生成式AI技術,能執行計數和搜尋查詢,並透過openFDA API和GPT-4模型解釋用戶的自然語言查詢,生成相關的API調用,還能總結不良事件報告。用戶可透過提供的連結下載原始報告。這項計畫在讓患者安全數據更易於研究者存取和管理方面,具有重要意義。 相關文章 PubMed DOI

這項研究探討生成式人工智慧(AI)在醫學教育中案例學習(CBL)的應用,特別針對中東和北非地區的COVID-19情境。CBL是培訓醫療專業人員的重要方法,能將理論與實務結合。雖然創建有效案例需耗時且具挑戰性,但AI能透過分析大量醫療數據,簡化這一過程,生成多樣的臨床情境。研究顯示,AI生成的案例能提升學習者的參與感與批判性思維,適用於不同教育層級,並呼籲進一步努力以促進其在醫學教育中的應用。 相關文章 PubMed DOI

這篇論文探討大型語言模型(LLMs),如OpenAI的GPT-4,所展現的突現特性,特別是它們被認為的智慧與意識。作者指出,對這些特性的定義不夠清晰,且模型內部推理存在缺陷。智能系統的關鍵在於對環境的反應,這可從行為中推斷。透過哲學現象學和認知生態學,論文分析了GPT-4的錯誤,認為其缺乏人類的時間意識,導致無法形成穩定的感知世界。最終,作者認為GPT-4與使用者共同創造虛構敘事,而非真正理解或擁有意識。 相關文章 PubMed DOI

這項研究提出了一種新方法,稱為混沌LLM基礎的教育問答系統(CHAQS),旨在提升教育領域的智能問答系統。它使用了超過383,000對的教育數據,並在ChatGLM模型上進行了先進的微調,包括p-tuning v2和低秩適應(LRA)。此外,還結合了模糊邏輯和李振盪器,增強模型的適應性和回應變異性。結果顯示,CHAQS的表現優於其他模型,精確度提高5.12%,召回率上升11%,F1分數改善8%。這顯示出複雜調整和模糊邏輯的結合顯著提升了教育問答系統的效能。 相關文章 PubMed DOI