LLM 相關三個月內文章 / 第 1 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究比較了外科醫生與大型語言模型(LLM)聊天機器人在解釋白內障手術併發症的效果。結果顯示,外科醫生的回應更清晰且同理心較高,但回應較短;聊天機器人則提供更詳細的解釋,準確性和完整性相似。研究建議透過真實情境和專業數據訓練聊天機器人,以提升其在病人諮詢中的表現。 相關文章 PubMed DOI 推理

在單細胞轉錄組學中,細胞類型註解不一致會影響數據整合與機器學習。為了解決這個問題,我們開發了統一的層級註解框架(uHAF),包含器官特定的層級細胞類型樹(uHAF-T)和大型語言模型驅動的映射工具(uHAF-Agent)。uHAF-T 提供38個器官的標準化參考,促進一致的標籤統一。uHAF-Agent 利用 GPT-4 將多樣的細胞標籤映射到 uHAF-T,簡化協調過程。這個框架增強了數據整合,支持機器學習,並促進單細胞研究的合作。uHAF 可在 https://uhaf.unifiedcellatlas.org 和 https://github.com/SuperBianC/uhaf 獲得,補充數據也可在 Bioinformatics 在線查詢。 相關文章 PubMed DOI 推理

這項研究介紹了Hyper-DREAM,一個創新的行動健康平台,專門用來管理高血壓。經過一年多學科團隊的開發,這個平台強調全面數據收集和增強醫病互動。 在2024年8月,對51位高血壓患者和六位醫生進行了可用性評估。結果顯示,Hyper-DREAM的BP Coach在實用性上超越了其他工具,雖然在清晰度上稍遜於醫生。醫生表示使用後效率提高,與病人的互動更快,工作壓力減輕。 患者對平台的易用性和實用性表示高度滿意,整體上,Hyper-DREAM顯示出在高血壓管理上的顯著優勢,並有助於減輕醫生的工作負擔。 相關文章 PubMed DOI 推理

這項研究探討了使用ChatGPT輔助醫學生學習視網膜色素變性(RP)的效果。研究中142名醫學生被分為兩組,一組使用傳統教材,另一組則使用ChatGPT。結果顯示,兩組的學習成效都有顯著提升,但使用ChatGPT的組別在複習時間上明顯較短,且在解決進階RP治療問題上表現更佳。研究建議結合AI與傳統教學,以提升醫學教育的效率和對罕見疾病的理解。 相關文章 PubMed DOI 推理

這項研究評估了Google的Gemini 2.0 Flash Experimental,這是一個先進的大型語言模型,特別針對內容審核和性別差異的偏見進行分析。與ChatGPT-4o相比,Gemini 2.0在性別偏見上有所減少,女性提示的接受率較高,但對性內容的審核較寬鬆,暴力提示的接受率仍然偏高。雖然性別偏見的改善值得肯定,但對暴力內容的容忍度增加引發了擔憂,可能會使暴力行為正常化。這些結果顯示,人工智慧與倫理標準的對齊仍面臨挑戰,需持續改進以確保審核的透明與公平。 相關文章 PubMed DOI 推理

大型語言模型(LLMs)在醫療保健,特別是胃腸科,展現出提升臨床決策、研究及病人管理的潛力。為了安全有效地應用這些模型,必須解決偏見、幻覺及法規遵循等挑戰。本文提出一個結構化框架,針對C型肝炎治療進行案例研究,涵蓋臨床目標定義、多學科團隊組建、數據準備、模型選擇與微調等步驟。此外,還強調遵循HIPAA和GDPR等法規,以確保負責任的AI應用。未來研究應聚焦於多機構驗證及AI輔助的臨床試驗。 相關文章 PubMed DOI 推理

是的,人工智慧確實能增強國家支持的宣傳活動。最近的研究顯示,生成式人工智慧工具已被用於與國家相關的宣傳網站,像是俄羅斯的網站,提升了製造虛假資訊的能力。研究結果指出: 1. **產出增加**:這些媒體能產生更多虛假資訊,讓錯誤敘事更容易散播。 2. **內容多樣化**:使用人工智慧後,發表的內容量和範圍明顯增加,顯示出更廣泛的宣傳努力。 3. **說服力**:調查顯示,人工智慧撰寫的文章仍具說服力,質量未下降。 總之,生成式人工智慧工具已改變國家支持的宣傳活動,使虛假資訊的散播更有效。 相關文章 PubMed DOI 推理

最近的研究指出,雖然ChatGPT在社會科學的文本標註上有潛力,但其封閉源碼的特性引發了透明度和數據保護的擔憂。相比之下,開源的大型語言模型(LLMs)提供了更好的解決方案。本研究系統性比較了開源LLMs、ChatGPT及傳統監督式機器學習的表現,使用美國新聞媒體的推文數據集進行二元文本標註任務。結果顯示,ChatGPT與開源模型的表現差異顯著,而基於DistilBERT的監督式分類器通常表現更佳。因此,對於重要的文本標註任務,建議謹慎使用ChatGPT。 相關文章 PubMed DOI 推理

這項研究評估了多模態大型語言模型(LLMs)在識別皮膚疾病的應用,並檢視性別和年齡的偏見。研究中使用了ChatGPT-4和LLaVA-1.6,結果顯示它們的準確率和F1分數超過了多個深度學習模型,但仍低於最佳的視覺變壓器模型。值得注意的是,ChatGPT-4和LLaVA-1.6在性別和年齡方面沒有偏見,顯示出在皮膚科應用中的潛力。未來需進一步研究以確保這些模型在醫療中的可靠性與公平性。 相關文章 PubMed DOI 推理

大型語言模型(LLMs)在教育上有潛力,但在高風險考試如牙科入學考試(DAT)的有效性仍不明朗。本研究評估了16個LLMs,包括通用和特定領域模型,針對DAT進行測試。結果顯示,GPT-4o和GPT-o1在文本問題上表現優異,特別是在自然科學和閱讀理解上。然而,所有模型在視覺空間推理方面面臨挑戰。雖然LLMs能增強知識,但在高階認知任務上仍需與教師指導結合,以提升學習效果。 相關文章 PubMed DOI 推理