LLM 相關三個月內文章 / 第 120 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究探討了人工智慧工具,特別是ChatGPT和Google的Gemini,在協助醫療專業人員評估懷疑神經遺傳疾病患者的表現。研究中提出了九十個問題,涵蓋臨床診斷和遺傳風險等主題。結果顯示,ChatGPT的準確性優於Gemini,但兩者都存在診斷不準確和虛假信息的問題。雖然這些AI工具在支持臨床醫生方面有潛力,但使用時需謹慎,並應與專業醫生合作,以確保評估的可靠性。 相關文章 PubMed DOI

抗微生物抗藥性是全球健康的重要議題,亟需創新策略來改善抗生素管理。AI 聊天機器人,特別是大型語言模型,能協助臨床醫師優化抗生素治療。本研究回顧了過去五年相關文獻,發現AI 聊天機器人能提供抗生素建議、增強醫學教育及改善臨床決策,但仍面臨臨床細節管理不一致、算法偏見及數據隱私等挑戰。未來需進行嚴格的臨床試驗及跨學科合作,以確保其安全有效地應用於臨床。 相關文章 PubMed DOI

改善重症監護病房(ICU)中文化少數群體病患及其家屬的溝通非常重要,因為語言障礙可能影響病患安全和家庭參與。目前的翻譯工具如Google Translate和ChatGPT在醫學術語上仍有不足。因此,開發專門針對醫療情境的翻譯工具是必要的,能增強語言少數群體獲得醫療服務的機會。 目前尚無專為ICU設計的AI翻譯應用程式,解決病患隱私和數據保密問題也很重要。針對ICU的人工智慧翻譯工具(AITIC)能提供快速準確的即時翻譯,改善溝通並提升護理品質。 相關文章 PubMed DOI

本研究探討AI模型ChatGPT-4 Omni在非對比電腦斷層掃描影像中檢測顱內出血的有效性。分析240個案例後,發現該模型在識別影像模式上達到100%準確率,但在ICH檢測的準確率為68.3%。敏感性為79.2%,特異性57.5%。在第二次評估中,準確率提升至73.3%。雖然模型在識別影像模式和檢測ICH方面有潛力,但在出血定位和分類上仍有不足,建議進一步訓練以提升其醫療應用表現。 相關文章 PubMed DOI

放射治療雖然有效,但手動劃定目標常常耗時且不穩定。這項研究介紹了Radformer,一種新型視覺語言模型,結合臨床文本和醫學影像,提升自動化的目標劃定。Radformer使用分層視覺變壓器和大型語言模型,並透過視覺語言注意模組整合信息。在2,985名頭頸癌患者的數據中,Radformer在目標劃定上表現優於現有模型,顯示出顯著的準確性進步,為AI輔助的放射治療計劃自動化鋪平道路。 相關文章 PubMed DOI

這項研究探討了努力與任務意義感的關係,涵蓋2,883名參與者的六項研究結果一致顯示,付出更多努力會提升任務的意義感。參與者在想像中付出較高努力時,感受到更強烈的意義感;即使是困難的任務也被認為更有意義。此外,使用ChatGPT的寫作任務中,個人努力的任務被視為更有意義。雖然努力能增加意義感,但效果有限。總體來說,這些研究強調了努力在獲得個人滿足感中的重要性,挑戰了只追求效率的觀念。 相關文章 PubMed DOI

這項研究探討了ChatGPT在提供醫療資訊時,如何根據疾病類型(醫療性 vs. 心理性)和使用者的溝通風格(中立 vs. 表達關心)來調整其回應。研究發現,當面對心理問題或使用者表達關心時,ChatGPT會使用更具同理心的語言;而在中立查詢中則偏向分析性語言。此外,健康相關的語言在心理討論中較常見,疾病相關的語言則多出現在身體狀況的對話中。這顯示ChatGPT的回應會受到疾病類型和使用者情感的影響,能透過調整溝通方式來提升病人的參與感。 相關文章 PubMed DOI

這項研究評估了多款AI聊天機器人在提供前列腺癌(PrCA)決策資訊的效果,包括ChatGPT-3.5、ChatGPT-4.0、Microsoft Copilot等。研究重點在於回應的準確性、完整性、可讀性和可信度,特別針對低識字率族群及高風險的非裔美國男性。結果顯示,雖然資訊準確,但完整性和可讀性各有差異。Microsoft Copilot Pro在標準篩檢問題上表現最佳,而Microsoft Copilot則在低識字率回應中表現突出。總體來說,AI聊天機器人可作為前列腺癌篩檢資訊的輔助資源,但仍需醫療專業指導。 相關文章 PubMed DOI

這項研究顯示大型語言模型(LLMs)在創建虛擬病人(VPs)方面的潛力,能模擬病人與醫師的互動。研究使用OpenAI的GPT模型生成60個針對慢性咳嗽和糖尿病的對話,並評估其真實性和使用者體驗。主要發現包括: 1. **成本效益**:每次對話成本低,具可擴展性。 2. **對話真實性**:評分高,顯示對話現實且有用。 3. **病人偏好**:大多數對話符合病人預期。 4. **模型比較**:GPT-4.0-turbo表現優於GPT-3.5-turbo。 5. **反饋相似性**:醫師與LLM的評分相似。 6. **缺陷識別**:某些特徵影響真實性。 7. **工具驗證**:確認測量工具的可靠性。 總體而言,LLM生成的虛擬病人能有效模擬臨床互動,具成本效益,建議進一步研究以提升對話質量。 相關文章 PubMed DOI

這篇論文探討了對話中的情感識別(ERC)面臨的挑戰,對於創建具同理心的對話系統非常重要。作者指出情感與語義之間的弱相關性,因為相似的短語在不同上下文中可能傳達不同情感。為了解決這個問題,提出了一種新的損失函數Focal Weighted Loss (FWL),並結合對抗性訓練,使用緊湊的MobileBERT模型。這種方法在四個基準數據集上測試,顯示出競爭力的結果,能在資源有限的情況下增強人類互動,與大型語言模型相抗衡。 相關文章 PubMed DOI