LLM 相關三個月內文章 / 第 13 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這篇評論探討了大型語言模型(LLMs)在眼科應用的倫理影響,分析了47篇相關文章。雖然LLMs在教育、研究、臨床決策和手術協助等方面有潛力,但也存在準確性不足、可能產生有害建議及數據隱私等倫理問題。評論強調在醫療中謹慎整合人工智慧的重要性,需有人的監督和透明度,以維持倫理標準。為了充分發揮LLMs的優勢,必須認識並解決這些倫理挑戰,並促進負責任的使用。 相關文章 PubMed DOI

這項研究評估了GPT-4 V在日本國家臨床工程師執照考試的表現,分析了2012至2023年的2,155道題目。該模型的平均正確率為86.0%,在臨床醫學和基礎醫學領域特別高(≥ 90%)。不過,在醫療設備安全管理等領域的表現較差,正確率僅64.8%到76.5%。涉及圖形和計算的問題準確率更低,特別是需要了解日本工業標準的問題,正確率僅31.0%。研究指出ChatGPT在圖像識別和理解特定標準方面的局限性,使用時需謹慎。 相關文章 PubMed DOI

這項研究探討了ChatGPT 3.5和4.0在提供HIV相關指導時,如何受到種族、族裔、性取向和性別認同的影響,並分析了對污名和歧視的提及。研究人員收集了300個回應,發現ChatGPT 4.0更能認同HIV相關的歧視,特別是針對黑人、西班牙裔、LGBTQ+和跨性別者,並涵蓋了肯定身份、專業護理和社會支持等主題。這些結果強調了評估AI技術在減少健康差異方面的重要性。 相關文章 PubMed DOI

這項研究評估了四款人工智慧聊天機器人對心肺復甦術(CPR)的回應質量,包括ChatGPT-3.5、Google Bard、Google Gemini和Perplexity。研究人員提出100個常見問題,獲得400個回應,並用修改版的DISCERN問卷及其他指標評估其質量。結果顯示,所有機器人的回應可讀性均超過六年級,其中Bard最佳,ChatGPT-3.5最難閱讀。研究指出,提升病人教育材料的質量和可讀性,可能有助於提高理解能力及病人存活率。 相關文章 PubMed DOI

OligoM-Cancer平台的開發目的是為了解決寡轉移性癌症(OMC)的理解與治療挑戰。相較於多轉移性癌症,OMC對局部治療的反應較佳,但相關研究仍然不足,因此需要更系統的比較與個性化治療。該平台提供有關OMC的標記、診斷、預後及治療選項的全面資源,並擁有1345篇文獻和393個相關因素的資料庫。OligoM-Cancer利用現代網路技術,旨在提升數據可解釋性,增強臨床實踐,並支持大型語言模型在OMC領域的應用,促進深入分析與提高治療可靠性。 相關文章 PubMed DOI

知識圖譜(KGs)改變了知識的表現方式,將實體及其關係以圖形結構組織,提升了推薦系統和問答系統的效能。像是Expert.AI的Sensigrafo,專注於透過機器導向的詞彙來增進自然語言理解。不過,維護知識圖譜仍然面臨挑戰,通常需要手動輸入。近期大型語言模型(LLMs)的進展,為自動化知識圖譜的豐富提供了新機會,本文探討了基於LLM的最新技術,並針對數據質量、經濟性、隱私等問題提供見解。 相關文章 PubMed DOI

這項研究評估了一個公開的人工智慧大型語言模型(LLM)在回答模擬病人關於美學乳房整形手術問題的表現。專家根據準確性、全面性等標準評分,總體得分為7.3分,乳房增大7.0分、乳房懸吊術7.6分、乳房縮小手術7.4分,對乳房植入物的知識得分為6.7分。儘管有些限制,研究顯示AI LLM可成為病人教育的有用工具,並可能隨著機器學習進步而改善。 相關文章 PubMed DOI

這項研究開發了一個聊天機器人,目的是協助從全人口基因篩檢中獲得正面結果,並運用大型語言模型。隨著基因檢測需求上升,這項研究希望透過科技創新來解決專家短缺的問題。 聊天機器人透過三步驟的提示工程創建,並在兩個假設情境中進行評估,專家們根據五點量表對八個標準進行打分。結果顯示,總分為3.88,語調和可用性最佳(各4.25分),但程式準確性最低(3.25分)。未來研究將專注於改進提示和設計混合型聊天機器人,以提升基因服務的品質。 相關文章 PubMed DOI

這項研究評估了ChatGPT在提供慢性鼻竇炎(CRS)資訊的有效性,並與醫療指導方針進行比較。研究中提出六個CRS相關問題,結果顯示ChatGPT的回答大致符合現有文獻,但仍有不一致之處。可讀性測試顯示資訊複雜度不同,平均可讀性分數為40.42%。雖然各類別之間可讀性無顯著差異,研究建議ChatGPT可作為醫療資訊的資源,但使用者需謹慎對待其準確性。最後以4級證據評級顯示中等可靠性。 相關文章 PubMed DOI

越來越多患者在網上尋找健康資訊,尤其是像佩羅尼氏病這種敏感疾病。大型語言模型(LLM)聊天機器人展現了提供資訊的潛力,但對於PD的準確性和可讀性仍不明朗。研究評估了四個LLM在回答PD查詢時的資訊質量,結果顯示在有提示的情況下,資訊質量提升至高水平,但平均閱讀水平為12.9年級,超過大多數患者的理解能力。雖然LLM在患者教育上有潛力,但仍需臨床背景和人類提示來提升效果,並需教育患者與醫生如何有效互動。 相關文章 PubMed DOI