LLM 相關三個月內文章 / 第 146 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究分析了三款AI聊天機器人(ChatGPT、Perplexity和Gemini)在低背痛相關問題上的可讀性、可靠性和回應質量。研究使用25個常見搜尋關鍵字,評估這些機器人提供的資訊是否易懂且可靠。結果顯示,所有機器人的可讀性均高於六年級水平,表示資訊難以理解。Perplexity在質量評估中表現最佳,但整體而言,這些聊天機器人的回應質量和可靠性都偏低。研究建議未來應提升AI聊天機器人的資訊清晰度與質量,以更好地幫助患者。 相關文章 PubMed DOI

這項研究探討了人工智慧,特別是ChatGPT,如何與人類編碼結合,分析LGBTQ+患者的醫療經驗反饋。研究者希望透過這種混合方法,找出關鍵主題,如肯定性護理、醫療提供者的教育及溝通挑戰。雖然ChatGPT加速了編碼過程,但人類監督仍然對維持數據的完整性和上下文準確性非常重要。這種創新方法不僅提升了對患者反饋的分析,還提供了改善患者與醫療提供者互動的寶貴見解,並且是首個在此背景下結合AI與人類分析的研究。 相關文章 PubMed DOI

這項研究探討英國國民健康服務(NHS)的資料庫使用情況,特別是amber和東米德蘭證據資料庫。研究透過線上問卷和訪談進行,收集了148份回覆,發現38%的參與者曾使用過NHS資料庫。結果顯示,圖書館員的推廣活動對資料庫使用有顯著影響,而ResearchGate是最受歡迎的替代平台。受訪者提到開放存取和知識分享的好處,但對存放過程和綠色開放存取了解不多。研究建議加強認知和機構支持,並呼籲NHS圖書館員積極推廣資料庫。 相關文章 PubMed DOI

這項研究評估了六款人工智慧應用程式在回答脫落牙齒緊急處理問題的表現。測試的應用程式包括不同版本的ChatGPT、Perplexity、Gemini和Copilot。結果顯示,ChatGPT 4.0的準確率最高,達95.6%,而Perplexity最低,僅67.2%。除了ChatGPT 4.0外,其他聊天機器人都不夠可靠。研究建議將國際牙科外傷學會的指導方針納入聊天機器人的資料庫,以提升準確性和可靠性。 相關文章 PubMed DOI

這項研究介紹了 MedS-Bench,旨在評估大型語言模型(LLMs)在臨床環境中的表現,涵蓋11個關鍵臨床任務。我們評估了九個知名的 LLM,發現它們在面對這些任務時表現不佳。為了解決這些問題,我們創建了 MedS-Ins,這是一個針對醫療應用的大規模指令調整數據集,包含58個醫療語料庫和500萬個實例。透過實驗,我們展示了該數據集的有效性,並開發出改進的模型 MMedIns-Llama 3。我們已公開 MedS-Ins,並鼓勵研究社群參與進一步發展。 相關文章 PubMed DOI

這項研究探討大型語言模型(LLMs)在分類與心理健康相關的電子健康紀錄(EHRs)術語的有效性,並與臨床專家的判斷進行比較。研究使用了來自美國50多家醫療機構的數據,分析了因心理健康問題入院的病人EHR。結果顯示,LLM與臨床醫生在術語的廣泛分類上達成高一致性(κ=0.77),但在具體的心理健康(κ=0.62)和身體健康術語(κ=0.69)上則較低,顯示出LLM的變異性。儘管如此,研究強調了LLM在自動化編碼和預測建模中的潛力。 相關文章 PubMed DOI

這項研究評估了OpenAI的ChatGPT-3.5和GPT-4在台灣國家藥師執照考試的表現。結果顯示,GPT-4的準確率為72.9%,明顯優於GPT-3.5的59.1%。在基礎科目中,GPT-4得分更高,顯示其在臨床藥學和教育上的潛力。不過,研究也提醒使用者需謹慎,因為模型仍有局限性。未來應著重改進模型的穩定性和問題設計,以更有效評估學生能力。 相關文章 PubMed DOI

這項研究探討了靈長類動物大腦皮層中腦回和腦溝的分子差異,使用狨猴的全腦原位雜交數據。研究人員運用先進的機器學習和大型語言模型,找出與這些皮層結構相關的基因,並進行基因富集、神經遷移和軸突引導通路分析,探討結構和功能連接的分子機制。結果為皮層摺疊的分子基礎提供新見解,並顯示LLM在理解大腦連接性上的應用潛力。 相關文章 PubMed DOI

生成式人工智慧(GenAI)在心理健康領域展現出重要潛力,能提供個人化的照護與危機預測,但其使用需謹慎考量倫理問題。這期專題專注於GenAI的負責任應用,探討情感識別、治療會議摘要等能力,並強調心理健康數據的敏感性及驗證的重要性。貢獻者指出需解決偏見、透明度等問題,確保AI輔助照護符合倫理。專題提出最佳實踐與監管方法,主張GenAI應輔助人類同理心,而非取代,強調各界合作的重要性。 相關文章 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs)從日本的肺癌放射學報告中提取資訊並進行聚類分析。隨著自然語言處理在醫學領域的應用增加,研究針對非英語醫學數據集的挑戰進行探討。使用MedTxt-RR數據集,研究發現腫瘤大小在73.3%的報告中被準確識別,腫瘤位置和側別則在83%的報告中被識別。結果顯示,無監督的LLM方法在資訊提取和聚類上優於傳統監督方法,顯示出LLM在提升放射學報告效用的潛力。 相關文章 PubMed DOI