LLM 相關三個月內文章 / 第 10 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究專注於從非結構化的臨床敘述中提取癲癇發作頻率的結構化資訊,對評估治療和病人安全非常重要。研究人員針對兩個任務進行研究:識別發作頻率的短語和提取相關屬性。他們微調了多個模型,包括BERT和生成性大型語言模型如GPT-4。結果顯示,GPT-4在所有任務中表現最佳,發作頻率短語的精確度達86.61%,屬性提取達90.23%。這強調了微調生成模型在臨床文本資訊提取上的有效性。 相關文章 PubMed DOI 推理

這項研究探討顏色與形容詞的聯結如何形成,特別是在先天失明者中,因為他們沒有視覺經驗。研究指出,顏色如紅色與「熱」、藍色與「冷」的聯結,不僅來自視覺,還透過語言學習而來。分析各種語言資料後,研究發現這些聯結在語言中是統計嵌入的。特別是,虛構文本的嵌入在預測這些聯結上比先進模型如GPT-4更有效,顯示語言上下文在不同感知經驗中共享意義的關鍵角色。 相關文章 PubMed DOI 推理

這項研究探討AI生成的健康資訊與CDC提供的資訊差異,重點在情感、可讀性和品質。透過語言期待理論,分析了不同來源內容對可信度的影響。比較了CDC和ChatGPT 3.5各20條資訊,並進行品質評估。 主要發現包括: 1. **情感**:ChatGPT的內容較多負面情感,常出現憤怒、悲傷和厭惡的詞彙。 2. **可讀性**:CDC的訊息更易讀,ChatGPT則需較高閱讀年級。 3. **品質**:CDC的資訊在品質評估中得分較高,顯示更可靠。 研究強調公共衛生專業人員需教育大眾理解AI生成健康資訊的複雜性,並建議健康素養計畫應涵蓋這類內容的品質與可讀性討論。 相關文章 PubMed DOI 推理

這項研究探討審稿人的經驗是否影響他們辨識人類撰寫與ChatGPT生成的摘要的能力。三十位審稿人被分為資深、初級和住院醫師,評估20篇摘要。結果顯示,整體正確識別率為50%,資深審稿人表現最佳,達60%。經驗和對AI的熟悉度與識別率有顯著關聯,顯示經驗在評估AI生成內容時的重要性。 相關文章 PubMed DOI 推理

這項研究提出了一個名為ChatIOS的框架,結合了GPT-4V和多模態預訓練技術,提升了深度學習在口內掃描中進行3D牙齒分割的效果。框架基於Teeth3DS數據集的1,800個掃描,包含約24,000顆牙齒的標註。經過消融研究,ChatIOS在分割質量、處理速度和臨床適用性上明顯優於現有方法,並在約2秒內完成掃描處理,適合正畸和假牙應用。這顯示了GPT-4V在數位牙科的潛力,對於有效的牙科治療至關重要。 相關文章 PubMed DOI 推理

這項研究調查了AI聊天機器人生成的化療相關病人教育材料的質量與可讀性。研究於2024年8月進行,針對四個聊天機器人(ChatGPT、Microsoft Copilot、Google Gemini和Meta AI)提出十個問題。結果顯示,這些材料的平均閱讀年級為13.7,範圍在12.5到14.2之間。 質量評估使用了PEMAT和DISCERN系統,平均DISCERN分數為4.2,顯示出高質量,而PEMAT的可理解性和可行性中位數分別為91.7%和75%。研究指出,雖然AI能生成高質量的材料,但可讀性較差,可能影響病人理解,建議謹慎使用,並強調需進一步研究AI在病人教育中的有效性。 相關文章 PubMed DOI 推理

這項研究評估沙烏地阿拉伯民眾在食源性肉毒桿菌中毒疫情後的知識、風險感知及食品安全處理實踐。調查於2024年進行,共有3,779名參與者,主要為年輕女性。結果顯示30.2%曾遭食物中毒,餐廳是主要來源。知識得分僅3.42,實踐得分3.70,且兩者無顯著相關。年齡、婚姻狀況及過去經歷影響實踐得分。研究強調需加強食品安全教育,並建議利用AI工具提升公眾認識。 相關文章 PubMed DOI 推理

這項研究探討大型語言模型(LLMs)在總結患者在網上論壇和健康社群分享經驗的有效性。研究評估了Flan-T5、GPT、GPT-3和GPT-3.5等模型,並測試不同的提示策略。結果顯示,GPT-3.5在零-shot提示中表現最佳,並在3-shot設置中結合方向性提示時達到最佳效果。手動評估也確認了其摘要的準確性。雖然研究顯示LLMs能提供有價值的質性見解,但也存在數據樣本小和手動摘要僅由一位標註者創建的限制。 相關文章 PubMed DOI 推理

這項研究探討生成式人工智慧(GAI)對耳鼻喉科住院醫師申請個人陳述的影響。研究比較GAI生成的陳述與成功申請者的陳述,並由21位評審進行10分制評分。結果顯示,GAI生成的陳述在真實性、可讀性、親和力和整體品質上均優於申請者的陳述。雖然GAI的陳述被認為結構良好,但評審者對AI生成內容的個人參與感到擔憂,這引發了對個人陳述角色及AI使用倫理的討論。 相關文章 PubMed DOI 推理

系統性紅斑性狼瘡(SLE)是一種複雜的自體免疫疾病,對患者造成長期挑戰。這項研究探討大型語言模型(LLMs)和生成式人工智慧(genAI)在分析醫療紀錄及評估SLE標準的潛力。研究分析了78名患者的紀錄,結果顯示genAI在某些標準的評估上與臨床分類一致,但在其他標準上準確率較低,整體預測成功率為72%。這表明genAI可能成為醫療專業人員評估SLE的有用工具,但仍需改進以提升準確性。 相關文章 PubMed DOI 推理