LLM 相關三個月內文章 / 第 46 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究分析了生成式人工智慧在醫學影像領域的偏見,使用了四個AI工具(DALL-E 3、Firefly 2、Stable Diffusion 2.1和Midjourney 5.2)創建了184張圖像,涵蓋391個角色。結果顯示,60.6%的角色為男性,87.7%擁有淺色膚色,顯示出對白人男性的偏見。DALL-E 3和Midjourney 5.2的男性比例較高,而Firefly 2的淺色膚色角色較少。圖像質量方面,DALL-E 3和Midjourney 5.2表現較佳,強調了對AI偏見的批判性評估的重要性。 相關文章 PubMed DOI

隨著心血管疾病、腫瘤等慢性病的增加,研究人員開始探索生成醫療報告的新方法。近期的研究聚焦於利用大型跨模態模型和自然語言生成技術,來縮短視覺數據(如X光影像)與文本之間的差距。為了解決這些挑戰,我們提出了多焦點區域輔助報告生成網絡(MRARGN),結合ResNet-50模型及注意力機制,提升跨模態信息的匹配,並生成詳細的醫學文本描述。實驗結果顯示,MRARGN在醫療報告生成上表現優於多種現有方法,證明其有效性。 相關文章 PubMed DOI

這項研究比較了ChatGPT-4生成的精神科出院摘要與住院醫師撰寫的摘要質量。研究結果顯示,人類撰寫的摘要在整體質量上明顯優於AI生成的,平均評分分別為3.78和3.12。人類摘要在大多數評估項目中表現更佳,且評分者偏好人類版本。AI摘要在40%的案例中出現幻覺,且內容錯誤率較高。雖然AI生成的摘要在簡潔性和正式性上有一定表現,但仍需改進,未來可作為醫生修訂的參考。 相關文章 PubMed DOI

這項研究探討了GPT-4在評估冠狀動脈疾病風險時可能存在的性別偏見,使用了相同的臨床情境來比較男性和女性,其中一些人有精神疾病的共病情況。研究結果顯示,精神疾病的存在可能會影響GPT-4對男性和女性冠狀動脈疾病風險的評估方式。 相關文章 PubMed DOI

這項研究探討如何將大型語言模型(LLMs)整合進證據基礎醫學(EBM),以自動化任務如證據檢索和傳播,來提升臨床決策。研究比較了七個LLMs的表現,結果顯示這些模型在理解和總結方面表現優異,知識引導的提示也顯著提升了效果。不過,在命名實體識別和事實準確性上仍面臨挑戰,需要進一步研究和質量控制才能應用於臨床。研究結果和代碼已在GitHub上公開。 相關文章 PubMed DOI

這項研究分析了四種自然語言處理(NLP)工具在標註胸部放射線報告的準確性及其人口統計偏差。研究期間為2022年4月至2024年4月,評估了CheXpert、RadReportAnnotator (RRA)、OpenAI的GPT-4和cTAKES在MIMIC和印第安納大學數據集上的表現。結果顯示,所有工具整體準確性高,但在不同數據集間有所差異,RRA和cTAKES在MIMIC數據集表現較佳,而CheXpert和GPT-4則在IU數據集上更突出。研究也發現年長患者的錯誤率較高,顯示這些工具在不同人口群體中的表現存在顯著差異,需進一步調查。 相關文章 PubMed DOI

最近,自然語言處理(NLP)領域因大型語言模型(LLMs)的出現而有了重大進展。這些模型基於深度學習架構,如變壓器(transformers),擁有數十億的參數和龐大的訓練數據,能在各種任務中達到高準確度。LLMs不僅在傳統NLP應用上表現出色,還在生物信息學中解決了複雜數據集的挑戰,協助基因組學和藥物發現等領域的研究,為生命科學的新發現鋪路。 相關文章 PubMed DOI

這項研究評估了ChatGPT-4在葡萄膜炎患者教育中的有效性,並與知名醫療網站進行比較。研究分析了八個可信來源的資訊,並由三位專家評估內容的偏好、全面性和準確性。結果顯示,專家偏好ChatGPT-4的標準回應,因為其內容全面且準確性與現有網站相似。簡化回應則更易於理解,適合不同教育水平的患者。總體而言,研究建議ChatGPT-4能有效提供準確的葡萄膜炎資訊,並可根據患者需求調整。 相關文章 PubMed DOI

這篇論文提出了一個創新的框架,旨在利用串流數據以零樣本方式自動擴展醫療本體。框架採用在線和層次聚類方法,無需大量標註數據或專業知識即可整合新知識。主要任務包括從病患論壇中識別和分類醫療症狀,以及將這些症狀組織進現有本體中。透過大型語言模型(LLMs),框架確保症狀準確分類,並降低人類干預需求。論文詳細介紹了框架的開發、實驗和數據可視化,顯示其在改善醫療本體和推進醫療知識系統的有效性。 相關文章 PubMed DOI

這項研究探討如何利用生成式人工智慧(AI)來分類和結構行動健康(mHealth)自我管理計畫,特別針對纖維肌痛症。研究人員根據202名患者的意見,開發了一個線上計畫,並使用ChatGPT-4和Infranodus進行知識圖譜和文本分析,並進行3D視覺化。 結果顯示出關鍵主題,如心理健康、壓力和疼痛管理,並強調「疼痛」與睡眠和壓力的關聯。研究指出內容中的空白,特別是社交聯繫的缺乏。總體而言,生成式AI能有效組織數位治療內容,並強調患者反饋的重要性。 相關文章 PubMed DOI