LLM 相關三個月內文章 / 第 28 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這篇評論深入探討靜脈血栓栓塞症(VTE)在醫療歷史及現行實務中的情況,並強調人工智慧(AI)在管理上的重要性。文章分析了AI在VTE預防和篩檢的應用,並展望未來的影響。評論指出需進行嚴謹的研究來評估AI的有效性,並提到大型語言模型和生成式AI的潛力與局限性,建議使用合成數據來解決數據挑戰。此外,文章強調AI部署中的倫理、法律和隱私問題,呼籲建立治理框架,並對AI在醫療中的未來持謹慎樂觀態度。 相關文章 PubMed DOI

這項研究評估了基於人工智慧的聊天機器人ChatPDF在生成學術精神醫學文章摘要的效果。研究人員提供了30篇論文,要求聊天機器人創建摘要,並將其與《精神醫學研究》的10篇摘要進行比較。結果顯示,AI生成的摘要在相似性和抄襲率上都很低,但結構化摘要的準確率僅有40%,非結構化摘要則為73%。專家指出,約30%的AI生成結論是錯誤的。總體來看,雖然ChatPDF能有效組織資訊,但對生成摘要的準確性仍需謹慎評估。 相關文章 PubMed DOI

這項研究探討如何利用自然語言處理(NLP)和機器學習(ML)技術,來識別急診部分診筆記中的熱性痙攣,特別針對6歲以下接種疫苗後的兒童。研究強調收集疫苗接種後不良事件數據的重要性,並開發了基準模式匹配方法來分類熱性痙攣。結果顯示,基於變壓器的模型在實時監測中表現優於傳統神經網絡,且足夠的訓練數據對模型效能至關重要。這項研究顯示NLP技術在疫苗不良事件監測中的潛力。 相關文章 PubMed DOI

這項研究評估了五款AI聊天機器人(GPT-4、Claude、Mistral、Google PaLM和Grok)對腎結石相關問題的回答質量。研究透過Google Trends找出熱門搜尋詞,並針對每個機器人提供25個查詢。分析工具包括DISCERN、PEMAT-P等。結果顯示,無一機器人的回答達到理想的可理解性標準。Grok在易懂性上表現最佳,而GPT-4則最難理解。整體來看,這些聊天機器人有潛力改善醫療溝通與病人理解。 相關文章 PubMed DOI

這項研究探討基因組語言模型(gLMs)在蛋白質相關任務上的表現,並與蛋白質語言模型(pLMs)進行比較。研究人員整理了五個數據集,將編碼DNA序列(CDS)與蛋白質連結。結果顯示,gLMs在某些任務上表現優於pLMs,特別是使用檢索的CDS時。此外,聯合基因組-蛋白質模型展現了更佳的表現。研究還開發了一種新的核苷酸變壓器模型,使用3mer標記化,表現優於6mer版本。這顯示gLMs在蛋白質組學中的潛力,並建議統一基因組學與蛋白質組學的方法。作者已公開代碼和數據集。 相關文章 PubMed DOI

這項研究評估了ChatGPT生成的胃腸科資訊的質量與可讀性,特別針對對話式和定義式問題的回應。三位認證的胃腸科醫生使用5點李克特量表評估回應的適當性,涵蓋六個類別。結果顯示,44%的對話式回應和69%的定義式回應被認為適當,但與胃腸急症相關的回應則全都不適當。可讀性評估顯示這些內容需大學程度的閱讀能力。總體而言,雖然ChatGPT能生成一般適合的回應,但在適當性和可讀性上仍需改進,才能成為可靠的醫療資訊來源。 相關文章 PubMed DOI

這項研究評估了ChatGPT 3.5在提供乳癌資訊的有效性。研究人員提出20個常見問題,並根據準確性、臨床一致性和可讀性進行評估。結果顯示,平均準確性得分為1.88,臨床一致性得分為2.79,回答平均字數為310字,但可讀性較差,Flesch Kincaid指數為37.9。研究發現,24%的回答是錯誤的,41%的回答缺乏真實參考文獻,建議病患在依賴ChatGPT獲取醫療資訊時要特別謹慎。 相關文章 PubMed DOI

TRIPOD-LLM 指導方針旨在標準化大型語言模型(LLMs)在醫療領域的報告,針對特有挑戰進行處理。這份擴展的 TRIPOD+AI 聲明包含19個主要項目和50個子項目的檢查清單,涵蓋從標題到討論的各個重要面向。指導方針模組化,適用於不同 LLM 研究設計,並強調透明度和人類監督。用戶可透過互動網站生成 PDF 文件,提升醫療 LLM 研究的質量和可重複性。作者的利益衝突已被披露,大多數作者無相關利益衝突。 相關文章 PubMed DOI

這項研究探討大型語言模型(LLMs),特別是GPT-4和GPT-3.5,如何分析急診部報告以識別與腎結石相關的就診。研究使用標註過的數據集,透過提示優化和微調來提升模型表現。結果顯示,GPT-4的宏觀F1分數達0.833,明顯優於基準系統的0.71,而GPT-3.5則為0.796。研究還發現,GPT-4在種族和性別偏見方面表現良好,顯示出其在臨床文本分析的潛力。 相關文章 PubMed DOI

精準醫療雖然帶來健康上的好處,但也面臨數據管理複雜、跨領域合作需求及專業人員教育等挑戰。為了解決這些問題,整合各領域專家知識至關重要,尤其是計算專家與醫療人員的合作。大型語言模型如GPT-4和Claude 3的出現,讓非專業人士也能接觸複雜數據。斯坦福數據海洋(SDO)透過可擴展的雲端平台,提供AI導師和數據可視化工具,促進教育與研究,特別支持經濟弱勢及邊緣化社群,提升生物醫學研究的跨學科合作。 相關文章 PubMed DOI