LLM 相關三個月內文章 / 第 99 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究評估了大型語言模型(LLMs)在回答結膜炎相關問題的有效性,於復旦大學眼耳鼻喉醫院進行。研究分為兩階段,第一階段四個LLM(GPT-4、Qwen、Baichuan 2和PaLM 2)回答22個問題,專家評估其正確性、完整性等。結果顯示GPT-4表現最佳,Qwen在有用性和安全性上也不錯。第二階段中,30名結膜炎患者與GPT-4或Qwen互動,滿意度高。研究結論認為LLMs能提升患者教育,但需改善個性化和複雜性處理能力。 相關文章 PubMed DOI

這篇論文介紹了一個新的資料集,名為DepressionEmo,專注於分析與憂鬱症相關的八種情緒,使用了6,037篇Reddit長文。資料集透過預訓練模型的零樣本分類進行創建,並經過標註者和ChatGPT的驗證,顯示出良好的評分一致性。研究探討情緒間的相關性,並評估多種文本分類方法,包括機器學習和深度學習模型。雖然BART和BERT的F1 Macro分數相同,但BERT因參數較少被視為最有效。該資料集可在GitHub上公開獲取。 相關文章 PubMed DOI

這篇評論深入探討靜脈血栓栓塞症(VTE)在醫療歷史及現行實務中的情況,並強調人工智慧(AI)在管理上的重要性。文章分析了AI在VTE預防和篩檢的應用,並展望未來的影響。評論指出需進行嚴謹的研究來評估AI的有效性,並提到大型語言模型和生成式AI的潛力與局限性,建議使用合成數據來解決數據挑戰。此外,文章強調AI部署中的倫理、法律和隱私問題,呼籲建立治理框架,並對AI在醫療中的未來持謹慎樂觀態度。 相關文章 PubMed DOI

這項研究評估了基於人工智慧的聊天機器人ChatPDF在生成學術精神醫學文章摘要的效果。研究人員提供了30篇論文,要求聊天機器人創建摘要,並將其與《精神醫學研究》的10篇摘要進行比較。結果顯示,AI生成的摘要在相似性和抄襲率上都很低,但結構化摘要的準確率僅有40%,非結構化摘要則為73%。專家指出,約30%的AI生成結論是錯誤的。總體來看,雖然ChatPDF能有效組織資訊,但對生成摘要的準確性仍需謹慎評估。 相關文章 PubMed DOI

這項研究探討如何利用自然語言處理(NLP)和機器學習(ML)技術,來識別急診部分診筆記中的熱性痙攣,特別針對6歲以下接種疫苗後的兒童。研究強調收集疫苗接種後不良事件數據的重要性,並開發了基準模式匹配方法來分類熱性痙攣。結果顯示,基於變壓器的模型在實時監測中表現優於傳統神經網絡,且足夠的訓練數據對模型效能至關重要。這項研究顯示NLP技術在疫苗不良事件監測中的潛力。 相關文章 PubMed DOI

這項研究評估了五款AI聊天機器人(GPT-4、Claude、Mistral、Google PaLM和Grok)對腎結石相關問題的回答質量。研究透過Google Trends找出熱門搜尋詞,並針對每個機器人提供25個查詢。分析工具包括DISCERN、PEMAT-P等。結果顯示,無一機器人的回答達到理想的可理解性標準。Grok在易懂性上表現最佳,而GPT-4則最難理解。整體來看,這些聊天機器人有潛力改善醫療溝通與病人理解。 相關文章 PubMed DOI

這項研究探討基因組語言模型(gLMs)在蛋白質相關任務上的表現,並與蛋白質語言模型(pLMs)進行比較。研究人員整理了五個數據集,將編碼DNA序列(CDS)與蛋白質連結。結果顯示,gLMs在某些任務上表現優於pLMs,特別是使用檢索的CDS時。此外,聯合基因組-蛋白質模型展現了更佳的表現。研究還開發了一種新的核苷酸變壓器模型,使用3mer標記化,表現優於6mer版本。這顯示gLMs在蛋白質組學中的潛力,並建議統一基因組學與蛋白質組學的方法。作者已公開代碼和數據集。 相關文章 PubMed DOI

這項研究評估了ChatGPT生成的胃腸科資訊的質量與可讀性,特別針對對話式和定義式問題的回應。三位認證的胃腸科醫生使用5點李克特量表評估回應的適當性,涵蓋六個類別。結果顯示,44%的對話式回應和69%的定義式回應被認為適當,但與胃腸急症相關的回應則全都不適當。可讀性評估顯示這些內容需大學程度的閱讀能力。總體而言,雖然ChatGPT能生成一般適合的回應,但在適當性和可讀性上仍需改進,才能成為可靠的醫療資訊來源。 相關文章 PubMed DOI

這項研究評估了ChatGPT 3.5在提供乳癌資訊的有效性。研究人員提出20個常見問題,並根據準確性、臨床一致性和可讀性進行評估。結果顯示,平均準確性得分為1.88,臨床一致性得分為2.79,回答平均字數為310字,但可讀性較差,Flesch Kincaid指數為37.9。研究發現,24%的回答是錯誤的,41%的回答缺乏真實參考文獻,建議病患在依賴ChatGPT獲取醫療資訊時要特別謹慎。 相關文章 PubMed DOI

TRIPOD-LLM 指導方針旨在標準化大型語言模型(LLMs)在醫療領域的報告,針對特有挑戰進行處理。這份擴展的 TRIPOD+AI 聲明包含19個主要項目和50個子項目的檢查清單,涵蓋從標題到討論的各個重要面向。指導方針模組化,適用於不同 LLM 研究設計,並強調透明度和人類監督。用戶可透過互動網站生成 PDF 文件,提升醫療 LLM 研究的質量和可重複性。作者的利益衝突已被披露,大多數作者無相關利益衝突。 相關文章 PubMed DOI