LLM 相關三個月內文章 / 第 108 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究探討大型語言模型(LLMs)在法醫傷害評估中的挑戰,因為這領域需要特定知識和準確的信息檢索。作者提出結合檢索增強生成(RAG)、圖形知識庫和深度學習技術,以提升LLMs根據中國《身體傷害程度評估標準》的評估能力。他們建立了一個包含26,199個傷害案例的數據集,並開發了RoBERTa-CNN模型來準確分類傷害。結果顯示,這種方法顯著提高了九個LLMs的準確率,並在犯罪分類中展現多樣性,證明了結合領域知識和先進技術的有效性。 相關文章 PubMed DOI 推理

這項研究評估了九個大型語言模型(LLMs)在醫學領域的表現,特別是在臨床化學和實驗室管理方面。使用零-shot提示法測試109個臨床測驗,結果顯示GPT-4o的準確率最高,達81.7%,其次是GPT-4 Turbo(76.1%)和Claude 3 Opus(74.3%)。這些模型在數字和計算任務上表現優異,顯示出它們能有效運用現有知識協助醫療專業人員進行決策,未來有潛力成為醫療輔助工具。 相關文章 PubMed DOI 推理

肝脂肪變性(脂肪肝)是嚴重肝臟疾病的前兆,會增加健康風險。這項研究探討大型語言模型(LLMs)在急診影像報告中識別肝脂肪變性的潛力。研究分析了200名成人的CT掃描,使用三種Azure OpenAI模型(ChatGPT 3.5、4和4o)進行檢測。結果顯示,這些模型的準確率高達96.2%至98.8%,且評估者間的可靠性極高。研究認為,LLMs能有效識別影像報告中的異常,對早期疾病介入有重要意義,並簡化電子病歷分析過程。 相關文章 PubMed DOI 推理

這項研究旨在開發機器學習和深度學習模型,自動化根據臨床轉診文本制定緊急腦部MRI掃描的協議。研究分析了2016至2019年間的1,953份轉診,並由神經放射科醫師提供參考標準。使用了三種機器學習演算法和兩個深度學習模型,結果顯示GPT-3.5模型在協議預測上達84%準確率,對比劑需求判斷達91%。研究證明這些模型能有效自動化MRI掃描協議的制定,結果已發表。 相關文章 PubMed DOI 推理

這項研究評估了ChatGPT在斜視醫療方面的準確性與可讀性,使用了免費版(3.5)和付費版(4.0)。共提出34個問題,並在加州和佛羅里達州的三個時間點進行評估。結果顯示,64%的回應被認為是「可接受的」,但根據版本和地點有所不同。佛羅里達州的回應更可能被評為「不準確且可能有害」。整體來看,雖然大部分回應可接受,但準確性和可讀性仍需提升,以增強對斜視家長和病患的實用性。 相關文章 PubMed DOI 推理

AICHECK的研究評估了ChatGPT在生成持續醫學教育內容的有效性,特別針對痤瘡的回應與NICE指導方針進行比較。研究使用23項問卷,由五位皮膚科醫生評估ChatGPT版本4的輸出。結果顯示質量、可讀性和全面性評分高,但準確性和與指導方針的一致性較低。雖然參考文獻的相關性和適切性獲得好評,但僅62.3%被認為是最新的。研究強調對於有爭議的主題,AI生成內容需嚴格評估和專家監督,以確保準確性。 相關文章 PubMed DOI 推理

這項研究強調了先進的大型語言模型(LLM),特別是Pro-PRIME模型,在增強結合生長激素的VHH抗體的穩定性方面的成效。考慮到蛋白質常需在極端環境中運作,研究探討了設計更高穩定性和功能性蛋白質的挑戰。經過兩輪設計,成功產生了一種突變抗體,具備更好的熱穩定性、極端pH抵抗力及更強的結合親和力。這是LLM設計的蛋白質產品首次成功應用於大規模生產,顯示其在蛋白質工程上的潛力。 相關文章 PubMed DOI 推理

最近大型語言模型(LLMs)如GPT-3.5和GPT-4在醫療領域的應用引起關注。本研究比較了這些模型在註解放射學報告及生成胸部CT印象的表現,旨在協助醫療專業人員處理日常文檔任務。研究使用了上下文學習和檢索增強生成等方法,並透過多種指標進行評估。結果顯示,GPT-4在性能上優於GPT-3.5,且提示設計對結果影響顯著。研究建議在醫療實踐中整合這些先進模型,以提升文檔效率與準確性。 相關文章 PubMed DOI 推理

這項研究探討生成性人工智慧(GenAI)在心理治療中的應用,特別是透過敘事治療和認知行為治療的外化技術。研究者開發了兩個AI工具:VIVI,用於生成代表病人內心經驗的圖像;DIVI,促進對話角色扮演以互動。這些工具作為「人工第三者」,增強治療師與病人之間的關係,但也面臨同理心缺失和文化偏見等挑戰。為解決這些問題,作者提出了SAFE-AI協議,提供負責任使用AI的指導方針,並鼓勵未來研究評估其在不同族群和環境中的有效性及倫理影響。 相關文章 PubMed DOI 推理

這篇論文介紹了一個新工具 SEMbeddings,結合微調的嵌入模型與潛在測量模型,能在實際數據收集前評估項目反應數據的適配度。作者將其應用於 VIA-IS-P 問卷,分析了 31,697 名參與者的回應,結果顯示項目嵌入的餘弦相似度與實證相關性有顯著關聯 (r = 0.67)。論文也提到,傳統適配指標可能不夠準確,但修正指標能提供潛在不適配的見解,對於問卷開發有幫助。隨著大型語言模型的進步,這些方法有望提升新問卷的開發效率。 相關文章 PubMed DOI 推理