LLM 相關三個月內文章 / 第 16 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究評估了ChatGPT 3.5在傳染病藥物治療問題上的回應質量,並由專家進行評估。結果顯示,只有41.8%的回應被認為有用,且雖然回應的正確性和安全性較高,但完整性不足。專家對回應的共識一般,對正確性和安全性則相當一致。總體來看,GPT-3.5的回應雖然正確且安全,但無法取代傳染病藥師的專業知識。 相關文章 PubMed DOI

將人工智慧(AI)應用於重症醫療能提升病患照護,但AI模型中的偏見可能影響多樣性與公平性。本研究分析了兩個AI圖像生成模型(Midjourney和ChatGPT DALL-E 2)所產生的重症醫師圖像,並與美國勞動力數據比較。結果顯示,這些模型過度代表白人和年輕醫師,且女性比例偏低。研究強調在醫療領域使用AI時,必須重視公平性、透明度和倫理問題,以避免強化刻板印象。 相關文章 PubMed DOI

這項研究評估了四種大型語言模型(LLMs)在生成冠狀動脈電腦斷層血管造影報告的CAD-RADS分數的表現。結果顯示,ChatGPT-4o的準確性最高,達87%,而ChatGPT-3.5雖然速度最快,但準確性最低,僅50.5%。Google Gemini Advanced的準確性為82.6%,而Google Gemini的失敗率較高,達12%。總體來看,雖然這些模型展現潛力,但在臨床應用前仍需改進。 相關文章 PubMed DOI

這項研究提出了一種名為EvoScan的方法,旨在有效探索蛋白質序列與功能之間的關係。透過識別高維序列空間中的關鍵特徵,EvoScan幫助研究人員找到重要的錨點,並可應用於各種生物分子功能。 為了進一步探索序列空間,研究人員開發了深度學習和大型語言模型,能從錨點重建序列空間,預測新穎的高適應性蛋白質序列。這種混合方法EvoAI在抑制蛋白上測試,結果顯示僅82個錨點就能將序列空間壓縮10^48倍,對生物分子設計及自然進化過程提供深入見解。 相關文章 PubMed DOI

大型語言模型(LLMs)在提升醫療服務上潛力巨大,但也帶來不少風險。主要擔憂在於這些模型可能根據不公正的標準來分配資源,涉及金融交易、線上行為、社交互動和醫療記錄等多種數據。研究指出,LLMs 可能顯示偏見,優先考量集體利益,卻犧牲個人權益,這可能為基於人工智慧的社會信用系統鋪路,進而引發醫療及其他領域的倫理與隱私問題。 相關文章 PubMed DOI

整合生物醫學知識對改善醫療診斷和個人化治療至關重要,但面臨數據集術語不一致的挑戰。生物醫學實體對齊是關鍵,需識別不同數據集中的等效實體。近期,大型語言模型(LLMs)如BERT在處理異質數據上顯示潛力,但無單一模型能解決所有實體匹配問題。為此,我們提出兩階段LLM構建框架(TSLLM),透過多目標和單目標遺傳算法自適應選擇和結合LLM,提升異質實體的區分能力。測試結果顯示,TSLLM在實體匹配上表現優於現有技術。 相關文章 PubMed DOI

研究蛋白質-蛋白質相互作用(PPIs)對於理解生物過程非常重要,尤其是在抗體與抗原、酶與抑制劑或促進劑的互動上。近期針對PPIs的研究,特別是與SARS-CoV-2的關聯,推動了疫苗的開發。雖然已有數據庫整理PPI網絡,但文本挖掘方法在新研究或少數物種中顯得尤為重要。比較不同的自然語言處理(NLP)工具後發現,傳統方法真陽性率高但網絡過度連接,機器學習方法則網絡結構相似但真陽性率低,而大型語言模型的表現則介於兩者之間。選擇合適的NLP方法需根據研究需求和文本量。 相關文章 PubMed DOI

這項研究評估了ChatGPT-4在生殖醫學問題上的表現,使用醫師考試資料庫和治療指導方針的查詢。三位專家根據相關性、準確性、完整性和可理解性進行評分。結果顯示,ChatGPT-4在該領域知識豐富,相關性和可理解性良好,但多選題的準確率僅為63.38%。專家評分差異明顯,其中一位專家評分較高。雖然它提供了實用建議和對指導方針的理解,但對地區性差異的知識仍有不足。總體來看,它可能成為生殖醫學中對患者和醫師的有用輔助工具。 相關文章 PubMed DOI

這項研究評估了大型語言模型(LLMs),特別是GPT-3.5和GPT-4,在診斷代謝功能障礙相關脂肪肝病(MASLD)的有效性,數據來自2017-2018年的NHANES。結果顯示,GPT-4的診斷準確性與傳統評分系統(如脂肪肝指數)相當,ROC曲線下面積(AUROC)分別為0.831、0.817和0.827,且優於GPT-3.5。此外,GPT-4V在解讀MASLD患者的超音波影像上顯示潛力,但準確性仍不及經驗豐富的放射科醫師。總體而言,GPT-4在診斷MASLD方面表現良好,並在便利性和多樣性上具優勢。 相關文章 PubMed DOI

這項研究評估了ChatGPT-4在小兒心臟病學中解讀多模態影像的能力,針對100道包含心臟超音波、血管造影、X光和心電圖的選擇題進行測試。結果顯示,提供影像時正確率為41%,心電圖的準確率最高(54%),而血管造影最低(29%)。不提供影像時,表現稍降至37%。研究指出,ChatGPT-4在解讀影像的能力有限,強調需進一步訓練才能整合進臨床實踐,並需更多研究探討其臨床推理能力。 相關文章 PubMed DOI