原始文章

罕見疾病診斷困難,因資料少且基因多樣。本研究評估大型語言模型(LLMs)在基因排序的表現,發現GPT-4表現最佳,但對知名基因有偏好且受輸入順序影響。採用分批處理可提升準確度並減少偏誤,有助加快罕見疾病基因鑑定與診斷。程式碼可在 GitHub 下載。 PubMed DOI


站上相關主題文章列表

生成式人工智慧(GAI)在醫療領域有顯著進展,但對於罕見疾病如原發性免疫疾病(PI)的輔助效果仍待探討。本研究評估了六種大型語言模型(LLMs)在提供PI臨床指導的表現。結果顯示,GPT-4o、Llama-3.1-70B-Instruct和Mistral-Large-Instruct-2407的診斷準確率超過88%,其中GPT-4o以96.2%領先。其他模型表現較差,準確率約60%或更低。雖然LLMs在PI診斷上顯示潛力,但仍需改進以提升臨床實用性。 PubMed DOI

你的專案專注於提升大型語言模型(LLMs)在基因組學的表現,特別是透過整合變異註解數據。你成功將1.9億條準確的變異註解整合進GPT-4o,讓使用者能查詢特定基因變異並獲得詳細解釋。雖然微調有助於提升表現,但檢索增強生成(RAG)在數據量和成本效益上更具優勢。這項研究不僅提高了變異解釋的可及性,也為未來基因組學的AI系統發展樹立了榜樣,展現了LLMs的潛力。公開數據集可依需求分享。 PubMed DOI

隨著生物醫學文獻的快速增長,使用大型語言模型(LLMs)來理解精準醫療變得越來越重要。然而,現有方法在提取複雜生物關係時面臨可靠性和可擴展性等挑戰。為了解決這些問題,我們提出了LORE,一種創新的無監督兩階段閱讀方法,將文獻視為可驗證的知識圖譜,並以語義嵌入表示。應用於PubMed摘要時,LORE能有效捕捉基因致病性信息,並在識別疾病相關基因方面達到90%的精確度,為研究人員提供了新的潛在治療靶點識別途徑。 PubMed DOI

大型語言模型(LLMs)如GPT-4o在醫療應用,特別是鑑別診斷方面展現潛力。研究人員創建了4,967個臨床案例,涵蓋378種遺傳疾病,並翻譯HPO術語,生成多語言提示。結果顯示,GPT-4o在英語中正確識別排名第一的診斷達19.8%,而在八種非英語語言中,正確率介於16.9%到20.5%之間。這顯示該模型在非英語臨床環境中的應用潛力,並得到多方支持,推進LLMs在醫療領域的合作努力。 PubMed DOI

這項研究顯示大型語言模型(LLMs)在診斷罕見疾病方面的潛力,因為這些疾病因發病率低且表現多樣而難以識別。研究分析了152個來自中國醫學案例資料庫的案例,並比較了四個LLMs(ChatGPT-4o、Claude 3.5 Sonnet、Gemini Advanced和Llama 3.1 405B)與人類醫師的診斷準確性。結果顯示,LLMs的表現超越人類醫師,Claude 3.5 Sonnet的準確率達78.9%,而人類醫師僅26.3%。這顯示LLMs在臨床上可能成為有價值的工具,但在實際應用前仍需進一步驗證及考量倫理與隱私問題。 PubMed DOI

大型語言模型(LLMs)能根據病人表現型有效排序相關基因,表現不輸甚至優於傳統生物資訊方法。LLMs 有潛力協助罕見遺傳疾病診斷,提升準確度並簡化流程,成為未來診斷新選擇。 PubMed DOI

這項研究比較 GPT-4o、Llama 3.1 和 Qwen 2.5 在癌症基因變異臨床分類的表現,發現 GPT-4o 準確率最高。LLMs 在有明確證據時表現佳,但遇到證據較弱的變異時一致性較差,且容易過度分類。透過 prompt 設計和檢索增強生成可提升準確度。整體來說,LLMs 有潛力,但臨床應用還需再優化。 PubMed DOI

這項研究推出 RDguru 智慧診斷系統,專為罕見疾病設計,結合 GPT-4、醫學知識和診斷工具。實測 238 個案例,RDguru 前 10 答案有 69.1% 命中正確診斷,前 5 有 63.6%,第一個建議正確率為 41.9%,能有效協助臨床決策。 PubMed

這篇研究比較GPT-4大型語言模型、深度學習和機器學習三種方法在電子病歷症狀標準化上的表現。結果發現,GPT-4表現最好,顯示大型語言模型很有潛力成為未來醫師筆記自動化分析的主流工具,有助於推動精準醫療發展。 PubMed

這項研究發現,像 Llama-2-70b-chat 和 GPT-3.5 這類大型語言模型,在描述282種遺傳疾病的年齡相關特徵時表現不錯,尤其有情境提示時更佳,且沒明顯年齡偏見。不過,雖然這些模型有潛力協助臨床應用,實際使用上還是有一些限制需要注意。 PubMed DOI