Evaluating Large Language Model Performance to Support the Diagnosis and Management of Patients with Primary Immune Disorders.
評估大型語言模型在支持原發性免疫疾病患者診斷和管理中的表現。 J Allergy Clin Immunol 2025-02-16

生成式人工智慧（GAI）在醫療領域有顯著進展，但對於罕見疾病如原發性免疫疾病（PI）的輔助效果仍待探討。本研究評估了六種大型語言模型（LLMs）在提供PI臨床指導的表現。結果顯示，GPT-4o、Llama-3.1-70B-Instruct和Mistral-Large-Instruct-2407的診斷準確率超過88%，其中GPT-4o以96.2%領先。其他模型表現較差，準確率約60%或更低。雖然LLMs在PI診斷上顯示潛力，但仍需改進以提升臨床實用性。 PubMed DOI

Boosting GPT models for genomics analysis: generating trusted genetic variant annotations and interpretations through RAG and Fine-tuning.
提升 GPT 模型於基因組分析的能力：透過 RAG 和微調生成可信的遺傳變異註解和詮釋。 Bioinform Adv 2025-02-21

你的專案專注於提升大型語言模型（LLMs）在基因組學的表現，特別是透過整合變異註解數據。你成功將1.9億條準確的變異註解整合進GPT-4o，讓使用者能查詢特定基因變異並獲得詳細解釋。雖然微調有助於提升表現，但檢索增強生成（RAG）在數據量和成本效益上更具優勢。這項研究不僅提高了變異解釋的可及性，也為未來基因組學的AI系統發展樹立了榜樣，展現了LLMs的潛力。公開數據集可依需求分享。 PubMed DOI

A large language model framework for literature-based disease-gene association prediction.
基於文獻的疾病-基因關聯預測的大型語言模型框架。 Brief Bioinform 2025-02-25

隨著生物醫學文獻的快速增長，使用大型語言模型（LLMs）來理解精準醫療變得越來越重要。然而，現有方法在提取複雜生物關係時面臨可靠性和可擴展性等挑戰。為了解決這些問題，我們提出了LORE，一種創新的無監督兩階段閱讀方法，將文獻視為可驗證的知識圖譜，並以語義嵌入表示。應用於PubMed摘要時，LORE能有效捕捉基因致病性信息，並在識別疾病相關基因方面達到90%的精確度，為研究人員提供了新的潛在治療靶點識別途徑。 PubMed DOI

Consistent Performance of GPT-4o in Rare Disease Diagnosis Across Nine Languages and 4967 Cases.
GPT-4o 在九種語言和 4967 例罕見疾病診斷中的一致表現。 medRxiv 2025-03-10

大型語言模型（LLMs）如GPT-4o在醫療應用，特別是鑑別診斷方面展現潛力。研究人員創建了4,967個臨床案例，涵蓋378種遺傳疾病，並翻譯HPO術語，生成多語言提示。結果顯示，GPT-4o在英語中正確識別排名第一的診斷達19.8%，而在八種非英語語言中，正確率介於16.9%到20.5%之間。這顯示該模型在非英語臨床環境中的應用潛力，並得到多方支持，推進LLMs在醫療領域的合作努力。 PubMed DOI

Comparative analysis of large language models on rare disease identification.
大型語言模型在罕見疾病識別上的比較分析。 Orphanet J Rare Dis 2025-04-01

這項研究顯示大型語言模型（LLMs）在診斷罕見疾病方面的潛力，因為這些疾病因發病率低且表現多樣而難以識別。研究分析了152個來自中國醫學案例資料庫的案例，並比較了四個LLMs（ChatGPT-4o、Claude 3.5 Sonnet、Gemini Advanced和Llama 3.1 405B）與人類醫師的診斷準確性。結果顯示，LLMs的表現超越人類醫師，Claude 3.5 Sonnet的準確率達78.9%，而人類醫師僅26.3%。這顯示LLMs在臨床上可能成為有價值的工具，但在實際應用前仍需進一步驗證及考量倫理與隱私問題。 PubMed DOI

The application of Large Language Models to the phenotype-based prioritization of causative genes in rare disease patients.
大型語言模型應用於罕見疾病患者以表現型為基礎的致病基因優先排序 Sci Rep 2025-04-29

大型語言模型（LLMs）能根據病人表現型有效排序相關基因，表現不輸甚至優於傳統生物資訊方法。LLMs 有潛力協助罕見遺傳疾病診斷，提升準確度並簡化流程，成為未來診斷新選擇。 PubMed DOI

Benchmarking large language models GPT-4o, llama 3.1, and qwen 2.5 for cancer genetic variant classification.
GPT-4o、llama 3.1 與 qwen 2.5 在癌症基因變異分類的效能評比 NPJ Precis Oncol 2025-05-14

這項研究比較 GPT-4o、Llama 3.1 和 Qwen 2.5 在癌症基因變異臨床分類的表現，發現 GPT-4o 準確率最高。LLMs 在有明確證據時表現佳，但遇到證據較弱的變異時一致性較差，且容易過度分類。透過 prompt 設計和檢索增強生成可提升準確度。整體來說，LLMs 有潛力，但臨床應用還需再優化。 PubMed DOI

RDguru: An Intelligent Agent for Rare Diseases.
RDguru：罕見疾病的智慧型代理人 AMIA Annu Symp Proc 2025-05-26

這項研究推出 RDguru 智慧診斷系統，專為罕見疾病設計，結合 GPT-4、醫學知識和診斷工具。實測 238 個案例，RDguru 前 10 答案有 69.1% 命中正確診斷，前 5 有 63.6%，第一個建議正確率為 41.9%，能有效協助臨床決策。 PubMed

A Large Language Model Outperforms Other Computational Approaches to the High-Throughput Phenotyping of Physician Notes.
大型語言模型在醫師筆記高通量表現型分析中優於其他計算方法 AMIA Annu Symp Proc 2025-05-26

這篇研究比較GPT-4大型語言模型、深度學習和機器學習三種方法在電子病歷症狀標準化上的表現。結果發現，GPT-4表現最好，顯示大型語言模型很有潛力成為未來醫師筆記自動化分析的主流工具，有助於推動精準醫療發展。 PubMed

Assessing Large Language Model Performance Related to Aging in Genetic Conditions.
與遺傳性疾病老化相關之大型語言模型表現評估 medRxiv 2025-06-26

這項研究發現，像 Llama-2-70b-chat 和 GPT-3.5 這類大型語言模型，在描述282種遺傳疾病的年齡相關特徵時表現不錯，尤其有情境提示時更佳，且沒明顯年齡偏見。不過，雖然這些模型有潛力協助臨床應用，實際使用上還是有一些限制需要注意。 PubMed DOI

原始文章

站上相關主題文章列表