原始文章

這篇論文探討基因數據在疾病診斷與治療中的重要性,特別是癌症研究,並指出將這些數據整合進臨床護理的挑戰,如電子健康紀錄的結構、保險成本及基因結果的可解釋性。研究也提到人工智慧(AI)和大型語言模型(LLMs)在解決這些問題上的潛力。儘管AI在醫學研究中的成功有限,但基於大量數據訓練的LLMs在基因分析上顯示出希望。研究評估了GPT模型在基因表達數據的預測能力,並與傳統機器學習方法進行比較,以探討其在預測癌症亞型的潛力。 PubMed DOI


站上相關主題文章列表

生成式人工智慧(GAI)和大型語言模型(LLM)已廣泛應用於各個領域,包括醫療保健。GAI在蛋白質結構和藥物發現等任務中有潛力,LLM則在醫療保健領域有多樣應用。區分通用LLM和專為醫療保健設計的模型至關重要,考量到這個領域的廣泛應用和相關出版物。 PubMed DOI

研究使用OpenAI的GPT-4開發AI助手,解釋藥物基因測試結果,提升臨床遺傳學決策,改善患者護理。AI助手採用RAG技術,結合CPIC數據庫,針對用戶提供個人化回答。相較ChatGPT 3.5,表現更佳,尤其在專業查詢方面。需改進回答準確性、相關性和語言表達。整合GPT-4與RAG提升效能,利用CPIC數據。挑戰在提高準確性、解決道德問題,發展專業基因/藥物模型。研究凸顯生成式AI在醫療支援和患者獲取複雜基因組學資訊的潛力。謹慎應用大型語言模型如GPT-4,可顯著提升對基因組學數據的理解,增進醫療服務。 PubMed DOI

GenAI LLMs,如ChatGPT,有潛力在醫療保健領域帶來重大影響。研究指出,這些技術可改善醫療服務效率,但也需面對道德及安全挑戰。未來應該加強研究,專注於實證或臨床領域,以推動這些技術在醫療保健中的應用。 PubMed DOI

隨著人工智慧工具的普及,患者和醫療專業人員越來越依賴這些工具提供的醫療資訊。本研究評估了五個大型語言模型(LLaMA 1、PaLM 2、Claude-v1、GPT-3.5和GPT-4)在2044個腫瘤學相關問題上的表現。結果顯示,GPT-4在與人類基準比較中表現最佳,達到第50百分位以上。雖然GPT-4的準確率高達81.1%,但所有模型仍存在顯著錯誤率,顯示出持續評估這些AI工具的重要性,以確保其安全應用於臨床實踐。 PubMed DOI

這項研究系統性回顧了生成性大型語言模型(LLMs)在臨床環境,特別是電子健康紀錄(EHRs)的應用。儘管自然語言處理技術進步,LLMs在臨床實踐中的整合仍有限,面臨多重挑戰。研究分析了自2023年以來的76篇相關文獻,發現包括提示工程的使用、少數多模態數據的應用、評估指標的多樣性,以及臨床決策中的偏見和幻覺等問題。未來需改進計算技術和標準化評估,以提升LLMs在醫療中的可靠性。總之,LLMs在病人護理上有潛力,但仍需克服重大障礙。 PubMed DOI

這項研究探討大型語言模型(LLMs)在理解醫學研究論文的能力,特別是使用STROBE檢查表進行評估。研究比較了六個LLMs的表現,包括GPT-3.5-Turbo和GPT-4系列,與專業醫學教授的評估。分析了50篇來自PubMed的論文,結果顯示GPT-3.5-Turbo的準確率最高(66.9%),而Gemini Pro和GPT-4-0613的得分最低。研究強調LLMs在醫學文獻理解上的潛力,但也指出需進一步研究以克服現有限制。 PubMed DOI

這項研究探討大型語言模型(LLMs)在診斷罕見遺傳疾病中的應用,特別是基於表型的基因優先排序。研究比較了五種LLMs,結果顯示GPT-4的表現最佳,能在前50個預測中準確識別17.0%的診斷基因,但仍低於傳統方法。雖然較大的模型通常表現較好,先進技術如檢索增強生成並未提升準確性,但精緻的提示改善了任務完整性。整體而言,這些發現顯示LLMs在基因組分析中的潛力與限制,對臨床應用有重要影響。 PubMed DOI

生成式人工智慧(AI)及大型語言模型(LLMs)在健康技術評估(HTA)中的應用越來越受到重視,主要可用於系統性文獻回顧、實證數據分析及健康經濟模型。AI能自動化文獻回顧過程,提高效率;在實證數據方面,能分析大量資料,提供臨床決策的洞見;在健康經濟模型中,則可支持模型的整體發展。然而,這些應用仍面臨科學嚴謹性、可靠性及數據隱私等挑戰,需謹慎整合並持續評估其效益與風險。 PubMed DOI

精準腫瘤學在非小細胞肺癌(NSCLC)中依賴生物標記檢測,但面臨基因組訓練不足和報告不一致等挑戰。研究評估了不同版本的ChatGPT在生成下一代測序報告及治療建議的能力,並引入生成式AI表現分數(G-PS)來衡量準確性和幻覺的出現。結果顯示,GPT-4的表現優於GPT-3.5,準確性更高且幻覺較少。這項研究顯示生成式AI在精準腫瘤學中的潛力,未來應重視其準確性和幻覺問題。 PubMed DOI

這項研究評估了大型語言模型(LLMs),特別是GPT-3.5和GPT-4,在從腫瘤科電子健康紀錄中提取患者共病情況的表現。研究分析了250份病歷報告,結果顯示GPT-4在敏感性上表現優於GPT-3.5和醫生,達到96.8%。雖然醫生在精確度上稍勝一籌,但GPT-4的表現更一致,且能推斷出非明確的共病情況。整體而言,這些模型在提取資訊方面顯示出潛力,可能成為數據挖掘的重要工具。 PubMed DOI