原始文章

這項研究用 GPT-3.5 和 GPT-4 來分析科學文獻,找出基因和藥物對傷口癒合的影響。結果發現,GPT-4 在辨識和萃取這些關係上比 GPT-3.5 更準確,顯示 GPT-4 不用再訓練就能有效協助生醫研究。 PubMed


站上相關主題文章列表

研究評估了大型語言模型在醫療保健領域的應用,尤其是在改善患者護理方面。使用MIMIC-III數據庫的電子健康記錄,測試了這些模型在識別特定疾病患者方面的效能。GPT-4在辨識COPD、CKD、PBC和Cancer Cachexia患者方面表現優異,而ChatGPT和LLaMA3則稍遜。儘管LLMs有潛力,但在臨床應用前仍需解決錯誤、解釋不足和倫理問題。進一步研究將有助於提升模型訓練和設計,以更好地應用於醫療保健。 PubMed DOI

這項研究分析了不同大型語言模型(LLMs)在識別遺傳疾病時的表現,對比了開源模型(如Llama-2-chat和Vicuna)與封閉源模型(如ChatGPT-4)。結果顯示,開源模型的準確率在54%-68%之間,而ChatGPT-4則高達89%-90%。研究還指出,臨床醫生和一般民眾的提問對模型表現有顯著影響,且使用列表型提示能提升準確性。整體而言,這項研究揭示了LLMs在醫療領域的潛力與挑戰。 PubMed DOI

這項研究探討大型語言模型(LLMs)在診斷罕見遺傳疾病中的應用,特別是基於表型的基因優先排序。研究比較了五種LLMs,結果顯示GPT-4的表現最佳,能在前50個預測中準確識別17.0%的診斷基因,但仍低於傳統方法。雖然較大的模型通常表現較好,先進技術如檢索增強生成並未提升準確性,但精緻的提示改善了任務完整性。整體而言,這些發現顯示LLMs在基因組分析中的潛力與限制,對臨床應用有重要影響。 PubMed DOI

這項研究評估了大型語言模型(LLMs),特別是GPT-3.5和GPT-4,在從腫瘤科電子健康紀錄中提取患者共病情況的表現。研究分析了250份病歷報告,結果顯示GPT-4在敏感性上表現優於GPT-3.5和醫生,達到96.8%。雖然醫生在精確度上稍勝一籌,但GPT-4的表現更一致,且能推斷出非明確的共病情況。整體而言,這些模型在提取資訊方面顯示出潛力,可能成為數據挖掘的重要工具。 PubMed DOI

本研究評估了GPT-3.5和GPT-4在從非結構化臨床文本中提取資訊的效果。使用了病人特徵、病史和臨床檢測結果的資料,並透過簡單提示進行查詢。結果顯示,GPT-4在性別資訊提取上準確率達95%,優於GPT-3.5的70%;但在身體質量指數(BMI)方面,GPT-3.5的78%表現更佳。研究建議整合特定任務的定義進入提示中,以提升提取效果,並鼓勵專業人士設計有效提示,監控大型語言模型的表現。 PubMed DOI

慢性疼痛影響超過20%的人口,對個人和經濟造成重大影響。有效的疼痛評估工具對改善患者生活至關重要。這項研究探討使用大型語言模型(如GPT-4)來評估患者的書面敘述(WNs)。分析43份纖維肌痛症患者的WNs後,結果顯示GPT-4的評估與專家評分高度一致,且專家認為其評分和解釋通常合適。這表明GPT-4能有效增強WNs的評估,為慢性疼痛管理提供新方法。 PubMed DOI

**重點摘要:** 這項研究介紹了一個名為 GeneRxGPT 的工具,它結合了大型語言模型(LLMs)和最新的生醫文獻,讓癌症研究人員可以更輕鬆地發現藥物與基因之間的關係、找出新的治療標的、藥物再利用,以及更深入了解複雜的分子交互作用——而且不需要具備進階的電腦運算技能。 PubMed DOI

這篇研究比較GPT-4大型語言模型、深度學習和機器學習三種方法在電子病歷症狀標準化上的表現。結果發現,GPT-4表現最好,顯示大型語言模型很有潛力成為未來醫師筆記自動化分析的主流工具,有助於推動精準醫療發展。 PubMed

大型語言模型正改變基因體醫療,能快速分析文獻和基因資料,提升診斷與治療建議的精準度。雖然還有挑戰待克服,但隨著技術進步和跨領域合作,未來 AI 將成為臨床基因體分析的主流工具,推動個人化醫療發展。 PubMed DOI

研究人員用GPT-4提出乳癌新藥物組合,選用多種原本非治療癌症的FDA核准藥物,兩兩搭配後進行細胞實驗。結果發現,有些AI建議的組合效果比現有治療還好,顯示大型語言模型在新藥開發和科學假說產生上很有潛力。 PubMed DOI