LLM 相關三個月內文章 / 第 85 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

OligoM-Cancer平台的開發目的是為了解決寡轉移性癌症(OMC)的理解與治療挑戰。相較於多轉移性癌症,OMC對局部治療的反應較佳,但相關研究仍然不足,因此需要更系統的比較與個性化治療。該平台提供有關OMC的標記、診斷、預後及治療選項的全面資源,並擁有1345篇文獻和393個相關因素的資料庫。OligoM-Cancer利用現代網路技術,旨在提升數據可解釋性,增強臨床實踐,並支持大型語言模型在OMC領域的應用,促進深入分析與提高治療可靠性。 相關文章 PubMed DOI

知識圖譜(KGs)改變了知識的表現方式,將實體及其關係以圖形結構組織,提升了推薦系統和問答系統的效能。像是Expert.AI的Sensigrafo,專注於透過機器導向的詞彙來增進自然語言理解。不過,維護知識圖譜仍然面臨挑戰,通常需要手動輸入。近期大型語言模型(LLMs)的進展,為自動化知識圖譜的豐富提供了新機會,本文探討了基於LLM的最新技術,並針對數據質量、經濟性、隱私等問題提供見解。 相關文章 PubMed DOI

這項研究評估了一個公開的人工智慧大型語言模型(LLM)在回答模擬病人關於美學乳房整形手術問題的表現。專家根據準確性、全面性等標準評分,總體得分為7.3分,乳房增大7.0分、乳房懸吊術7.6分、乳房縮小手術7.4分,對乳房植入物的知識得分為6.7分。儘管有些限制,研究顯示AI LLM可成為病人教育的有用工具,並可能隨著機器學習進步而改善。 相關文章 PubMed DOI

這項研究開發了一個聊天機器人,目的是協助從全人口基因篩檢中獲得正面結果,並運用大型語言模型。隨著基因檢測需求上升,這項研究希望透過科技創新來解決專家短缺的問題。 聊天機器人透過三步驟的提示工程創建,並在兩個假設情境中進行評估,專家們根據五點量表對八個標準進行打分。結果顯示,總分為3.88,語調和可用性最佳(各4.25分),但程式準確性最低(3.25分)。未來研究將專注於改進提示和設計混合型聊天機器人,以提升基因服務的品質。 相關文章 PubMed DOI

這項研究評估了ChatGPT在提供慢性鼻竇炎(CRS)資訊的有效性,並與醫療指導方針進行比較。研究中提出六個CRS相關問題,結果顯示ChatGPT的回答大致符合現有文獻,但仍有不一致之處。可讀性測試顯示資訊複雜度不同,平均可讀性分數為40.42%。雖然各類別之間可讀性無顯著差異,研究建議ChatGPT可作為醫療資訊的資源,但使用者需謹慎對待其準確性。最後以4級證據評級顯示中等可靠性。 相關文章 PubMed DOI

越來越多患者在網上尋找健康資訊,尤其是像佩羅尼氏病這種敏感疾病。大型語言模型(LLM)聊天機器人展現了提供資訊的潛力,但對於PD的準確性和可讀性仍不明朗。研究評估了四個LLM在回答PD查詢時的資訊質量,結果顯示在有提示的情況下,資訊質量提升至高水平,但平均閱讀水平為12.9年級,超過大多數患者的理解能力。雖然LLM在患者教育上有潛力,但仍需臨床背景和人類提示來提升效果,並需教育患者與醫生如何有效互動。 相關文章 PubMed DOI

這項研究評估了大型語言模型(LLMs)在藥物審查中的表現,特別是劑量錯誤、藥物相互作用及基因組學建議的能力。研究測試了四個LLM,發現ChatGPT在劑量方案上表現良好,但對simvastatin的問題有例外。所有LLM都能識別warfarin的相互作用,但錯過metoprolol和verapamil的相互作用。Claude-Instant在治療監測上提供適當建議,而Gemini在基因組學上表現不錯。研究指出,LLM在藥物審查中有潛力,但整合進醫療系統對病人安全至關重要。 相關文章 PubMed DOI

大型語言模型(LLMs),像是GPT-3.5-turbo和GPT-4,對醫療專業人員有潛在的協助能力,但可能帶有訓練數據中的偏見,影響其在醫療情境中的有效性。本研究分析這些模型在預測住院、費用和死亡率時的表現,發現它們對白人族群的預測較高,且在困難醫療情況下過於樂觀。這些偏見反映了醫療不平等,強調了進一步研究的必要性,以減少語言模型中的偏見,確保所有病患都能獲得公平和準確的醫療結果。 相關文章 PubMed DOI

準確預測ADMET(吸收、分佈、代謝、排泄和毒性)特性對藥物開發非常重要,能幫助選擇具良好藥物動力學及降低毒性的化合物。目前的ADMET數據集因樣本數量少及代表性不足而受限。為了解決這些問題,我們提出了一個多代理數據挖掘系統,利用大型語言模型識別14,401個生物測試的實驗條件,並整合不同來源的數據,最終創建了PharmaBench,包含156,618條原始條目,旨在支持藥物發現相關的AI模型開發。 相關文章 PubMed DOI

這項研究評估了GPT-3.5這種大型語言模型在自動標記產科事件報告的效果。分析了370份住院產科報告,並以人類標註作為金標準。結果顯示,該模型的敏感度達85.7%,特異度為97.9%,使用了79個標籤,而人類僅用了49個。模型的標籤解釋也有60.8%獲得審核者認可。總體來看,GPT-3.5能提升事件報告系統的數據利用效率,並可能改善病人安全。 相關文章 PubMed DOI