原始文章

這項研究分析超過9萬則推特,並精細標註1,000則推文,提升辨識藥物與膳食補充劑關係的能力。結合BioBERT和ChatGPT,關係偵測準確率很高(F1值最高0.99),但實體辨識較難,因為類型太像。這方法有助於監測補充劑使用和藥物交互作用,也證明傳統NLP和大型語言模型結合在醫療文本分析上很有潛力。 PubMed


站上相關主題文章列表

傳統的飲食評估方式可能不夠客觀且耗時,但現在有人工智慧(AI)解決方案可以自動化這個過程。這項研究使用GPT-4V模型驅動ChatGPT進行飲食評估,表現出在檢測食物和識別菜餚方面的潛力。這個方法不需要特定訓練數據,並且可以根據上下文提示來估計食物份量,提高評估的準確性。 PubMed DOI

這項研究比較了微調深度學習模型(基於PubMed摘要)與大型語言模型(ChatGPT-3.5)在不良藥物事件命名實體識別(NER)的表現。結果顯示,Hussain等人的微調模型達到97.6%的F1分數,遠高於ChatGPT-3.5的86.0%。雖然少量學習在數據有限時仍具實用性,但無法超越深度學習模型的表現。未來將探討使用GPT-4的少量提示及微調GPT-3.5的可能性。 PubMed DOI

這項研究評估了ChatGPT-4在社區藥局的表現,包括藥物資訊檢索、標籤錯誤識別、處方解讀及決策支持等。結果顯示,ChatGPT對藥物查詢的回應相當滿意,能引用正確的藥物數據,並成功識別標籤錯誤。在臨床情境中,其建議與藥師相當,特別是在藥物反應評估和健康建議方面。研究指出,ChatGPT可能成為社區藥局的有用工具,但仍需進一步驗證其在不同查詢和病人群體中的有效性及隱私問題。 PubMed DOI

不良藥物事件(ADEs)對住院率影響顯著,且與高發病率和死亡率相關。傳統的藥物安全監測依賴於不良事件報告系統,但社交媒體如X(前身為Twitter)提供了有價值的患者見解。本研究探討使用大型語言模型(LLMs)進行ADE分類,結果顯示RoBERTa-large模型表現最佳,F1指標達0.8,微調後的ChatGPT則為0.75。特徵分析顯示某些術語在識別ADE中至關重要,顯示LLMs在藥物安全監測中的潛力。 PubMed DOI

這項研究探討了使用ChatGPT評估草藥與藥物之間的相互作用(HDi),以改善臨床決策。研究針對一位接受卡培他濱治療的直腸腺癌患者,並使用了多種草藥補充品。雖然ChatGPT能快速處理數據,但藥師認為16%的相互作用不太可能,73%的機制被判定為假陽性,4%為幻覺。大部分引用的文獻過時或無法獲取。研究建議進一步探索AI在此領域的應用,並強調專家驗證的重要性。 PubMed DOI

這項研究探討了生成預訓練變壓器(GPT)模型在評估處方藥、非處方藥及草藥補充品之間的藥物相互作用的有效性。以Lexicomp®為參考,研究評估了73對藥物組合,結果顯示所有GPT模型的準確率都低於50%,且與Lexicomp的協議度也很低。雖然GPT-4和GPT-4o在識別高風險相互作用上稍有改善,但整體而言,這些發現顯示大型語言模型在藥物相互作用評估中的局限性,對病人安全的可靠性引發擔憂。 PubMed DOI

這項研究探討大型語言模型(LLMs)在藥理學中的挑戰,因為缺乏全面的測試集。研究團隊創建了一個包含藥物資訊檢索、先導化合物結構優化及研究趨勢分析的測試集,並評估了GPT-3.5和GPT-4的表現。結果顯示這兩個模型在藥物特性、動力學及毒性預測等方面表現優異,但在藥物識別和互動資訊檢索上仍有不足。研究建議透過檢索增強生成(RAG)方法,整合專業知識庫,以提升LLMs在藥理學的應用效果。 PubMed DOI

這項研究比較了四款主流AI(ChatGPT-3.5、ChatGPT-4、Ernie Bot、iFLYTEK Spark)辨識網路健康資訊真偽的能力。結果顯示,ChatGPT-4 準確率最高,Ernie Bot 和 iFLYTEK Spark 表現也不錯,ChatGPT-3.5 稍微落後。雖然整體表現佳,但在專業或複雜情境下還有進步空間。 PubMed DOI

這篇論文用大型語言模型產生了1.7萬則帶有不良藥物事件標註的合成推文,解決社群媒體上缺乏標註資料的問題。用這些資料預訓練的NER模型,在真實推文上表現更好,經人工標註資料微調後更創新高,證明合成資料能大幅提升ADE偵測效果,且資料集已公開。 PubMed DOI

這項研究發現,ChatGPT(GPT-4)在協助藥物不良反應的系統性回顧時,能有效找出搜尋策略中遺漏的關鍵字。實驗中,ChatGPT用嚴格比對能找回49%遺漏詞,語意比對則達71%,顯示它在優化搜尋策略上很有幫助。 PubMed DOI