LLM 相關三個月內文章 / 第 21 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究評估了兩個人工智慧語言模型,ChatGPT 和 iFlytek Spark,在生成踝部骨折手術後加速康復(ERAS)建議的表現。結果顯示,ChatGPT 在正確回答專家共識問題上表現較佳,達82.9%,但在某些領域仍有不一致。iFlytek Spark 則為62.9%,回應較為一般化。兩者在65.7%的問題上達成一致,ChatGPT 提供的建議更具體。研究強調了精煉人工智慧模型的重要性,以確保其與醫療指導一致,並需醫師監督以確保安全性。未來應提升人工智慧在骨科護理中的可靠性。 相關文章 PubMed DOI 推理

這項研究評估了基於GPT-4的RadOnc-GPT在前列腺癌治療相關訊息回覆的有效性,旨在減輕臨床團隊的工作負擔。該模型與梅奧診所的電子健康紀錄整合,分析了90位非轉移性前列腺癌患者的158條訊息。結果顯示,RadOnc-GPT在同理心上稍勝臨床團隊,並在其他方面得分相當。雖然模型能為護理人員節省每條訊息5.2分鐘,臨床醫生則節省2.4分鐘,但仍存在上下文不足和知識缺口等限制。整體而言,該模型有助於提升醫療效率與溝通質量。 相關文章 PubMed DOI 推理

最近通用視覺-語言模型(VLMs)在多模態任務上展現出強大的推理能力,但在物體理解和定位上仍有挑戰。現有模型常將文本與圖像標記對齊,可能導致嵌入不佳及背景特徵干擾,且對新視覺概念的泛化能力不足。為了解決這些問題,我們提出一種新方法,透過上下文中的視覺物體向量來提示大型語言模型,提升物體級推理的精確度,並加快訓練速度。我們的實驗顯示,這種方法在物體分類和標題生成上表現優異,並在複雜場景中具備良好的泛化能力。 相關文章 PubMed DOI 推理

這份文件探討多模態大型語言模型(MLLMs)如何減輕護理人員的文書負擔,並提升病患護理的品質與效率。透過整合音頻、視頻和文本數據,MLLMs能即時更新病歷,讓護理人員更專注於病患照護。此外,預測分析可增強個人化護理,改善工作流程。雖然有潛力,但仍需進一步研究其準確性及倫理問題。整合MLLMs可減少行政負擔,提升護理滿意度,並促進護理人員與病患的互動,最終改善護理品質。 相關文章 PubMed DOI 推理

這項研究探討了ChatGPT在生成高品質的案例導向解剖學多選題(MCQs)的有效性,特別針對內分泌和泌尿生殖系統。研究使用結構化框架進行AI輔助題目生成,經專家評估後在502名二年級醫學生中測試。結果顯示,生成的題目在區分高低表現學生方面有效,且大多數題目難度適中,適合醫學考試。研究指出,ChatGPT是醫學教育者的有用工具,但人類專業知識仍然重要,以確保題目質量。未來可探討AI在其他解剖學主題的題目生成能力。 相關文章 PubMed DOI 推理

這項研究探討美國急診部門的遠程心理健康護理實施情況,並檢視人工智慧(AI)如何增強質性數據分析。279家急診部門的主任提供了改善建議,研究小組分別使用傳統方法和AI(ChatGPT 4.0)進行分析。 主要發現包括:建議分為改善遠程心理健康護理和增強整體系統兩大類,特別是簡化獲取流程。AI在分析中表現出色,識別出人類分析師未捕捉的有效代碼,且75%的編碼結果一致。 結論指出,美國急診部門在獲取遠程心理健康護理的及時性和效率上仍需顯著提升。 相關文章 PubMed DOI 推理

最近,人工智慧在分子設計上有了新進展,讓合成化學家能更輕鬆地創造特定功能的分子。雖然已有多款AI分子生成器,但使用這些工具仍需專業知識。為了解決這個問題,我們開發了ChatChemTS,一個基於大型語言模型的聊天機器人,透過簡單對話幫助設計新分子,並自動生成獎勵函數。我們的研究展示了它在設計色素和抗癌藥物方面的能力。ChatChemTS已開源,並可在GitHub上獲得,網址是 https://github.com/molecule-generator-collection/ChatChemTS。這項技術讓更多人能輕鬆使用AI進行分子設計。 相關文章 PubMed DOI 推理

這項研究旨在透過自動化系統提升從科學文獻中提取藥物動力學(PK)數據的效率。研究團隊建立了一個包含2,640個專家標註表格的語料庫,並訓練了一個監督式分類流程,結合GPT-4來改善預測準確度,F1分數超過96%。該模型應用於PubMed Central的PK論文,並整合到www.pkpdai.com的搜尋工具中,代表自動化PK數據提取的重要進展,語料庫和代碼已公開。 相關文章 PubMed DOI 推理

這項研究評估了四個大型語言模型(LLMs)在回答脊髓損傷相關問題的表現,包括ChatGPT-4o、Claude-3.5 sonnet、Gemini-1.5 Pro和Llama-3.1。結果顯示,Gemini的資訊品質最佳,但可讀性較低,需大學程度理解。ChatGPT在準確性上表現最佳,達83.8%的「良好」評級,超過其他模型。所有模型在全面性和自我修正能力上表現良好,特別是ChatGPT和Claude在修訂後有顯著改善。這是首次在脊髓損傷背景下系統性比較這些模型的研究。 相關文章 PubMed DOI 推理

這篇論文探討了一種創新的壓縮大型語言模型(LLMs)的方法,以降低其計算需求和環境影響。主要技術包括: 1. **前向傳播剪枝(FPP)**:透過凍結和將未使用的參數設為零,減少嵌入層和前饋層的可訓練參數,提升訓練和收斂速度。 2. **權重矩陣折疊**:利用相同列壓縮和對角權重壓縮,修剪自注意力層的查詢和鍵矩陣,增強模型一致性和性能。 測試結果顯示,變壓器層減少99%,整體模型壓縮約70%,同時保持相似準確性,顯著降低記憶體使用和計算需求,促進人工智慧的可持續發展。 相關文章 PubMed DOI 推理