LLM 相關三個月內文章 / 第 13 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究探討了一種新演算法GLM-4,旨在改善CNC機器切削工具的壽命診斷。傳統深度學習在小數據集上表現不佳,但大型語言模型(LLMs)提供了新解決方案。該模型在PHM 2010數據集和專有銑刀數據集上分別達到93.8%和93.3%的診斷準確率,超越了傳統模型如SVM、CNN和RNN,以及基準LLMs如ChatGLM2-6B。研究顯示,結合特定領域的特徵工程與LLMs能顯著提升智能製造的診斷能力。 相關文章 PubMed DOI 推理

這項研究介紹了一種新的個人化大型語言模型(PLLM)代理,旨在提升大型語言模型在人體與機器人及人機互動中的整合能力。雖然現有研究多集中於技術層面,但在適應個別用戶情境上仍面臨挑戰。我們提出利用特定領域數據來個人化模型,並透過NeuroSense EEG數據集進行驗證。研究結果顯示,PLLM在醫療、教育及輔助技術等領域具有效用,並探討了相關的倫理考量,如數據隱私問題。這標誌著人工智慧在適應性和個人化上的重要進展。 相關文章 PubMed DOI 推理

本研究旨在開發一個標準化流程,利用大型語言模型(LLM)從腰椎MRI報告中提取數據,並評估其與專業評分的一致性。研究分析了230名慢性下背痛患者的數據,結果顯示模型在數據提取上表現優異,平均F1分數達0.96,但與專業評分的一致性僅為中等(kappa 0.424)。特別是在側凹狹窄的報告中,低報現象明顯,顯示出需要更客觀的數據提取方法。 相關文章 PubMed DOI 推理

這項研究探討了人工智慧(AI)如何幫助一般醫師(GPs)進行關於死亡的開放性討論。研究使用ChatGPT-4o模擬醫療溝通場景,讓GP與臨終病人及其照顧者進行諮詢。結果顯示,ChatGPT成功創建了一個七步驟的討論場景,但未明確使用「臨終」或「死亡」等詞彙,也忽略了文化和宗教因素。總結來說,ChatGPT-4o可作為GPs學習進行敏感討論的有用工具,無需高端技術資源。 相關文章 PubMed DOI 推理

本研究探討生成式人工智慧(GenAI)在臨床微生物學和傳染病諮詢中的應用潛力。透過評估四款聊天機器人(如GPT-4.0),研究發現GPT-4.0在事實一致性、全面性及無醫療危害性方面表現優於其他兩款。專家對AI回應的評分顯著高於住院醫師,且專家認為回應“無害”的可能性更高,但仍有少於兩成的回應被認為無害。研究強調醫療人員的專業知識對AI回應的解讀影響深遠,並指出目前無AI模型可在無人監督下安全使用於臨床。 相關文章 PubMed DOI 推理

Thyro-GenAI是一款基於檢索增強生成(RAG)技術的聊天機器人,專注於甲狀腺疾病的臨床問題。經過與其他三款服務型大型語言模型(如ChatGPT、Perplexity和Claude)的比較,Thyro-GenAI在回應質量上表現最佳,並且在參考資料的可靠性上也名列前茅。這顯示出Thyro-GenAI能提供更準確的臨床推理,減少幻覺現象,對一線醫師在管理甲狀腺疾病患者時具有重要的輔助價值。 相關文章 PubMed DOI 推理

本研究評估了ChatGPT-4在眼科診所對病人訊息的分流效果,並與眼科住院醫師進行比較。分析139則訊息後,發現MD與GPT-4在診所建議上的一致性為64.7%,而在分流緊急性上為60.4%。GPT-4在93.5%的案例中提供的緊急性建議與MD相符或更早。結果顯示,GPT-4能支持醫生的判斷,減輕工作負擔,並改善病人護理,但無法完全取代醫生的角色。整合AI有助於提升服務質量與病人結果。 相關文章 PubMed DOI 推理

本研究評估四種人工智慧應用程式(ChatGPT-4.0、Bing AI、Google Bard 和 Perplexity)在管理膀胱輸尿管逆流(VUR)方面與美國泌尿學會(AUA)指導方針的一致性。針對 AUA 指導方針提出 51 個問題,經兩位兒科外科醫生獨立評估,結果顯示各 AI 平均分數相近,且評分一致性高。這些 AI 應用程式在提供基於指導方針的建議上,對兒科泌尿學具有潛在價值。 相關文章 PubMed DOI 推理

本研究探討人工智慧(AI)在骨科教育,特別是肩膀和肘部手術的應用。從AAOS ResStudy問題庫中選取50個相關問題,評估不同AI聊天機器人的表現。結果顯示,聊天機器人的平均準確率為60.4%,其中GPT-4o表現最佳,達74%。雖然AI在簡單問題上表現較佳,但仍需專家判斷的輔助,顯示AI在醫學教育中的潛力與局限性。 相關文章 PubMed DOI 推理

本研究探討了深度學習模型在預測晚期上皮性卵巢癌患者手術結果的有效性,特別是使用非結構化的手術筆記。評估了RoBERTa和GatorTron兩個模型,結果顯示GatorTron在大多數任務中表現優於RoBERTa,顯示專為醫療設計的模型在理解醫療語言上有明顯優勢。不過,兩者在預測術後併發症和住院時間時仍面臨挑戰,顯示手術文本不足以全面反映術後恢復的複雜性。這些發現對提升患者護理質量的醫療AI系統發展至關重要。 相關文章 PubMed DOI 推理