LLM 相關三個月內文章 / 第 114 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這篇論文探討了一種新方法,透過檢索增強生成(RAG)框架來評估教師與學生的模擬教學。傳統方法需教師直接參與,增加工作負擔,限制學生獨立練習。研究使用開源工具,如FastChat和Whisper,搭配本地大型語言模型(LLM)分析教學音頻。評估了三個7B參數的開源中文LLM,結果顯示internlm2模型在分析教學音頻及提供反饋方面表現優異。研究還對10名參賽者的模擬教學進行系統分析,並由專家手動評分,驗證系統有效性,顯示先進語言技術在教育評估中的潛力。 相關文章 PubMed DOI

這項研究評估了具影像識別功能的 ChatGPT 4.0 在診斷鱗狀細胞癌 (SCC) 和白斑病的能力,分析了 45 張影像。結果顯示,ChatGPT 4.0 能準確識別白斑病,但對 SCC 的診斷能力有限,需結合臨床病史才能提高準確性。僅依臨床病史時,白斑病和部分 SCC 的誤分類情況明顯。整體而言,雖然在白斑病檢測上有潛力,但對於口腔及咽喉部的 SCC 診斷仍不可靠,未來技術進步可能改善其臨床應用。 相關文章 PubMed DOI

在建築、工程和建設(AEC)領域,自動合規檢查(ACC)需要自動化解釋建築法規,但因自然語言的細微差異和機器學習資源有限,過程變得複雜。為了解決這些問題,我們推出了CODE-ACCORD,這是一個包含862個獨立句子的數據集,來自英國和芬蘭的建築法規。這些句子完整表達規則,對ACC至關重要。經過12名標註者的手動標註,該數據集提供了4,297個實體和4,329個關係,為機器可讀的規則生成奠定基礎,並支持各種機器學習和自然語言處理任務。 相關文章 PubMed DOI

TPepRet是一個新型模型,旨在深入了解T細胞受體(TCR)與肽的相互作用,對癌症免疫療法、疫苗開發及自體免疫疾病管理非常重要。與現有工具不同,TPepRet考量了序列數據的方向性語義,提升了TCR-肽結合的準確性。它使用雙向門控遞歸單元(BiGRU)網絡來捕捉序列依賴性,並整合大型語言模型進行全面分析。經過嚴格評估,TPepRet的表現超越其他工具,成為理解臨床TCR-肽相互作用的重要資源。源代碼可在GitHub上找到,補充數據則在Bioinformatics上提供。 相關文章 PubMed DOI

多學科腫瘤委員會(MTBs)在癌症治療決策中扮演重要角色,但常面臨案例過載,影響決策品質。臨床決策支持系統(CDSSs)雖已引入協助醫師,但使用仍有限。大型語言模型(LLMs)如ChatGPT的出現,為提升CDSS的效率提供新機會。 OncoDoc2專注於乳腺癌管理,研究探討LLMs如何透過提示工程技術(PETs)改善其可用性。使用200個乳腺癌患者摘要進行評估,結果顯示最佳方法結合Mistral和OpenChat模型,達到不錯的準確率,但與金標準建議的匹配度仍低,顯示LLMs在醫療決策中仍需進一步發展。 相關文章 PubMed DOI

抗微生物抗藥性(AMR)對全球健康構成嚴重威脅,預計到2050年每年可能造成1000萬人死亡。為了有效應對,公共衛生訊息需針對不同受眾調整。本研究評估了ChatGPT-4生成適合文化和語言的AMR意識內容的能力。專家們識別了AMR的主要貢獻者,並開發了多語言的內容。雖然ChatGPT-4在生成定制內容方面顯示潛力,但質量差異顯著,需專業審查。未來研究應聚焦於完善提示和整合反饋,以提升內容有效性。 相關文章 PubMed DOI

這項研究評估了ChatGPT(3.5和4版本)在提供肩膀和肘部手術資訊的準確性,分析了114個問題。結果顯示,ChatGPT 3.5的正確率為52.3%,而ChatGPT 4則達到73.3%。雖然3.5在不穩定性類別表現較佳,但4在大多數其他類別中表現更優。兩者的表現都超過50%的熟練度,但仍無法取代臨床決策。研究建議進一步改善ChatGPT的訓練,以提升其作為醫療資訊資源的效用。 相關文章 PubMed DOI

大型語言模型(LLMs)如BERT和GPT的發展,推進了自然語言處理,特別是在心理健康支持方面。不過,這些模型在提供可靠的心理健康資訊上仍有疑慮。本次回顧將探討影響LLMs可信度的因素,重點在可靠性、可解釋性和倫理考量。 根據PRISMA-ScR指導原則,回顧將納入2019至2024年期間的相關研究,並由兩位獨立審查者進行數據篩選。系統性搜尋已完成,篩選階段進行中,數據提取預計在2024年11月初完成,綜合分析則在11月底前完成,結果將為實務工作者和政策制定者提供重要見解。 相關文章 PubMed DOI

這項研究針對自殺這一公共衛生議題,運用機器學習模型來識別有風險的個體,特別針對14至25歲的青少年。研究使用德國危機熱線的數據,開發預測自殺意念和行為的方法,並與傳統文本分類進行比較。基於變壓器的模型表現優異,達到0.89的宏觀AUC,並成功識別與自殺風險相關的語言特徵。研究結果顯示,這些模型能有效輔助臨床決策,未來可探索多模態輸入及時間性因素。 相關文章 PubMed DOI

這項研究探討大型語言模型(LLMs)生成的簡化放射學報告對腫瘤科病人的影響,分為兩個階段進行。第一階段測試五種LLMs,結果顯示Claude Opus-Prompt 3表現稍佳。第二階段中,100名病人分為兩組,一組收到原始報告,另一組則收到簡化版本。調查結果顯示,簡化報告的病人對疾病理解更好,對醫療狀況感到更有信心。雖然少數報告需修正,但顯示LLMs能有效簡化醫療資訊,仍需人類監督。整體而言,研究建議LLMs可增強病人對健康資訊的理解。 相關文章 PubMed DOI