LLM 相關三個月內文章 / 第 125 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這篇研究用大型語言模型分析電子病歷,來預測兒童心肺繞道手術後發生急性腎損傷的風險。結果顯示,LLM模型比傳統和專家模型更準確,兩者結合後效果更好。研究也提出讓AI預測結果更容易被醫師理解的方法,幫助提升臨床信任並發掘新醫療知識。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4和GPT-3.5在提供孕產婦健康資訊時表現較佳,但所有模型偶爾會出現內容不完整或用詞太艱深的情況,也有性別偏見問題。雖然LLM能提升資訊可近性,但在非英語環境下,翻譯和文化調整還需加強。 相關文章 PubMed DOI 推理

公開的大型語言模型(LLM)能產生具說服力的政治訊息,影響力跟人類寫的差不多,甚至被認為更有邏輯、較有事實根據,但人類寫的內容較有獨特性。這代表AI已能大規模製造有效的政治宣傳,對社會影響不容小覷。 相關文章 PubMed DOI 推理

這項研究發現,大型語言模型(LLMs)能準確從開放式問卷的自由回答中,萃取並分類Covid-19的傳播情境,表現甚至比傳統封閉式問題更好。LLMs不只分類準確,還能發現更多細緻、過去沒注意到的傳播情境,顯示未來疫情時有助提升流行病學資料的蒐集和分析效率。 相關文章 PubMed DOI 推理

MiniCPM-V 是專為手機等邊緣裝置打造的高效多模態 AI,雖然只有 8B 參數,但在 11 項測試中表現甚至超越 GPT-4V 等大型模型。它能處理高畫質圖片、穩定辨識文字、支援 30 多種語言,還能在一般消費級硬體上順暢運作。這代表 AI 越來越輕量化,裝置效能提升,讓大家更容易用到先進 AI,也更重視隱私和離線使用。 相關文章 PubMed DOI 推理

這篇研究提出一套全新地理空間決策框架,把模糊概念分析、Surprisingly Popular法和GPT-4o結合,補足傳統模型常忽略的人類認知因素。這樣不只提升預測準確度,也讓結果更容易理解。像都市移動和環境風險分析,XGBoost模型準確率高達0.8412。這方法也能評估AI解釋和人類推理的相符度,對GIS、都市規劃和環境管理很有幫助。 相關文章 PubMed DOI 推理

研究分析12萬多份急診醫師病歷,訓練模型偵測醫師疲勞(定義為7天內上班5天以上)。模型能準確辨識疲勞醫師的病歷,並標記夜班或病患量多等高疲勞情境。被標記為「疲勞」的病歷,常和較差的臨床決策有關。疲勞醫師的用字也更可預測。用大型語言模型產生的病歷,疲勞分數比真人高74%,顯示AI生成紀錄可能不自然。 相關文章 PubMed DOI 推理

這篇研究回顧生成式AI在心理健康照護的應用,發現相關研究逐年增加,美國、中國、英國發表最多。應用重點包括情感支持、心理評估和個人化介入,但也面臨隱私和可靠性等挑戰。建議未來加強跨領域合作,推動標準化發展。 相關文章 PubMed DOI 推理

這項研究比較OpenAI Whisper和Dragon Medical One在神經外科手術報告語音轉文字的表現。兩者單字錯誤率都很低,Whisper為1.75%,Dragon為1.54%;但Whisper在語言錯誤上更優(0.50% vs 1.34%)。此外,Whisper在語速快或內容長時,準確度下降較少。整體來說,Whisper表現不輸市售系統,甚至更好,有助提升臨床記錄效率與準確性。 相關文章 PubMed DOI 推理

這項研究比較CTGAN和GPT-4o兩種生成式模型產生神經外科病患合成資料的效果。結果發現,GPT-4o在資料真實性、隱私保護和實用性都比CTGAN更好,且能保留重要臨床預測因子,適合用來訓練機器學習模型。合成資料有助於解決資料取得困難,但還需進一步優化並在不同資料集驗證。 相關文章 PubMed DOI 推理