LLM 相關三個月內文章 / 第 133 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

MiniCPM-V 是專為手機等邊緣裝置打造的高效多模態 AI,雖然只有 8B 參數,但在 11 項測試中表現甚至超越 GPT-4V 等大型模型。它能處理高畫質圖片、穩定辨識文字、支援 30 多種語言,還能在一般消費級硬體上順暢運作。這代表 AI 越來越輕量化,裝置效能提升,讓大家更容易用到先進 AI,也更重視隱私和離線使用。 相關文章 PubMed DOI 推理

這篇研究提出一套全新地理空間決策框架,把模糊概念分析、Surprisingly Popular法和GPT-4o結合,補足傳統模型常忽略的人類認知因素。這樣不只提升預測準確度,也讓結果更容易理解。像都市移動和環境風險分析,XGBoost模型準確率高達0.8412。這方法也能評估AI解釋和人類推理的相符度,對GIS、都市規劃和環境管理很有幫助。 相關文章 PubMed DOI 推理

研究分析12萬多份急診醫師病歷,訓練模型偵測醫師疲勞(定義為7天內上班5天以上)。模型能準確辨識疲勞醫師的病歷,並標記夜班或病患量多等高疲勞情境。被標記為「疲勞」的病歷,常和較差的臨床決策有關。疲勞醫師的用字也更可預測。用大型語言模型產生的病歷,疲勞分數比真人高74%,顯示AI生成紀錄可能不自然。 相關文章 PubMed DOI 推理

這篇研究回顧生成式AI在心理健康照護的應用,發現相關研究逐年增加,美國、中國、英國發表最多。應用重點包括情感支持、心理評估和個人化介入,但也面臨隱私和可靠性等挑戰。建議未來加強跨領域合作,推動標準化發展。 相關文章 PubMed DOI 推理

這項研究比較OpenAI Whisper和Dragon Medical One在神經外科手術報告語音轉文字的表現。兩者單字錯誤率都很低,Whisper為1.75%,Dragon為1.54%;但Whisper在語言錯誤上更優(0.50% vs 1.34%)。此外,Whisper在語速快或內容長時,準確度下降較少。整體來說,Whisper表現不輸市售系統,甚至更好,有助提升臨床記錄效率與準確性。 相關文章 PubMed DOI 推理

這項研究比較CTGAN和GPT-4o兩種生成式模型產生神經外科病患合成資料的效果。結果發現,GPT-4o在資料真實性、隱私保護和實用性都比CTGAN更好,且能保留重要臨床預測因子,適合用來訓練機器學習模型。合成資料有助於解決資料取得困難,但還需進一步優化並在不同資料集驗證。 相關文章 PubMed DOI 推理

這項研究發現,家長和小朋友都願意嘗試專為小兒風濕疾病設計的聊天機器人,重視信任、可靠性和客製化功能。研究建議應由專業醫療人員參與設計,協助家庭在回診間的照護,也適用於其他慢性小兒疾病。未來應實際測試原型在日常生活的效果。 相關文章 PubMed DOI 推理

這篇論文提出CILMP方法,結合大型語言模型產生的專業醫學知識,來客製化醫學影像分類模型的提示語。CILMP能根據不同疾病和影像自動調整提示語,讓視覺-語言模型在多種醫學影像分類任務上表現更好,效果也比現有方法優秀。 相關文章 PubMed DOI 推理

DeepSeek‑R1 在回答胃癌程式性細胞死亡相關問題時表現最穩定,特別是在臨床指引和複雜主題上最可靠。Claude 3.5 整體也不錯,但有時會漏掉最新資訊。DeepSeek‑V3 在細節和指引題目上較弱,修正答案時進步有限。總結來說,DeepSeek‑R1 最適合處理進階腫瘤學問題。 相關文章 PubMed DOI 推理

不管是網路還是 ChatGPT-4.0 提供的皮膚癌篩檢資訊,內容都太難懂,超過國小六年級的閱讀程度,一般人不太容易看懂。ChatGPT 的回答甚至比多數網站還難理解。大學和非大學網站在易讀性上也沒差。為了讓大家更容易了解並願意做篩檢,網路和 AI 的健康資訊都應該寫得更清楚、簡單。 相關文章 PubMed DOI 推理