LLM 相關三個月內文章 / 第 115 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

隨著城市成為人類活動的核心,城市感知的重要性日益提升。大型語言模型(LLMs)透過其語言框架,為城市感知帶來新機會。本文探討LLMs在理解城市機制上的潛力,重點在於改善人類與LLMs的知識轉移、提升對城市運作的認識,以及透過LLM代理實現自動化決策。雖然LLMs能提供更深入的城市動態理解,但也面臨多模態數據整合、時空推理、文化適應性和隱私等挑戰。未來的城市感知需善用LLMs的智慧,並克服這些挑戰,以促進智能和可持續的城市發展。 相關文章 PubMed DOI

這篇文章從社會語言學的角度分析語言模型,認為語言模型其實代表了不同的語言變體。文章首先定義了社會語言學中的語言變體,然後探討這種理解如何解決語言模型面臨的五大挑戰:社會偏見、領域適應、對齊、語言變遷和規模。作者指出,提升語言模型的效能和社會影響力的關鍵在於精心設計訓練數據集,讓其準確反映特定的語言變體,並運用社會語言學的見解。 相關文章 PubMed DOI

這項研究評估了六種不同的少量樣本提示方法,針對大型語言模型在Spider4SPARQL基準測試中的表現,該測試專注於複雜的SPARQL知識圖譜問答。實驗分為兩組,第一組檢視基於樣本數量或類型的提示方法,第二組則探討如何透過LLM生成的解釋來優化提示。結果顯示,商業模型在KGQA的準確率不超過51%,顯示處理複雜查詢的挑戰。最有效的方法是結合簡單提示與本體,並使用五個隨機樣本。 相關文章 PubMed DOI

這項研究探討情感表達在群眾募資中的影響,重點在口頭與視覺元素。研究分析了3,817個專案,發現正向情感表達能提升捐贈決策,尤其口頭表達對捐贈金額影響顯著。情感價值透過同理心影響捐贈行為。募款者應強調正面情感,結合視覺與口頭內容,以提升參與度和捐贈效果。這些見解有助於理解利他行為的情感動機,並優化線上募款策略。 相關文章 PubMed DOI

這項研究探討開源大型語言模型(LLMs)在從電子健康紀錄(EHRs)中提取社會健康決定因素(SDoH)數據的效果。研究隨機選取200名患者,並由兩位審查者手動標記九個SDoH方面,達成93%的高一致性。結果顯示,LLMs的表現明顯優於基準模型,特別是在識別明確提及的SDoH方面。最佳模型openchat_3.5在所有SDoH方面的準確率最高。研究強調進一步精煉和專業訓練的潛力,以提升LLMs在臨床研究中的應用,最終改善醫療結果。 相關文章 PubMed DOI

這項研究旨在提升腎臟腫瘤切除後患者的存活率預測,採用結合K-means聚類和Transformer特徵轉換的新方法。研究使用C4KC-KiTS-2019數據集,分析210名患者的術前CT影像,從中提取放射組學特徵,最終選出11個關鍵特徵。透過預訓練的Transformer模型和K-means聚類,模型在預測1年、3年和5年存活率方面表現優異,AUC值分別為0.889、0.841和0.926。此外,SHAP算法分析了特徵的重要性,顯示這種非侵入性方法對臨床決策有助益,可能改善患者的管理與治療策略。 相關文章 PubMed DOI

EmoAtlas是一個情感分析計算庫,能從18種語言的文本中提取情感與詞彙聯想。它運用可解釋的人工智慧進行語法解析,根據Plutchik理論識別八種情感,並在英語和意大利語的情感檢測上表現優於BERT和ChatGPT 3.5。其憤怒檢測準確率達85.6%,速度比BERT快12倍,且無需微調。EmoAtlas還能分析文本中情感的表達,提供如酒店評論等情境下的客戶情感見解,作為獨立資源發布,旨在提取可解釋的見解。 相關文章 PubMed DOI

這項研究評估了Google Gemini和Microsoft Copilot在肥胖藥物及外科管理的表現,特別是它們對美國糖尿病協會(ADA)和美國臨床內分泌學會(AACE)指導方針的遵循情況。研究發現,Microsoft Copilot在完整性上表現優異(10/10),而Google Gemini僅有一半問題(5/10)回答完整。Google Gemini拒絕回答兩個問題,建議諮詢醫生。雖然兩者都未顯示偏見,但Microsoft Copilot的部分回應則有偏見。這顯示出AI工具在肥胖管理上的潛力與表現差異。 相關文章 PubMed DOI

這項研究探討了使用ChatGPT驅動的智能眼科多模態互動診斷系統(IOMIDS),幫助患者自我診斷和分診。IOMIDS結合文字輸入及來自裂隙燈和智慧型手機的影像數據,評估病史並診斷眼科疾病。研究在三個醫療中心進行,涵蓋10個子專科和50種疾病,分析了15,640個數據。結果顯示,文字加智慧型手機的模型達到最高診斷準確率,顯示基於聊天機器人的人工智慧在眼科自我診斷和分診上有潛力。該臨床試驗已註冊於NCT05930444。 相關文章 PubMed DOI

這篇論文介紹了一種新的網路安全異常檢測方法,叫做「透過引導提示的表格異常檢測」(TAD-GP)。它使用了一個擁有70億參數的開源大型語言模型,並結合了多種創新策略,如數據樣本引入和思考鏈推理。實驗結果顯示,這個方法在三個數據集上F1分數顯著提升,分別增加了79.31%、97.96%和59.09%。特別是較小的TAD-GP模型在性能上超越了大型模型,顯示出在資源有限環境中的有效性,適合私有部署,填補了網路安全異常檢測的重要空白。 相關文章 PubMed DOI