原始文章

多層次上下文學習者(MCL)模型針對現有文本屬性圖(TAG)學習方法的不足,透過整合社交網絡的多層次上下文來進行改進。傳統方法主要關注節點的文本屬性,而MCL模型則將社交網絡建模為多層次上下文文本邊圖(MC-TEG),提升語義嵌入能力。MCL利用大型語言模型的推理能力生成語義嵌入,並引入雙向動態圖注意力層來區分權重信息。實驗結果顯示,MCL在六個社交網絡數據集上顯著超越基準模型,提升預測準確率,證明其在社交網絡增強表示學習的有效性。 PubMed DOI


站上相關主題文章列表

知識圖譜(KGs)改變了知識的表現方式,將實體及其關係以圖形結構組織,提升了推薦系統和問答系統的效能。像是Expert.AI的Sensigrafo,專注於透過機器導向的詞彙來增進自然語言理解。不過,維護知識圖譜仍然面臨挑戰,通常需要手動輸入。近期大型語言模型(LLMs)的進展,為自動化知識圖譜的豐富提供了新機會,本文探討了基於LLM的最新技術,並針對數據質量、經濟性、隱私等問題提供見解。 PubMed DOI

這項研究探討如何利用大型語言模型(LLM)分析媒體對中國的態度,以香港的《東方日報》為例。研究強調分析媒體數據集對理解公眾意見的重要性,並指出傳統方法常忽略隱性態度。研究使用Martin和White的框架來分類態度,並運用Meta的開源Llama2(13b)模型進行分析,針對40,000條與中國相關的表達進行量化。結果顯示,LLM能有效識別顯性和隱性態度,準確率約80%,與人類編碼者相當。研究也討論了實施過程中的挑戰及其解決策略。 PubMed DOI

短文本聚類面臨詞彙共現的挑戰,但研究顯示大型語言模型(LLMs)能有效生成嵌入,捕捉語義細微差異,改善聚類結果。透過高斯混合模型,聚類效果比傳統方法如doc2vec和潛在狄利克雷分配更明顯且易解釋。人類評審和生成型LLM的驗證顯示高一致性,顯示LLM能縮短聚類產出與解釋的距離。此外,LLM與人類編碼的比較揭示了兩者的偏見,質疑傳統將人類編碼視為最終標準的做法。 PubMed DOI

這篇論文對多語言大型語言模型(MLLMs)進行了全面回顧,強調其在多語言任務上的成功。雖然該領域已有進展,但缺乏系統性的調查。論文的貢獻包括: 1. **廣泛調查**:首次詳細回顧MLLMs中的多語言對齊。 2. **統一分類法**:提供分類框架,總結目前進展。 3. **新興前沿**:識別關鍵新興領域及其挑戰。 4. **豐富資源**:彙編開源資源,方便研究者使用。 作者希望這項工作能激發更多研究與突破。 PubMed DOI

基礎模型已成為人工智慧應用,特別是自然語言處理中不可或缺的部分。圖形機器學習也正朝向更先進的深度學習技術發展。基礎模型的成功促使研究者探索圖形基礎模型(GFMs),這些模型預期能在大型圖形數據集上進行預訓練,並適應不同任務。不過,這個新興領域目前缺乏明確定義和系統分析。本文介紹GFMs的關鍵特徵,並根據其對圖形神經網絡和大型語言模型的依賴程度,將研究分為三類,並回顧GFMs的現狀及未來研究方向。 PubMed DOI

學術論文的接受過程相當複雜,主要依賴同行評審,且常常資源密集且存在偏見。隨著深度學習的進步,研究人員開始探索自動化預測論文接受情況的方法。目前的方法通常分析整篇論文,效率不高且可能包含不相關資訊。為了解決這些問題,本研究提出LMCBert,結合大型語言模型與動量對比學習,專注於提取論文核心語義,減少冗餘,並提升對學術寫作的理解。實證結果顯示LMCBert表現良好,相關代碼與數據可在 https://github.com/iioSnail/LMCBert 獲取。 PubMed DOI

這項研究分析了七種大型語言模型(LLMs)在潛在內容分析的有效性,並與人類標註者進行比較。研究涵蓋情感、政治傾向、情感強度和諷刺檢測。結果顯示,無論是人類還是LLMs,在情感和政治分析上表現一致,LLMs的可靠性通常超過人類。不過,人類在情感強度評分上較高,兩者在諷刺檢測上都面臨挑戰。總體來看,LLMs,特別是GPT-4,能有效模仿人類的分析能力,但人類專業知識仍然重要。 PubMed DOI

這篇文章探討了多模態推薦系統的最新進展,這些系統結合文本、圖像和用戶對話等多種數據。文章指出兩大挑戰:用戶需求的複雜性和高品質數據集的不足,尤其在互動場景中。提出的解決方案結合多模態技術與大型語言模型(LLMs),提升用戶互動和推薦準確性。關鍵技術包括交叉注意力機制、多圖神經網絡和自我反思機制。實驗結果顯示,這些模型在準確率和召回率上超越現有方法,並在視覺問答任務中表現優異,顯示出其實際應用潛力。 PubMed DOI

大型語言模型正帶動材料科學革新,讓自動化材料發現成真,像是資料擷取、性質預測都更有效率。不過,目前還有專業知識整合不夠、資源消耗大等問題。未來要加強LLM的適應性、效率和可信度,才能讓這些技術在實際應用上更可靠、更公平。 PubMed DOI

這篇論文提出一個結合深度語境嵌入和CNN的混合模型,專門提升像LLaMA2這類大型語言模型在標準化中文文本處理的表現。新方法能同時抓住語意和結構特徵,讓中文NLP任務更準確又有效率,並在多項測試中表現優異,也有望應用在翻譯和情感分析等領域。 PubMed DOI