原始文章

多層次上下文學習者(MCL)模型針對現有文本屬性圖(TAG)學習方法的不足,透過整合社交網絡的多層次上下文來進行改進。傳統方法主要關注節點的文本屬性,而MCL模型則將社交網絡建模為多層次上下文文本邊圖(MC-TEG),提升語義嵌入能力。MCL利用大型語言模型的推理能力生成語義嵌入,並引入雙向動態圖注意力層來區分權重信息。實驗結果顯示,MCL在六個社交網絡數據集上顯著超越基準模型,提升預測準確率,證明其在社交網絡增強表示學習的有效性。 PubMed DOI


站上相關主題文章列表

在大型圖像上進行預先訓練,就像在文字上為自然語言處理做預訓練一樣,對後續的圖像應用很有幫助。研究提出了GaLM框架,可以在包含文字資訊的大型異構圖上預先訓練模型,再針對不同圖像結構的應用進行微調。實驗結果顯示這種方法在真實和公共數據集上都很有效。 PubMed DOI

Transformer神經網絡,特別是大型語言模型(LLMs),在材料分析、設計和製造上很有效。它們能處理各種數據,支持工程分析,像MechGPT在材料力學領域表現出理解能力。檢索增強的本體知識圖表等策略可提高生成性能,解決困難。這些方法在材料設計探索中有優勢,並提供見解。非線性取樣和基於代理的建模增強生成能力,改進內容生成和評估。例如,問答、代碼生成和自動生成力場開發。 PubMed DOI

神經機器人技術中,層面情感分析(ABSA)對理解文本情感至關重要。ABSA研究面臨訓練數據不足挑戰。先前研究注重結合語義和句法特徵進行情感預測,但可能使層面失去聯繫。有些研究使用圖卷積進行句法分析,但遇到梯度爆炸問題。本文探討使用ChatGPT進行文本擴增,並引入閘控注意機制處理梯度爆炸。結合圖特徵與情感知識,加強詞語與情感極性關係。交叉融合有效結合語義和句法特徵,實驗結果顯示模型優於基準。 PubMed DOI

知識圖譜(KGs)改變了知識的表現方式,將實體及其關係以圖形結構組織,提升了推薦系統和問答系統的效能。像是Expert.AI的Sensigrafo,專注於透過機器導向的詞彙來增進自然語言理解。不過,維護知識圖譜仍然面臨挑戰,通常需要手動輸入。近期大型語言模型(LLMs)的進展,為自動化知識圖譜的豐富提供了新機會,本文探討了基於LLM的最新技術,並針對數據質量、經濟性、隱私等問題提供見解。 PubMed DOI

這篇論文探討了多模態大型語言模型(MLLMs)的最新進展,特別是像GPT-4V這類結合語言處理與多模態任務的模型。作者強調了MLLMs的獨特能力,例如從圖像生成敘事及進行複雜推理,顯示出朝向人工通用智慧的潛力。論文提供了MLLMs的全面概述,包括架構、訓練策略和評估方法,並探討了增強其適應性的方法。此外,還討論了多模態幻覺等問題及未來研究方向,以提升MLLM的能力。 PubMed DOI

這項研究探討如何利用大型語言模型(LLM)分析媒體對中國的態度,以香港的《東方日報》為例。研究強調分析媒體數據集對理解公眾意見的重要性,並指出傳統方法常忽略隱性態度。研究使用Martin和White的框架來分類態度,並運用Meta的開源Llama2(13b)模型進行分析,針對40,000條與中國相關的表達進行量化。結果顯示,LLM能有效識別顯性和隱性態度,準確率約80%,與人類編碼者相當。研究也討論了實施過程中的挑戰及其解決策略。 PubMed DOI

這篇論文對多語言大型語言模型(MLLMs)進行了全面回顧,強調其在多語言任務上的成功。雖然該領域已有進展,但缺乏系統性的調查。論文的貢獻包括: 1. **廣泛調查**:首次詳細回顧MLLMs中的多語言對齊。 2. **統一分類法**:提供分類框架,總結目前進展。 3. **新興前沿**:識別關鍵新興領域及其挑戰。 4. **豐富資源**:彙編開源資源,方便研究者使用。 作者希望這項工作能激發更多研究與突破。 PubMed DOI

基礎模型已成為人工智慧應用,特別是自然語言處理中不可或缺的部分。圖形機器學習也正朝向更先進的深度學習技術發展。基礎模型的成功促使研究者探索圖形基礎模型(GFMs),這些模型預期能在大型圖形數據集上進行預訓練,並適應不同任務。不過,這個新興領域目前缺乏明確定義和系統分析。本文介紹GFMs的關鍵特徵,並根據其對圖形神經網絡和大型語言模型的依賴程度,將研究分為三類,並回顧GFMs的現狀及未來研究方向。 PubMed DOI

學術論文的接受過程相當複雜,主要依賴同行評審,且常常資源密集且存在偏見。隨著深度學習的進步,研究人員開始探索自動化預測論文接受情況的方法。目前的方法通常分析整篇論文,效率不高且可能包含不相關資訊。為了解決這些問題,本研究提出LMCBert,結合大型語言模型與動量對比學習,專注於提取論文核心語義,減少冗餘,並提升對學術寫作的理解。實證結果顯示LMCBert表現良好,相關代碼與數據可在 https://github.com/iioSnail/LMCBert 獲取。 PubMed DOI

這篇文章探討了多模態推薦系統的最新進展,這些系統結合文本、圖像和用戶對話等多種數據。文章指出兩大挑戰:用戶需求的複雜性和高品質數據集的不足,尤其在互動場景中。提出的解決方案結合多模態技術與大型語言模型(LLMs),提升用戶互動和推薦準確性。關鍵技術包括交叉注意力機制、多圖神經網絡和自我反思機制。實驗結果顯示,這些模型在準確率和召回率上超越現有方法,並在視覺問答任務中表現優異,顯示出其實際應用潛力。 PubMed DOI