原始文章

在機器學習中,平衡預測準確性、模型可解釋性和領域泛化是一大挑戰。我們研究了77,640個配置中的120個可解釋模型和166個不透明模型,進行文本分類以識別文本複雜性,並預測讀者的處理難度感知。結果顯示,任務1中準確性與可解釋性之間存在權衡,但在任務2中,可解釋模型在領域泛化上表現更佳。加入乘法互動也增強了可解釋模型的能力。我們強調使用大型數據集訓練,並整合外部理論與分佈外數據以驗證模型,確保穩健性。 PubMed DOI


站上相關主題文章列表

生成式人工智慧目前不太用於文本分析,但在評估情緒上有潛力。一研究比較了ChatGPT和LIWC工具的分析結果,發現兩者關聯較小,ChatGPT在22%情況下計算LIWC分析時出錯。這顯示大型語言模型處理詞語和數字可能不可靠,使用時要謹慎。 PubMed DOI

本文探討了如何透過大型語言模型(LLM)推動人機互動,並超越傳統的可解釋人工智慧(XAI)範式,考慮LLM的認知解釋。作者方法著重於認知建模、遺傳算法、神經網絡、因果循環動力學和特徵實現等解決方案,使XAI更具目的性和持續性。研究結果顯示,在信息處理中應用LLM需要特定結構條件,尤其在戰略規劃情境下,可加速集體問題解決。這研究有助於各領域發展可解釋的LLM。 PubMed DOI

研究比較了人類和人工智慧(AI)在文本分析上的表現,結果顯示機器學習模型在處理複雜敘述時比大型語言模型和非專家人類表現更好。機器學習和語言模型在選擇關鍵詞方面更貼近人類思維,但次要詞彙則有差異。 PubMed DOI

心理研究中使用大型語言模型(LLMs)引起關注,但「GPTology」的使用限制和風險令人擔憂,可能影響像ChatGPT這樣的模型。我們需了解LLMs在心理研究中的限制、道德問題和潛力,解決其對實證研究的影響。重要的是認識全球心理多樣性,謹慎看待LLMs作為通用解決方案,發展透明方法從AI生成的數據中做可靠推論。多元化人類樣本,擴展心理學方法,確保科學包容可靠,避免同質化和過度依賴LLMs。 PubMed DOI

目前增強大型語言模型的策略主要是透過擴大模型規模、數據量和計算能力,並進行後處理和微調。然而,這樣的調整可能會影響模型的可靠性。我們的研究發現,雖然模型在簡單任務上表現不錯,但在低難度領域的準確性卻不穩定,特別是人類監督能夠發現的錯誤。早期模型常避免回答,而新模型則可能給出看似合理但實際錯誤的回應。這顯示出對通用人工智慧的重新設計是必要的,尤其是在需要可預測錯誤的應用中。 PubMed DOI

在研究中,我探討了大型語言模型(LLMs),特別是GPT-3.5和GPT-4,對複雜行為科學實驗結果的預測能力。結果顯示,GPT-4在預測情感、性別和社會認知方面,與119位人類專家的表現相當,相關性高達0.89,而GPT-3.5則僅有0.07。在另一項研究中,讓大學參與者與GPT-4驅動的聊天機器人互動,提升了他們的預測準確性。這些結果顯示,人工智慧在預測行為主張的實證支持上,可能成為有價值的工具,並強調人類與AI合作的潛力。 PubMed DOI

您提出的將類別數據轉換為可解釋的數值特徵向量的方案,利用大型語言模型(LLMs)相當創新。透過LLMs識別類別屬性的關鍵特徵,能創建多維特徵向量,便於與數值數據進行綜合分析。 這種自動化轉換簡化了數據預處理,並且增加的可解釋性讓用戶能調整輸出,確保符合領域知識和分析需求。互動工具也能幫助用戶驗證和完善AI生成的特徵向量,提升數據轉換質量,增強對AI輸出的信任。 總之,這種方法有潛力顯著提升異質數據集的分析,結合LLMs的優勢與用戶調整,實現更好的可解釋性和可用性。 PubMed DOI

這項研究探討健康素養對明智健康決策的重要性,強調生物醫學文本需以適當的閱讀水平呈現。研究發現,知識較少的讀者在理解缺乏明確概念的文本時會遇到困難。透過大型語言模型(LLMs)自動化測量文本的連貫性,結果顯示讀者的理解能力與LLMs的連貫性指標有顯著相關。此外,改善文本可理解性的措施也提升了連貫性和讀者理解。總之,LLMs的連貫性測量能有效識別生物醫學文本中難以理解的部分,幫助提升文獻的可及性。 PubMed DOI

這項研究探討大型語言模型(如 GPT-4)如何在不微調的情況下實現超出分佈的泛化,特別是從輸入提示推斷隱藏規則。研究重點在於變壓器的訓練動態及歸納頭的角色。主要發現指出,OOD 泛化與模型在自注意力層間組合資訊的能力有關,並且嵌入空間中的共享潛在子空間有助於這種組合,形成「共同橋接表徵假說」。這顯示模型的早期層和後期層能夠協調,以支持學習 OOD 任務所需的規則。 PubMed DOI

大型語言模型有潛力改變科學數據的分析與溝通,但在準確性上仍有挑戰。洛瑞特腦研究所與塔爾薩大學開發的LITURAt系統,透過整合外部數據檢索和分析工具,旨在提供可靠的輸出,讓專家與非專家都能輕鬆使用。研究顯示,LITURAt在查詢一致性和準確性上表現優異,能改善科學數據分析的可及性。儘管有些限制,LITURAt仍顯示出促進數據驅動見解民主化的潛力。 PubMed DOI