Can generative AI infer thinking style from language? Evaluating the utility of AI as a psychological text analysis tool.
生成式人工智慧能從語言推斷思考風格嗎？評估人工智慧作為心理文本分析工具的效用。 Behav Res Methods 2024-01-26

生成式人工智慧目前不太用於文本分析，但在評估情緒上有潛力。一研究比較了ChatGPT和LIWC工具的分析結果，發現兩者關聯較小，ChatGPT在22%情況下計算LIWC分析時出錯。這顯示大型語言模型處理詞語和數字可能不可靠，使用時要謹慎。 PubMed DOI

Accelerating human-computer interaction through convergent conditions for LLM explanation.
透過收斂條件加速人機互動的LLM解釋。 Front Artif Intell 2024-06-17

本文探討了如何透過大型語言模型（LLM）推動人機互動，並超越傳統的可解釋人工智慧（XAI）範式，考慮LLM的認知解釋。作者方法著重於認知建模、遺傳算法、神經網絡、因果循環動力學和特徵實現等解決方案，使XAI更具目的性和持續性。研究結果顯示，在信息處理中應用LLM需要特定結構條件，尤其在戰略規劃情境下，可加速集體問題解決。這研究有助於各領域發展可解釋的LLM。 PubMed DOI

Comparing human text classification performance and explainability with large language and machine learning models using eye-tracking.
使用眼動追蹤比較大型語言和機器學習模型在人類文本分類性能和可解釋性方面的表現。 Sci Rep 2024-06-21

研究比較了人類和人工智慧（AI）在文本分析上的表現，結果顯示機器學習模型在處理複雜敘述時比大型語言模型和非專家人類表現更好。機器學習和語言模型在選擇關鍵詞方面更貼近人類思維，但次要詞彙則有差異。 PubMed DOI

Perils and opportunities in using large language models in psychological research.
在心理研究中使用大型語言模型的風險與機會。 PNAS Nexus 2024-07-17

心理研究中使用大型語言模型(LLMs)引起關注，但「GPTology」的使用限制和風險令人擔憂，可能影響像ChatGPT這樣的模型。我們需了解LLMs在心理研究中的限制、道德問題和潛力，解決其對實證研究的影響。重要的是認識全球心理多樣性，謹慎看待LLMs作為通用解決方案，發展透明方法從AI生成的數據中做可靠推論。多元化人類樣本，擴展心理學方法，確保科學包容可靠，避免同質化和過度依賴LLMs。 PubMed DOI

Larger and more instructable language models become less reliable.
更大且更具可指導性的語言模型變得不那麼可靠。 Nature 2024-09-25

目前增強大型語言模型的策略主要是透過擴大模型規模、數據量和計算能力，並進行後處理和微調。然而，這樣的調整可能會影響模型的可靠性。我們的研究發現，雖然模型在簡單任務上表現不錯，但在低難度領域的準確性卻不穩定，特別是人類監督能夠發現的錯誤。早期模型常避免回答，而新模型則可能給出看似合理但實際錯誤的回應。這顯示出對通用人工智慧的重新設計是必要的，尤其是在需要可預測錯誤的應用中。 PubMed DOI

Can large language models help predict results from a complex behavioural science study?
大型語言模型能否幫助預測複雜行為科學研究的結果？ R Soc Open Sci 2024-09-26

在研究中，我探討了大型語言模型（LLMs），特別是GPT-3.5和GPT-4，對複雜行為科學實驗結果的預測能力。結果顯示，GPT-4在預測情感、性別和社會認知方面，與119位人類專家的表現相當，相關性高達0.89，而GPT-3.5則僅有0.07。在另一項研究中，讓大學參與者與GPT-4驅動的聊天機器人互動，提升了他們的預測準確性。這些結果顯示，人工智慧在預測行為主張的實證支持上，可能成為有價值的工具，並強調人類與AI合作的潛力。 PubMed DOI

Large Language Models for Transforming Categorical Data to Interpretable Feature Vectors.
大型語言模型在將類別數據轉換為可解釋特徵向量中的應用。 IEEE Trans Vis Comput Graph 2024-09-30

您提出的將類別數據轉換為可解釋的數值特徵向量的方案，利用大型語言模型（LLMs）相當創新。透過LLMs識別類別屬性的關鍵特徵，能創建多維特徵向量，便於與數值數據進行綜合分析。這種自動化轉換簡化了數據預處理，並且增加的可解釋性讓用戶能調整輸出，確保符合領域知識和分析需求。互動工具也能幫助用戶驗證和完善AI生成的特徵向量，提升數據轉換質量，增強對AI輸出的信任。總之，這種方法有潛力顯著提升異質數據集的分析，結合LLMs的優勢與用戶調整，實現更好的可解釋性和可用性。 PubMed DOI

Coherence and comprehensibility: Large language models predict lay understanding of health-related content.
一致性與可理解性：大型語言模型預測大眾對健康相關內容的理解。 J Biomed Inform 2024-12-11

這項研究探討健康素養對明智健康決策的重要性，強調生物醫學文本需以適當的閱讀水平呈現。研究發現，知識較少的讀者在理解缺乏明確概念的文本時會遇到困難。透過大型語言模型（LLMs）自動化測量文本的連貫性，結果顯示讀者的理解能力與LLMs的連貫性指標有顯著相關。此外，改善文本可理解性的措施也提升了連貫性和讀者理解。總之，LLMs的連貫性測量能有效識別生物醫學文本中難以理解的部分，幫助提升文獻的可及性。 PubMed DOI

Out-of-distribution generalization via composition: A lens through induction heads in Transformers.
透過組合實現超出分佈的泛化：從變壓器中的歸納頭的角度來看。 Proc Natl Acad Sci U S A 2025-02-07

這項研究探討大型語言模型（如 GPT-4）如何在不微調的情況下實現超出分佈的泛化，特別是從輸入提示推斷隱藏規則。研究重點在於變壓器的訓練動態及歸納頭的角色。主要發現指出，OOD 泛化與模型在自注意力層間組合資訊的能力有關，並且嵌入空間中的共享潛在子空間有助於這種組合，形成「共同橋接表徵假說」。這顯示模型的早期層和後期層能夠協調，以支持學習 OOD 任務所需的規則。 PubMed DOI

Leveraging Large Language Models and Agent-Based Systems for Scientific Data Analysis: Validation Study.
利用大型語言模型和基於代理的系統進行科學數據分析：驗證研究。 JMIR Ment Health 2025-02-13

大型語言模型有潛力改變科學數據的分析與溝通，但在準確性上仍有挑戰。洛瑞特腦研究所與塔爾薩大學開發的LITURAt系統，透過整合外部數據檢索和分析工具，旨在提供可靠的輸出，讓專家與非專家都能輕鬆使用。研究顯示，LITURAt在查詢一致性和準確性上表現優異，能改善科學數據分析的可及性。儘管有些限制，LITURAt仍顯示出促進數據驅動見解民主化的潛力。 PubMed DOI

原始文章

站上相關主題文章列表