原始文章

這項研究針對外語學習者在學習英語詞彙時的挑戰,透過語義標註的語料庫,建立了一份高頻詞義清單,主要來自當代美國英語和英國國家語料庫。研究人員利用BERT模型進行準確的語義標註,篩選出5000個關鍵詞義。這份清單有三大優勢:在不同語料庫中穩定覆蓋、高頻項目識別準確,且條目數較少,明確指出對初學者最相關的詞義。這項研究為語言學習者提供了重要資源。 PubMed DOI


站上相關主題文章列表

學者一直在爭論語言是否僅透過語言輸入就能學會。近來大型語言模型(LLMs)的進步提供了一個希望的研究途徑。雖然LLMs有限制,但它們顯示出類似人類語法的語言可以在沒有預先存在的語法下被習得,顯示統計學習在語言習得中扮演重要角色。LLMs為認知科學家提供了計算模型,讓他們探索人類語言習得和使用的複雜性。 PubMed DOI

研究發現不同語言在自然、顏色、親屬等領域的意義有變異。大型語言模型用來分析此變異,發現語義領域內意義較一致,跨領域變異較大。具體意義較抽象意義變化小,受地理、環境、文化影響。母語影響語義空間,影響語言感知。對語言教育、跨文化交流、翻譯重要,因意義以獨特方式連結不同語言。 PubMed DOI

研究發現,使用大型語言模型的聊天機器人對語言學習有正面影響,特別是在詞彙學習方面。學生在詞彙知識的學習和應用上有顯著進步。聊天機器人有助於詞彙長期記憶,也促進了偶發學習。這項研究強調整合人工智慧工具在語言教育中的重要性,並強調教育工作者應善用這些技術進行有效教學。 PubMed DOI

醫學領域中,找到正確資訊很重要。這篇論文提出使用大型語言模型和生成模型來改善消除歧義,方法是增加相關內容的實例來擴充資料集。結合BlueBERT、Transformers和BIOGPT,產生多樣臨床文本實例。在CASI資料集上評估,方法提升效能,特別對有限實例的情況,解決資料不均和類似概念挑戰。結果顯示,大型語言模型和生成技術有效,模型準確度高於先前方法。 PubMed DOI

臨床紀錄中的縮寫和符號很重要,對NLP很關鍵。先前研究用傳統方法成功。我們研究用ChatGPT和BERT評估縮寫和符號消歧。ChatGPT在區分上表現優秀,訓練量少也有效。Open LLM Mixtrial-8x7B在縮寫上表現好,BERT模型準確率超過95%。ChatGPT在相似性和相關性評估上與人類標準高度相符。 PubMed DOI

這項初步研究探討個體在閱讀時如何處理語意,透過分析眼動和腦電圖(EEG)數據,並結合大型語言模型(LLMs)。研究聚焦於閱讀理解任務,參與者閱讀不同關鍵字相關性的單詞。研究結果顯示,與關鍵字相關的單詞獲得的眼動注視次數顯著高於低相關性單詞,達到60%以上的驗證準確率。這項研究對於理解人類認知及發展閱讀輔助技術具有重要意義。 PubMed DOI

這項研究探討如何利用註解的臨床文件來提升ICD-10代碼相關術語的識別。研究人員分析了約190萬個去識別化的ICD-10代碼,並與德文問題清單中的簡短文本進行共現分析,找出統計上顯著的術語候選者。初步分析後,利用大型語言模型擴展種子術語,結果顯示在識別額外術語方面表現良好,顯示出結合臨床數據與語言模型的潛力,能有效縮小標準化術語與日常醫療用語之間的差距。 PubMed DOI

兩字測試(TWT)是一個新開源基準,專門評估大型語言模型(LLMs)的語義理解能力。它針對1,768個名詞-名詞組合進行意義判斷,並提供0到4的評分或二元判斷(有意義 vs. 無意義)。實驗顯示,像GPT-4和Claude-3-Optus等模型在這方面的表現都不如人類,經常錯誤地將無意義的短語判斷為有意義。這突顯了目前LLMs的局限性,提醒我們對其理解能力的主張應保持謹慎。 PubMed DOI