Expansive data, extensive model: Investigating discussion topics around LLM through unsupervised machine learning in academic papers and news.
廣泛的數據,龐大的模型:通過非監督式機器學習在學術論文和新聞中探討 LLM 的討論主題。
PLoS One 2024-05-31
研究探討2020年6月1日至2023年12月31日期間,針對大型語言模型(LLMs)的主題建模方法。使用Web of Science和LexisNexis數據,聚焦於"Large language model"、"LLM"和"ChatGPT"等LLMs。評估LDA、NMF、CTM和BERTopic等方法,發現BERTopic表現最佳。新聞報導著重LLM應用,學術論文則更專業。研究提供LLMs未來挑戰見解,對LLM服務業者有幫助。
PubMedDOI