An Empirical Evaluation of Prompting Strategies for Large Language Models in Zero-Shot Clinical Natural Language Processing: Algorithm Development and Validation Study.
大型語言模型在零-shot臨床自然語言處理中提示策略的實證評估：演算法開發和驗證研究。 JMIR Med Inform 2024-04-08

LLMs在臨床應用上很強大，但缺乏標記數據。為了掌握臨床知識，需要進行上下文學習。研究評估了零-shot和少-shot臨床信息提取的提示工程技術。結果顯示，定制任務特定提示至關重要，而啟發式和集成提示也很有效。GPT-3.5表現最佳，並且集成方法有助於提升性能。這項研究為臨床自然語言處理的提示工程提供了重要的指導。 PubMed DOI

Using large language models for safety-related table summarization in clinical study reports.
使用大型語言模型進行臨床研究報告中與安全相關的表格摘要。 JAMIA Open 2024-05-31

LLMs在臨床試驗文件生成上有潛力。輝瑞挑戰使用LLMs自動化臨床試驗文件，尤其是為CSRs創建安全表摘要。評估顯示性能差異，特別是在事實準確性和寫作風格方面。團隊多使用GPT模型，改進方向包括表格輸入、上下文添加和微調。挑戰結果顯示LLMs在自動化CSRs中表格摘要有潛力，強調需優化人類輸入和持續研究。 PubMed DOI

Expansive data, extensive model: Investigating discussion topics around LLM through unsupervised machine learning in academic papers and news.
廣泛的數據，龐大的模型：通過非監督式機器學習在學術論文和新聞中探討 LLM 的討論主題。 PLoS One 2024-05-31

研究探討2020年6月1日至2023年12月31日期間，針對大型語言模型（LLMs）的主題建模方法。使用Web of Science和LexisNexis數據，聚焦於"Large language model"、"LLM"和"ChatGPT"等LLMs。評估LDA、NMF、CTM和BERTopic等方法，發現BERTopic表現最佳。新聞報導著重LLM應用，學術論文則更專業。研究提供LLMs未來挑戰見解，對LLM服務業者有幫助。 PubMed DOI

Large Language Models Can Enable Inductive Thematic Analysis of a Social Media Corpus in a Single Prompt: Human Validation Study.
大型語言模型能夠在單一提示中啟用社交媒體語料庫的歸納主題分析：人類驗證研究。 JMIR Infodemiology 2024-08-29

這項研究探討生成性大型語言模型（LLMs）在分析公共健康相關社交媒體內容的可行性，特別是疫苗言論。研究發現，LLMs通常能有效識別人類專家所關注的主題，且錯誤信息出現率較低。雖然LLMs的分析深度不及人類專家，但專家認為其生成的主題仍然合理且相關。總體來看，LLMs在處理健康相關社交媒體內容方面展現出顯著潛力，未來可能有助於公共健康策略的制定與社區關注的理解。 PubMed DOI

Towards Dataset-scale and Feature-oriented Evaluation of Text Summarization in Large Language Model Prompts.
大型語言模型提示中文本摘要的數據集規模和特徵導向評估。 IEEE Trans Vis Comput Graph 2024-09-09

最近大型語言模型和提示工程的進展，讓自訂聊天機器人變得更容易，不再需要程式設計技能。不過，進行大規模的提示評估仍然很具挑戰性。我們的研究確定了五個關鍵挑戰，並提出了一個以特徵為導向的提示評估工作流程，特別針對文本摘要，強調根據摘要特徵來評估提示，而非僅依賴傳統指標。為了支持這個流程，我們推出了Awesum，一個視覺分析系統，幫助用戶識別最佳提示改進。我們的測試顯示，Awesum能有效幫助非技術用戶進行系統性評估，並可應用於其他自然語言生成任務。未來建議專注於大型語言模型的特徵導向評估。 PubMed DOI

Harnessing AI and analytics to enhance cybersecurity and privacy for collective intelligence systems.
利用人工智慧和分析技術增強集體智慧系統的網絡安全與隱私。 PeerJ Comput Sci 2024-09-24

這項研究探討人工智慧、大數據分析與網路安全的交集，特別是如何透過創新方法增強安全性與隱私。研究強調自然語言處理在提升資訊安全的潛力，並評估平衡數據效用與個人隱私的技術。重要貢獻是提出一種新穎的惡意軟體檢測方法，利用深度學習技術，將惡意檔案轉換為灰階圖像進行分析，達到99.86%的檢測準確率。研究結果顯示深度學習在揭示複雜系統隱藏模式的有效性，推進計算安全領域的發展。 PubMed DOI

Using large language models to create narrative events.
使用大型語言模型創造敘事事件。 PeerJ Comput Sci 2024-12-09

這篇文章探討如何將大型語言模型（LLMs）融入科學工作流程，將原始文本轉化為有條理的敘事，並運用語義網技術。文章強調敘事在傳遞複雜科學資訊中的重要性，以及生成文本的可靠性。研究定義了「敘事事件」，並比較了不同小型LLM在特定需求下的表現，重點在於保持原始敘事的完整性。初步評估顯示，LLaMA 2在生成與源文本緊密對齊的敘事事件方面最為有效，並且透過提示工程技術進一步提升了輸出質量。 PubMed DOI

Utilizing large language models for identifying future research opportunities in environmental science.
利用大型語言模型識別環境科學未來研究機會。 J Environ Manage 2024-12-14

這項研究強調環境科學中創新研究方法的必要性，以應對氣候變遷和生物多樣性喪失等全球挑戰。由於現有文獻的複雜性，識別有意義的研究主題變得困難。傳統文獻計量學無法捕捉新興跨學科領域，但人工智慧（AI）和大型語言模型（LLMs）的進步提供了新機會。研究發現，GPT-3.5在分析環境科學前沿主題上表現更佳，顯示跨學科研究、AI和大數據對解決環境挑戰的重要性。LLMs可成為研究人員的寶貴工具，提供未來研究方向的靈感。 PubMed DOI

Efficient anomaly detection in tabular cybersecurity data using large language models.
使用大型語言模型在表格型網絡安全數據中進行高效異常檢測。 Sci Rep 2025-01-27

這篇論文介紹了一種新的網路安全異常檢測方法，叫做「透過引導提示的表格異常檢測」（TAD-GP）。它使用了一個擁有70億參數的開源大型語言模型，並結合了多種創新策略，如數據樣本引入和思考鏈推理。實驗結果顯示，這個方法在三個數據集上F1分數顯著提升，分別增加了79.31%、97.96%和59.09%。特別是較小的TAD-GP模型在性能上超越了大型模型，顯示出在資源有限環境中的有效性，適合私有部署，填補了網路安全異常檢測的重要空白。 PubMed DOI

Ontology-based prompt tuning for news article summarization.
基於本體的提示調整在新聞文章摘要中的應用。 Front Artif Intell 2025-02-26

這項研究提出了一個新框架，結合本體知識與抽象文本摘要，提升新聞文章的摘要質量與相關性。傳統的提取式摘要常常內容過於一般化且不準確，因為缺乏專業知識。這個新方法透過本體知識微調摘要過程，產生更準確且具上下文的摘要。評估結果顯示，這個框架的表現超越了BART、BERT和GPT-3.5，ROUGE-1分數提高5.1%，ROUGE-L改善9.8%。整體來看，將本體見解融入摘要過程是一個有效的策略，能生成高質量的新聞摘要。 PubMed DOI

原始文章

站上相關主題文章列表