Perceptions and detection of AI use in manuscript preparation for academic journals.
學術期刊手稿編寫中人工智慧應用的認知與檢測。 PLoS One 2024-07-12

學者對於AI在學術寫作中的影響看法不一，尤其在報告AI使用時存在爭議。倫理、學術角色和語言背景都影響了他們的立場。強調了在準備手稿時要求報告AI使用的挑戰，因為尚無共識，且檢測工具難以辨識微妙的情況。 PubMed DOI

Human or Machine? A Comparative Analysis of Artificial Intelligence-Generated Writing Detection in Personal Statements.
人類還是機器？人工智慧生成寫作檢測在個人陳述中的比較分析。 J Phys Ther Educ 2025-01-14

這項研究探討了人類評審、重複量化分析（RQA）和AI檢測工具GPTZero在辨別人類與AI生成的個人陳述的有效性，特別針對物理治療師教育計畫的申請。研究分析了50份梅奧診所的申請者陳述與50份由Google Gemini生成的陳述。結果顯示，人類評審在辨識上表現一致且準確，而RQA和GPTZero也各有優勢。研究強調，未來應結合這些方法，以提升對個人陳述的評估，確保學術誠信。 PubMed DOI

Evaluating human ability to distinguish between ChatGPT-generated and original scientific abstracts.
評估人類區分 ChatGPT 生成與原創科學摘要的能力。 Updates Surg 2025-01-24

這項研究探討人類評審者在辨識ChatGPT生成的科學摘要與原始摘要的準確性。來自不列顛哥倫比亞大學的41名外科實習生和教職員參加了線上調查，結果顯示只有40%能正確識別原始摘要，而63.4%偏好AI生成的摘要。分析指出，偏好原始摘要的受訪者更容易正確識別。這顯示人類在區分AI與人類生成內容上面臨挑戰，並且對AI生成的摘要有明顯偏好，突顯了AI在學術寫作中的影響及其倫理考量。 PubMed DOI

Detecting Artificial Intelligence-Generated Versus Human-Written Medical Student Essays: Semirandomized Controlled Study.
檢測人工智慧生成與人類撰寫的醫學生論文：半隨機對照研究。 JMIR Med Educ 2025-03-07

這項研究探討醫療專家與人文學者在辨識醫學生與ChatGPT生成文本的能力。研究於2023年5月至8月進行，35位專家分析了兩篇醫學主題的文本，並被要求找出AI生成的部分。結果顯示，專家們在70%的情況下正確識別AI文本，兩組專家之間差異不大。雖然內容錯誤影響不大，但冗餘、重複和連貫性等風格特徵對他們的判斷至關重要。研究建議未來可在不同學術領域進一步探討，以提升辨識能力。 PubMed DOI

Using aggregated AI detector outcomes to eliminate false-positives in STEM-student writing.
利用聚合的 AI 偵測結果消除 STEM 學生寫作中的假陽性。 Adv Physiol Educ 2025-03-19

這項研究探討了人工智慧檢測器在辨別學生撰寫的論文與AI生成論文的效果，參與者為190名低年級解剖學與生理學的學生。研究分析了50篇論文，使用四種AI檢測器，並由人類評分者評估48篇。結果顯示，人類評分者的準確率為84-95%，而AI檢測器則為93-98%。假陽性率低，AI檢測器僅有1.3%的錯誤分類。學生調查顯示，許多人認為AI生成的論文優於自己的作品。整體來看，結合使用AI檢測器對教師評估學生作品是有效的策略。 PubMed DOI

Identification of dental related ChatGPT generated abstracts by senior and young academicians versus artificial intelligence detectors and a similarity detector.
年長與年輕學者對於牙科相關 ChatGPT 生成摘要的識別，與人工智慧檢測器及相似性檢測器的比較。 Sci Rep 2025-04-02

這項研究探討了如何區分人類撰寫的摘要與ChatGPT生成的摘要，分析了160篇摘要，並使用了三種AI檢測工具和一個抄襲檢測器。研究發現，所有方法對摘要來源的判斷都有誤，學者的經驗影響檢測準確性，資深學者表現最佳。GPTZero和相似性檢測器在識別來源上特別有效。研究建議人類專家與AI工具合作，能提升識別學術摘要的準確性。 PubMed DOI

Association of reviewer experience with discriminating human-written versus ChatGPT-written abstracts.
評審經驗與區分人類撰寫與 ChatGPT 撰寫摘要的關聯性。 Int J Gynecol Cancer 2025-04-14

這項研究探討審稿人的經驗是否影響他們辨識人類撰寫與ChatGPT生成的摘要的能力。三十位審稿人被分為資深、初級和住院醫師，評估20篇摘要。結果顯示，整體正確識別率為50%，資深審稿人表現最佳，達60%。經驗和對AI的熟悉度與識別率有顯著關聯，顯示經驗在評估AI生成內容時的重要性。 PubMed DOI

Detection and classification of ChatGPT-generated content using deep transformer models.
使用深度 Transformer 模型偵測與分類 ChatGPT 生成內容 Front Artif Intell 2025-04-21

這項研究建立了一個結合人類和 ChatGPT 生成文本的資料集，訓練多種機器學習模型來偵測 AI 內容。以 Transformer 架構、特別是自訂 RoBERTa 模型，能有效分辨 AI 與人類文本（F1 分數 0.992，準確率 0.991），為 AI 文字偵測提供強力基準。未來建議擴展到其他 AI 來源並持續優化偵測技術。 PubMed DOI

Assessing the Capability of Large Language Model Chatbots in Generating Plain Language Summaries.
大型語言模型聊天機器人在產生淺顯易懂摘要之能力評估 Cureus 2025-04-22

這項研究發現，AI聊天機器人產生的科學白話摘要比人類寫的更容易懂，對教育程度較低的人特別有幫助，品質也差不多。研究人員，尤其是非英語母語者，可以用AI來寫PLS，但還是要記得檢查內容有沒有錯。 PubMed DOI

Can AI Tools Reliably and Effectively Detect Plagiarism in Scientific Writing?
AI 工具能否可靠且有效地偵測科學寫作中的抄襲？ Cureus 2025-06-12

這項研究發現，目前免費的AI工具（如ChatGPT、Bard、SmallSEO）在偵測科學論文抄襲上效果有限，尤其對AI重寫過的內容幾乎無法辨識。也就是說，AI不僅難以抓出抄襲，還能幫助抄襲內容規避偵測，現階段並不可靠。 PubMed DOI

原始文章

站上相關主題文章列表