原始文章

這項初步研究發現,AI生成的學術摘要即使經過人工編輯或模仿特定作者風格,還是有很大機率被AI偵測工具抓出來。雖然人工編輯能降低被發現的機率,但不代表就能完全避開偵測。不同偵測工具結果也不太一樣,未來還需要更多研究來釐清AI寫作和偵測之間的互動。 PubMed DOI


站上相關主題文章列表

學者對於AI在學術寫作中的影響看法不一,尤其在報告AI使用時存在爭議。倫理、學術角色和語言背景都影響了他們的立場。強調了在準備手稿時要求報告AI使用的挑戰,因為尚無共識,且檢測工具難以辨識微妙的情況。 PubMed DOI

這項研究探討了人類評審、重複量化分析(RQA)和AI檢測工具GPTZero在辨別人類與AI生成的個人陳述的有效性,特別針對物理治療師教育計畫的申請。研究分析了50份梅奧診所的申請者陳述與50份由Google Gemini生成的陳述。結果顯示,人類評審在辨識上表現一致且準確,而RQA和GPTZero也各有優勢。研究強調,未來應結合這些方法,以提升對個人陳述的評估,確保學術誠信。 PubMed DOI

這項研究探討人類評審者在辨識ChatGPT生成的科學摘要與原始摘要的準確性。來自不列顛哥倫比亞大學的41名外科實習生和教職員參加了線上調查,結果顯示只有40%能正確識別原始摘要,而63.4%偏好AI生成的摘要。分析指出,偏好原始摘要的受訪者更容易正確識別。這顯示人類在區分AI與人類生成內容上面臨挑戰,並且對AI生成的摘要有明顯偏好,突顯了AI在學術寫作中的影響及其倫理考量。 PubMed DOI

這項研究探討醫療專家與人文學者在辨識醫學生與ChatGPT生成文本的能力。研究於2023年5月至8月進行,35位專家分析了兩篇醫學主題的文本,並被要求找出AI生成的部分。結果顯示,專家們在70%的情況下正確識別AI文本,兩組專家之間差異不大。雖然內容錯誤影響不大,但冗餘、重複和連貫性等風格特徵對他們的判斷至關重要。研究建議未來可在不同學術領域進一步探討,以提升辨識能力。 PubMed DOI

這項研究探討了人工智慧檢測器在辨別學生撰寫的論文與AI生成論文的效果,參與者為190名低年級解剖學與生理學的學生。研究分析了50篇論文,使用四種AI檢測器,並由人類評分者評估48篇。結果顯示,人類評分者的準確率為84-95%,而AI檢測器則為93-98%。假陽性率低,AI檢測器僅有1.3%的錯誤分類。學生調查顯示,許多人認為AI生成的論文優於自己的作品。整體來看,結合使用AI檢測器對教師評估學生作品是有效的策略。 PubMed DOI

這項研究探討了如何區分人類撰寫的摘要與ChatGPT生成的摘要,分析了160篇摘要,並使用了三種AI檢測工具和一個抄襲檢測器。研究發現,所有方法對摘要來源的判斷都有誤,學者的經驗影響檢測準確性,資深學者表現最佳。GPTZero和相似性檢測器在識別來源上特別有效。研究建議人類專家與AI工具合作,能提升識別學術摘要的準確性。 PubMed DOI

這項研究探討審稿人的經驗是否影響他們辨識人類撰寫與ChatGPT生成的摘要的能力。三十位審稿人被分為資深、初級和住院醫師,評估20篇摘要。結果顯示,整體正確識別率為50%,資深審稿人表現最佳,達60%。經驗和對AI的熟悉度與識別率有顯著關聯,顯示經驗在評估AI生成內容時的重要性。 PubMed DOI

這項研究建立了一個結合人類和 ChatGPT 生成文本的資料集,訓練多種機器學習模型來偵測 AI 內容。以 Transformer 架構、特別是自訂 RoBERTa 模型,能有效分辨 AI 與人類文本(F1 分數 0.992,準確率 0.991),為 AI 文字偵測提供強力基準。未來建議擴展到其他 AI 來源並持續優化偵測技術。 PubMed DOI

這項研究發現,AI聊天機器人產生的科學白話摘要比人類寫的更容易懂,對教育程度較低的人特別有幫助,品質也差不多。研究人員,尤其是非英語母語者,可以用AI來寫PLS,但還是要記得檢查內容有沒有錯。 PubMed DOI

這項研究發現,目前免費的AI工具(如ChatGPT、Bard、SmallSEO)在偵測科學論文抄襲上效果有限,尤其對AI重寫過的內容幾乎無法辨識。也就是說,AI不僅難以抓出抄襲,還能幫助抄襲內容規避偵測,現階段並不可靠。 PubMed DOI