原始文章

這項研究探討了如何區分人類撰寫的摘要與ChatGPT生成的摘要,分析了160篇摘要,並使用了三種AI檢測工具和一個抄襲檢測器。研究發現,所有方法對摘要來源的判斷都有誤,學者的經驗影響檢測準確性,資深學者表現最佳。GPTZero和相似性檢測器在識別來源上特別有效。研究建議人類專家與AI工具合作,能提升識別學術摘要的準確性。 PubMed DOI


站上相關主題文章列表

研究評估使用人工智慧模型ChatGPT生成臨床研究論文摘要的效果。30篇基礎研究論文透過ChatPDF生成摘要,專家評估後發現,生成摘要質量低、格式差異大、結論不正確,且與原摘要相似度低。使用ChatGPT生成摘要時,可能會有質量和準確性問題。 PubMed DOI

研究發現,審稿人經驗對區分人類和ChatGPT寫作摘要有影響。30位審稿人評估了10篇人類和10篇ChatGPT寫作的摘要,結果顯示人類摘要較易被辨識。資深審稿人辨識率高於初級審稿人和住院醫師,經驗和對人工智慧熟悉程度與辨識率有關。ChatGPT摘要有46.3%被正確辨識,與經驗豐富的審稿人相關。 PubMed DOI

研究比較人類審查員和AI檢測軟體在醫學領域摘要辨識的表現,結果顯示AI較佳但有限制。Grammarly指出原創摘要問題多於AI。建議未來醫學研究需明確AI使用指南,因AI普及需求增加。 PubMed DOI

研究發現大學教師通常能分辨學生和ChatGPT生成的反思,且對反思主題分析沒有太大差異。儘管意見有些不同,但結果顯示ChatGPT在牙科教育和研究上有應用潛力。 PubMed DOI

評審人員在肩膀和肘部手術領域的測試中,發現區分人工智慧生成和原創研究摘要的挑戰。他們對人工智慧生成的辨識率為62%,但有38%的原創摘要被誤認為人工智慧生成。GPTZero工具生成的摘要被認為具有較高的人工智慧概率。在抄襲檢測方面,人工智慧生成的摘要得分較低。評審人員表示區分人類和人工智慧生成的內容相當困難,不實際的數據有助於識別人工智慧生成的摘要,而寫作風格則導致原創摘要被誤認。 PubMed DOI

本研究探討生成式人工智慧工具ChatGPT對牙科研究寫作的影響,分析2018至2024年間在PubMed的牙科出版物摘要。研究對299,695篇摘要進行關鍵字分析,發現ChatGPT發布前每10,000篇論文中出現的「信號詞」頻率為47.1,發布後增至224.2,增幅顯著。其中「delve」的使用增幅最大。研究顯示生成式人工智慧在牙科研究中的採用逐漸增加,雖然可能提升生產力,但也引發對偏見和不準確性的擔憂,強調需制定明確指導方針以確保學術出版的責任性。 PubMed DOI

這項研究評估了ChatGPT 3.5和4.0版本在生成和評分醫學研究摘要的能力。研究期間為2023年8月至2024年2月,訓練聊天機器人根據文獻創建10個摘要,並與現有摘要進行比較。五位外科醫生評審發現,AI生成的摘要與人類撰寫的質量相當,評分中位數相似。雖然版本1的評分接近評審者的評價,但版本2則偏向給予較高分數。整體而言,研究顯示AI能有效生成難以區分的醫學摘要,顯示其在醫學研究中的潛力。 PubMed DOI

這項研究評估生成式預訓練變壓器(GPT)在牙科領域創建科學摘要的效果。研究人員從十篇牙科放射學文章中收集原始摘要,並用其他十篇文章的內容提示ChatGPT生成摘要。五位評估者根據七個標準對生成的摘要和原始摘要進行評分。結果顯示,GPT生成的摘要在拼寫和標點符號上最具區別性,整體準確性平均為60%。雖然GPT的表現優異,但線上檢測器仍能識別AI生成的內容。 PubMed DOI

這項研究探討人類評審者在辨識ChatGPT生成的科學摘要與原始摘要的準確性。來自不列顛哥倫比亞大學的41名外科實習生和教職員參加了線上調查,結果顯示只有40%能正確識別原始摘要,而63.4%偏好AI生成的摘要。分析指出,偏好原始摘要的受訪者更容易正確識別。這顯示人類在區分AI與人類生成內容上面臨挑戰,並且對AI生成的摘要有明顯偏好,突顯了AI在學術寫作中的影響及其倫理考量。 PubMed DOI

這項研究探討醫療專家與人文學者在辨識醫學生與ChatGPT生成文本的能力。研究於2023年5月至8月進行,35位專家分析了兩篇醫學主題的文本,並被要求找出AI生成的部分。結果顯示,專家們在70%的情況下正確識別AI文本,兩組專家之間差異不大。雖然內容錯誤影響不大,但冗餘、重複和連貫性等風格特徵對他們的判斷至關重要。研究建議未來可在不同學術領域進一步探討,以提升辨識能力。 PubMed DOI