Comparison of Medical Research Abstracts Written by Surgical Trainees and Senior Surgeons or Generated by Large Language Models.
外科實習生與資深外科醫生撰寫的醫學研究摘要及大型語言模型生成的摘要比較。 JAMA Netw Open 2024-08-02

這項研究評估了ChatGPT 3.5和4.0版本在生成和評分醫學研究摘要的能力。研究期間為2023年8月至2024年2月，訓練聊天機器人根據文獻創建10個摘要，並與現有摘要進行比較。五位外科醫生評審發現，AI生成的摘要與人類撰寫的質量相當，評分中位數相似。雖然版本1的評分接近評審者的評價，但版本2則偏向給予較高分數。整體而言，研究顯示AI能有效生成難以區分的醫學摘要，顯示其在醫學研究中的潛力。 PubMed DOI

Human or Machine? A Comparative Analysis of Artificial Intelligence-Generated Writing Detection in Personal Statements.
人類還是機器？人工智慧生成寫作檢測在個人陳述中的比較分析。 J Phys Ther Educ 2025-01-14

這項研究探討了人類評審、重複量化分析（RQA）和AI檢測工具GPTZero在辨別人類與AI生成的個人陳述的有效性，特別針對物理治療師教育計畫的申請。研究分析了50份梅奧診所的申請者陳述與50份由Google Gemini生成的陳述。結果顯示，人類評審在辨識上表現一致且準確，而RQA和GPTZero也各有優勢。研究強調，未來應結合這些方法，以提升對個人陳述的評估，確保學術誠信。 PubMed DOI

Evaluating human ability to distinguish between ChatGPT-generated and original scientific abstracts.
評估人類區分 ChatGPT 生成與原創科學摘要的能力。 Updates Surg 2025-01-24

這項研究探討人類評審者在辨識ChatGPT生成的科學摘要與原始摘要的準確性。來自不列顛哥倫比亞大學的41名外科實習生和教職員參加了線上調查，結果顯示只有40%能正確識別原始摘要，而63.4%偏好AI生成的摘要。分析指出，偏好原始摘要的受訪者更容易正確識別。這顯示人類在區分AI與人類生成內容上面臨挑戰，並且對AI生成的摘要有明顯偏好，突顯了AI在學術寫作中的影響及其倫理考量。 PubMed DOI

Detecting Artificial Intelligence-Generated Versus Human-Written Medical Student Essays: Semirandomized Controlled Study.
檢測人工智慧生成與人類撰寫的醫學生論文：半隨機對照研究。 JMIR Med Educ 2025-03-07

這項研究探討醫療專家與人文學者在辨識醫學生與ChatGPT生成文本的能力。研究於2023年5月至8月進行，35位專家分析了兩篇醫學主題的文本，並被要求找出AI生成的部分。結果顯示，專家們在70%的情況下正確識別AI文本，兩組專家之間差異不大。雖然內容錯誤影響不大，但冗餘、重複和連貫性等風格特徵對他們的判斷至關重要。研究建議未來可在不同學術領域進一步探討，以提升辨識能力。 PubMed DOI

Human Reviewers' Ability to Differentiate Human-Authored or Artificial Intelligence-Generated Medical Manuscripts: A Randomized Survey Study.
人類審稿者區分人類撰寫或人工智慧生成醫學手稿的能力：一項隨機調查研究。 Mayo Clin Proc 2025-03-09

這項研究評估人類是否能區分由人類撰寫的醫學手稿與AI生成的手稿，特別是使用ChatGPT 3.5。研究於2023年10月進行，51位醫師參與，隨機審閱三篇手稿。結果顯示，參與者識別作者的準確率不高，特異性55.6%，敏感性31.2%。高影響因子的手稿較易識別，而影響因子低的則較難。與AI互動頻率高的人更能正確識別作者。總之，研究顯示生成式AI的醫學手稿難以區分，凸顯學術出版的潛在影響及對AI內容認識的需求。 PubMed DOI

Comparative Assessment of the Knowledge, Awareness, and Practices Regarding an Artificial Intelligence Tool (Chat Generative Pre-trained Transformer or ChatGPT) Among Dental Undergraduate and Postgraduate Students and the Teaching Faculty.
牙科本科生、研究生及教學教職員對人工智慧工具（Chat Generative Pre-trained Transformer 或 ChatGPT）知識、認知及實踐的比較評估。 Cureus 2025-03-19

人工智慧（AI）正在改變牙科領域，特別是ChatGPT等工具在診斷和治療計畫中展現潛力。本研究調查了384名印度馬哈拉施特拉邦的牙科學生和教職員對ChatGPT的認知與使用情況。結果顯示，87.2%的受訪者認識到ChatGPT的AI特性，研究生對其知識和使用意願較高，但教職員對數據隱私的擔憂更重。為了更好地整合AI於牙科教育，需開發針對性的培訓計畫。 PubMed DOI

Association of reviewer experience with discriminating human-written versus ChatGPT-written abstracts.
評審經驗與區分人類撰寫與 ChatGPT 撰寫摘要的關聯性。 Int J Gynecol Cancer 2025-04-14

這項研究探討審稿人的經驗是否影響他們辨識人類撰寫與ChatGPT生成的摘要的能力。三十位審稿人被分為資深、初級和住院醫師，評估20篇摘要。結果顯示，整體正確識別率為50%，資深審稿人表現最佳，達60%。經驗和對AI的熟悉度與識別率有顯著關聯，顯示經驗在評估AI生成內容時的重要性。 PubMed DOI

Man Versus Machine: A Comparative Study of Human and ChatGPT-Generated Abstracts in Plastic Surgery Research.
人類與機器的對決：人類與 ChatGPT 生成的整形外科研究摘要的比較研究。 Aesthetic Plast Surg 2025-04-14

這項研究探討了ChatGPT-4在生成科學摘要方面的能力，分析了十篇來自PubMed的整形外科文章。研究使用Flesch-Kincaid年級水平和可讀性評分來評估生成的摘要。結果顯示，雖然ChatGPT生成的摘要在可讀性上略高，但評估者90%的時間偏好ChatGPT的版本，並認為其更清晰簡潔。整體來看，研究顯示ChatGPT能有效生成高品質的科學摘要，但仍需進一步研究來確認這些結果。 PubMed DOI

From Algorithms to Academia: An Endeavor to Benchmark AI-Generated Scientific Papers against Human Standards.
從演算法到學術界：以人類標準評估 AI 生成科學論文的嘗試 Arch Bone Jt Surg 2025-05-07

這項研究比較AI（ChatGPT和scite Assistant）和人類寫的科學論文，評估正確性、可讀性和被接受度。結果顯示，人類寫的論文品質最高，尤其是跟骨骨折主題。AI寫的論文內容大致正確，但引用準確度不一，ChatGPT表現較好。結論是AI能輔助科學寫作，但還是需要嚴格查證，才能確保內容正確。 PubMed DOI

EXPRESS: Large Language Model Content Detectors: Effects of Human Editing and ChatGPT Mimicking Individual Style - A Preliminary Study.
EXPRESS：大型語言模型內容偵測器：人工編輯與ChatGPT模仿個人風格的影響——初步研究 J Investig Med 2025-06-17

這項初步研究發現，AI生成的學術摘要即使經過人工編輯或模仿特定作者風格，還是有很大機率被AI偵測工具抓出來。雖然人工編輯能降低被發現的機率，但不代表就能完全避開偵測。不同偵測工具結果也不太一樣，未來還需要更多研究來釐清AI寫作和偵測之間的互動。 PubMed DOI

原始文章

站上相關主題文章列表