Awareness and use of generative AI-powered tools: results of one-year follow-up prospective cross-sectional global survey.

生成式 AI 工具的認知與使用情形：一年期追蹤前瞻性全球橫斷面調查結果

<think> 好的，我现在需要分析用户提供的PubMed研究标题和摘要，并从六个角度进行深入分析。首先，我得仔细阅读摘要，理解研究的目的、方法、结果以及结论。研究的标题是关于生成式AI工具的意识和使用情况的一年随访调查。摘要中提到，他们调查了泌尿科专业人士使用GPT和LLM chatbots的情况，比较了基线调查和一年后的结果。结果显示，在学术任务中使用显著增加，但在临床任务中使用减少，尤其是在治疗决策和随访护理方面。接下来，我需要从六个角度来分析： 1. 研究目的与假设：研究主要探讨了泌尿科专业人士使用GPT/LLMs chatbots的变化，以及这些工具在学术和临床中的应用。假设可能是这些工具在学术中的使用会增加，而在临床中的使用可能因风险而有所保留。 2. 方法与设计：采用了一年随访的横断面调查，样本量为129，使用卡方检验和t检验。优点是能追踪变化，缺点是样本可能不够大，且为自我报告，存在偏差。 3. 数據解釋與結果：结果支持假设，学术使用增加，临床使用减少，尤其是治疗决策和随访护理。这可能反映了对AI在临床决策中可靠性的担忧。 4. 局限性与偏見：样本量小，可能存在选择偏差，且仅限于泌尿科，无法推广到其他领域。自我报告可能导致记忆偏差。 5. 臨床及未來研究意涵：研究强调了AI在学术中的潜力，但临床应用需要更多验证，确保安全性和有效性。 6. 其他觀點：可能存在伦理和法律问题，或者工具本身的改进空间。另外，用户接受度和培训可能影响使用情况。现在，我需要将这些思考整理成连贯的分析，引用摘要中的具体内容来支持每个观点。 </think> ### 1. 研究目的與假設這項研究的主要目的是探討泌尿科專業人士在學術和臨床活動中使用生成式人工智慧（Generative AI, GenAI）工具的變化趨勢。具體來說，研究側重於了解基於生成式預訓練變壓器（GPTs）和大型語言模型（LLMs）的聊天機器人在學術任務和臨床任務中的使用情況，以及其在一年的時間跨度內的演變。研究假設可能是，這些工具在學術任務中的使用會增加，而在臨床任務中的使用可能因為風險和不確定性而有所保留。摘要中提到，研究旨在「assess how the use of GPTs/LLMs chatbots by professionals working in urology has changed over time in the setting of academic and clinical activities」，這表明研究假設這些工具的使用模式會隨時間演變，可能在學術領域更為普及，而在臨床領域則可能因為專業倫理和準確性問題而受到限制。 ### 2. 方法與設計研究採用了一年隨訪的前瞻性横斷面調查，調查對象為泌尿科專業人士。調查結果通過卡方檢驗和t檢驗來比較類別變量和連續變量。這種研究設計的優點在於可以追蹤變化趨勢，並提供時間序列的數據。然而，研究樣本量為129人，可能限制了結果的普適性。此外，調查為自我報告式，可能存在記憶偏差或社交期望偏差。研究方法的合理性在於其能夠捕捉使用模式的變化，但潛在缺陷在於樣本量可能不足以代表整體泌尿科專業人士的使用情況，且調查設計可能忽略了一些重要的外部變量，如科技採用率的地區差異或個體差異。 ### 3. 數據解釋與結果研究結果顯示，86%的參與者報告使用GPTs/LLMs聊天機器人進行學術任務，較之前的52.4%有顯著增加（P<0.001）。這表明學術領域中，這些工具的使用indeed有顯著提升，支持了研究假設。然而，在臨床任務中，參與者報告使用這些工具進行治療決策和病患隨訪護理的頻率有所下降（分別為18.6% vs. 31.0%和10.1% vs. 21.4%），這可能反映了臨床領域中對這些工具的風險和不確定性的擔憂。結果表明，GPTs/LLMs在學術任務中已經確立了其角色，但在臨床實踐中仍然存在一定的阻力。這可能是因為臨床決策需要更高的準確性和責任，而生成式AI在這些方面的可靠性仍然存在爭議。 ### 4. 局限性與偏見研究的局限性包括樣本量小，可能導致結果的不穩定性。此外，調查僅限於泌尿科專業人士，結果可能不適用於其他醫學領域。另一個潛在的偏見是自我報告偏差，參與者可能會高估或低估自己的使用情況。此外，研究可能忽略了其他重要變量，如參與者的年資、技術熟悉度或對AI的態度。研究還可能存在選擇偏差，因為只有那些願意參加調查的人士才會被納入樣本中，這可能導致結果不代表整體人群。此外，研究設計為前瞻性横斷面調查，缺乏對參與者使用行為的長期追蹤，可能無法捕捉更複雜的使用模式。 ### 5. 臨床及未來研究意涵這項研究的結果對臨床應用和未來研究具有重要意義。首先，研究表明生成式AI在學術領域的使用潛力，例如在文獻回顧、數據分析和報告撰寫等任務中，這些工具可以顯著提高效率。然而，在臨床領域，生成式AI的使用仍然存在障礙，可能需要進一步的研究來確保其安全性和有效性。未來研究可以側重於解決這些障礙，例如開發更準確和可靠的AI模型，或者設計更好的使用指南和倫理框架，以便在臨床實踢中更好地應用這些工具。此外，研究還可以探討如何提高專業人士對AI工具的信任和接受度。 ### 6. 其他觀點除了研究提到的結果，還存在其他可能的解釋和觀點。例如，生成式AI在臨床領域的使用減少可能不僅僅是因為準確性和風險的問題，還可能與法規和倫理考慮有關。例如，醫療機構可能對AI的使用有更嚴格的規範，或者專業人士可能對AI在敏感任務中的應用持更為謹慎的態度。另一個可能的觀點是，生成式AI在學術領域的普及可能導致學術工作的同質化，或者可能影響研究的原創性。這需要未來研究進一步探討。此外，研究結果可能受到工具本身的影響，例如GPTs/LLMs的更新版本可能在一年的時間跨度內引入了新的功能或改進，這可能影響使用模式。因此，未來研究可以考慮控制這些變量，以更好地了解使用模式的變化。總的來說，這項研究提供了有價值的見解，但仍需進一步研究以解決其局限性並探討更廣泛的應用和影響。