原始文章

這項研究評估了一個生成式人工智慧平台,旨在自動化根據泌尿科期刊文章創建社交媒體貼文。研究期間收集了100篇貼文,並開發了一個免費的GPT工具來生成包含標題摘要、關鍵發現等內容的貼文。三位醫師評估了生成貼文的準確性和適當性。結果顯示,76.6%的貼文符合準確性標準,且學術醫師和一般公眾均偏好GPT生成的貼文。研究結論認為,生成式人工智慧能有效自動化創建準確且受歡迎的社交媒體貼文,適用於學術界和大眾。 PubMed DOI


站上相關主題文章列表

研究發現,比較放射科醫師和GPT-4 AI生成的放射學報告,發現兩者在質量和內容上相當,但AI報告更為簡潔,且結構稍有不同。這顯示GPT-4可能是一個可靠的工具,有助於提升臨床效率和溝通。然而,仍需解決道德問題和限制,以確保安全實施。 PubMed DOI

ChatGPT是一個能夠創造類似人類寫作的語言模型,很難區分真假。研究測試人們是否能分辨AI生成的摘要和人類寫的,以及AI檢測器的準確性。骨科醫師和教授們辨識AI生成的摘要,結果喜憂參半。檢測AI內容對防止科學出版的虛假資訊至關重要,需要更多研究改進檢測方法。 PubMed DOI

研究比較ChatGPT和Bard等平台的AI回應與泌尿學官方病人教育資料,發現AI回應在準確性、全面性、清晰度和實用性方面表現較佳。然而,可讀性較差。雖AI被視為可靠資訊來源,但閱讀難度可能限制普羅大眾使用。 PubMed DOI

生成式人工智慧如CHATGPT在臨床護理和醫學教育中被應用。一項研究評估了CHATGPT 4在模擬加拿大泌尿科醫學委員會考試中的表現,結果顯示得分為46%,低於即將畢業的泌尿科住院醫師平均分數。CHATGPT在不同主題上表現有差異,尤其在腫瘤學方面表現較差。研究建議持續評估生成式人工智慧的能力,並進一步開發和訓練以提升在泌尿科領域的應用價值。 PubMed DOI

本研究評估了三個大型語言模型(LLMs)生成的泌尿科病人資訊小冊子(PILs)品質,包括ChatGPT-4、PaLM 2和Llama 2。針對包皮環切術、腎切除術、過動膀胱症候群及經尿道前列腺切除術(TURP)進行評估。結果顯示,PaLM 2的PILs品質最佳,平均得分3.58,且最易閱讀。雖然LLMs能減輕醫療人員負擔,但內容仍需臨床醫師審查,且閱讀水平偏高,顯示需改進算法或提示設計。病人對這些小冊子的滿意度尚未評估。 PubMed DOI

這項研究評估了ChatGPT 3.5和4.0版本在生成和評分醫學研究摘要的能力。研究期間為2023年8月至2024年2月,訓練聊天機器人根據文獻創建10個摘要,並與現有摘要進行比較。五位外科醫生評審發現,AI生成的摘要與人類撰寫的質量相當,評分中位數相似。雖然版本1的評分接近評審者的評價,但版本2則偏向給予較高分數。整體而言,研究顯示AI能有效生成難以區分的醫學摘要,顯示其在醫學研究中的潛力。 PubMed DOI

這項研究評估了ChatGPT在回應泌尿科病人訊息的有效性,結果顯示其回應中有47%適合用於病人溝通。分析指出,對於簡單問題,56%的回應被認為可接受;但對於較複雜的問題,只有34%被認可。評估標準包括準確性、完整性、有幫助性、可理解性及潛在傷害。總體來看,雖然ChatGPT能協助管理病人訊息,減輕醫療團隊負擔,但表現會因問題複雜度而異。隨著技術進步,預期其回應品質會進一步提升。 PubMed DOI

這項研究全面回顧了ChatGPT在臨床醫學、泌尿科及學術醫學的應用,並探討了相關的倫理挑戰與風險。研究團隊從2022年1月到2024年1月,針對泌尿科與人工智慧進行了廣泛搜尋。結果顯示,ChatGPT能協助生成準確的臨床文件及提供醫療資訊,但對資訊準確性仍有疑慮,需醫師監督以保障病人安全。在學術領域,ChatGPT可協助撰寫與整理數據,但需有指導方針以防學術不端。總之,雖然ChatGPT對泌尿科醫師及學術界有幫助,但人類監督仍是維護安全與透明的關鍵。 PubMed DOI

這項研究評估了病人教育材料的可讀性,並探討了生成式人工智慧工具(如ChatGPT-4和Google Gemini)如何將這些材料簡化到六年級的閱讀水平。分析了七份來自主要放射學團體的文件,原始材料的平均閱讀水平為11.72。經過簡化後,ChatGPT的閱讀水平降至7.32,Gemini則為6.55。ChatGPT減少了15%的字數,保留95%的資訊,而Gemini減少33%,保留68%。三位放射科醫師評估後認為,ChatGPT在適當性、清晰度和相關性上表現更佳。研究指出,生成式人工智慧能顯著改善病人教育材料的可讀性,但專家審查仍然很重要。 PubMed DOI

2022年11月推出的ChatGPT引起了對大型語言模型在臨床環境中應用的關注。最近一項針對英國全科醫生的調查顯示,20%的醫生已在臨床實踐中使用生成式人工智慧工具。使用者中,29%用於生成就診後文檔,28%用於建議鑑別診斷。儘管醫生認為這些工具在行政和臨床推理上有價值,但缺乏明確的指導和政策,醫療界面臨著教育專業人員和患者的挑戰。 PubMed DOI