LLM 相關三個月內文章 / 第 4 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

您對AI檢測軟體在識別AI生成文本的研究非常深入。透過使用ChatGPT撰寫有關「電休克療法(ECT)在治療抵抗性憂鬱症中的角色」的文章,並進行改寫,您測試了多種檢測工具的有效性。 結果顯示,這些工具的敏感性差異很大,從0%到100%不等。特別是,有一半的工具在檢測原始AI生成內容時達到100%準確率,而其他工具在改寫文本時也表現不錯。這顯示出某些工具的有效性,但仍需改進。 您的結論強調了AI在學術寫作中的角色及其潛在風險,特別是對作者可信度的影響。學術期刊對AI生成內容的限制也引發了持續的討論。總體而言,您的研究為AI檢測軟體的現狀及其對學術誠信的影響提供了重要見解。 相關文章 PubMed DOI

**引言** 人工智慧(AI)在醫學領域受到廣泛關注,尤其是大型語言模型(LLMs)如ChatGPT的興起,使其對醫學生更具可及性。本研究探討醫學生如何使用基於LLM的工具及其看法。 **方法** 2024年1月,佛羅里達大學醫學院對醫學生進行調查,評估他們對AI和LLM工具的使用情況及看法。 **結果** 102名受訪者中,69%每月至少使用一次這些工具,77.1%認為信息準確,80%有意在未來繼續使用。對AI有基本了解的學生更可能使用這些工具並進行信息交叉檢查。接觸過AI的學生對臨床決策中信任AI的可能性更高。 **結論** 基於LLM的聊天機器人已成為醫學生學習的重要資源,醫學生普遍對其持正面看法,並希望在課程中納入AI,以準備未來的實踐。 相關文章 PubMed DOI

本研究探討在醫院中使用ChatGLM提取真實世界數據(RWD)的可行性,並與傳統手動流程進行比較。研究結合了ChatGLM、電子病例報告表(eCRFs)和電子健康紀錄,並利用LLaMA模型評估數據提取準確性。結果顯示,ChatGLM輔助的數據轉錄效率提升了80.7%。雖然手動輸入準確率高達99.59%,但ChatGLM和LLaMA的準確率分別為77.13%和43.86%。研究還指出了提示設計、輸出一致性等挑戰,並強調了增強互操作性和透明度的重要性。 相關文章 PubMed DOI

這篇文章探討了人工智慧的興起,特別是大型語言模型(LLMs)對各領域的影響,尤其是在醫學上。像ChatGPT和Bard這類模型,透過大量文本數據訓練,能生成回應,並在科學研究中協助處理醫療數據、診斷及撰寫學術材料。文章也提到LLMs的未來潛力、應用挑戰,以及監控使用以確保道德和有效實施的重要性。 相關文章 PubMed DOI

這項研究比較了ChatGPT 3.5和Google Bard在牙科教育中的表現。研究設計了七個問題來評估這些模型的能力,包括創建練習和模擬牙科問題。結果顯示,ChatGPT 3.5在創建相關練習和評估工具方面表現較佳,而Bard在檢索和批評研究文章上更為出色。研究強調了生成語言模型在增強牙科教育的潛力,但也指出了模型表現的差異,建議對基於證據的內容生成進行針對性訓練,並提醒教育者在依賴AI進行重要決策時要謹慎。 相關文章 PubMed DOI

這項研究探討將生成式人工智慧(ChatGPT)、模板和數位影像整合進針刺技能訓練的效果,並與傳統訓練比較。90位醫師分為三組:傳統訓練、模板與數位影像訓練,以及結合ChatGPT的訓練。結果顯示,ChatGPT組在理論知識上顯著提升,技術技能評分也高於傳統組,且學習進展最快。受訓者對ChatGPT組的滿意度最高,顯示這種訓練方法更受歡迎。整體而言,這些技術創新有效提升了醫療技能的學習效果。 相關文章 PubMed DOI

CRISPR-Cas 系統的引入大幅推進了基因編輯技術。傳統上,發現 Cas 蛋白常依賴序列相似性,可能會忽略遠端同源物。隨著大型語言模型的發展,現在可以在不需大量訓練數據的情況下對 Cas 系統進行建模。我們提出的 CHOOSER 框架,能無需對齊地發現 CRISPR-Cas 系統,特別是具自我處理 pre-crRNA 能力的系統。透過 CHOOSER,我們識別出 11 個新 Casλ 同源物,顯示其在基因編輯領域的潛力。 相關文章 PubMed DOI

這項研究評估生成式預訓練變壓器(GPT)在牙科領域創建科學摘要的效果。研究人員從十篇牙科放射學文章中收集原始摘要,並用其他十篇文章的內容提示ChatGPT生成摘要。五位評估者根據七個標準對生成的摘要和原始摘要進行評分。結果顯示,GPT生成的摘要在拼寫和標點符號上最具區別性,整體準確性平均為60%。雖然GPT的表現優異,但線上檢測器仍能識別AI生成的內容。 相關文章 PubMed DOI

這項研究評估了四個大型語言模型(LLMs)在解答牙周病學問題的可靠性,包括ChatGPT 4.0、Google Gemini、Google Gemini Advanced和Microsoft Copilot。研究提出十個問題,並由兩位牙周病專家根據全面性、準確性、清晰度和相關性進行評分。結果顯示,ChatGPT 4.0表現最佳,而Google Gemini得分最低。雖然LLMs在臨床實踐中有潛力,但不應取代專業牙醫,因為不準確的資訊可能影響病人護理。總之,ChatGPT 4.0優於其他模型,但仍需注意其局限性。 相關文章 PubMed DOI

臨床決策中的認知偏誤可能導致誤診和病人不良結果。本研究探討大型語言模型(LLMs)如何透過多代理框架來減少這些偏誤。研究人員模擬臨床決策,創建不同角色的代理進行對話,以提高診斷準確性。分析16個因認知偏誤而誤診的案例,測試各種代理組合。使用GPT-4的代理包括決策者、挑戰偏誤的魔鬼代言人等。結果顯示,初始診斷準確率為0%,但經過討論後,最佳框架的準確率提升至76%。這顯示LLM驅動的對話在醫療情境中具潛力。 相關文章 PubMed DOI