LLM 相關三個月內文章 / 第 80 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

最近的研究顯示,像ChatGPT這樣的大型語言模型(LLMs)能有效通過美國醫學執照考試(USMLE),但對其在特定醫學領域的表現缺乏深入分析。研究比較了不同版本的ChatGPT(GPT-3.5、GPT-4和GPT-4 Omni)在750道臨床情境選擇題中的準確性。結果顯示,GPT-4 Omni的準確率最高,達90.4%,顯著超過其他版本及醫學生的平均準確率。這顯示出其在醫學教育中的潛在價值,但也強調了謹慎整合LLMs的重要性。 相關文章 PubMed DOI

網路犯罪對重要數據造成威脅,促使組織成立網路安全事件響應小組(CSIRTs)來監控和調查威脅。為了測試防禦技術和CSIRTs的能力,通常由「紅隊」進行對手模擬。為簡化此過程,我們提出了SpecRep系統,根據特定攻擊者目標構建攻擊場景,並開發元語言和編譯器生成攻擊場景。此外,我們利用文本處理工具和大型語言模型,從公開白皮書中提取資訊,轉化為可供SpecRep模擬的攻擊規範,已在智慧家庭、大型企業和工業控制系統中展示模擬能力。 相關文章 PubMed DOI

大型語言模型(LLMs)有潛力顯著改變臨床醫學,能改善醫療服務的可及性、增強診斷、協助手術規劃及促進教育。不過,這些模型的有效運用需謹慎設計提示,以應對幻覺和偏見等挑戰。理解標記化、嵌入和注意力機制等關鍵概念,以及運用策略性提示技術,對生成準確輸出至關重要。AI技術與醫療專業人員的合作、重視倫理問題如數據安全和偏見緩解,能提升醫療服務質量與可及性。持續的研究與發展對於發揮LLMs在醫療領域的潛力至關重要。 相關文章 PubMed DOI

這項研究評估了ChatGPT-3.5在提供阻塞性睡眠呼吸暫停症(OSA)資訊的有效性,並與Google搜尋進行比較。結果顯示,ChatGPT-3.5在資訊品質和可靠性上明顯優於Google搜尋,但可讀性較差。具體來說,ChatGPT-3.5在全球品質評分和內容可靠性上得分較高,而Google搜尋則提供了更易讀的內容。研究指出,ChatGPT-3.5是病人教育的好資源,但需改善可讀性,以便讓更多病人能夠理解。醫療提供者應協助病人評估線上健康資訊的可靠性。 相關文章 PubMed DOI

這項研究評估了多種人工智慧模型在台灣急診醫學專科考試中的表現,包括ChatGPT-3.5、GPT-4、自訂GPT和GPT-4o。共施測200道單選題,結果顯示GPT-4o以138題的正確率最高,接著是自訂GPT的119題、GPT-4的105題和GPT-3.5的77題。統計分析顯示GPT-4o優於GPT-4,GPT-4又優於GPT-3.5,自訂GPT則優於GPT-4但不及GPT-4o。研究強調大型語言模型在醫學教育中的潛力,並指出其在考試準備和資訊提供上的優勢。 相關文章 PubMed DOI

這項研究探討了ChatGPT在遠距醫療管理轉移性前列腺癌的有效性,並與腫瘤科醫師進行比較,特別是在COVID-19疫情期間。研究分析了102名患者,重點在於ChatGPT在病歷記錄和決定面對面諮詢時的協助能力。結果顯示,ChatGPT與腫瘤科醫師在治療決策上有中等程度的一致性(Cohen's Kappa = 0.43, p < 0.001),診斷數量相似(中位數各為5,p = 0.12)。雖然結果顯示合理的一致性,但仍需進一步研究以了解其在醫療中的潛在應用。 相關文章 PubMed DOI

這篇系統性回顧強調了人工智慧(AI)在醫療領域的進展,特別是2010至2023年間在醫學影像檢測骨折的應用。研究評估了各種AI模型,尤其是卷積神經網絡(CNN),在準確性、敏感性和特異性上優於傳統方法。回顧還探討了3D CT和MRI與AI演算法的整合,提升了診斷準確性和病人結果。此外,生成式AI和大型語言模型(LLMs)在合成數據和臨床模擬中的潛力也被提及。最後,文章指出了研究中的空白並建議未來的改進方向。 相關文章 PubMed DOI

基於變壓器的語言模型(LLMs)在分析生物序列數據上表現優異,因為它們能學習複雜關係,類似於處理自然語言的方式。我們的研究聚焦於DNABERT,這是一個專為人類基因組訓練的DNA語言模型,使用重疊的k-mer作為標記。我們開發了一種方法來研究模型的學習過程,並評估其在特定任務中的有效性。結果顯示,雖然重疊k-mer模型在基因組相關任務中表現良好,但在學習較大序列上下文時卻面臨挑戰,這強調了檢視生物LLMs知識表徵的重要性。 相關文章 PubMed DOI

人工智慧(AI)正在革新生物醫學研究,特別是在頭痛疾病如偏頭痛的治療上。透過機器學習,AI能分析大量健康數據,幫助理解疾病機制並預測病人對治療的反應。未來的AI整合可能帶來精準治療,改善臨床實踐,提升病人結果,並減輕醫師負擔。 AI工具如大型語言模型可自動化臨床筆記,並識別有效藥物組合,降低醫師的認知負擔。此外,虛擬健康助理和可穿戴設備在偏頭痛管理中也扮演重要角色。儘管AI的潛力巨大,但仍需克服技術素養、隱私和法規等挑戰。 相關文章 PubMed DOI

這項研究評估了六個大型語言模型(LLM)的表現,並與生物醫學及健康資訊學課程學生的知識評估分數進行比較。研究涵蓋139名學生,包括研究生、繼續教育學生和醫學生,他們回答了多選題和期末考。結果顯示,這些LLM的得分介於學生的第50到75百分位之間,表現相當不錯。這引發了對高等教育中學生評估方法的思考,特別是在在線課程中,因為LLM的能力可能會挑戰傳統的評估方式。 相關文章 PubMed DOI