LLM 相關三個月內文章 / 第 107 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

致癌物的識別與分類對癌症流行病學非常重要,但現有系統如IARC和NTP面臨文獻增長的挑戰。為此,我們開發了CarD-T框架,利用變壓器技術有效識別潛在致癌物。CarD-T在已知致癌物的PubMed摘要上進行訓練,並成功識別了60%的已確立致癌物,還提名了約1500個潛在致癌物。與GPT-4相比,CarD-T在召回率和F1分數上表現更佳,並能評估致癌性矛盾證據。總之,CarD-T是識別致癌物的強大工具,提升公共健康應對能力。 相關文章 PubMed DOI

這篇論文提出一種新方法,利用大型語言模型(LLMs)、AI代理和開放地理數據,提升城市騎乘安全。方法包括分析城市風險和現有騎乘設施的數據,並透過數據預處理和提示工程,創建友好的系統,提供騎乘安全見解。過程分為數據準備、代理協調和決策執行三步,確保開源工具有效整合,促進城市規劃者和騎士的可及性。研究顯示結合LLMs和AI代理的潛力,能改善騎乘實踐和城市交通規劃。 相關文章 PubMed DOI

這項研究評估了先進大型語言模型(LLMs)在醫學考試中的視覺能力,特別是GPT-4和Google的Gemini。研究比較了它們在台灣專科醫師考試(肺部與重症醫學)的表現,並以僅處理文本的GPT-3.5為基準。結果顯示,GPT-4的表現持續優於Gemini和GPT-3.5,經常超過60的及格門檻,接近人類考生的水準。相對而言,Gemini的表現較低,而GPT-3.5得分最低,顯示出新模型在解讀複雜醫療資訊方面的優勢。 相關文章 PubMed DOI

這項研究針對外語學習者在學習英語詞彙時的挑戰,透過語義標註的語料庫,建立了一份高頻詞義清單,主要來自當代美國英語和英國國家語料庫。研究人員利用BERT模型進行準確的語義標註,篩選出5000個關鍵詞義。這份清單有三大優勢:在不同語料庫中穩定覆蓋、高頻項目識別準確,且條目數較少,明確指出對初學者最相關的詞義。這項研究為語言學習者提供了重要資源。 相關文章 PubMed DOI

這項研究評估了三個聊天機器人—ChatGPT、Bing Chat 和 AskOE—在骨科手術治療問題上的回應品質。專家對每個機器人的回應進行評分,結果顯示 AskOE 在臨床正確性、完整性等方面表現最佳,受到評審者的偏好。雖然 ChatGPT 和 AskOE 都有錯誤,但 AskOE 的表現更為可靠,顯示其在醫療領域的潛在價值。 相關文章 PubMed DOI

肌肉骨骼疾病(MSDs)是全球主要的殘疾原因,影響各族群。本研究評估了ChatGPT 3.5和4在提供MSDs初級預防資訊的有效性,重點在於預防而非診斷。使用CLEAR工具評估回應質量,並由獨立專家審核。統計分析顯示,兩個版本在低背痛、骨折等疾病的預防資訊上表現良好,但ChatGPT-4在完整性、適當性和相關性上優於3.5。研究強調AI在公共健康溝通中的潛力,並指出未來需持續改進以增強全球健康倡議。 相關文章 PubMed DOI

生成式人工智慧(Gen-AI),像是ChatGPT,已在健康教育,特別是藥學領域引起關注。雖然其整合帶來潛在好處,但也存在學術誠信的風險。這篇綜述評估了Gen-AI在藥學教育中的影響,並強調了需要針對學術誠信風險的研究。研究顯示,雖然認識到Gen-AI的優勢,但缺乏相關的風險緩解策略。未來需加強對學生和教職員的教育訓練,並重新設計評估方式,以確保學術誠信。 相關文章 PubMed DOI

這項研究探討了先進自動語音辨識(ASR)技術在病人接觸過程中轉錄醫療資訊的效果,特別是在嘈雜的緊急醫療服務(EMS)環境中。研究評估了四個ASR引擎,結果顯示Google Speech-to-Text Clinical Conversation表現最佳,尤其在「心理狀態」和「過敏」類別上。然而,所有引擎在「治療」和「藥物」等關鍵類別的表現都不理想,顯示目前ASR技術尚無法完全自動化EMS的臨床文檔。這強調了進一步提升ASR技術的必要性。 相關文章 PubMed DOI

這項研究比較了AI聊天機器人(ChatGPT和Google Gemini)生成的病患教育材料與傳統病患資訊手冊(PILs)在眼科手術局部麻醉方面的效果。專家評估發現,雖然AI提供的語言較簡單且易懂,但傳統PILs在完整性和可讀性上表現更佳。統計分析顯示,ChatGPT在準確性和完整性上稍勝於Google Gemini,但兩者都不及PILs。值得一提的是,Google Gemini的情感語調最為正面。研究結果顯示,AI聊天機器人可作為病患教育的輔助工具,幫助提升病患的理解與決策能力。 相關文章 PubMed DOI

這篇論文回顧了自然語言處理技術,特別是大型語言模型在放射科報告中提取結構化數據的應用。雖然放射影像使用普遍,但報告中的自由文本常未被充分利用。根據PRISMA-ScR指導方針,分析了2023年8月1日從五個資料庫中找到的34項研究。結果顯示,大多數研究集中在前變壓器和編碼器模型上,外部驗證時性能下降。LLMs可能增強信息提取的普遍適用性,但面臨外部驗證不足和報告粒度問題等挑戰。 相關文章 PubMed DOI