LLM 相關三個月內文章 / 第 64 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

本研究評估了GPT-3.5和GPT-4在從非結構化臨床文本中提取資訊的效果。使用了病人特徵、病史和臨床檢測結果的資料,並透過簡單提示進行查詢。結果顯示,GPT-4在性別資訊提取上準確率達95%,優於GPT-3.5的70%;但在身體質量指數(BMI)方面,GPT-3.5的78%表現更佳。研究建議整合特定任務的定義進入提示中,以提升提取效果,並鼓勵專業人士設計有效提示,監控大型語言模型的表現。 相關文章 PubMed DOI 推理

大型語言模型的快速進步讓人工智慧生成內容(AIGC)在醫學考試題目創建上展現新可能。本研究指出傳統紙本考試的限制,並提出利用AIGC設計各類型題目的簡化方法,包括選擇題、案例研究和視頻題目。雖然AIGC在模擬臨床情境上表現優異,但手動審查仍是確保內容準確性和品質的關鍵。未來可能會結合檢索增強生成、多人系統和視頻生成等技術,進一步提升醫學考試準備的品質,支持醫學生的有效訓練。 相關文章 PubMed DOI 推理

這篇論文回顧了不同自主程度的移動操控器的研究,強調它們在危險環境中的應用,特別是在退役場地和搜救行動中。現有系統多依賴人機協作,無法完全自主,面臨安全性和可靠性挑戰。文中指出可變自主性(Variable Autonomy)相關的研究空白,並建議未來可開發全身可變自主性、使用虛擬實境框架,以及整合大型語言模型,以減輕操作員在複雜情況下的負擔。 相關文章 PubMed DOI 推理

這項研究探討了ChatGPT在荷蘭社區藥局的應用,指出其潛在好處與擔憂。研究中,106名藥學專業人士中有50.9%曾使用ChatGPT,38.7%是用於藥學任務。受訪者認為ChatGPT在寫作輔助和快速解答臨床問題上有潛力,但對其可靠性和答案準確性表示擔憂。結果顯示,雖然ChatGPT是有價值的工具,但因質量問題,目前在臨床查詢的使用仍有限,需與可靠來源交叉參考以確保藥物護理的準確性。 相關文章 PubMed DOI 推理

生成式人工智慧(GAI)正在革新癌症研究與治療,特別是在腫瘤學領域。這篇綜述探討了GAI的現況與未來應用,尤其在泌尿系腫瘤方面的角色。GAI透過整合多種數據,提升癌症診斷與影像解讀,並協助臨床決策與治療選擇,還能簡化行政任務與後續護理。儘管GAI在提高診斷準確性上展現潛力,但其不穩定性仍需人類監督與專業指導,以確保有效整合於腫瘤學實務中。 相關文章 PubMed DOI 推理

這項研究評估了兩個版本的ChatGPT—ChatGPT-4和ChatGPT-4o—在本科牙髓學教育的多選題回答準確性。共提出60個問題,結果顯示ChatGPT-4o的準確率為92.8%,明顯高於ChatGPT-4的81.7%,且p值小於0.001。雖然問題組影響準確率,但一天中的時間對兩者無影響。兩個模型的一致性無顯著差異。總體來看,ChatGPT-4o在準確性上優於ChatGPT-4,顯示AI在牙科教育中的潛在價值,但也需注意其局限性與風險。 相關文章 PubMed DOI 推理

這項研究探討了使用開源大型語言模型Llama 3,分析2018至2023年間去中心化臨床試驗(DCTs)的趨勢,並解決試驗登記中術語不標準的問題。研究人員從ClinicalTrials.gov獲取數據,使用三個不同版本的Llama 3模型進行DCT分類和提取去中心化元素。結果顯示,微調模型能提高敏感性,但正確預測值較低,需專注於DCT術語。最終識別出692個DCT,主要為第二期試驗,顯示大型語言模型在分析非結構化臨床數據的潛力,並強調管理模型偏見的重要性。 相關文章 PubMed DOI 推理

這項研究評估了六款人工智慧聊天機器人在牙科修復問題上的表現,包括ChatGPT-3.5、ChatGPT-4、ChatGPT-4o、Chatsonic、Copilot和Gemini Advanced。結果顯示,ChatGPT-4、ChatGPT-4o、Chatsonic和Copilot的可靠性為「良好」,而ChatGPT-3.5和Gemini Advanced則為「尚可」。在病人相關問題中,Chatsonic表現最佳;在牙科問題中,ChatGPT-4o最突出。整體來看,這些AI在準確性和可讀性上各有優劣,顯示出在牙科領域的潛力。 相關文章 PubMed DOI 推理

這項研究建立了一個命名實體(NE)框架,從癌症基因組圖譜-甲狀腺癌(TCGA-THCA)數據庫的臨床筆記中提取資訊,專注於良性分化甲狀腺癌患者的AJCC分期和ATA風險類別。框架包含標註指導方針、數據標記、提示策略及評估代碼。我們測試了四個大型語言模型,並將其輸出與專家數據比較。基於50份病理筆記建立的框架,經289份筆記和35個偽臨床案例驗證,成功提高了分期和風險分類的效率與準確性。 相關文章 PubMed DOI 推理

這項研究評估了幾個大型語言模型(LLM)聊天機器人,包括Google、Bard、GPT-3.5和GPT-4,對於慢性健康狀況的病人教育效果。研究針對高血壓、高脂血症、糖尿病、焦慮和情緒障礙等五個常見健康問題進行評分。結果顯示,GPT-3.5和GPT-4在內容的全面性和質量上表現優於Bard和Google,但後者的回應更易讀。整體來看,這項研究建議LLM工具在健康查詢中可能比傳統搜尋引擎提供更準確的信息,適合用於病人教育。 相關文章 PubMed DOI 推理