LLM 相關三個月內文章 / 第 105 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

數位化自然歷史標本的過程中,標籤轉換成數位數據常面臨挑戰。本研究探討了兩種提取資訊的方法:基於規則的方法和使用ChatGPT4的大型語言模型。研究比較了這兩者在達爾文核心欄位中的錯誤率。結果顯示,雖然ChatGPT4有時不符合標準,但基於規則的方法誤報率較高。研究人員因此開發了一種結合兩者的集成方法,顯著降低了錯誤率,提升了數據質量。儘管人為驗證仍然重要,自動化方法可加速標本館標籤的數位化,並適用於其他自然歷史收藏品。 相關文章 PubMed DOI

藥物重定位有助於加速開發、降低成本及失敗率,但獲取可靠的負面數據仍是挑戰。為了解決這個問題,我們採用了正負標籤學習方法,並利用大型語言模型(GPT-4)分析前列腺癌臨床試驗,成功識別真負樣本,預測準確性顯著提升。透過我們的標記策略,建立了包含80種藥物的數據集,並評估了11,043種藥物的重定位潛力,找出980個前列腺癌治療候選者。這一方法可擴展至其他疾病,為新療法的發現提供更準確的數據支持。 相關文章 PubMed DOI

這項研究評估了四個大型語言模型(LLMs)在腫瘤學知識的表現,使用土耳其醫學腫瘤學會的考試問題。測試的模型包括Claude 3.5 Sonnet、ChatGPT 4o、Llama-3和Gemini 1.5,共分析790道選擇題。Claude 3.5 Sonnet表現最佳,所有考試通過,平均得分77.6%;ChatGPT 4o通過七場考試,得分67.8%。Llama-3和Gemini 1.5表現較差,得分均低於50%。研究顯示,這些模型需定期更新,以保持腫瘤學教育的相關性。總體而言,先進的LLMs在該領域有潛力,但仍需持續改進。 相關文章 PubMed DOI

在2024年10月29日,來自美國各藥學院的主席和副主席召開虛擬會議,討論藥學科學的現狀及研究生教育的最佳實踐。會議重點包括校友參與及受訓者對學術職業的低興趣。Dawn Beraud博士強調科學倡導的重要性,特別是在資金和政策決策方面。討論中提到大型語言模型的應用及財務支持挑戰,並提出NextProf PharmSci計畫,旨在透過工作坊幫助受訓者準備學術角色。與會者一致支持每年舉辦此活動,並計畫未來的主題與暑期學校計畫。 相關文章 PubMed DOI

這篇文章全面介紹了大型語言模型(LLMs)的進展及其在放射學的潛在應用。文獻回顧了醫學領域中LLMs的研究,特別關注其在臨床環境中的相關性與限制。文章強調了幾項重要研究,並指出放射科醫師參與LLM技術的重要性。了解各種應用及病人安全、倫理和數據保護的挑戰,對於負責任地將LLMs整合進臨床實踐至關重要。 相關文章 PubMed DOI

大型語言模型(LLMs)如ChatGPT的發展,催生了能處理複雜任務的代理人,但這些代理人常面臨錯誤傳播和適應性不足的挑戰。為了解決這些問題,我們提出了「任務分解與代理生成」(TDAG)框架,將複雜任務拆解為小子任務,並分配給專門的子代理,以提升適應性。 此外,我們推出了ItineraryBench基準測試,專注於旅行規劃,評估代理人在記憶、規劃和工具使用等方面的能力。實驗結果顯示,TDAG在處理複雜任務時的表現顯著優於現有基準,展現出更強的適應性和情境意識。 相關文章 PubMed DOI

這篇研究指出大型語言模型(LLMs)在提升證據綜合效率方面的潛力,特別是在隨機對照試驗(RCTs)的數據提取上。作者針對LLMs開發了結構化提示,使用Claude(Claude-2),涵蓋了Cochrane手冊的六大領域共58項內容。他們在10個已發表的Cochrane評論RCT上測試,結果顯示數據提取準確率高達94.77%,各領域準確率介於77.97%到100%之間,且每個RCT的提取時間僅需88秒。這些結果顯示結構化提示能有效增強LLMs在系統性回顧中的應用,對證據綜合方法學是一大進步。 相關文章 PubMed DOI

最近的研究顯示,ChatGPT在全膝關節置換術(TKA)病人的術前教育中,能有效減少焦慮並提升滿意度。這項2023年的初步研究涉及60名病人,分為使用ChatGPT輔助的知情同意組和傳統醫生主導組。結果顯示,使用ChatGPT的病人在術前和術後焦慮分數顯著較低,且對住院經驗的滿意度更高。不過,對於抑鬱、膝關節功能或疼痛程度並未見顯著差異。未來仍需進一步研究以確認這些發現。 相關文章 PubMed DOI

這項系統性回顧分析了137篇經過同行評審的研究,探討生成式人工智慧聊天機器人在健康建議上的表現。結果顯示,研究報告標準差異大,主要集中在外科、醫學和基層醫療。大部分研究針對治療、診斷或疾病預防,但幾乎全數(99.3%)使用的都是無法訪問的封閉源碼大型語言模型,且對其特徵描述不足。此外,多數研究未提及提示工程,只有少數討論倫理、法規及病人安全。這些結果顯示需改善報告標準,建議開發聊天機器人評估報告工具(CHART),以提升臨床評估與整合的效果。 相關文章 PubMed DOI

這項研究探討生成式人工智慧(AI)對藥學學生在客觀結構化臨床考試(OSCE)中的表現及焦慮影響。研究於2024年進行,涉及88名藥學博士學生,分為介入組和對照組。介入組使用AI工具生成學習材料,而對照組則接受傳統指導。結果顯示,兩組在考試成績和焦慮量表上並無顯著差異,AI工具未能提升學業表現或減少焦慮,但也沒有負面影響。研究建議需進一步探討AI對教育成果的長期影響。 相關文章 PubMed DOI