LLM 相關三個月內文章 / 第 120 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這篇教學評論探討大型語言模型(LLMs)在化學領域中,如何從非結構化的知識中提取結構化數據。傳統上,這需要大量人工和有限的自動化,但LLMs能讓非專家更有效地獲取數據。評論指出了應用LLMs的挑戰,並強調領域知識在驗證結果中的重要性。它還概述了當前的實踐,呼籲標準化指導方針,並提出將LLMs與化學專業知識結合的框架,幫助研究人員加速新化合物和材料的發現,應對社會挑戰。 相關文章 PubMed DOI

這項研究探討大型語言模型(LLMs)在藥理學中的挑戰,因為缺乏全面的測試集。研究團隊創建了一個包含藥物資訊檢索、先導化合物結構優化及研究趨勢分析的測試集,並評估了GPT-3.5和GPT-4的表現。結果顯示這兩個模型在藥物特性、動力學及毒性預測等方面表現優異,但在藥物識別和互動資訊檢索上仍有不足。研究建議透過檢索增強生成(RAG)方法,整合專業知識庫,以提升LLMs在藥理學的應用效果。 相關文章 PubMed DOI

在科學出版中,作者排序對研究者的認可和職業發展非常重要。最近的研究顯示,20%的作者面臨榮譽作者的問題。這項研究評估了顎面外科和耳鼻喉科的作者貢獻指導方針。2024年3月16日,研究者檢索了Scopus索引的期刊,發現21本期刊中只有8本遵循CRediT系統,147篇手稿中僅38.8%報告了貢獻。報告的貢獻與實際作者身份的協議分數為65.3%。研究強調了這些期刊中標準化貢獻系統的低採用率,未來需進一步研究以確保公平的作者認可。 相關文章 PubMed DOI

大型語言模型(LLMs)在臨床環境中有潛力,但在提供可靠的預測概率上常遇挑戰,這對透明度和知情決策很重要。研究顯示,明確提示生成的概率在六個開源LLMs和五個醫療數據集上表現不如隱含概率,尤其在小型LLMs和不平衡數據集上更明顯。這強調了謹慎解讀結果的必要性,並呼籲開發更好的概率估計方法及進一步研究,以提升LLMs在臨床應用的可行性。 相關文章 PubMed DOI

大型語言模型(LLMs)如GPT和LLaMA在自然語言處理上表現優異,但在製藥製造等特定領域仍在探索中。本研究利用製造偏差的歷史記錄,旨在提升生產力、效率、品質和合規性。透過建立數據集,研究評估生成型LLMs和文本嵌入模型在處理偏差任務的能力。結果顯示,較大的生成模型在提取任務中表現佳,推理能力強,但也有幻覺行為。嵌入模型則能有效捕捉偏差類別的語義。整體而言,AI工具在製藥製造流程中展現出顯著潛力,並提出未來研究的方向。 相關文章 PubMed DOI

這項研究評估了一個大型語言模型(LLM)在監測兒童注意力不足過動症(ADHD)藥物副作用的有效性。研究回顧了2015至2022年間社區初級醫療網絡中6至11歲ADHD兒童的電子健康紀錄。LLaMA模型經過ADHD相關臨床筆記訓練,並與醫療紀錄進行人工審查,顯示高敏感性(87.2%)和特異性(86.3%),AUC為0.93。主要發現包括:模型不受性別或保險類型影響,電話就診的副作用詢問記錄顯著低於其他就診方式。研究結論指出,LLM可有效衡量護理質量並改善ADHD藥物管理。 相關文章 PubMed DOI

這項研究評估了兩個大型語言模型(LLMs),ChatGPT 和 Bard,在中級生命支持相關的多選題(MCQs)上的表現。結果顯示,Bard 的整體得分稍高於 ChatGPT,但差異不顯著。兩者在子問題的表現也無明顯差異。雖然有些回答不正確,但它們的解釋仍提供了有用資訊。評分者對解釋的評價一致性高,顯示回答質量穩定。總體來看,這兩個模型表現相似,但在醫學教育的準確性上仍需改進。 相關文章 PubMed DOI

這項研究評估了ChatGPT-4在整形外科和重建外科的資訊質量與可讀性。研究人員針對過去15年最常搜尋的十個主題,設計了九個問題並輸入ChatGPT-4。結果顯示,使用DISCERN工具評估後,回應的資訊質量得分偏低,平均為34;可讀性指數也不佳,Flesch-Kincaid平均為33.6,Coleman-Liau為15.6。儘管如此,十二位整形外科醫師對回應的清晰度和準確性給予正面評價,平均得分分別為7.38和7.4。研究建議,AI語言模型如ChatGPT可作為健康資訊的起點,未來有潛力改善內容質量。 相關文章 PubMed DOI

這項研究探討了OpenAI的ChatGPT在泌尿科教育,特別是腎細胞癌(RCC)方面的潛力。研究人員根據專業指導方針生成問題,並評估ChatGPT的回應。結果顯示,ChatGPT在準確性和實用性上獲得高度評價,臨床醫生和非臨床人員的評分差異不大。使用ChatGPT能提升對資訊的信心,支持其在醫學教育中的應用,但對於病人教育的使用態度未見改變。作者認為,ChatGPT作為輔助工具有潛力,但需進一步驗證才能廣泛採用。 相關文章 PubMed DOI

生成式人工智慧(AI)在公共衛生溝通中的應用越來越普遍,能有效提升全球資訊的傳遞。研究指出,這些AI模型能改善患者的健康素養,特別是對於像急性肺栓塞這類複雜疾病的理解至關重要。最近的研究評估了ChatGPT、Google Gemini和Microsoft CoPilot等AI模型生成的回應,發現它們的可讀性尚未達到美國的推薦標準。隨著這些模型的持續進步,未來對其可讀性的研究將有助於了解如何透過深度學習提升溝通效果。 相關文章 PubMed DOI