LLM 相關三個月內文章 / 第 30 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這篇論文探討如何利用大型語言模型(LLMs)來簡化生物醫學數據處理,特別是自動化數據發現與整合。我們推廣互操作性標準,透過創建共同數據元素(CDEs)來提升數據整合的效率。經過分析三十一項研究,我們開發了CDEs,並使用API填寫OpenAI GPT模型的元數據。經專家審查,94%的元數據無需手動修訂。我們的方法在阿茲海默症和帕金森基因計畫的數據中測試,顯示出良好的互操作性,旨在提升生物醫學研究的效率與合作性。 相關文章 PubMed DOI

這項研究探討增強檢索生成(RAG)的大型語言模型(LLMs)在急診科臨床紀錄中生成ICD-10-CM代碼的有效性,並與醫療提供者進行比較。研究基於Mount Sinai Health System的500次急診就診數據,發現RAG增強的LLMs在準確性和特異性上均優於醫療提供者,且GPT-4的表現尤為突出。即使是較小的模型如Llama-3.1-70B,經過RAG後也顯示出顯著提升。這顯示生成式人工智慧在改善醫療編碼準確性及減少行政負擔方面的潛力。 相關文章 PubMed DOI

這項研究評估了大型語言模型(LLMs),特別是GPT-4和Gemini Advanced,對輻射安全與防護的理解,使用了日本輻射防護監督考試的問題。結果顯示,GPT-4的準確率為71.0%,Gemini Advanced則為65.3%。兩者在文本問題上表現較好,但在法律和法規方面的準確性較低,顯示出需要進一步訓練。總體而言,雖然這兩個模型在輻射安全的核心主題上有不錯的表現,但在法律領域仍需加強。 相關文章 PubMed DOI

這項研究專注於預測蛋白質表面的疏水性區域,對於蛋白質的相互作用及聚集性疾病非常重要。研究人員使用進化尺度模型(ESM-2),透過高效的微調方法訓練模型,無需大量計算資源。他們在局部和全局層面進行多項任務探索,最終開發出名為PatchProt的模型,能有效預測疏水性區域、二級結構及表面可及性,表現超越現有方法。研究顯示,結合局部任務可提升全局任務的預測準確性,為蛋白質性質預測設立新標準。 相關文章 PubMed DOI

GPTON 利用 GPT-4 來強化本體敘述,將結構化知識轉換為語言,並將本體術語整合進大型語言模型中。這種方法使得超過 68% 的基因集在前五名預測中能獲得準確的文本和本體註釋。手動評估證實了 GPTON 的有效性,顯示它如何運用 LLMs 和結構化知識,對生物醫學研究做出重要貢獻,超越了基因集的註釋範疇。 相關文章 PubMed DOI

這篇論文介紹了**LitAI**,一種新方法,旨在提升從各種文獻格式(如文本、表格和圖形)中檢索資訊的能力。LitAI 結合了生成式人工智慧工具與光學字符識別(OCR),有效改善從 PDF 文件提取資訊的效果。作者透過特定提示和上下文學習,確保資訊檢索的準確性。實證評估顯示,LitAI 的表現超越了 Tesseract-OCR 和 GPT-4 等現有方法。LitAI 的實作已在 GitHub 上提供,詳情可參考相關連結。 相關文章 PubMed DOI

生物調控事件的提取是生物醫學自然語言處理(BioNLP)中的重要研究領域。傳統方法面臨文本挖掘的錯誤連鎖問題及語料庫主題範圍有限的挑戰。大型語言模型(LLMs)因其強大的語義理解和廣泛知識,提供了潛在解決方案。在第八屆生物醫學聯合註釋黑客松(BLAH 8)中,我們探討了使用LLMs提取與水稻相關的生物調控事件。結果顯示LLMs表現良好,但也發現幾個需解決的問題,以便未來在低資源主題中應用。 相關文章 PubMed DOI

電子表型化是一個複雜的過程,涉及分析結構化和非結構化數據,使用規則技術、機器學習和自然語言處理。目前,準確的表型定義需要大量人力,主要依賴文獻回顧和專業知識,這使得擴展困難。大型語言模型(LLMs)提供自動提取表型定義的潛力,但也面臨可靠性和準確性等挑戰。我們的研究目標是建立標準評估集,確保模型輸出可靠,並測試不同提示策略以提取表型定義。結果顯示,雖然有進展,但仍需人類評估,且我們的方法有潛力減少文獻回顧所需時間。 相關文章 PubMed DOI

這項研究評估了尼日利亞阿費·巴巴洛拉大學藥學學生對聊天型人工智慧工具(如ChatGPT<sup>®</sup>)的認知與看法。透過2024年3至4月的線上問卷調查,共有252名學生參與,主要為女性(72.2%)。結果顯示,88%的學生了解這些工具,82.8%用於學術目的。大多數學生(85.3%)對這些工具持正面看法,認為能提升學業表現,但也有65.7%擔心分心,65.1%擔心學術不誠實。研究強調將人工智慧教育納入藥學課程的重要性,以提升學生的知識與應用能力。 相關文章 PubMed DOI

**引言** 隨著人工智慧的發展,大型語言模型(LLMs)在牙科領域的應用逐漸受到重視。這些模型能生成類似人類的文本,潛在地提升臨床實踐和病人教育,但其準確性對病人護理至關重要。 **目的** 本研究首次評估不同LLMs的牙科知識,透過分析它們對全國牙科考試(INBDE)問題的回答準確性。 **方法** 我們測試了多個閉源和開源的LLMs,針對「病人箱」風格的問題及傳統多選題進行評估。 **結果** ChatGPT-4的準確率最高,達75.88%;Claude-2.1為66.38%;Mistral-Medium則為54.77%。模型間的表現差異顯著。 **結論** 研究顯示LLMs在牙科的潛力,並強調選擇合適模型的重要性,但在臨床應用前仍需克服一些挑戰。 相關文章 PubMed DOI