LLM 相關三個月內文章 / 第 136 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這篇論文探討了Cockpit-Llama的開發,這是一個專門用來預測駕駛者行為意圖的語言模型,目的是提升車輛駕駛艙的互動性。透過分析駕駛者的行為、歷史數據及環境狀態,Cockpit-Llama能做出準確預測,協助主動決策。研究團隊還建立了一個新的多屬性駕駛艙數據集,涵蓋情緒和身體狀況等多方面資料。使用低秩適應(LoRA)進行微調後,實驗結果顯示Cockpit-Llama在預測準確度上超越了現有方法,顯著改善了智能駕駛艙的推理能力。 相關文章 PubMed DOI

這項研究評估了AtlasGPT和ChatGPT 4.0在預測動脈瘤性蛛網膜下腔出血(aSAH)患者的準確性,並與傳統臨床評估量表比較。研究包含82名患者,結果顯示住院死亡率為22%,34.1%需進行減壓性半顱切除手術。出院時28%患者有良好結果,六個月後提升至46.9%。AtlasGPT在預測手術需求方面表現最佳(AUC 0.80),而WFNS量表在長期功能預測上最為準確(AUC 0.76)。研究建議結合AI模型與傳統量表可提升預測準確性。 相關文章 PubMed DOI

隨著科學文章數量快速增加,如何組織和提取資訊成為一大挑戰,顯示出自動化的必要性。本研究探討利用大型語言模型(如OpenAI的GPT-4.0)來提取科學文獻中的關鍵洞察。我們開發了名為ArticleLLM的系統,透過手動基準微調來提升模型表現,並採用多演員LLM策略,結合多個微調模型的優勢,增強提取效果。本研究顯示LLMs在關鍵洞察提取上的潛力,並強調協作微調的好處,有助於提升學術文獻調查與知識發現的效率。 相關文章 PubMed DOI

COVID-19疫情對全球醫療系統造成壓力,特別是孕婦面臨更高健康風險。錯誤資訊的增加讓婦產科醫生在提供疫苗安全性建議時面臨挑戰。研究評估了四個AI模型(ChatGPT-3.5、ChatGPT-4、Microsoft Copilot和Google Bard)在提供COVID-19對懷孕影響的準確性。結果顯示,ChatGPT-4和Microsoft Copilot表現最佳,但仍有些不準確之處。研究強調了在醫療溝通中保持中立和客觀的重要性,並建議根據受眾選擇合適的AI工具。 相關文章 PubMed DOI

這項研究提出了一個框架,利用Meta的Llama-3-8B大型語言模型來檢測法語電子健康紀錄中的痛風。由於“goutte”有多重含義,準確檢測變得困難。研究比較了該模型與傳統的正則表達式方法,使用700段來自瑞士日內瓦大學醫院的EHR資料。結果顯示,該模型在痛風檢測上達到92.7%的正確預測率和95.4%的整體準確率,並在600段鈣焦磷酸鹽沉積病的資料上也表現良好,達94.1%準確率。這顯示LLM在非英語EHR中識別疾病的潛力,有助於改善臨床試驗的病人招募。 相關文章 PubMed DOI

這項研究評估了GPT-4在總結介入放射學報告的效果,旨在幫助外行人理解並翻譯醫學文本。研究總結了200份報告,並用Flesch-Kincaid閱讀水平和Flesch閱讀容易度分數來評估可讀性。結果顯示,總結後的可讀性明顯改善,外行人的理解分數也從2.5提升至4.3。雖然翻譯成其他語言後誤資訊略有增加,但關鍵錯誤資訊並未顯著上升。整體而言,GPT-4在提升報告可讀性和病人溝通方面展現了潛力。 相關文章 PubMed DOI

這項研究調查了丹麥18,000名員工在11種職業中對ChatGPT的使用情況,發現年輕和經驗較少的員工特別喜愛這個工具。不過,女性使用ChatGPT的機率比男性低16個百分點。值得注意的是,使用ChatGPT的員工在推出前的收入稍高,但工作年限較短。儘管大家認為ChatGPT能提升生產力,卻仍面臨雇主限制和對額外培訓的需求等挑戰。 相關文章 PubMed DOI

這項研究評估了七個大型語言模型(LLMs)在中國國家護理執照考試(CNNLE)上的表現,涵蓋了2019至2023年的1200道多選題。結果顯示,Qwen-2.5的準確率最高,達88.9%,接著是GPT-4o(80.7%)和ERNIE Bot-3.5(78.1%)。研究還探討了結合機器學習技術的潛力,使用XGBoost模型後準確率提升至90.8%。這是首個針對CNNLE評估LLMs的研究,顯示它們在醫療教育中的潛力,建議進一步研究以提升考試準備和專業訓練的有效性。 相關文章 PubMed DOI

這段文字探討了複雜的深度學習模型在基因組學中的重要性,特別是透過內含子保留來理解基因調控。文中提到兩種大型基因組模型:自我監督的大型語言模型用於DNA序列,以及基於廣泛基因組數據集的監督模型。作者認為這些模型在功能上類似於自然語言處理的基礎模型,能有效編碼染色質狀態,幫助創建準確的基因調控模型。特別是Sei模型在開發可解釋的內含子保留模型方面表現優異,超越了DNABERT-2模型,並揭示了轉錄因子和染色質標記的調控作用。 相關文章 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs)來提升自然語言處理中的文本相似性理解。研究中,微調後的LLaMA模型(70億參數)在F1分數上達到84.9%,超越了先前的Siamese卷積神經網絡(82.02%)。此外,700億參數的LLaMA3.1模型也表現不俗,F1分數為74.4%。這顯示微調LLMs對特定任務的有效性,並建議可應用於履歷與職位匹配及學術投稿審稿人識別等領域。 相關文章 PubMed DOI