原始文章

這篇研究發現,大型語言模型在沒經過特別訓練下,結合檢索增強生成(RAG)和提示工程,能有效自動摘要專業資訊,表現不錯。不過,還是會遇到像網頁爬蟲限制和偶爾誤解任務等問題,未來還需要進一步優化。 PubMed


站上相關主題文章列表

最近大型語言模型和提示工程的進展,讓自訂聊天機器人變得更容易,不再需要程式設計技能。不過,進行大規模的提示評估仍然很具挑戰性。我們的研究確定了五個關鍵挑戰,並提出了一個以特徵為導向的提示評估工作流程,特別針對文本摘要,強調根據摘要特徵來評估提示,而非僅依賴傳統指標。為了支持這個流程,我們推出了Awesum,一個視覺分析系統,幫助用戶識別最佳提示改進。我們的測試顯示,Awesum能有效幫助非技術用戶進行系統性評估,並可應用於其他自然語言生成任務。未來建議專注於大型語言模型的特徵導向評估。 PubMed DOI

最近的研究顯示大型語言模型(LLMs)在自然語言處理,特別是遠程醫療中有很大潛力。研究比較了GPT-3.5、GPT-4和LLaMA 2在醫療諮詢摘要的表現。結果顯示,LLaMA2-7B在n-gram精確度上表現最佳,而GPT-4在語義準確性和可讀性上優於其他模型。所有模型在總結能力上相似,但GPT-4在內容理解和結構上稍有優勢,顯示其生成病人友好摘要的潛力。研究也探討了使用LLMs的潛在風險與限制。 PubMed DOI

生命科學領域的出版物數量不斷增加,特別是在RNA科學方面,這對策展人來說是一大挑戰。為了解決時間不足的問題,本研究探討利用大型語言模型(LLMs)自動生成與非編碼RNA(ncRNAs)相關的高品質摘要。研究結果顯示,透過適當的提示和驗證,LLMs能產生準確的摘要並附上參考文獻。經手動評估後,這些摘要的質量相當高,已應用於超過4,600種ncRNAs,並可透過RNAcentral資源訪問。這表明自動文獻摘要是一個可行的解決方案。欲了解更多,請訪問RNAcentral網站:https://rnacentral.org/。 PubMed DOI

這篇文章探討大型語言模型(LLMs)在放射學的應用潛力,強調優化互動技術以獲得可靠結果的重要性。主要內容包括: 1. **提示工程**:設計精確的提示能提升LLMs的回應質量,讓其更符合放射學任務需求。 2. **零樣本與少樣本學習**:這些技術讓LLMs在不需大量再訓練的情況下,能適應特定放射學情境。 3. **檢索增強生成(RAG)**:將最新的領域資訊整合進LLMs,幫助生成更準確且具上下文的內容。 文章建議放射科醫生採用這些技術,以提升病患護理和檢查效率。 PubMed DOI

大型語言模型(LLMs)大幅提升了臨床自然語言生成(NLG)的能力,為處理醫療文本提供了新方法。不過,將這些模型應用於醫療環境前,必須進行全面評估,以確保其可靠性與有效性。我們的回顧探討了現有NLG在醫療領域的評估指標,並提出一種未來的方法,旨在減少專家評估的限制,平衡資源效率與人類判斷的一致性,確保生成內容符合臨床高標準。 PubMed DOI

生命科學文獻量暴增,人工整理越來越吃力。這項研究用大型語言模型(LLMs)自動產生高品質、正確又有參考文獻的非編碼RNA(ncRNA)摘要,大多數都獲得專家好評。總共產出超過4,600篇摘要,已公開在RNAcentral。結果證明,只要設計好提示並自動檢查,現有LLMs就能自動化文獻摘要整理。 PubMed DOI

這項研究探討如何用 Llama 3.1-8B 這類大型語言模型,從澳洲長照機構的護理紀錄中擷取失智症患者的躁動行為和營養不良風險資訊。結果發現,少樣本學習比零樣本學習好,PEFT 技術能提升兩者表現,RAG 只對少樣本有幫助。最佳組合是少樣本加 RAG,但零樣本加 PEFT 也差不多好,提供臨床資訊擷取的實用參考。 PubMed DOI

本研究提出用大型語言模型(LLM)自動評估AI生成的電子健康紀錄(EHR)摘要,效果和專家評分高度一致,尤其是像GPT-3這類模型。這種方法省時又可靠,有助於確保醫療AI摘要的品質與安全性,適合大規模應用。 PubMed DOI

生命科學文獻量暴增,人工整理越來越困難。本研究證明,只要設計好提示語和檢查流程,大型語言模型就能自動產出高品質、正確引用的非編碼RNA文獻摘要。人工審查也認可這些摘要的品質。這次共產生超過4,600篇摘要,已上架RNAcentral。未來只要做好品質控管,知識庫就能自動化產生文獻摘要。 PubMed DOI

這項研究評估多種大型語言模型,利用提示工程從胃鏡和大腸鏡報告中擷取結構化資訊。結果顯示,大型且專業化的模型在基本資訊擷取表現最好,但遇到複雜推理時仍有限制。少樣本學習對部分模型有幫助,顯示LLMs自動化醫療文本分析有潛力,但還需改進。 PubMed DOI