原始文章

這篇論文介紹了TCNNet-9B,專為台灣網路產業設計的繁體中文語言模型。它基於Yi-1.5-9B架構,並利用多元網路資料進行預訓練和微調,涵蓋網路知識、DIY指南、設備推薦及當地網路安全法規。 經過嚴格評估,TCNNet-9B在問答準確率上提升2.35倍,專業知識理解增強37.6%,產品推薦相關性提高29.5%。其有效性也在Hi5智能銷售顧問系統中得到驗證,顯示出針對特定領域調整大型語言模型的重要性。 PubMed DOI


站上相關主題文章列表

精煉生物醫學大型語言模型(LLMs)專注提升單一詞彙的生物醫學任務表現。為了解決這個問題,Taiyi雙語精煉LLM應運而生,處理多國語言的生物醫學自然語言處理任務。透過整合生物醫學數據並實施2階段的精煉策略,Taiyi在命名實體識別、關係提取和文本分類等任務中超越一般的LLMs。雖然Taiyi在生物醫學NLP雙語多任務上有潛力,但在資訊提取等任務上仍面臨挑戰,LLMs在這些任務中的表現不如傳統方法。 PubMed DOI

生成式大型語言模型(LLMs)在自然語言處理表現優秀,尤其在問答和對話系統。MedChatZH是基於Transformer和LLaMA的中文醫學問答模型,透過醫學書籍預訓練並微調在醫學指導數據,在醫學對話數據集中表現優異。有興趣的研究者可在GitHub找到相關資源,支持中醫學和LLMs研究。 PubMed DOI

LLMs如ChatGPT和Med-PaLM在醫學問答表現優秀,但在非英語環境面臨挑戰。KFE框架提升中文醫學表現,整合臨床知識。像ChatGPT和GPT-4在CNMLE-2022有顯著進步,超越人類並通過考試。研究指出結合醫學知識與LLMs的情境學習有效,可橋接全球醫療語言障礙,減少不平等。 PubMed DOI

這項研究致力於開發一個針對傳統中醫的語言模型,旨在提升臨床推理能力,如診斷和處方建議。研究人員創建了三個重要數據集,並開發了Lingdan預訓練模型及兩個專門模型,分別用於症狀分析和草藥處方建議。這些模型在中醫知識回答和處方建議上表現優異,Lingdan-PR的F1-score比最佳基準提高了18.39%。這項研究顯示了人工智慧在改善醫療決策中的潛力,相關資料可在 https://github.com/TCMAI-BJTU/LingdanLLM 獲得。 PubMed DOI

在醫療領域,先進的大型語言模型(LLMs)逐漸被應用,但在傳統中醫(TCM)方面的專業知識仍然不足。為了解決這個問題,我們開發了TCMChat,這是一個專門針對中醫文本和中文問答數據集訓練的生成性LLM。TCMChat基於Baichuan2-7B-Chat模型,經過預訓練和微調,並在六個中醫相關場景中表現優異。我們的資源已在GitHub和HuggingFace上公開,為中醫研究提供了有價值的工具和友好的對話介面。 PubMed DOI

大型語言模型(LLMs)在醫學領域的應用越來越受到重視,但在中醫方面的研究仍然有限。本研究回顧了29項相關研究,發現LLMs在知識提取和輔助診斷方面有潛力。專為中醫設計的模型在執業醫師考試中達到70%的準確率,而通用模型則為60%。不過,LLMs在中醫應用上仍面臨數據質量、安全性及中醫特有的複雜性等挑戰。未來應著重於跨學科訓練和數據標準化等方向。 PubMed DOI

這項研究探討如何利用大型語言模型(LLM)分析媒體對中國的態度,以香港的《東方日報》為例。研究強調分析媒體數據集對理解公眾意見的重要性,並指出傳統方法常忽略隱性態度。研究使用Martin和White的框架來分類態度,並運用Meta的開源Llama2(13b)模型進行分析,針對40,000條與中國相關的表達進行量化。結果顯示,LLM能有效識別顯性和隱性態度,準確率約80%,與人類編碼者相當。研究也討論了實施過程中的挑戰及其解決策略。 PubMed DOI

DeepSeek的開源模型在成本和效率上確實有優勢,對開發者和研究人員來說非常吸引。因為是開源的,使用者可以根據需求自由修改,增加靈活性和自訂性。此外,優化的架構能縮短訓練時間,降低資源消耗,特別適合計算資源有限的人。這種經濟實惠又高效的結合,讓更多人能接觸到先進的機器學習技術。 PubMed DOI

這項研究提出了一種方法,旨在為越南語這種低資源語言的醫療資訊創建訓練數據集,以微調大型語言模型(LLMs)。目的是改善醫療資訊的獲取,增強發展中國家的醫療溝通。研究過程中,選擇基礎模型並彙編約337,000對提示-回應對,使用低秩適應技術進行微調。微調後的模型在多項指標上表現優於基礎模型,顯示出其在越南語健康查詢中的潛力。雖然本地部署可提升數據隱私,但高計算需求和成本仍是挑戰,研究呼籲關注醫療差距,促進全球健康公平。 PubMed DOI

這項研究評估了全球大型語言模型(LLMs)和中文領域的LLMs在回答近視相關問題的表現。測試的模型包括ChatGPT-3.5、ChatGPT-4.0、Google Bard等,還有華佗GPT、MedGPT等中文模型。共評估39個問題,專家用3分制評分。結果顯示,ChatGPT-3.5、百度ERNIE 4.0和ChatGPT-4.0在準確性上表現最佳,且ChatGPT系列在全面性和同理心方面也表現不錯。整體來看,無論是全球還是中文模型,都能有效解決近視問題,特別是全球模型表現優異。 PubMed DOI