Evaluation of LLMs accuracy and consistency in the registered dietitian exam through prompt engineering and knowledge retrieval.
透過提示工程和知識檢索評估大型語言模型在註冊營養師考試中的準確性和一致性。 Sci Rep 2025-01-09

這篇論文探討了大型語言模型（LLMs）在營養與飲食應用中的表現，特別是針對註冊營養師（RD）考試的1050道問題。研究比較了GPT-4o、Claude 3.5 Sonnet和Gemini 1.5 Pro的準確性與一致性，並分析了不同提示技術的效果。結果顯示，GPT-4o在使用帶自我一致性的思考鏈（CoT-SC）時表現最佳，而Gemini 1.5 Pro在零提示（ZS）下則展現最高一致性。研究強調選擇合適的LLM和提示策略對減少錯誤風險的重要性。 PubMed DOI

Accuracy of Current Large Language Models and The Retrieval Augmented Generation Model in Determining Dietary Principles in Chronic Kidney Disease.
慢性腎病飲食原則的當前大型語言模型及檢索增強生成模型的準確性。 J Ren Nutr 2025-01-26

這項研究評估了不同大型語言模型（LLMs）和檢索增強生成（RAG）框架在提供慢性腎病（CKD）飲食指導的準確性。研究以2020年國家腎臟基金會的營養指導為基準，測試了四個聊天機器人（GPT-4、Gemini 和 Llama），並使用12個相關提示。結果顯示，Gemini 和 RAG 的準確性最高（中位數4.0），而 GPT-4 和 Llama 較低（中位數2.5和1.5）。研究建議針對特定領域定制LLMs，或利用指導方針增強RAG框架，以提高醫療保健中的準確性。 PubMed DOI

NutriRAG: Unleashing the Power of Large Language Models for Food Identification and Classification through Retrieval Methods.
NutriRAG：透過檢索方法釋放大型語言模型在食物識別和分類中的力量。 medRxiv 2025-04-01

這項研究探討了先進的自然語言處理技術如何改善食物分類和飲食分析，使用來自飲食追蹤應用的原始文本。研究分為數據收集、框架開發和應用三個階段，參與者透過 myCircadianClock 應用記錄餐點。研究人員創建了 NutriRAG 框架，結合大型語言模型如 GPT-4，提升了食物分類的準確性。結果顯示，參與者在不同飲食模式下的飲食行為有顯著變化，顯示出 NutriRAG 在個性化營養和健康問題解決上的潛力，並建議進一步研究。 PubMed DOI

Evaluation of Large Language Models in Tailoring Educational Content for Cancer Survivors and Their Caregivers: Quality Analysis.
大型語言模型在為癌症倖存者及其照顧者量身定制教育內容中的評估：質量分析。 JMIR Cancer 2025-04-07

這項研究探討大型語言模型（LLMs）在為癌症倖存者及其照顧者創建教育材料的有效性，特別針對弱勢群體。研究比較了三個模型（GPT-3.5 Turbo、GPT-4 和 GPT-4 Turbo）在生成30個癌症護理主題內容的表現，目標是達到六年級的閱讀水平，並提供西班牙語和中文翻譯。主要發現包括：LLMs整體表現良好，74.2%符合字數限制，平均質量分數為8.933，但只有41.1%達到所需閱讀水平。翻譯準確率高，西班牙語96.7%、中文81.1%。常見問題有範圍模糊和缺乏可行建議。GPT-4表現優於GPT-3.5 Turbo，使用項目符號提示效果更佳。結論指出，LLMs在創建可及的教育資源方面潛力大，但需改善閱讀水平和內容全面性，未來研究應結合專家意見和更好數據以提升有效性。 PubMed DOI

From bytes to bites: application of large language models to enhance nutritional recommendations.
從位元到咬合：大型語言模型在增強營養建議中的應用。 Clin Kidney J 2025-04-14

大型語言模型（LLMs），像是ChatGPT，正被研究用於增強慢性腎臟病（CKD）患者的營養指導。為了發揮其最佳效能，醫療專業人員、患者及照顧者的合作至關重要。雖然LLMs能提供食譜建議，但在分析電解質和卡路里等重要營養成分上仍有不足。未來的技術進步預期能改善這些能力，實現精確的營養分析和烹飪輔助工具。CKD社群的參與對於推動人工智慧在營養護理中的應用非常重要，並需保持批判性思維。 PubMed DOI

An Evaluation of Large Language Models for Supplementing a Food Extrusion Dataset.
用於補充食品擠壓數據集之大型語言模型的評估 Foods 2025-04-26

目前食品擠壓研究缺乏標準化資料集，影響進展。作者建立人工整理的資料集，並測試大型語言模型（LLMs）自動擷取文獻資料的能力。結果發現，LLMs 雖然偶有錯誤或遺漏，但能大幅減少人工整理時間，是輔助建立資料集、加速研究的有力工具。 PubMed DOI

Benchmarking large language models GPT-4o, llama 3.1, and qwen 2.5 for cancer genetic variant classification.
GPT-4o、llama 3.1 與 qwen 2.5 在癌症基因變異分類的效能評比 NPJ Precis Oncol 2025-05-14

這項研究比較 GPT-4o、Llama 3.1 和 Qwen 2.5 在癌症基因變異臨床分類的表現，發現 GPT-4o 準確率最高。LLMs 在有明確證據時表現佳，但遇到證據較弱的變異時一致性較差，且容易過度分類。透過 prompt 設計和檢索增強生成可提升準確度。整體來說，LLMs 有潛力，但臨床應用還需再優化。 PubMed DOI

A Large Language Model Outperforms Other Computational Approaches to the High-Throughput Phenotyping of Physician Notes.
大型語言模型在醫師筆記高通量表現型分析中優於其他計算方法 AMIA Annu Symp Proc 2025-05-26

這篇研究比較GPT-4大型語言模型、深度學習和機器學習三種方法在電子病歷症狀標準化上的表現。結果發現，GPT-4表現最好，顯示大型語言模型很有潛力成為未來醫師筆記自動化分析的主流工具，有助於推動精準醫療發展。 PubMed

FoodSky: A food-oriented large language model that can pass the chef and dietetic examinations.
FoodSky：一個能通過廚師與營養師考試的食物導向大型語言模型 Patterns (N Y) 2025-06-09

作者們開發了 FoodSky，一款專為食物領域設計的大型語言模型，結合完整食物知識庫和先進演算法。FoodSky 在專業食物考試中表現優於一般模型，展現出在烹飪和飲食相關任務上的高效能，為食物專業 AI 設下新標準。 PubMed DOI

A novel fine-tuning and evaluation methodology for large language models on IoT raw data summaries (LLM-RawDMeth): A joint perspective in diabetes care.
物聯網原始數據摘要大型語言模型之新穎微調與評估方法（LLM-RawDMeth）：糖尿病照護的整合觀點 Comput Methods Programs Biomed 2025-06-14

這項研究用專家指導的模糊邏輯和提示工程，微調GPT模型，讓它能準確又簡潔地摘要連續血糖監測數據。微調後的GPT-4o準確率高達96%，顯示AI有助於糖尿病管理，能把複雜數據轉成實用資訊，減輕醫護人員負擔。 PubMed DOI

原始文章

站上相關主題文章列表