原始文章

這項研究比較 GPT-4o、Llama-3 (70B) 和 Mixtral (8x7B) 三款大型語言模型,發現 Llama-3 (70B) 和 GPT-4o 拆解餐點成分的表現都比 Mixtral 好,尤其 Llama-3 (70B) 準確率和 F1-score 都最高。結果顯示,像 Llama-3 這類開源模型,對個人化營養和餐點客製化很有幫助。 PubMed DOI


站上相關主題文章列表

研究比較了GPT-4、GPT-3.5和Llama模型在臨床敘述中處理縮寫的能力。結果顯示,GPT-4在英文表現優秀,但在德文和葡萄牙文仍有進步空間。額外資料對結果影響不大。建議在英文臨床文本中使用GPT-4,但在其他語言可能需要更好的模型。目前不建議使用Llama模型。 PubMed DOI

這項研究評估了大型語言模型(LLMs),特別是GPT-3.5、GPT-4和Llama-2(13B和7B架構),在自主評估臨床紀錄方面的表現。研究中使用了提示工程、微調和低秩適應等技術,特別關注Llama-2 7B模型。結果顯示,GPT-4的表現最佳,接近專家評估。微調後的Llama-2 7B在西班牙語理解上有顯著提升,並且低秩適應技術有效增強了模型性能。研究強調了LLMs在醫學教育中的潛力,並建議未來應解決現有限制以進一步提升模型表現。 PubMed DOI

這篇論文探討了大型語言模型(LLMs)在營養與飲食應用中的表現,特別是針對註冊營養師(RD)考試的1050道問題。研究比較了GPT-4o、Claude 3.5 Sonnet和Gemini 1.5 Pro的準確性與一致性,並分析了不同提示技術的效果。結果顯示,GPT-4o在使用帶自我一致性的思考鏈(CoT-SC)時表現最佳,而Gemini 1.5 Pro在零提示(ZS)下則展現最高一致性。研究強調選擇合適的LLM和提示策略對減少錯誤風險的重要性。 PubMed DOI

這項研究探討了先進的自然語言處理技術如何改善食物分類和飲食分析,使用來自飲食追蹤應用的原始文本。研究分為數據收集、框架開發和應用三個階段,參與者透過 myCircadianClock 應用記錄餐點。研究人員創建了 NutriRAG 框架,結合大型語言模型如 GPT-4,提升了食物分類的準確性。結果顯示,參與者在不同飲食模式下的飲食行為有顯著變化,顯示出 NutriRAG 在個性化營養和健康問題解決上的潛力,並建議進一步研究。 PubMed DOI

大型語言模型(LLMs),像是ChatGPT,正被研究用於增強慢性腎臟病(CKD)患者的營養指導。為了發揮其最佳效能,醫療專業人員、患者及照顧者的合作至關重要。雖然LLMs能提供食譜建議,但在分析電解質和卡路里等重要營養成分上仍有不足。未來的技術進步預期能改善這些能力,實現精確的營養分析和烹飪輔助工具。CKD社群的參與對於推動人工智慧在營養護理中的應用非常重要,並需保持批判性思維。 PubMed DOI

目前食品擠壓研究缺乏標準化資料集,影響進展。作者建立人工整理的資料集,並測試大型語言模型(LLMs)自動擷取文獻資料的能力。結果發現,LLMs 雖然偶有錯誤或遺漏,但能大幅減少人工整理時間,是輔助建立資料集、加速研究的有力工具。 PubMed DOI

這項研究比較 GPT-4o、Llama 3.1 和 Qwen 2.5 在癌症基因變異臨床分類的表現,發現 GPT-4o 準確率最高。LLMs 在有明確證據時表現佳,但遇到證據較弱的變異時一致性較差,且容易過度分類。透過 prompt 設計和檢索增強生成可提升準確度。整體來說,LLMs 有潛力,但臨床應用還需再優化。 PubMed DOI

這篇研究比較GPT-4大型語言模型、深度學習和機器學習三種方法在電子病歷症狀標準化上的表現。結果發現,GPT-4表現最好,顯示大型語言模型很有潛力成為未來醫師筆記自動化分析的主流工具,有助於推動精準醫療發展。 PubMed

作者們開發了 FoodSky,一款專為食物領域設計的大型語言模型,結合完整食物知識庫和先進演算法。FoodSky 在專業食物考試中表現優於一般模型,展現出在烹飪和飲食相關任務上的高效能,為食物專業 AI 設下新標準。 PubMed DOI

這項研究用專家指導的模糊邏輯和提示工程,微調GPT模型,讓它能準確又簡潔地摘要連續血糖監測數據。微調後的GPT-4o準確率高達96%,顯示AI有助於糖尿病管理,能把複雜數據轉成實用資訊,減輕醫護人員負擔。 PubMed DOI