原始文章

這項研究探討了三個人工智慧模型在提供健康營養和懷孕期間體重管理資訊的有效性,分別是GPT-4、MedicalGPT和Med-PaLM。結果顯示,Med-PaLM的回應質量最高,平均得分3.93,顯著優於其他兩者。GPT-4的表現也優於MedicalGPT。在語義相似性方面,Med-PaLM在使用WORD2VEC時得分最高(0.92)。儘管Med-PaLM表現優越,研究仍強調持續進行AI在醫療領域的整合與改進的重要性,因為模型表現存在變異性。 PubMed DOI


站上相關主題文章列表

利用NLP技術協助整理懷孕和心理健康文章,幫助患者找到可信賴的健康資訊。透過手動檢視392篇文章建立語料庫,再利用BERT和gpt-3.5-turbo模型簡化分類。BERT擅長分辨相關性和主題,而gpt-3.5-turbo則擅長細分懷孕相關文章的特定主題。這種新方法可提供個人化、經濟實惠的健康教育資源,增進資訊的影響力。 PubMed DOI

研究評估個人化AI減重飲食計畫在臨床上的潛力,結果顯示與人類計畫無顯著差異。改進AI輸入或許提高計畫品質,推進個人化減重護理。需要進一步研究。 PubMed DOI

研究評估人工智慧回答肥胖手術問題的品質和易讀性,使用不同LLMs提供答案,由肥胖手術醫生評估。結果顯示像ChatGPT-4這樣的模型能提供適當回答,但表現有差異。臨床使用AI需謹慎,提供監督很重要。未來需進一步研究LLMs如何改善肥胖手術醫療服務和決策。 PubMed DOI

研究發現ChatGPT-4在回答與PCOS相關不孕症問題上表現良好,尤其在是非題方面表現完美。儘管多選題稍微下降,但整體表現仍穩定。這項研究強調ChatGPT-4對醫護人員在處理PCOS相關不孕症問題上的幫助。 PubMed DOI

這項研究探討了像ChatGPT這樣的AI聊天機器人在提供第二型糖尿病和代謝症候群的營養管理指導上的有效性。研究重點包括飲食管理、營養照護過程及1500卡路里菜單規劃。雖然兩位營養師的評估大致一致,但ChatGPT的建議在減重、能量缺口、人體測量及身體活動等方面存在明顯不足,且NCP的輸出不完整。儘管如此,營養師對其回應的清晰度評價良好。結論指出,ChatGPT可作為從業者的輔助工具,但使用者需了解其局限性。 PubMed DOI

在2023年8月的一項分析中,對ChatGPT-3.5和Bard(Google Gemini)在回答12個懷孕問題的表現進行比較。根據美國婦產科醫學會的標準,ChatGPT-3.5的可接受回答率為58%,而Bard則達到83%。此外,ChatGPT-3.5的參考資料全有問題,Bard只有8%不一致。整體來看,Bard在準確性上優於ChatGPT-3.5,但兩者都需進一步評估才能成為懷孕婦女的可靠資訊來源。 PubMed DOI

這項研究評估了AI語言模型ChatGPTv4在卵巢儲備不足(DOR)臨床指引中的表現,為期兩個月。研究結果顯示,ChatGPTv4在是非題的回答準確率達100%,多選題準確率從98.2%提升至100%。開放式回答的準確性和完整性也顯著改善,顯示出其在生殖內分泌學中作為可靠AI工具的潛力,能增強臨床決策和指引發展。不過,研究也指出受控環境的限制,可能無法完全反映真實臨床互動。 PubMed DOI

這項研究探討了人工智慧,特別是ChatGPT,在婦產科臨床決策中的應用潛力。結果顯示,雖然ChatGPT在某些情況下能提供正確答案,但在其他情況下表現不佳,顯示出其準確性和可靠性有限。因此,醫療專業人員需仔細審查AI的建議,並強調需要更清晰的指導方針。持續的技術進步對改善AI在臨床中的角色也很重要。總體而言,AI在醫療領域有潛力,但目前最適合在受控環境中使用,以確保病人安全和護理準確。 PubMed DOI

這項研究評估了GPT-4在預測體外受精(IVF)妊娠結果的準確性,結果顯示其預測準確率為0.79,接收者操作特徵曲線下面積(AUROC)為0.89,均優於原始研究的0.78和0.87。這顯示GPT-4能有效創建和增強IVF成功的預測模型,可能有助於縮短數據科學家與醫療專業人員的距離。不過,仍需進一步研究,使用更大且多樣的數據集來確認這些結果,並擴大其在輔助生殖中的應用。 PubMed DOI

這項研究評估了生成式預訓練變換器(GPT)在阿茲海默症(AD)管理中的表現。研究提出十四個問題,並向GPT-3.5和GPT-4詢問,還收集了四位神經科醫師的回應。結果顯示,神經科醫師的平均得分為3.9,而GPT的得分為4.4,且80%的高評價回應來自GPT。英文回應的可理解性和滿意度高於中文,家屬對GPT和醫師的評分無顯著差異。總體來看,GPT能有效提供AD相關的教育資訊,可能改善醫療管理和患者結果。 PubMed DOI