LLM 相關三個月內文章 / 第 47 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究探討了ChatGPT的預測能力,特別是GPT-3.5-turbo和GPT-4,針對韓國敗血症聯盟數據庫的數據,預測成人ICU患者的院內死亡率。研究分析了4,786名患者的7天死亡率和4,025名患者的30天死亡率。結果顯示,GPT-4在7天死亡率的預測上表現較佳,AUROC達0.70-0.83,而GPT-3.5則為0.51-0.70。對於30天死亡率,GPT-4的AUROC範圍為0.51-0.59,顯示出一定的預測潛力。 相關文章 PubMed DOI

這項研究顯示生成式人工智慧,特別是OpenAI的GPT-4 Turbo API,在提升放射學訓練方面的潛力。研究發現,這個AI模型能檢測到的差異明顯多於專業放射科醫師,顯示其在傳統審查中可能被忽略的改進空間。雖然AI在差異檢測上表現優異,但在評分一致性上仍有改進空間。生成的教學要點在85%的案例中被認為適當,顯示其教育價值。未來研究可著重於提高模型準確性及評分者一致性,並探討AI反饋對實習生的長期影響。 相關文章 PubMed DOI

您的研究強調病人教育在心臟衰竭管理中的重要性,並探討像ChatGPT這樣的AI聊天機器人的潛力。您比較了ChatGPT的回應與頂尖心臟病學機構的教育材料,評估了可讀性和可行性。 研究發現,雖然ChatGPT的回應較長且複雜,但可讀性得分仍具競爭力。然而,其可行性得分較低,顯示資訊雖全面,但對病人來說應用不易。 這項研究強調AI在病人教育中的潛力,但也指出需進一步研究以提升這些工具的可靠性和有效性,才能被認可為可信資源。整體而言,您的工作為技術與醫療教育的交集提供了重要見解。 相關文章 PubMed DOI

斜視是常見的眼科疾病,病人教育對於知情決策很重要。本研究比較了三個AI聊天機器人(ChatGPT、Bard、Copilot)和一個可靠網站(AAPOS)在回答斜視相關問題的表現。結果顯示,AAPOS在準確性上表現最佳,其次是Bard、Copilot和ChatGPT。Bard在可理解性和可行性方面得分最高,而AAPOS則在可讀性上最容易理解。情感分析顯示,Bard和Copilot在病人教育上有潛力,但AAPOS在準確性和可讀性上仍優於這些聊天機器人。 相關文章 PubMed DOI

這項研究探討了ChatGPT-4在文獻回顧中的有效性,特別是在醫療法律背景下醫生與病人之間的關係。分析了由GPT-4生成的文獻回顧與人類研究者撰寫的回顧,並根據準確性、反應時間等標準進行比較。結果顯示,GPT-4在反應時間和知識廣度上表現優異,但在深入理解和情境相關性上較弱。研究強調,雖然GPT-4可作為初步工具,但仍需專家評估以提升學術成果的準確性和情境豐富性,特別是在醫學研究領域。 相關文章 PubMed DOI

這項研究探討耳鼻喉科住院醫師選拔中,人工智慧模擬的決策是否受到人口統計偏見影響。研究使用OpenAI的GPT-4和GPT-4o模擬選拔委員會的決策,結果顯示RSC成員在種族、性別和性取向上存在偏見,特別偏好與自己相似的申請者。最新的ChatGPT-4o則顯示出對黑人女性和LGBTQIA+申請者的偏好,強調在選拔過程中需注意和減少這些偏見,以確保未來醫療人力的多樣性和代表性。 相關文章 PubMed DOI

這項研究評估了商業自動語音辨識(ASR)系統在聽障和重聽者的表現,並與正常聽力者比較。測試了850個音頻檔案,結果顯示聽障者的平均字詞錯誤率(WER)高達52.6%,而正常聽力者僅5.0%。特別是低可懂度的聽障者,WER高達85.9%。這顯示ASR系統對聽障者的服務不足,尤其是對於使用手語或有先天性聽損的人,凸顯了科技公司在可及性上的承諾需要加強,並需使用多樣化的數據來改善ASR系統。 相關文章 PubMed DOI

這項研究強調了數據驅動和機器學習在有機化學中的重要性,特別是在將文獻中的非結構化文本轉為結構化反應數據。這對於提升反應預測和條件建議非常關鍵。研究人員微調了一個大型語言模型,從有機合成程序中提取反應信息,並依據開放反應數據庫格式化。經過微調後,模型在生成完整記錄時達到91.25%的準確率,單個數據欄位則為92.25%。研究還探討了模型的局限性及其在特定任務上的表現。 相關文章 PubMed DOI

這段文字探討戰爭期間負面情緒對社會價值觀、心理健康及全球和平的影響,強調理解這些情緒的重要性,以便更好應對衝突中的人類行為。隨著自然語言處理和人工智慧技術的進步,數位治療工具如AI應用程式能提升心理健康服務的可及性,特別是在資源有限的地區。建議結合線上認知行為療法與情感基礎策略,轉化負面情緒,保護心理健康。AI工具如ChatGPT和Google Gemini可協助創造情感共鳴的訊息,提升溝通效果,設計正面影響的干預措施。 相關文章 PubMed DOI

這封信對Gravina等人關於ChatGPT在提供炎症性腸病患者醫療資訊的文章提出批評。雖然研究結果令人鼓舞,但信中強調需要更複雜的技術,例如結合推理與行動的檢索增強生成,以提升資訊的準確性和可靠性。信中指出,基本的問答測試不足以評估,應採用更全面的評估方法,來有效檢視大型語言模型在臨床環境中的表現。 相關文章 PubMed DOI