LLM 相關三個月內文章 / 第 48 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究針對大型語言模型(LLMs),如GPT-3.5、GPT-4、Claude2和Llama2的智力進行調查,特別關注前額葉功能。結果顯示,雖然GPT-3.5在某些領域表現不錯,但在計畫和理解意圖上不太穩定,Claude2也有類似情況。相對之下,Llama2在大部分測試中表現不佳。值得一提的是,GPT-4在所有任務中表現良好,顯示出更接近人類的認知能力。研究證實,傳統神經心理測試能有效評估LLM的表現。 相關文章 PubMed DOI

這項研究評估了三個AI聊天機器人—ChatGPT、Bard和Bing—在眼部炎症、葡萄膜疾病及治療選擇的知識。共提出36個問題,結果顯示ChatGPT正確率52.8%,Bard為38.9%,Bing則44.4%。三者對20個問題的回答一致,正確率為45%。統計分析顯示它們的表現沒有顯著差異(P = 0.654)。研究結果指出,這些聊天機器人在眼部健康資訊的準確性仍需提升,未來可針對改善其表現進行研究。 相關文章 PubMed DOI

這項研究強調了在科學發現中傳遞不確定性所面臨的挑戰。雖然透明度很重要,但研究顯示不確定性的訊息在社交媒體上不易被分享,實驗中效果也不佳。第一項研究分析了超過200萬條Twitter訊息,發現不確定性高的訊息分享數較少。第二項實驗確認了這一趨勢,參與者接觸不同不確定性水平的訊息。這些結果顯示,不確定性雖然是科學傳播的關鍵,但可能會影響公眾對科學資訊的參與,對科學家和傳播者的研究呈現方式提出了重要考量。 相關文章 PubMed DOI

這項研究評估了GPT-4在神經放射學中生成鑑別診斷的效果,並與專業神經放射科醫師進行比較。研究分析了60份報告,結果顯示GPT-4在61.7%的案例中正確包含實際診斷,而醫師的準確率在63.3%到73.3%之間。GPT-4與醫師的協議程度被評為公平到中等。雖然GPT-4在輔助放射學工作上顯示潛力,但準確性仍不及人類專家,這強調了了解其局限性的重要性。 相關文章 PubMed DOI

骨科醫生對人工智慧(AI)的潛力越來越感興趣,特別是在2022年ChatGPT發布後,許多文章探討大型語言模型(LLMs)在骨科的應用。雖然研究顯示這些模型在處理骨科主題時的準確性不錯,但大多數研究重複性高,未能探索新領域。LLMs在數據處理和模式識別上表現優異,應鼓勵創意思考,尋找AI的新應用,以提升病患護理。期刊應支持這些創新研究,發掘AI如何改變骨科實踐,改善病患治療結果。 相關文章 PubMed DOI

這項研究探討南非放射學學生如何在學習和評估中運用人工智慧(AI)。透過焦點小組訪談,研究發現三個主要主題:首先,學生對AI的理解和看法;其次,他們在理論和臨床學習中使用AI的經驗及面臨的挑戰,如對可靠性和倫理的擔憂;最後,強調在教育中融入AI的必要性,包括負責任使用AI的教育。參與者認為AI能提升學術表現和臨床學習,但對AI生成資訊的可信度仍有疑慮。研究建議將AI納入課程,以改善醫學影像和放射科學的教育。 相關文章 PubMed DOI

在朝聖期間,將ChatGPT-4o即時翻譯技術應用於一家三級醫療機構的放射科,顯著提升了溝通與效率。根據2023年6月與2024年6月的數據比較,平均檢查時間從15.4分鐘降至11.1分鐘,每班病人通量從49.5例增至56.2例。此外,帶有伪影的掃描數量也大幅減少。患者與放射技術師的滿意度高,顯示程序遵從性提高且壓力降低。整體而言,這項研究證實了ChatGPT-4o在多語言醫療環境中的有效性。 相關文章 PubMed DOI

這項研究評估了ChatGPT-4o在解讀懷疑有阻塞性睡眠呼吸暫停症患者的多導睡眠圖的有效性,並與認證睡眠醫師的解讀進行比較。主要發現顯示,對於簡單案例,診斷一致性高達97%,治療建議一致性為100%。但在複雜案例中,診斷一致性降至70%,治療建議則降至44%。研究強調精確提示能提升AI表現,顯示AI在睡眠醫學的潛力,但仍需進一步研究以解決數據保護問題並驗證結果。 相關文章 PubMed DOI

這項研究探討了在足踝外科領域中,醫生能否區分由人工智慧(特別是ChatGPT 3.0)生成的摘要與人類撰寫的摘要。研究中,九位醫生參加了盲測,結果顯示他們的準確率僅為50.5%,幾乎等同於隨機猜測。評審者的經驗和對人工智慧的熟悉度對準確性影響不大,且評審者之間的可靠性隨時間下降。這顯示人工智慧生成的摘要與人類撰寫的相似度高,讓識別變得困難。 相關文章 PubMed DOI

文件級關係三元組提取在生物醫學文本挖掘中非常重要,尤其是在藥物發現和生物醫學知識圖譜的建立上。不過,現有語言模型在新數據集和關係類型上泛化能力不足,影響其效能。為了解決這個問題,我們提出了一種漸進學習策略,發展出PLRTE模型,透過四級漸進學習過程來增強模型對各種生物醫學關係的理解。實驗結果顯示,我們的模型在DDI和BC5CDR數據集上性能提升5%到20%,並在未見過的Chemprot和GDA數據集上也展現出良好的泛化能力。 相關文章 PubMed DOI