LLM 相關三個月內文章 / 第 74 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

2022年11月ChatGPT的發布引起了對生成式人工智慧(AI)的廣泛關注,促使學術期刊迅速制定相關政策,這些政策差異很大,有的要求作者聲明使用AI,有的則禁止使用。文章探討了機器學習和生成式AI的基本原理及其對科學出版的影響,並指出某些政策可能無法長期維持,因為AI生成的文本質量提升,檢測變得困難。文章呼籲成立專責小組,推動負責任的AI使用,以提升疼痛研究的出版質量。 相關文章 PubMed DOI

這項研究評估了大型語言模型(LLM),特別是ChatGPT,在回答結直腸癌相關病理問題的有效性。研究人員比較了ChatGPT的回答與腸胃科醫生的回答,並創建了一個互動系統,讓用戶上傳病理報告圖片以獲得AI生成的答案。結果顯示,對於常見問題,腸胃科醫生對AI的評價與傳統答案相似,但在特定報告問題上,AI的表現獲得更高評價。總體而言,ChatGPT能提供可信的病理問題答案,增強醫生與患者的溝通。 相關文章 PubMed DOI

最近,人工智慧(AI)在遠距醫療的應用上有了顯著進展,特別是像ChatGPT這樣的聊天機器人。研究團隊開發了一個結合ChatGPT與Synthesia的視頻機器人,專門解答乳房重建的常見問題。調查顯示,63.5%的參與者偏好視頻機器人,因為它更具吸引力,且77%希望看到與自己性別和種族相符的角色。雖然兩者在有效性和信任度上相似,但視頻機器人的人性化特徵提升了互動性,未來應進一步研究種族和性別一致性對病人體驗的影響。 相關文章 PubMed DOI

這項研究比較了傳統機器學習演算法和大型語言模型在評估學生解決物理問題時的效果。雖然大型語言模型在教育上有創新潛力,但也存在生成不準確資訊、缺乏可解釋性及資源需求高等限制。結果顯示,傳統機器學習演算法在這個情境中表現更佳,特別是在有標記數據的情況下,能有效補充大型語言模型。因此,研究人員在選擇方法時應考慮具體情境和可用資源。 相關文章 PubMed DOI

研究顯示,ChatGPT-4在使用十項人格量表(TIPI)評估公共人物的人格特質上表現優異,相關係數高達0.76到0.87,顯示其評估結果與人類評審者高度一致。這可能歸因於其廣泛的訓練數據、對語言細微差別的理解、模式識別能力,以及缺乏偏見的反饋。這些發現顯示,ChatGPT-4在心理學、行銷和公共關係等領域具有潛在價值,並引發對AI在社會評估中可靠性的思考,顯示出AI在理解人類行為方面的進步與應用潛力。 相關文章 PubMed DOI

這篇社論探討生成式人工智慧的進展,特別是OpenAI的新模型o1-Preview,並與傳統的ChatGPT (GPT-4)進行比較。雖然ChatGPT在一般醫療建議上已經相當實用,但o1-Preview透過「思考鏈」提供更強的推理能力,能處理更複雜的醫療問題,如遺傳疾病。文章強調o1-Preview在減少不準確性和改善輸出質量的潛力,並提到倫理挑戰和數據多樣性需求。結論呼籲醫療專業人員、政策制定者和計算機科學家合作,以充分發揮AI模型的潛力,提升醫療系統的效率與準確性。 相關文章 PubMed DOI

這項研究評估了生成式人工智慧模型ChatGPT在預測住院病人藥物間相互作用(DDIs)的有效性。研究人員將病人的資料輸入ChatGPT,並用三種不同的提示進行比較。結果顯示,當提示明確提到「藥物相互作用」時,ChatGPT的敏感度較高,但整體準確性仍然偏低,假陰性比例高,且與藥劑師的協議程度極低。Cohen's kappa值顯示評估者之間的可靠性不佳,強調在臨床使用前,ChatGPT仍需進一步改進。 相關文章 PubMed DOI

這項研究探討大型語言模型(LLMs),特別是GPT-4,如何應用於分析課堂對話,以評估教學品質和診斷教育需求。傳統質性分析方法耗時且需專業知識,研究旨在確認LLMs是否能簡化此過程。研究使用中學數學和中文課的數據,將專家手動編碼的結果與GPT-4生成的結果進行比較。結果顯示,GPT-4能顯著節省時間,且編碼一致性高,顯示LLMs在教學評估和教育改進上具潛力。 相關文章 PubMed DOI

這項研究開發了一種名為DeepAIP的深度學習模型,專門用來預測抗炎肽(AIPs)。由於傳統的抗炎治療方法如NSAIDs和糖皮質激素常有副作用,尋找替代療法變得相當重要。DeepAIP結合了上下文自注意力機制和預訓練的蛋白質語言模型,顯著提高了預測準確性。測試中,Prot-T5表現最佳,DeepAIP的表現超越現有方法,成功識別17個新型抗炎肽序列。研究數據和代碼已在GitHub上公開。 相關文章 PubMed DOI

這項研究評估了三個生成式人工智慧(GAI)系統的診斷準確性,包括Gemini Advanced、Gemini和Bard,透過分析392份病例報告來比較它們生成鑑別診斷清單的能力。結果顯示,Gemini的表現最佳,前10名清單中納入最終診斷的比率為76.5%。雖然Gemini Advanced的準確性較低,但整體來說,Gemini在診斷準確性上優於Bard。研究強調這些系統尚未經過臨床驗證,未來仍需改進。 相關文章 PubMed DOI