LLM 相關三個月內文章 / 第 25 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

最近的調查顯示,雖然ChatGPT是一個通用的虛擬助手,但在判斷兩張照片是否是同一個人方面,其表現已經達到與人類相當的水準。這顯示出它在圖像與文本配對上的訓練,使其能夠執行通常由專門的面孔識別系統完成的任務。這些結果為未來深入研究ChatGPT在這方面的能力及其錯誤與人類錯誤的比較提供了新的機會。 相關文章 PubMed DOI

這項研究探討大型語言模型(LLMs),特別是Llama-2,如何在電子健康紀錄(EHRs)中檢測精神科入院紀錄的自殺風險。研究人員評估了不同Llama-2模型在100份精神科報告上的表現,並與專家定義的真實情況進行比較。經過德國微調的Llama-2模型表現最佳,準確率達87.5%,敏感性83.0%,特異性91.8%。結果顯示,LLMs能有效提取自殺相關資訊,並保持數據隱私,顯示其在監測精神科緊急情況及增強自殺管理上的潛在應用價值。 相關文章 PubMed DOI

這篇綜述論文探討了醫療人工智慧(AI)的最新進展,特別是基礎模型和大型語言模型的應用。它提出了一個新的分類框架,將模型分為特定疾病、一般領域和多模態三類。論文還指出了數據獲取和增強等挑戰,包括數據量、標註、隱私等問題。此外,還討論了醫療AI模型的評估和監管,強調其在醫療保健中的潛力。最後,論文呼籲持續改進、數據安全和標準化評估,以確保AI在臨床實踐中的有效整合。 相關文章 PubMed DOI

這項研究評估了ChatGPT-4對於Kienböck's disease (KD) 的常見問題回應的質量與可讀性。十九個問題被分為一般知識、診斷和治療,並由33位手外科醫生使用全球質量評分標準進行評估。結果顯示平均GQS分數為4.28,表示大部分回應被評為良好或優秀。不過,根據可讀性測試,這些回應的難度超過大學畢業生的水平,顯示需要改進以提高可讀性,讓更多人能輕鬆理解。這項研究屬於四級觀察性研究。 相關文章 PubMed DOI

預測蛋白質-蛋白質相互作用位點對於理解生化過程非常重要,尤其是在病毒與受體蛋白質的互動中,有助於疾病機制和藥物開發。傳統方法面臨處理時間長、成本高和準確性低的挑戰。為了解決這些問題,我們提出了一種新穎的網絡,利用多重信息融合來預測相互作用位點。透過圖卷積網絡、雙向長短期記憶(BiLSTM)和ProtT5模型,我們的模型在多項評估指標上超越現有方法,顯示出其有效性和優越性。 相關文章 PubMed DOI

這項研究評估了人類審查者與GPT-4在評估病例報告和系列的質量一致性。研究分析了797篇2023至2024年發表的文獻,發現人類與GPT-4的評估一致性在41.91%到80.93%之間,病例選擇的問題一致性最低。無論期刊影響因子如何,一致性都相對穩定。重複分析顯示GPT-4在大多數情況下表現良好,但仍需人類監督,因為其尚未達到系統性回顧的嚴格標準。 相關文章 PubMed DOI

這項研究評估了ChatGPT在解答肢端肥大症相關問題的可用性與可靠性。研究分為兩部分:首先,提出35個病人常見問題;其次,使用醫學術語呈現四個病人案例。三位專家根據安全性、可靠性、正確性和可用性對ChatGPT的回答進行評分。 結果顯示,ChatGPT在回答病人問題的正確性平均得分為6.78,可靠性得分為6.69。雖然它能有效回應相關詢問,但不應被視為病人管理的獨立可靠來源,建議作為醫療專業人員的輔助工具。 相關文章 PubMed DOI

這項研究探討如何利用生成式人工智慧,特別是大型語言模型,來改善投資組合的建構。研究針對這些AI工具的輸出解讀問題,提出了一個結構化的提示框架,幫助不同經驗的投資者更清楚地理解結果。研究還創建了多種情境來測試提示的影響,並提出了一種新算法,結合了非線性啟動的甲蟲觸角搜索策略與白鷺群體優化算法,來解決考慮交易成本的均值-方差投資組合選擇問題。模擬結果顯示,這個算法在優化投資組合方面表現出色,能達到更高的夏普比率。 相關文章 PubMed DOI

聊天機器人的出現可能會顯著改變信息獲取和教育,特別是在光化學領域。最近的評估測試了五款聊天機器人,包括ChatGPT 3.5和4.0,針對13個光化學問題。結果顯示,這些機器人在基本概念上表現中等,但在專業問題上表現不佳,常常提供複雜或不相關的解釋,或是缺乏有意義的內容。因此,目前的聊天機器人不適合獨立用於教育,仍需專家提供專業知識。 相關文章 PubMed DOI

COVID-19疫情促進了遠距學習的發展,讓開卷考試(OBEs)與閉卷考試(CBEs)在STEM教育中受到更多關注。本研究系統性回顧了自2013年以來的相關文獻,分析OBEs與CBEs對大學STEM學生的影響。結果顯示,OBEs通常能獲得較高的學生分數,但也存在變異性。儘管OBEs更能評估現代教育所需的能力,先進的語言模型(LLMs)卻可能影響其有效性,造成學術誠信的問題。因此,未來研究需探討如何在LLMs影響下維持OBEs的公正性與有效性。 相關文章 PubMed DOI