LLM 相關三個月內文章 / 第 31 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這篇論文探討如何將領域專業知識融入提示工程,以提升大型語言模型(LLMs)在科學領域的表現。研究顯示,這種新方法在能力、準確性、F1分數及減少幻覺等指標上,表現優於傳統方法。針對MacMillan催化劑、紫杉醇和鋰鈷氧化物等複雜材料的案例研究,證實了這種方法的有效性。結果顯示,專業提示能幫助LLMs產生更準確的輸出,顯示其在科學研究中的潛在價值。論文也討論了目前方法的限制及未來研究方向。 相關文章 PubMed DOI

這項研究探討了ChatGPT 3.5在回答牙科問題的準確性和完整性。十位專家提出30個問題,並用李克特量表評估ChatGPT的回答。結果顯示,雖然ChatGPT的準確性(中位數5.50)和完整性(中位數2.00)表現不錯,但仍有改進空間。經過重新評估後,其表現顯著提升,顯示機器學習的潛力。不過,研究也指出仍有不準確之處,特別是參考資料,強調人類判斷在臨床決策中的重要性,以及基於證據的醫療實踐的必要性。 相關文章 PubMed DOI

在急診部門,快速且準確的診斷對病人結果和醫療效率非常重要。本研究評估了ChatGPT-3.5和ChatGPT-4在根據急診入院前24小時的電子健康紀錄生成鑑別診斷清單的表現。結果顯示,兩者在預測身體系統層級的診斷上都相當準確,GPT-4稍優於GPT-3.5,但在具體診斷類別上表現不一,精確度較低。值得注意的是,GPT-4在幾個關鍵類別中展現了更高的準確性,顯示其在處理複雜臨床情況上的優勢。 相關文章 PubMed DOI

這項研究調查了ChatGPT-3.5在波蘭醫學期末考試的表現,考試包含200道題目,評估醫學知識。分析980道題目後,發現ChatGPT的平均正確率約60%,顯著低於人類考生(p < 0.001)。不同科目表現差異大,血液學準確率最低(42.1%),內分泌學最高(78.6%)。研究顯示題目難度與正確性有顯著相關(p = 0.04),但題型對準確性影響不大(p = 0.46)。結果顯示ChatGPT-3.5可輔助考試準備,但需謹慎對待,建議與其他AI工具進行驗證。 相關文章 PubMed DOI

偏頭痛是一種常見且成本高的神經系統疾病,雖然有多種非藥物和數位治療選擇,但患者常缺乏資訊。本研究探討使用ChatGPT管理偏頭痛的效果,發現其能清楚地處理症狀描述、提供可信資源和治療選項。透過十次互動分析,ChatGPT的回應通常相關且具同理心,促進了用戶參與。不過,來源引用不一致和某些地方的可理解性不足仍需改善。總體來看,ChatGPT對尋求偏頭痛資訊的患者有潛力,但數位健康素養仍然重要,需持續評估AI系統的影響。 相關文章 PubMed DOI

大型語言模型(LLMs),如OpenAI的GPT系列,在醫學領域展現潛力,特別是在腫瘤學中。研究評估了LLM在分類化療引起的主觀毒性方面的能力,結果顯示LLM在一般毒性類別的準確率為85.7%,但在特定類別的準確率僅為64.6%。雖然LLM的表現與腫瘤科醫生相當,但特定類別的準確性仍需改進。未來研究應聚焦於真實病人的驗證及即時互動能力,並考量數據準確性和隱私等倫理問題。總體而言,LLMs有潛力提升病人護理質量與效率。 相關文章 PubMed DOI

順式調控元件(CREs)在基因表達調控中扮演重要角色,因為它們會與轉調控因子互動,影響生物體的功能。ENCODE計畫增進了我們對這些元件的了解,而新技術如大規模平行報導測試則提升了檢測能力。隨著多模態功能基因組數據的發展,我們運用深度學習和大型語言模型來分析CRE的核苷酸序列,這讓我們能更準確預測CRE的活性並設計新元件。了解CRE的運作對基因治療、選擇性育種和微生物合成生物學非常重要。 相關文章 PubMed DOI

這項研究強調微調蛋白質語言模型在各種預測任務中的有效性,顯示針對特定任務的監督式微調能提升表現。研究比較了三個先進模型(ESM2、ProtT5、Ankh)在八個任務上的表現,結果顯示高效的微調能達到類似改善,並顯著減少資源消耗和訓練時間。特別對於數據集有限的任務,如預測單個蛋白質的適應性景觀,微調的做法更具價值。作者還提供了使用者友好的筆記本,方便進行模型微調。 相關文章 PubMed DOI

深腦刺激(DBS)是一種外科手術,主要用來治療帕金森氏症等疾病,透過在特定腦區植入電極進行治療。由於患者對手術常有疑慮,像ChatGPT這樣的工具能提供易懂的資訊。一項研究評估了ChatGPT 3.5和4對80個DBS相關問題的回答,結果顯示GPT 4的準確率為83.8%,而GPT 3.5為57.5%。不過,GPT 3.5有6.3%的回答可能有害,而GPT 4則沒有。雖然表現不錯,但有害回答的存在提醒我們要謹慎,建議患者在考慮DBS手術時,不要僅依賴AI模型。 相關文章 PubMed DOI

這項研究評估了GPT-4(特別是ChatGPT)在解讀腦腫瘤MRI報告的診斷能力。研究分析了150份術前病患的報告,結果顯示GPT-4的診斷準確率為73%,而神經放射科醫師則為80%。在鑑別診斷方面,GPT-4的準確率高達94%,放射科醫師則介於73%到89%之間。研究結果表明,GPT-4可作為神經放射科醫師的有用第二意見,並能成為一般放射科醫師和住院醫師的指導工具,顯示其在臨床診斷中的潛力。 相關文章 PubMed DOI