LLM 相關三個月內文章 / 第 44 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究針對缺乏公開數據集的問題,探討如何根據乳腺影像報告及BI-RADS類別進行分類。研究團隊建立了一個包含5046份西班牙語放射學報告的數據集,經過認證的放射科醫生標註後翻譯成英文。經過預處理後,使用多種機器學習和深度學習分類器進行分析。結果顯示,BioGPT分類器的表現最佳,平均靈敏度達0.60,優於BERT的0.54。這項研究為未來BI-RADS分類的研究提供了基準數據集和基線結果,促進該領域的發展。 相關文章 PubMed DOI

大型語言模型(LLMs)能生成類似人類的高品質文本,對資訊生態系統影響深遠。為了防止濫用,水印技術可用於識別合成文本,但因質量和檢測性等挑戰,尚未普遍應用。這篇論文介紹了SynthID-Text,一種專為生產設計的水印方案,能在不影響文本質量的情況下,實現高檢測準確率。實驗顯示,SynthID-Text在可檢測性上優於其他方法,並保持LLM性能,作者希望能推動水印技術的發展,促進負責任的LLM使用。 相關文章 PubMed DOI

這項研究指出大型語言模型(LLMs)在醫學應用中存在重大脆弱性,只需操控模型權重的1.1%就能注入錯誤的生物醫學資訊,並在輸出中擴散。儘管如此,模型在其他生物醫學任務上的表現仍然不變。研究測試了1,025個錯誤的生物醫學事實,凸顯了LLMs在醫療領域的安全性和信任問題。結果強調了需要採取保護措施、驗證流程及謹慎的存取管理,以確保這些模型在醫療實踐中的安全可靠。 相關文章 PubMed DOI

這項研究分析了大型語言模型(LLMs),特別是GPT模型,在政治偏見和不一致性方面的表現,針對美國和中國的政治議題進行比較。結果顯示,這些模型對中國的政治知識和態度不一致性較高,中文模型對中國的負面評價較少,而英語模型則批評較多。這種差異主要源於審查制度和地緣政治緊張,而非模型本身的問題。此外,兩種模型都顯示出對各自國家的「內群體偏見」,這些發現強調了在極化的全球環境中,資訊傳播的重要性。 相關文章 PubMed DOI

這篇系統性回顧與統合分析探討大型語言模型(LLMs)在臨床腫瘤學的應用,分析了34項研究以評估其表現。研究發現,LLMs主要測試回答腫瘤學問題的能力,但因方法論和評估標準不同,表現上有顯著變異。模型能力、提示策略及特定腫瘤領域等因素影響這些變異。此外,LLMs缺乏標準化報告協議,造成方法論不一致。解決這些問題對提升研究可比性及促進LLM在臨床實踐中的應用至關重要。 相關文章 PubMed DOI

這項研究評估了四種自然語言處理(NLP)模型——ChatGPT 3.5、ChatGPT 4、Bard 和 Claude 2.0——在腹股溝疝氣管理方面的回應準確性與質量。六位疝氣外科醫生使用李克特量表評分,結果顯示相關性高(4.76),但完整性(4.11)和準確性(4.14)較低。ChatGPT 4 在準確性上表現最佳。可讀性評估顯示,無一文件符合美國醫學會標準,ACS 文件在可讀性和教育質量上得分最高。總體而言,雖然NLP提供了相關資訊,但可讀性和教育質量仍需改善,外科醫生應注意這些工具的優缺點。 相關文章 PubMed DOI

這項研究評估了 ChatGPT-4 在從電子健康紀錄中提取心臟衰竭症狀的零樣本學習效果。研究人員將其表現與傳統機器學習和基於規則的方法進行比較,結果顯示 ChatGPT-4 的精確度達 90.6%、召回率 100% 和 F1 分數 95%,遠超過傳統方法的 54.9% 精確度。研究還指出,提示風格和溫度設置會影響表現。總體來看,這顯示 ChatGPT-4 在醫療自然語言處理上的潛力。 相關文章 PubMed DOI

這項研究評估了ChatGPT-4在處理足部和踝部病變的診斷能力,提供了八個臨床案例,並由三位專科骨科醫生進行評分。結果顯示,ChatGPT-4的平均得分為22.0分(滿分25分),對Morton神經瘤的案例得分最高(24.7分),而腓骨肌腱撕裂的案例得分最低(16.3分)。雖然它在診斷和治療建議上表現優異,但在提供全面資訊和替代治療選項方面仍有不足。不過,它並未提出虛構的治療方案,顯示出其可靠性。總體來看,ChatGPT-4可成為醫生提供病人教育的有用工具。 相關文章 PubMed DOI

這篇文章探討了一項實驗,對比了ChatGPT-4和ChatGPT-3.5在SAT、BMAT和IMSAT等入學考試的表現。結果顯示,ChatGPT-4的表現明顯優於前一版本,SAT考試得分進入前10%,並且能夠取得進入頂尖義大利醫學院的分數。研究還分析了錯誤答案,找出了ChatGPT-4的三種邏輯和計算錯誤,突顯了其弱點,並提出了在教育中有效運用AI的建議,儘管仍有一些限制。 相關文章 PubMed DOI

是的,美國總統之間的語言差異確實明顯,表現在語言風格、語調和修辭策略上。研究指出,唐納德·川普的演講風格獨特,主要表現為: 1. **語言風格**:川普使用非正式且對抗性的語言,簡單直接,容易引起共鳴;而其他總統則較為正式。 2. **分裂性語言**:川普常用分裂性語言,與其他總統的和解語言形成對比。 3. **修辭策略**:他經常誇張和攻擊對手,這使他與前任總統區別開來。 這些差異在各種演講中都很明顯,顯示出川普的獨特性並非偶然,而是持續的溝通風格。 相關文章 PubMed DOI