原始文章

這項歐盟 Interact-Europe 計畫,針對腫瘤學教育教材,開發並評估專為醫學領域設計的語音和機器翻譯系統,把英文訓練影片翻成法文、西班牙文、德文和斯洛維尼亞文。研究比較三種醫療機器翻譯模型,發現大型語言模型(LLMs)翻譯品質可比傳統系統。團隊也公開一個大型腫瘤學訓練影片資料集供大家研究。 PubMed DOI


站上相關主題文章列表

醫療播客的興起讓我們擁有了大量的音頻內容,裡面充滿了專業術語和專家討論。為了提升大型語言模型(LLMs),我們提出了一個計算框架,利用公開的醫療播客數據。我們的數據集包含超過4300小時的轉錄音頻,生成了3900萬個文本標記。名為MedPodGPT的模型整合了這些豐富的對話,改善了對自然語言和醫學知識的理解。評估顯示,MedPodGPT的表現比標準開源基準提高了2.31%,在多語言轉移方面也有2.58%的改善,顯示其適應各種語言的能力。這樣的進展為醫療研究和教育提供了更好的支持。 PubMed DOI

這篇論文探討流行病學和臨床癌症登記在改善腫瘤醫療及研究中的重要性,特別是在癌症影響日益擴大的情況下。文中指出醫療數據的多樣性帶來挑戰,使得腫瘤手動記錄變得困難。研究提出利用大型語言模型(LLMs)將非結構化醫療報告轉換為德國基本腫瘤數據集所需的結構化格式。結果顯示,將LLMs整合進醫院數據管理或癌症登記系統,能顯著提升癌症數據的質量與完整性,對於有效的診斷、治療及療效評估至關重要。這項研究為人工智慧在醫療數據處理及癌症護理中的潛力提供了新的見解。 PubMed DOI

這項研究探討了如何在有限計算資源下,利用非專有的大型語言模型(LLMs)協助醫療專業人員撰寫德語醫療文本。研究團隊訓練了四個擁有70億參數的模型,並與商業模型Claude-v2進行比較。結果顯示,BLOOM-CLP-German模型在自動評估中表現最佳,且在專家評估中,有93.1%的生成報告被認為可用,僅需少量修改。這顯示即使資源有限,仍能生成適合臨床的醫療文檔,強調選擇非英語模型時需考慮目標語言的重要性。 PubMed DOI

開源多語言醫學語言模型的發展,旨在服務不同語言和地區的使用者。主要貢獻包括: 1. **MMedC Corpus**:一個包含約255億詞元的多語言醫學語料庫,涵蓋六種主要語言,促進大型語言模型的適應性。 2. **MMedBench**:一個多語言醫學多選題問答基準,幫助監測多語言醫學模型的進展。 3. **模型評估**:評估各種開源模型在MMedBench上的表現,最終產出MMed-Llama 3,擁有80億參數,表現超越其他開源模型,甚至可與GPT-4競爭。 總之,這項工作提供了全面的語料庫、基準和模型,推進多語言醫學模型的發展。 PubMed DOI

這項研究評估大型語言模型(LLMs)在翻譯放射科報告的效果。由於合格翻譯者不足,這對病人護理造成挑戰。研究團隊將100份合成報告翻譯成九種語言,並使用十個LLM進行自動翻譯,結果由18位放射科醫生評估。發現GPT-4的翻譯品質最佳,特別是在英德、英希、英泰和英土語言對上表現突出。雖然LLMs在清晰度和一致性上表現良好,但醫學術語的準確性仍需改進。總體來說,LLMs能有效翻譯放射科報告,但不同模型和語言的表現有所差異。 PubMed DOI

這項研究介紹了MedExamLLM,一個評估大型語言模型(LLMs)在全球醫學考試表現的平台。它彙整了193篇相關文章,涵蓋16個LLM及來自28國、15種語言的198個醫學考試,時間範圍從2009到2023年。結果顯示,美國考試數量最多,主要語言為英語,GPT系列,特別是GPT-4,表現最佳。該平台強調LLM能力在地理和語言上有顯著差異,並且是開源的,旨在促進人工智慧在醫學教育中的應用。未來研究應解決潛在偏見及非英語研究的排除問題。 PubMed DOI

這項研究探討大型語言模型(LLMs)在為癌症倖存者及其照顧者創建教育材料的有效性,特別針對弱勢群體。研究比較了三個模型(GPT-3.5 Turbo、GPT-4 和 GPT-4 Turbo)在生成30個癌症護理主題內容的表現,目標是達到六年級的閱讀水平,並提供西班牙語和中文翻譯。 主要發現包括:LLMs整體表現良好,74.2%符合字數限制,平均質量分數為8.933,但只有41.1%達到所需閱讀水平。翻譯準確率高,西班牙語96.7%、中文81.1%。常見問題有範圍模糊和缺乏可行建議。GPT-4表現優於GPT-3.5 Turbo,使用項目符號提示效果更佳。 結論指出,LLMs在創建可及的教育資源方面潛力大,但需改善閱讀水平和內容全面性,未來研究應結合專家意見和更好數據以提升有效性。 PubMed DOI

大型語言模型在醫學教育應用越來越普遍,不只幫助老師設計課程、製作教材,也能給予學生回饋,提升語言和寫作能力。這篇綜述分析實際案例,說明LLMs對師生的好處,並討論遇到的挑戰及解方。研究建議醫學教育應更廣泛運用LLMs,以提升學習成效和病人安全。 PubMed DOI

這篇研究發現,大型語言模型在製作日本放射技術師國考教材時,對文字題表現不錯,但計算題和影像判讀較弱。建議搭配程式工具解計算題,影像題則用關鍵字輔助。老師要主動監督和驗證內容。隨著LLM進步,教學方法也要跟著調整,才能確保非英語環境下的教學品質。 PubMed DOI

這項研究發現,GPT-4 和 GPT-4o 在韓國輸血醫學執照考試(無論韓文或英文題目)表現穩定且優於標準,其他模型則較不穩定,特別是遇到韓文題目時。所有模型在法律與倫理題目上表現較差。總結來說,GPT-4/4o 在專業內容上可靠,但臨床應用前仍需針對在地法規和多語言進行微調。 PubMed DOI