MedicoVerse 是一個針對製藥產業法規文件進行摘要的解決方案,運用先進的機器學習技術。它採用多階段流程,包括詞嵌入、聚類和摘要生成。首先,利用 SapBERT 模型創建嵌入,接著用層次聚合聚類方法組織這些嵌入,最後使用 bart-large-cnn-samsum 模型對每個聚類進行摘要,並合併成綜合概述。與 T5、Google Pegasus 等模型比較後,MedicoVerse 在 ROUGE 分數、BERTScore 等評估標準上表現更佳,提供更具資訊性的摘要。
PubMed
DOI