首页编程相关正文

我要发布

transformer abstractive summarization

Boss 编程相关

2025-12-10 0 1,045

该论文的代码“有效适应了预处理的变压器以抽象摘要”

要求

要在Train.py中运行培训脚本。您还需要：

pytorch（版本> = 0.4）
TQDM
pyrouge
编辑部
TensorFlow（CPU版本还可以）
NLTK
Spacy（和“ EN”模型）

您可以通过克隆Alec Radford的存储库来下载OpenAI预训练版本的权重，并将包含预训练权重的model文件夹放在本仓库中。

为了运行此代码，您需要通过脚本中提供的脚本使用BPE预处理数据集

数据集预处理

培训和评估脚本期望3个总输出文件： train_encoded.jsonl ， val_encoded.jsonl和test_encoded.jsonl

CNN/每日邮件

可以从OpenNMT下载纸张中使用的数据和拆分。首先，使用提供的链接中的sed命令删除开始和结尾句子标签。要处理数据，请运行以下命令：

 python scripts/encode_cnndm.py --src_file {source file} --tgt_file {target file} --out_file {output file}

XSUM

可以使用XSUM刮擦纸张中使用的数据和拆分。通过Extract text from HTML Files运行命令。要处理数据，请运行以下命令：

 python scripts/encode_xsum.py --summary_dir {summary directory} --splits_file {split file} --train_file {train file} --val_file {val file} --test_file {test_file}

编辑部

可以从新闻编辑室下载纸张中使用的数据和拆分。要处理数据，请运行以下命令：

 python scripts/encode_newsroom.py --in_file {input split file} --out_file {output file}

训练

要训练模型，请运行以下命令：

 python train.py \\
  --data_dir {directory containing encoded data} \\
  --output_dir {name of folder to save data in} \\
  --experiment_name {name of experiment to save data with} \\
  --show_progress \\
  --doc_model \\
  --num_epochs_dat 10 \\
  --num_epochs_ft 10 \\
  --n_batch 16 \\
  --accum_iter 4 \\
  --use_pretrain

使用域自适应训练训练10个时期的预dataset的文档嵌入模型，并使用微调训练10个时期。该模型的有效批量大小为64，因为实际批量大小为16，并且我们在4个批次上积累了梯度。批次大小必须由可用的GPU数量排除。目前对多GPU使用的培训进行了优化，并且可能对单个GPU机器不起作用。

评估

要评估模型，请运行以下命令：

 python evaluate.py \\
  --data_file {path to encoded data file encoded data} \\
  --checkpoint {checkpoint to load model weights from} \\
  --beam {beam size to do beam search with} \\
  --doc_model \\
  --save_file {file to output results to} \\
  --n_batch {batch size for evaluation, must be divisible by number of gpus}

评估测试集中的文档嵌入模型。当前评估用于多GPU使用情况，并且可能对单个GPU机器不起作用。由于评估脚本将删除一些示例，如果数据点的数量不被GPU排除，则您可能需要运行create_small_test.py脚本以获取被排除在外的最后几个文件并在最后汇总结果。

下载源码

从 GitHub 克隆

通过命令行克隆项目:

git clone https://github.com/Andrew03/transformer-abstractive-summarization.git

收藏 (0) 打赏

感谢您的支持，我会继续努力的!

打开微信/支付宝扫一扫，即可进行扫码打赏哦，分享从这里开始，精彩与您同在

申明：本文由第三方发布，内容仅代表作者观点，与本网站无关。对本文以及其中全部或者部分内容的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。本网发布或转载文章出于传递更多信息之目的，并不意味着赞同其观点或证实其描述，也不代表本网对其真实性负责。

左子网编程相关 transformer abstractive summarization https://www.zuozi.net/33154.html

Boss

上一篇： nlp models

下一篇： UiPath AE S02P01 BuildFirstProcess VB

常见问题

发货方式是什么？

1、自动：拍下后，点击（下载）链接即可下载；2、手动：拍下后，联系卖家发放即可或者联系官方找开发者发货。

查看详情

交易周期是多久呢？

1、源码默认交易周期：手动发货商品为1-3天，并且用户付款金额将会进入平台担保直到交易完成或者3-7天即可发放，如遇纠纷无限期延长收款金额直至纠纷解决或者退款！；

查看详情

能退款么？

1、描述：源码描述(含标题)与实际源码不一致的（例：货不对板）； 2、演示：有演示站时，与实际源码小于95%一致的（但描述中有”不保证完全一样、有变化的可能性”类似显著声明的除外）； 3、发货：不发货可无理由退款； 4、安装：免费提供安装服务的源码但卖家不履行的； 5、收费：价格虚标，额外收取其他费用的（但描述中有显著声明或双方交易前有商定的除外）； 6、其他：如质量方面的硬性常规问题BUG等。注：经核实符合上述任一，均支持退款，但卖家予以积极解决问题则除外。

查看详情

注意事项

1、左子会对双方交易的过程及交易商品的快照进行永久存档，以确保交易的真实、有效、安全！ 2、左子无法对如“永久包更新”、“永久技术支持”等类似交易之后的商家承诺做担保，请买家自行鉴别； 3、在源码同时有网站演示与图片演示，且站演与图演不一致时，默认按图演作为纠纷评判依据（特别声明或有商定除外）； 4、在没有”无任何正当退款依据”的前提下，商品写有”一旦售出，概不支持退款”等类似的声明，视为无效声明； 5、在未拍下前，双方在QQ上所商定的交易内容，亦可成为纠纷评判依据（商定与描述冲突时，商定为准）； 6、因聊天记录可作为纠纷评判依据，故双方联系时，只与对方在左子上所留的QQ、手机号沟通，以防对方不承认自我承诺。 7、虽然交易产生纠纷的几率很小，但一定要保留如聊天记录、手机短信等这样的重要信息，以防产生纠纷时便于左子介入快速处理。

查看详情

左子网

分享最新WordPress教程共同学习，共同进步，共同成长！

QQ交流群

要求

数据集预处理

CNN/每日邮件

XSUM

编辑部

训练

评估

相关文章

微信

左子网

QQ交流群