infersent

2025-12-10 0 523

infersent :学习通用句子表示

该存储库包含用于监督NLI任务的Pytorch实现和实验界面,该任务具有不同的模型,用于学习通用句子表示。

结果

使用SNLI数据对NLI任务培训了基线模型MeanEmbedding和三个基于LSTM的模型LSTMBiLSTMBiLSTM-maxpool 。使用Senteval框架对8个转移任务进行评估句子嵌入。

按照infersent论文的第5节的定义,计算了Senteval任务的微标准和宏观度量[1]。结果在下面列出:

模型 snli-dev SNLI测试 Senteval-Micro Senteval-Macro
含义 69.5 69.1 77.31 77.92
LSTM 80.5 80.2 70.467 70.282
比尔斯特 80.00 80.08 71.997 71.531
Bilstm-Maxpool 86.50 85.87 79.075 78.831

组织

该存储库被组织成以下主要组成部分:

  • models.py编码器和分类器模型的Pytorch模块。
  • data.py SNLIData类,用于准备用于培训和评估的数据。
  • train.py与不同编码器进行培训的Pytorch Lightning模型和培训CLI。
  • eval.py CLI,使用模型检查点并在SNLI和SenteVal任务上运行评估。
  • demo.ipynb用于测试模型推理的Jupyter笔记本和分析结果。

设置

 # Using pip
pip install -r requirements.txt
# Using conda
conda env create -f environment.yml
# Download english model for SpaCy tokenizer
python -m spacy download en_core_web_sm

要使用Senteval进行评估,请按以下方式准备SenteVal安装:

git clone https://*github.**com/facebookresearch/SentEval.git
cd SentEval/ && python setup.py install
# Download datasets
cd SentEval/data/downstream/ && ./get_transfer_data.bash

训练

运行train.py具有以下编码器类型之一: MeanEmbeddingLSTMBiLSTMBiLSTM-maxpool 。培训过程将创建./logs目录中的模型检查点,张板日志和HyperParams文件hparams.yaml

python train.py --encoder_type= \' BiLSTM \' 

评估

使用模型检查点标志运行eval.py ,以在SNLI和SenteVal上运行评估任务。

python eval.py --checkpoint_path= \' ./logs/MeanEmbedding/version_0/checkpoints/epoch=2-step=12875.ckpt \' 

预训练的模型

模型检查点和张板日志是公开的,可以在此处找到:https://drive.google.com/drive/folders/1ebjyf0wj31ezmpebig1nhw-1jomml1iy?usp = sharing

参考

[1] A. Conneau,D。Kiela,H。Schwenk,L。Barrault,A。Bordes,监督从自然语言推理数据中学习通用句子表示的

下载源码

通过命令行克隆项目:

git clone https://github.com/parasdahal/infersent.git

收藏 (0) 打赏

感谢您的支持,我会继续努力的!

打开微信/支付宝扫一扫,即可进行扫码打赏哦,分享从这里开始,精彩与您同在
点赞 (0)

申明:本文由第三方发布,内容仅代表作者观点,与本网站无关。对本文以及其中全部或者部分内容的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。本网发布或转载文章出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,也不代表本网对其真实性负责。

左子网 编程相关 infersent https://www.zuozi.net/33123.html

常见问题
  • 1、自动:拍下后,点击(下载)链接即可下载;2、手动:拍下后,联系卖家发放即可或者联系官方找开发者发货。
查看详情
  • 1、源码默认交易周期:手动发货商品为1-3天,并且用户付款金额将会进入平台担保直到交易完成或者3-7天即可发放,如遇纠纷无限期延长收款金额直至纠纷解决或者退款!;
查看详情
  • 1、描述:源码描述(含标题)与实际源码不一致的(例:货不对板); 2、演示:有演示站时,与实际源码小于95%一致的(但描述中有”不保证完全一样、有变化的可能性”类似显著声明的除外); 3、发货:不发货可无理由退款; 4、安装:免费提供安装服务的源码但卖家不履行的; 5、收费:价格虚标,额外收取其他费用的(但描述中有显著声明或双方交易前有商定的除外); 6、其他:如质量方面的硬性常规问题BUG等。 注:经核实符合上述任一,均支持退款,但卖家予以积极解决问题则除外。
查看详情
  • 1、左子会对双方交易的过程及交易商品的快照进行永久存档,以确保交易的真实、有效、安全! 2、左子无法对如“永久包更新”、“永久技术支持”等类似交易之后的商家承诺做担保,请买家自行鉴别; 3、在源码同时有网站演示与图片演示,且站演与图演不一致时,默认按图演作为纠纷评判依据(特别声明或有商定除外); 4、在没有”无任何正当退款依据”的前提下,商品写有”一旦售出,概不支持退款”等类似的声明,视为无效声明; 5、在未拍下前,双方在QQ上所商定的交易内容,亦可成为纠纷评判依据(商定与描述冲突时,商定为准); 6、因聊天记录可作为纠纷评判依据,故双方联系时,只与对方在左子上所留的QQ、手机号沟通,以防对方不承认自我承诺。 7、虽然交易产生纠纷的几率很小,但一定要保留如聊天记录、手机短信等这样的重要信息,以防产生纠纷时便于左子介入快速处理。
查看详情

相关文章

猜你喜欢
发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务