liucaiquan.site - 才权的博客

next (2079) hexo (1121)

Example domain paragraphs

BERT推理加速的理论可以参考之前的博客《从零开始学习自然语言处理(NLP)》-BERT模型推理加速总结(5)。这里主要介绍基于Nvidia开源的Fast Transformer,并结合半精度模型量化加速,进行实践,并解决了TensorFlow Estimator预测阶段重复加载模型的问题。主要包括:

Pre-train模型获取

结合自身业务Fine-tuning