liucaiquan.site - 才权的博客

next (2079) hexo (1121)

Example domain paragraphs

BERT推理加速的理论可以参考之前的博客《从零开始学习自然语言处理(NLP)》-BERT模型推理加速总结（5）。这里主要介绍基于Nvidia开源的Fast Transformer，并结合半精度模型量化加速，进行实践，并解决了TensorFlow Estimator预测阶段重复加载模型的问题。主要包括：

Pre-train模型获取

结合自身业务Fine-tuning