说明:象限感知网络(QPNet)
一个基于实例分割的简单而优雅的模型被设计用于文档和自然图像中的文本检测。 由卷积和双向长期短期记忆(BiLSTM)网络组成,它专注于分割近距离文本实例并检测长文本以提高在实际应用中的实用性。 输入图像通过它们与对象和背景的四个象限有关的网格位置进行编码。 具有转置操作的BiLSTM用于组合左右和上下上下文。 在没有边界框回归的情况下,仅设计一个输出分类分支来预测每个像素的准确位置,即象限感知。 因此,很容易训练。 最后,采用简单的后处理自然地找到文本位置。
安装
克
<weixin_42132352> 上传 | 大小:788kb