基于形态滤波增强的最稳定极值区视频文本检测方法（专利号：2012101926925）

日期: 2016-04-12浏览:

专利号：	2012101926925
申请日：	2012/06/12
授权公告日：	2015/03/11
专利权人：	大连理工大学
发明人：	陈丽娇；卢湖川

摘要：

本发明属于视频检索技术领域，涉及到图像处理相关知识，特别涉及到视频文字检测方法。其特征是从待测视频中提取出视频字幕用于识别和视频检索。首先，利用梯度幅度图（GAM）来增强输入图像的文本边界；其次，使用两个方向的形态滤波滤除部分背景干扰并增强了文本与背景的对比度；再次，我们使用最稳定极值区（MSER）区域检测器来检测视频文本的显著图，利用Graph？Cuts得到文本的最佳分割；最后利用文本的几何分布特性将文本连成文本行，并用多帧确认和一些启发教育的方法去除非文本区域。本发明的效果和益处是克服了在本文检测中比较敏感的文本边界模糊、对比度低以及背景复杂等技术难题，并且检测结果可以直接用于文字识别。

上一篇：一种基于几何图形特征点形状描述子的方法（专利号：2013101316312）