手写数字识别系统之细化图像

2016-07-31 ruki 更多博文 » 博客 » GitHub »

手写数字识别 神经网络 细化 图像处理

原文链接 https://waruqi.github.io/2016/07/31/hnr-thin.cn/
注:以下为加速网络访问所做的原文缓存,经过重新格式化,可能存在格式方面的问题,或偶有遗漏信息,请以原文为准。


简介

所谓的细化就是经过一层层的剥离,从原来的图中去掉一些点,但仍要保持原来的形状,直到得到图像的骨架。

骨架,可以理解为图象的中轴,例如一个长方形的骨架是它的长方向上的中轴线;正方形的骨架是它的中心点;圆的骨架是它的圆心,直线的骨架是它自身,孤立点的骨架也是自身。

细化删除条件

  • 内部点不能删除
  • 孤立点不能删除
  • 直线端点不能删除
  • 如果P是边界点,去掉P后,如果连通分量不增加,则P可以删除

细化步骤

通过基于数学形态学的腐蚀细化法,通过刚才的删除条件,进行匹配删除,由于是直接判断,省了模板匹配的这一步。

针对3*3的八邻域,进行操作:

|| p3 || p2 || p9 || || p4 || p1 || p8 || || p5 || p6 || p7 ||

其中p1 = 1为黑点,如果以下四个条件同时满足,则删除p1,即令p1 = 0:

2 ≤ NZ(p1) ≤ 6  // 用于排除孤立点和内部点

NZ(p1) = l // NZ(p1)为p1点分支数,分支数为1说明是边界点,删除后不增加连通分量

p2 * p4 * p8 = 0 or NZ(p2) != 1 // 向下删除,避免打断
p2 * p4 * p6 = 0 or NZ(p4) != 1 // 向右删除,避免打断

p6 * p8 * p2 = 0 or NZ(p8) != 1 // 向左删除,避免打断
p6 * p4 * p8 = 0 or NZ(p6) != 1 // 向上删除,避免打断

实验结果

细化前:

thin_1

细化后:

thin_2

不足与改进

可以看到,使用这种算法的效果还算不错,但是还是有许多不足的地方,比如说:

  • 颈部化:线条交叉处会产生变形
  • 多余分支:由于线条粗细不均会产生多余分支
  • 头部消减:较粗的线条端点容易在逐层腐蚀中被消减,这对于原本就较短的数字线条尤为严重。

这些问题虽然有一些解决方法,但我目前实现的效果不佳,有待进一步研究

参考文献

如果想要了解更多数字图像处理相关的内容,可以去我的书柜看看,冈萨雷斯写的那本书数字图像处理还是非常经典的。。