| 【论文摘要】 |
随着计算机科学、多媒体技术的飞速发展,以彩色图像为主的多媒体信息迅速成为重要的通用信息媒体。在彩色图像中,文字信息(如新闻标题、旁白等等)包含了丰富的高层语义信息,自动提取出这些文字,通过对它们的识别和分析,对于图像高层语义的索引和检索是非常有帮助的。此外,还可将提取出的文字从原图中去除,同时修复被文字所遮挡的背景区域,然后添加上多语种的文字,这对于不同语种间的图像交流和图像的再次使用也是很有意义的。
利用彩色图像文字区域与背景之间存在明显边缘轮廓的特点,本文提出了一种新的图像文字提取算法—CEMA(Color-edge detection,Morph- ology,logic operator“AND”)。该算法首先用垂直、水平和对角三个方向的彩色边缘检测算子从原图中提取出三幅边缘图像,然后分别对这三幅边缘图像依次运用形态学中的闭、开、水平膨胀、水平腐蚀运算,得到三幅不同的连通域图,最后,将这三幅连通域图进行逻辑与运算,去除噪声,得到最终的文字区域。实验结果证明,CEMA算法非常有效,文字提取率高,且具有鲁棒性。
在提取出图像内的文字区域后,本文运用纹理修复技术,将提取出的文字从原... |