经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 程序设计 » Python » 查看文章
python简单实现图片文字分割
来源:jb51  时间:2021/9/6 10:18:03  对本文有异议

本文实例为大家分享了python简单实现图片文字分割的具体代码,供大家参考,具体内容如下

原图:

图片预处理:图片二值化以及图片降噪处理。

  1. # 图片二值化
  2. def binarization(img,threshold):
  3. #图片二值化操作
  4. width,height=img.size
  5. im_new = img.copy()
  6. for i in range(width):
  7. for j in range(height):
  8. a = img.getpixel((i, j))
  9. aa = 0.30 * a[0] + 0.59 * a[1] + 0.11 * a[2]
  10. if (aa <= threshold):
  11. im_new.putpixel((i, j), (0, 0, 0))
  12. else:
  13. im_new.putpixel((i, j), (255, 255, 255))
  14.  
  15. # im_new.show() # 显示图像
  16. return im_new
  1. # 图片降噪处理
  2. def clear_noise(img):
  3. # 图片降噪处理
  4.  
  5. x, y = img.width, img.height
  6. for i in range(x-1):
  7. for j in range(y-1):
  8. if sum_9_region(img, i, j) < 600:
  9. # 改变像素点颜色,白色
  10. img.putpixel((i, j), (255,255,255))
  11. # img = np.array(img)
  12. # # cv2.imwrite('handle_two.png', img)
  13. # # img = Image.open('handle_two.png')
  14. img.show()
  15. return img
  16.  
  17. # 获取田字格内当前像素点的像素值
  18. def sum_9_region(img, x, y):
  19. """
  20. 田字格
  21. """
  22. # 获取当前像素点的像素值
  23.  
  24. a1 = img.getpixel((x - 1, y - 1))[0]
  25. a2 = img.getpixel((x - 1, y))[0]
  26. a3 = img.getpixel((x - 1, y+1 ))[0]
  27. a4 = img.getpixel((x, y - 1))[0]
  28. a5 = img.getpixel((x, y))[0]
  29. a6 = img.getpixel((x, y+1 ))[0]
  30. a7 = img.getpixel((x+1 , y - 1))[0]
  31. a8 = img.getpixel((x+1 , y))[0]
  32. a9 = img.getpixel((x+1 , y+1))[0]
  33. width = img.width
  34. height = img.height
  35.  
  36. if a5 == 255: # 如果当前点为白色区域,则不统计邻域值
  37. return 2550
  38.  
  39. if y == 0: # 第一行
  40. if x == 0: # 左上顶点,4邻域
  41. # 中心点旁边3个点
  42. sum_1 = a5 + a6 + a8 + a9
  43. return 4*255 - sum_1
  44. elif x == width - 1: # 右上顶点
  45. sum_2 = a5 + a6 + a2 + a3
  46. return 4*255 - sum_2
  47. else: # 最上非顶点,6邻域
  48. sum_3 = a2 + a3+ a5 + a6 + a8 + a9
  49. return 6*255 - sum_3
  50.  
  51. elif y == height - 1: # 最下面一行
  52. if x == 0: # 左下顶点
  53. # 中心点旁边3个点
  54. sum_4 = a5 + a8 + a7 + a4
  55. return 4*255 - sum_4
  56. elif x == width - 1: # 右下顶点
  57. sum_5 = a5 + a4 + a2 + a1
  58. return 4*255 - sum_5
  59. else: # 最下非顶点,6邻域
  60. sum_6 = a5+ a2 + a8 + a4 +a1 + a7
  61. return 6*255 - sum_6
  62.  
  63. else: # y不在边界
  64. if x == 0: # 左边非顶点
  65. sum_7 = a4 + a5 + a6 + a7 + a8 + a9
  66. return 6*255 - sum_7
  67. elif x == width - 1: # 右边非顶点
  68. sum_8 = a4 + a5 + a6 + a1 + a2 + a3
  69. return 6*255 - sum_8
  70. else: # 具备9领域条件的
  71. sum_9 = a1 + a2 + a3 + a4 + a5 + a6 + a7 + a8 + a9
  72. return 9*255 - sum_9

经过二值化和降噪后得到的图片

对图片进行水平投影与垂直投影:

  1. # 传入二值化后的图片进行垂直投影
  2. def vertical(img):
  3. """传入二值化后的图片进行垂直投影"""
  4. pixdata = img.load()
  5. w,h = img.size
  6. ver_list = []
  7. # 开始投影
  8. for x in range(w):
  9. black = 0
  10. for y in range(h):
  11. if pixdata[x,y][0] == 0:
  12. black += 1
  13. ver_list.append(black)
  14. # 判断边界
  15. l,r = 0,0
  16. flag = False
  17. t=0#判断分割数量
  18. cuts = []
  19. for i,count in enumerate(ver_list):
  20. # 阈值这里为0
  21. if flag is False and count > 0:
  22. l = i
  23. flag = True
  24. if flag and count == 0:
  25. r = i-1
  26. flag = False
  27. cuts.append((l,r))#记录边界点
  28. t += 1
  29. #print(t)
  30. return cuts,t
  31.  
  32. # 传入二值化后的图片进行水平投影
  33. def horizontal(img):
  34. """传入二值化后的图片进行水平投影"""
  35. pixdata = img.load()
  36. w,h = img.size
  37. ver_list = []
  38. # 开始投影
  39. for y in range(h):
  40. black = 0
  41. for x in range(w):
  42. if pixdata[x,y][0] == 0:
  43. black += 1
  44. ver_list.append(black)
  45. # 判断边界
  46. l,r = 0,0
  47. flag = False
  48. # 分割区域数
  49. t=0
  50. cuts = []
  51. for i,count in enumerate(ver_list):
  52. # 阈值这里为0
  53. if flag is False and count > 0:
  54. l = i
  55. flag = True
  56. if flag and count == 0:
  57. r = i-1
  58. flag = False
  59. cuts.append((l,r))
  60. t += 1
  61. return cuts,t

这两段代码目的主要是为了分割得到水平和垂直位置的每个字所占的大小,接下来就是对预处理好的图片文字进行分割。

  1. # 创建获得图片路径并处理图片函数
  2. def get_im_path():
  3.  
  4. OpenFile = tk.Tk()#创建新窗口
  5. OpenFile.withdraw()
  6. file_path = filedialog.askopenfilename()
  7.  
  8. im = Image.open(file_path)
  9. # 阈值
  10. th = getthreshold(im) - 16
  11. print(th)
  12. # 原图直接二值化
  13. im_new1 = binarization(im, th)
  14. im_new1.show()
  15. # 直方图均衡化
  16. im1 = his_bal(im)
  17. im1.show()
  18. im_new_np = np.array(his_bal(im))
  19.  
  20. th1 = getthreshold(im1) - 16
  21. print(th1)
  22. # 二值化
  23. im_new = binarization(im1, th1)
  24. # 降噪
  25. im_new_cn = clear_noise(im_new)
  26. height = im_new_cn.size[1]
  27. print(height)
  28. # 算出水平投影和垂直投影的数值
  29. v, vt = vertical(im_new1)
  30. h, ht = horizontal(im_new1)
  31. # 算出分割区域
  32. a = []
  33. for i in range(vt):
  34. a.append((v[i][0], 0, v[i][1], height))
  35. print(a)
  36.  
  37. im_new.show() # 直方图均衡化后再二值化
  38.  
  39. # 切割
  40. for i, n in enumerate(a, 1):
  41. temp = im_new_cn.crop(n) # 调用crop函数进行切割
  42. temp.show()
  43. temp.save("c/%s.png" % i)

至此大概就完成了。

接下来是文件的全部代码:

  1. import numpy as np
  2. from PIL import Image
  3. import queue
  4. import matplotlib.pyplot as plt
  5. import tkinter as tk
  6. from tkinter import filedialog#导入文件对话框函数库
  7.  
  8. window = tk.Tk()
  9. window.title('图片选择界面')
  10. window.geometry('400x100')
  11.  
  12. var = tk.StringVar()
  13.  
  14.  
  15. # 创建获得图片路径并处理图片函数
  16. def get_im_path():
  17.  
  18. OpenFile = tk.Tk()#创建新窗口
  19. OpenFile.withdraw()
  20. file_path = filedialog.askopenfilename()
  21.  
  22. im = Image.open(file_path)
  23. # 阈值
  24. th = getthreshold(im) - 16
  25. print(th)
  26. # 原图直接二值化
  27. im_new1 = binarization(im, th)
  28. im_new1.show()
  29. # 直方图均衡化
  30. im1 = his_bal(im)
  31. im1.show()
  32. im_new_np = np.array(his_bal(im))
  33.  
  34. th1 = getthreshold(im1) - 16
  35. print(th1)
  36. # 二值化
  37. im_new = binarization(im1, th1)
  38. # 降噪
  39. im_new_cn = clear_noise(im_new)
  40. height = im_new_cn.size[1]
  41. print(height)
  42. # 算出水平投影和垂直投影的数值
  43. v, vt = vertical(im_new1)
  44. h, ht = horizontal(im_new1)
  45. # 算出分割区域
  46. a = []
  47. for i in range(vt):
  48. a.append((v[i][0], 0, v[i][1], height))
  49. print(a)
  50.  
  51. im_new.show() # 直方图均衡化后再二值化
  52.  
  53. # 切割
  54. for i, n in enumerate(a, 1):
  55. temp = im_new_cn.crop(n) # 调用crop函数进行切割
  56. temp.show()
  57. temp.save("c/%s.png" % i)
  58.  
  59. # 传入二值化后的图片进行垂直投影
  60. def vertical(img):
  61. """传入二值化后的图片进行垂直投影"""
  62. pixdata = img.load()
  63. w,h = img.size
  64. ver_list = []
  65. # 开始投影
  66. for x in range(w):
  67. black = 0
  68. for y in range(h):
  69. if pixdata[x,y][0] == 0:
  70. black += 1
  71. ver_list.append(black)
  72. # 判断边界
  73. l,r = 0,0
  74. flag = False
  75. t=0#判断分割数量
  76. cuts = []
  77. for i,count in enumerate(ver_list):
  78. # 阈值这里为0
  79. if flag is False and count > 0:
  80. l = i
  81. flag = True
  82. if flag and count == 0:
  83. r = i-1
  84. flag = False
  85. cuts.append((l,r))#记录边界点
  86. t += 1
  87. #print(t)
  88. return cuts,t
  89.  
  90. # 传入二值化后的图片进行水平投影
  91. def horizontal(img):
  92. """传入二值化后的图片进行水平投影"""
  93. pixdata = img.load()
  94. w,h = img.size
  95. ver_list = []
  96. # 开始投影
  97. for y in range(h):
  98. black = 0
  99. for x in range(w):
  100. if pixdata[x,y][0] == 0:
  101. black += 1
  102. ver_list.append(black)
  103. # 判断边界
  104. l,r = 0,0
  105. flag = False
  106. # 分割区域数
  107. t=0
  108. cuts = []
  109. for i,count in enumerate(ver_list):
  110. # 阈值这里为0
  111. if flag is False and count > 0:
  112. l = i
  113. flag = True
  114. if flag and count == 0:
  115. r = i-1
  116. flag = False
  117. cuts.append((l,r))
  118. t += 1
  119. return cuts,t
  120.  
  121. # 获得阈值算出平均像素
  122. def getthreshold(im):
  123. #获得阈值 算出平均像素
  124. wid, hei = im.size
  125. hist = [0] * 256
  126. th = 0
  127. for i in range(wid):
  128. for j in range(hei):
  129. gray = int(0.3 * im.getpixel((i, j))[0] + 0.59 * im.getpixel((i, j))[1] + 0.11 * im.getpixel((i, j))[2])
  130. th = gray + th
  131. hist[gray] += 1
  132.  
  133.  
  134. threshold = int(th/(wid*hei))
  135. return threshold
  136.  
  137. # 直方图均衡化 提高对比度
  138. def his_bal(im):
  139. #直方图均衡化 提高对比度
  140.  
  141. # 统计灰度直方图
  142. im_new = im.copy()
  143. wid, hei = im.size
  144. hist = [0] * 256
  145. for i in range(wid):
  146. for j in range(hei):
  147. gray = int(0.3*im.getpixel((i,j))[0]+0.59*im.getpixel((i,j))[1]+0.11*im.getpixel((i,j))[2])
  148. hist[gray] += 1
  149.  
  150. # 计算累积分布函数
  151. cdf = [0] * 256
  152. for i in range(256):
  153. if i == 0:
  154. cdf[i] = hist[i]
  155. else:
  156. cdf[i] = cdf[i - 1] + hist[i]
  157.  
  158. # 用累积分布函数计算输出灰度映射函数LUT
  159. new_gray = [0] * 256
  160. for i in range(256):
  161. new_gray[i] = int(cdf[i] / (wid * hei) * 255 + 0.5)
  162.  
  163. # 遍历原图像,通过LUT逐点计算新图像对应的像素值
  164. for i in range(wid):
  165. for j in range(hei):
  166. gray = int(0.3*im.getpixel((i,j))[0]+0.59*im.getpixel((i,j))[1]+0.11*im.getpixel((i,j))[2])
  167. im_new.putpixel((i, j), new_gray[gray])
  168. return im_new
  169.  
  170. # 图片二值化
  171. def binarization(img,threshold):
  172. #图片二值化操作
  173. width,height=img.size
  174. im_new = img.copy()
  175. for i in range(width):
  176. for j in range(height):
  177. a = img.getpixel((i, j))
  178. aa = 0.30 * a[0] + 0.59 * a[1] + 0.11 * a[2]
  179. if (aa <= threshold):
  180. im_new.putpixel((i, j), (0, 0, 0))
  181. else:
  182. im_new.putpixel((i, j), (255, 255, 255))
  183.  
  184. # im_new.show() # 显示图像
  185. return im_new
  186.  
  187. # 图片降噪处理
  188. def clear_noise(img):
  189. # 图片降噪处理
  190.  
  191. x, y = img.width, img.height
  192. for i in range(x-1):
  193. for j in range(y-1):
  194. if sum_9_region(img, i, j) < 600:
  195. # 改变像素点颜色,白色
  196. img.putpixel((i, j), (255,255,255))
  197. # img = np.array(img)
  198. # # cv2.imwrite('handle_two.png', img)
  199. # # img = Image.open('handle_two.png')
  200. img.show()
  201. return img
  202.  
  203. # 获取田字格内当前像素点的像素值
  204. def sum_9_region(img, x, y):
  205. """
  206. 田字格
  207. """
  208. # 获取当前像素点的像素值
  209.  
  210. a1 = img.getpixel((x - 1, y - 1))[0]
  211. a2 = img.getpixel((x - 1, y))[0]
  212. a3 = img.getpixel((x - 1, y+1 ))[0]
  213. a4 = img.getpixel((x, y - 1))[0]
  214. a5 = img.getpixel((x, y))[0]
  215. a6 = img.getpixel((x, y+1 ))[0]
  216. a7 = img.getpixel((x+1 , y - 1))[0]
  217. a8 = img.getpixel((x+1 , y))[0]
  218. a9 = img.getpixel((x+1 , y+1))[0]
  219. width = img.width
  220. height = img.height
  221.  
  222. if a5 == 255: # 如果当前点为白色区域,则不统计邻域值
  223. return 2550
  224.  
  225. if y == 0: # 第一行
  226. if x == 0: # 左上顶点,4邻域
  227. # 中心点旁边3个点
  228. sum_1 = a5 + a6 + a8 + a9
  229. return 4*255 - sum_1
  230. elif x == width - 1: # 右上顶点
  231. sum_2 = a5 + a6 + a2 + a3
  232. return 4*255 - sum_2
  233. else: # 最上非顶点,6邻域
  234. sum_3 = a2 + a3+ a5 + a6 + a8 + a9
  235. return 6*255 - sum_3
  236.  
  237. elif y == height - 1: # 最下面一行
  238. if x == 0: # 左下顶点
  239. # 中心点旁边3个点
  240. sum_4 = a5 + a8 + a7 + a4
  241. return 4*255 - sum_4
  242. elif x == width - 1: # 右下顶点
  243. sum_5 = a5 + a4 + a2 + a1
  244. return 4*255 - sum_5
  245. else: # 最下非顶点,6邻域
  246. sum_6 = a5+ a2 + a8 + a4 +a1 + a7
  247. return 6*255 - sum_6
  248.  
  249. else: # y不在边界
  250. if x == 0: # 左边非顶点
  251. sum_7 = a4 + a5 + a6 + a7 + a8 + a9
  252. return 6*255 - sum_7
  253. elif x == width - 1: # 右边非顶点
  254. sum_8 = a4 + a5 + a6 + a1 + a2 + a3
  255. return 6*255 - sum_8
  256. else: # 具备9领域条件的
  257. sum_9 = a1 + a2 + a3 + a4 + a5 + a6 + a7 + a8 + a9
  258. return 9*255 - sum_9
  259.  
  260. btn_Open = tk.Button(window,
  261. text='打开图像', # 显示在按钮上的文字
  262. width=15, height=2,
  263. command=get_im_path) # 点击按钮式执行的命令
  264.  
  265. btn_Open.pack()
  266.  
  267.  
  268. # 运行整体窗口
  269. window.mainloop()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持w3xue。

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号