经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 程序设计 » Python » 查看文章
让Python给你讲笑话、段子,一个有趣的Python案例
来源:cnblogs  作者:Pythonbiubiubiu  时间:2019/11/12 8:49:10  对本文有异议

前言

文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

作者:番茄哈哈

PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取

http://note.youdao.com/noteshare?id=3054cce4add8a909e784ad934f956cef

这次准备介绍Python爬虫爬取网页数据、解析并应用于实践,打算写几篇文章,从最基础的Python爬虫语法开始介绍爬虫,步步深入,最终实现一个较完整的实例。

这一系列文章包括:

  • request库介绍及应用

  • beautifulsoup库介绍及应用

  • 正则表达式匹配及应用

  • 对话机器人实例

  • tkinter库制作界面以及Python程序打包成可执行exe文件

本篇文章主要给出我最后做出来的一个可运行exe应用的展示,主要的目的是提高阅读者学习的兴趣。

最后做出来的聊天机器人可以根据用户输入的指令在指定网站爬取信息,并在后台解析,返回结果输出到界面。

我将这个exe应用放在了最后,可直接在电脑运行的文件,大家可以下载自己玩或者发给好友秀一下。

运行截图入下:

在这里插入图片描述

用户可以输入指令,例如:“给我讲个笑话”,“给我讲个段子”,“在网上给我找句晚安的话”等。如下:

在这里插入图片描述

在这里插入图片描述

我用的开发工具是Spyder,在后续的文章中我会逐渐深入的讲解这个例子的原理以及实现方法。

下面附上代码,感兴趣的同学可以拷贝自己运行试一下。

  1. 1 from tkinter import *
  2. 2 import time
  3. 3 import requests
  4. 4 from bs4 import BeautifulSoup
  5. 5 import bs4
  6. 6 import random
  7. 7 import re
  8. 8 def getHTMLText(url):
  9. 9 try:
  10. 10 r = requests.get(url, timeout=30)
  11. 11 r.raise_for_status()
  12. 12 #r.encoding = r.apparent_encoding
  13. 13 return r.text
  14. 14 except:
  15. 15 print("faile")
  16. 16 return ""
  17. 17 ?
  18. 18 def fillUnivList(ulist, html):
  19. 19 soup = BeautifulSoup(html, "html.parser")
  20. 20 for tr in soup.find_all('article'):
  21. 21 if isinstance(tr, bs4.element.Tag):
  22. 22 tds = tr('a')
  23. 23 ulist.append([tds[0].string, tds[1].string, tds[2].string])
  24. 24 def printUnivList(ulist,k):
  25. 25 return ulist[k][0]
  26. 26 ?
  27. 27 def getduanzi():
  28. 28 uinfo = []
  29. 29 k=1
  30. 30 u = 'http://duanziwang.com/category/%E4%B8%80%E5%8F%A5%E8%AF%9D%E6%AE%B5%E5%AD%90/'
  31. 31 i=random.randint(1,49)
  32. 32 url=u+str(i)+'/'
  33. 33 html = getHTMLText(url)
  34. 34 fillUnivList(uinfo, html)
  35. 35 k=random.randint(0,9)
  36. 36 return printUnivList(uinfo,k)
  37. 37 def fill2(ulist,html):
  38. 38 soup = BeautifulSoup(html, "html.parser")
  39. 39 for tr in soup.find_all('div','article block untagged mb15 typs_hot'):
  40. 40 if isinstance(tr, bs4.element.Tag):
  41. 41 tds = tr.find('div','content')
  42. 42 tdss=tds('span')
  43. 43 reg = re.compile('<[^>]*>')
  44. 44 text=reg.sub('',str(tdss))
  45. 45 regg = re.compile('\\[|\\]|\\n')
  46. 46 text=regg.sub('',text)
  47. 47 ulist.append(text)
  48. 48 def getjoke():
  49. 49 ulist=[]
  50. 50 u='https://www.qiushibaike.com/text/page/'
  51. 51 i=random.randint(1,13)
  52. 52 url=u+str(i)+'/'
  53. 53 html=getHTMLText(url)
  54. 54 fill2(ulist,html)
  55. 55 k=random.randint(0,16)
  56. 56 #print(str(ulist[k]))
  57. 57 return str(ulist[k])
  58. 58 def getHTMLText2(url):
  59. 59 try:
  60. 60 r = requests.get(url, timeout=30)
  61. 61 r.raise_for_status()
  62. 62 r.encoding = r.apparent_encoding
  63. 63 return r.text
  64. 64 except:
  65. 65 return ""
  66. 66 def geturl(url,text):
  67. 67 html=getHTMLText2(url)
  68. 68 soup = BeautifulSoup(html, "html.parser")
  69. 69 for tds in soup.find_all('a'):
  70. 70 #print(tds.string)
  71. 71 if str(tds.string) in text:
  72. 72 #print(tds.attrs['href'])
  73. 73 return tds.attrs['href']
  74. 74 return ''
  75. 75 def getmoreurl(url):
  76. 76 html=getHTMLText2(url)
  77. 77 soup = BeautifulSoup(html, "html.parser")
  78. 78 try:
  79. 79 li=soup.find_all('li',attrs={'class':'articleTitle fl'})
  80. 80 k=random.randint(0,len(li)-1)
  81. 81 return li[k]('a')[0].attrs['href']
  82. 82 except:
  83. 83 return ''
  84. 84 def getsen(url):
  85. 85 html=getHTMLText2(url)
  86. 86 soup = BeautifulSoup(html, "html.parser")
  87. 87 try:
  88. 88 li=soup.find('p')
  89. 89 reg = re.compile('<p>.*')
  90. 90 l=reg.findall(str(li))
  91. 91 #print(l)
  92. 92 k=random.randint(0,len(l)-1)
  93. 93 text=re.findall('[\u4e00-\u9fa5]+',l[k])
  94. 94 x=''
  95. 95 if len(text):
  96. 96 for t in text[:-2]:
  97. 97 x=x+t+','
  98. 98 return x+text[-1]+''
  99. 99 else:
  100. 100 return "不好意思,出了点小问题,请重试!"
  101. 101 except:
  102. 102 return "抱歉,没找到你想要的"
  103. 103 def getsentance(text):
  104. 104 start_url = 'http://www.siandian.com'
  105. 105 urll='http://www.siandian.com/tags.html'
  106. 106 end1=geturl(urll,text)
  107. 107 if end1=='':
  108. 108 return "抱歉,没有找到你想要的。"
  109. 109 else:
  110. 110 end2=getmoreurl(start_url+end1)
  111. 111 if end2=='':
  112. 112 return "抱歉,没有找到你想要的。"
  113. 113 else:
  114. 114 #print(start_url+end2)
  115. 115 return getsen(start_url+end2)
  116. 116 def xiaotang(s):
  117. 117 sign=1;
  118. 118 while(sign):
  119. 119 if '段子' in s:
  120. 120 while('段子' in s or '继续' in s or '再来' in s or s==''):
  121. 121 return getduanzi()
  122. 122 elif '笑话' in s:
  123. 123 while('笑话' in s or '继续' in s or '再来' in s or s==''):
  124. 124 return getjoke()
  125. 125 elif '' in s or '' in s:
  126. 126 return getsentance(s)
  127. 127 elif '傻子' in s or '' in s or '' in s:
  128. 128 return '这是脏话不可以说哦'
  129. 129 elif '' in s or '垃圾' in s or '傻逼' in s:
  130. 130 t='你是魔鬼吗?'
  131. 131 x=''
  132. 132 for i in range(10):
  133. 133 x=x+t+''+'\n'
  134. 134 return x
  135. 135 else:
  136. 136 return "我好像不明白\n"
  137. 137 def main():
  138. 138 def start():
  139. 139 strMsg = '小糖:' + time.strftime("%Y-%m-%d %H:%M:%S",
  140. 140 time.localtime()) + '\n '
  141. 141 txtget.insert(END, strMsg, 'redcolor')
  142. 142 txtget.insert(END, '你好,请问有什么可以帮忙的?')
  143. 143 def sendMsg():#发送消息
  144. 144 t=txtMsg.get('0.0', END)
  145. 145 txtMsg.delete('0.0', END)
  146. 146 strMsg = '我:' + time.strftime("%Y-%m-%d %H:%M:%S",
  147. 147 time.localtime()) + '\n '
  148. 148 for i in range(int(txtget.index(END).split(".")[0])-int(txtMsgList.index(END).split(".")[0])+1):
  149. 149 txtMsgList.insert(END, '\n')
  150. 150 txtMsgList.insert(END, strMsg, 'greencolor')
  151. 151 txtMsgList.insert(END, t)
  152. 152 txtMsgList.see(END)
  153. 153 for i in range(int(txtMsgList.index(END).split(".")[0])-int(txtget.index(END).split(".")[0])+1):
  154. 154 txtget.insert(END, '\n')
  155. 155 txtget.see(END)
  156. 156 ?
  157. 157 ?
  158. 158 ?
  159. 159 strMsg = '小糖:' + time.strftime("%Y-%m-%d %H:%M:%S",
  160. 160 time.localtime()) + '\n '
  161. 161 for i in range(int(txtMsgList.index(END).split(".")[0])-int(txtget.index(END).split(".")[0])+1):
  162. 162 txtget.insert(END, '\n')
  163. 163 txtget.insert(END, strMsg, 'redcolor')
  164. 164 txtget.insert(END, xiaotang(t))
  165. 165 txtget.see(END)
  166. 166 for i in range(int(txtget.index(END).split(".")[0])-int(txtMsgList.index(END).split(".")[0])+1):
  167. 167 txtMsgList.insert(END, '\n')
  168. 168 txtMsgList.see(END)
  169. 169 ?
  170. 170 ?
  171. 171 def cancelMsg():#取消消息
  172. 172 txtMsg.delete('0.0', END)
  173. 173 ?
  174. 174 def sendMsgEvent(event): #发送消息事件
  175. 175 sendMsg()
  176. 176 ?
  177. 177 #创建窗口
  178. 178 t = Tk()
  179. 179 t.title('小糖助手')
  180. 180 ?
  181. 181 #创建frame容器
  182. 182 frmLT = Frame(width=500, height=320, bg='#F19C8B')
  183. 183 frmLC = Frame(width=500, height=150, bg='#F19C8B')
  184. 184 frmLB = Frame(width=500, height=30,bg='white')
  185. 185 frmRT = Frame(width=200, height=500,bg='#F19C8B')
  186. 186 ?
  187. 187 #创建控件
  188. 188 txtMsgList = Text(frmLT,width=40,bd=0)
  189. 189 txtMsgList.tag_config('greencolor', foreground='#008C00')#创建tag
  190. 190 txtMsg = Text(frmLC)
  191. 191 txtget = Text(frmLT,width=40,bd=0)
  192. 192 txtget.tag_config('redcolor', foreground='#DC143C')#创建tag
  193. 193 start()
  194. 194 #txtMsg.bind("", sendMsgEvent)
  195. 195 txtMsg.bind('<Return>',sendMsgEvent)
  196. 196 btnSend = Button(frmLB, text='发 送', width = 8, command=sendMsg,bg='#E88384',bd=0)
  197. 197 btnCancel = Button(frmLB, text='取消', width = 8, command=cancelMsg,bg='#F3ADA0',bd=0)
  198. 198 scollor=Scrollbar(bg='white')
  199. 199 scollor.config(command=txtget.yview)
  200. 200 scollor.config(command=txtMsgList.yview)
  201. 201 txtget.config(yscrollcommand=scollor.set)
  202. 202 txtMsgList.config(yscrollcommand=scollor.set)
  203. 203 imgInfo = PhotoImage(file = "aa.png")
  204. 204 lblImage = Label(frmRT, image = imgInfo)
  205. 205 lblImage.image = imgInfo
  206. 206 ?
  207. 207 #窗口布局
  208. 208 frmLT.grid(row=0, column=0, columnspan=2, padx=0, pady=0)
  209. 209 frmLC.grid(row=1, column=0, columnspan=2, padx=0, pady=0)
  210. 210 frmLB.grid(row=2, column=0, columnspan=2,padx=0)
  211. 211 scollor.grid(row=0,column=2,sticky=N+S)
  212. 212 frmRT.grid(row=0, column=3, rowspan=3, padx=0, pady=0)
  213. 213 #固定大小
  214. 214 frmLT.grid_propagate(0)
  215. 215 frmLC.grid_propagate(0)
  216. 216 frmLB.grid_propagate(0)
  217. 217 frmRT.grid_propagate(0)
  218. 218 ?
  219. 219 btnSend.grid(row=2, column=0)
  220. 220 btnCancel.grid(row=2, column=1)
  221. 221 lblImage.grid()
  222. 222 txtget.grid(row=0,column=0)
  223. 223 ?
  224. 224 txtMsgList.grid(row=0,column=1)
  225. 225 ?
  226. 226 txtMsg.grid()
  227. 227 ?
  228. 228 #主事件循环
  229. 229 t.mainloop()
  230. 230 ?
  231. 231 if __name__ == '__main__':
  232. 232 main()

 

原文链接:http://www.cnblogs.com/qun821460695/p/11837790.html

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号