经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 程序设计 » Python » 查看文章
让Python给你讲笑话、段子,一个有趣的Python案例
来源:cnblogs  作者:Pythonbiubiubiu  时间:2019/11/12 8:49:10  对本文有异议

前言

文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

作者:番茄哈哈

PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取

http://note.youdao.com/noteshare?id=3054cce4add8a909e784ad934f956cef

这次准备介绍Python爬虫爬取网页数据、解析并应用于实践,打算写几篇文章,从最基础的Python爬虫语法开始介绍爬虫,步步深入,最终实现一个较完整的实例。

这一系列文章包括:

  • request库介绍及应用

  • beautifulsoup库介绍及应用

  • 正则表达式匹配及应用

  • 对话机器人实例

  • tkinter库制作界面以及Python程序打包成可执行exe文件

本篇文章主要给出我最后做出来的一个可运行exe应用的展示,主要的目的是提高阅读者学习的兴趣。

最后做出来的聊天机器人可以根据用户输入的指令在指定网站爬取信息,并在后台解析,返回结果输出到界面。

我将这个exe应用放在了最后,可直接在电脑运行的文件,大家可以下载自己玩或者发给好友秀一下。

运行截图入下:

在这里插入图片描述

用户可以输入指令,例如:“给我讲个笑话”,“给我讲个段子”,“在网上给我找句晚安的话”等。如下:

在这里插入图片描述

在这里插入图片描述

我用的开发工具是Spyder,在后续的文章中我会逐渐深入的讲解这个例子的原理以及实现方法。

下面附上代码,感兴趣的同学可以拷贝自己运行试一下。

  1 from tkinter import *
  2 import time
  3 import requests
  4 from bs4 import BeautifulSoup
  5 import bs4
  6 import random
  7 import re 
  8 def getHTMLText(url):
  9     try:
 10         r = requests.get(url, timeout=30)
 11         r.raise_for_status()
 12         #r.encoding = r.apparent_encoding
 13         return r.text
 14     except:
 15         print("faile")
 16         return ""
 17 ?
 18 def fillUnivList(ulist, html):
 19     soup = BeautifulSoup(html, "html.parser")
 20     for tr in soup.find_all('article'):
 21         if isinstance(tr, bs4.element.Tag):
 22             tds = tr('a')
 23             ulist.append([tds[0].string, tds[1].string, tds[2].string])
 24 def printUnivList(ulist,k):
 25     return ulist[k][0]
 26 ?
 27 def getduanzi():
 28     uinfo = []
 29     k=1
 30     u = 'http://duanziwang.com/category/%E4%B8%80%E5%8F%A5%E8%AF%9D%E6%AE%B5%E5%AD%90/'
 31     i=random.randint(1,49)
 32     url=u+str(i)+'/'
 33     html = getHTMLText(url)
 34     fillUnivList(uinfo, html)
 35     k=random.randint(0,9)
 36     return printUnivList(uinfo,k)
 37 def fill2(ulist,html):
 38     soup = BeautifulSoup(html, "html.parser")
 39     for tr in soup.find_all('div','article block untagged mb15 typs_hot'):
 40         if isinstance(tr, bs4.element.Tag):
 41             tds = tr.find('div','content')
 42             tdss=tds('span')         
 43             reg = re.compile('<[^>]*>')
 44             text=reg.sub('',str(tdss))
 45             regg = re.compile('\\[|\\]|\\n')
 46             text=regg.sub('',text)
 47             ulist.append(text)
 48 def getjoke():
 49     ulist=[]
 50     u='https://www.qiushibaike.com/text/page/'
 51     i=random.randint(1,13)
 52     url=u+str(i)+'/'
 53     html=getHTMLText(url)
 54     fill2(ulist,html)
 55     k=random.randint(0,16)
 56     #print(str(ulist[k]))
 57     return str(ulist[k])
 58 def getHTMLText2(url):
 59     try:
 60         r = requests.get(url, timeout=30)
 61         r.raise_for_status()
 62         r.encoding = r.apparent_encoding
 63         return r.text
 64     except:
 65         return ""
 66 def geturl(url,text):
 67     html=getHTMLText2(url)
 68     soup = BeautifulSoup(html, "html.parser")
 69     for tds in soup.find_all('a'):
 70         #print(tds.string)
 71         if str(tds.string) in text:
 72             #print(tds.attrs['href'])
 73             return tds.attrs['href']
 74     return ''
 75 def getmoreurl(url):
 76     html=getHTMLText2(url)
 77     soup = BeautifulSoup(html, "html.parser")
 78     try:
 79         li=soup.find_all('li',attrs={'class':'articleTitle fl'})
 80         k=random.randint(0,len(li)-1)
 81         return li[k]('a')[0].attrs['href']
 82     except:
 83         return ''
 84 def getsen(url):
 85     html=getHTMLText2(url)
 86     soup = BeautifulSoup(html, "html.parser")
 87     try:
 88         li=soup.find('p')
 89         reg = re.compile('<p>.*')      
 90         l=reg.findall(str(li))
 91         #print(l)
 92         k=random.randint(0,len(l)-1)
 93         text=re.findall('[\u4e00-\u9fa5]+',l[k])
 94         x=''
 95         if len(text):
 96             for t in text[:-2]:
 97                 x=x+t+','
 98             return x+text[-1]+''
 99         else:
100             return "不好意思,出了点小问题,请重试!"
101     except:
102         return "抱歉,没找到你想要的"
103 def getsentance(text):
104     start_url = 'http://www.siandian.com'
105     urll='http://www.siandian.com/tags.html'
106     end1=geturl(urll,text)
107     if end1=='':
108         return "抱歉,没有找到你想要的。"
109     else:
110         end2=getmoreurl(start_url+end1)
111         if end2=='':
112             return "抱歉,没有找到你想要的。"
113         else:
114             #print(start_url+end2)
115             return getsen(start_url+end2)
116 def xiaotang(s):
117     sign=1;
118     while(sign):
119         if '段子' in s:
120             while('段子' in s or '继续' in s or '再来' in s or s==''):
121                 return getduanzi()
122         elif '笑话' in s:
123             while('笑话' in s or '继续' in s or '再来' in s or s==''):
124                 return getjoke()
125         elif '' in s or '' in s:
126                 return getsentance(s)  
127         elif '傻子' in s or '' in s or '' in s:
128             return '这是脏话不可以说哦'
129         elif '' in s or '垃圾' in s or '傻逼' in s:
130             t='你是魔鬼吗?'
131             x=''
132             for i in range(10):
133                 x=x+t+''+'\n'
134             return x
135         else:
136             return "我好像不明白\n"
137 def main():
138   def start():
139       strMsg = '小糖:' + time.strftime("%Y-%m-%d %H:%M:%S",
140                                   time.localtime()) + '\n '
141       txtget.insert(END, strMsg, 'redcolor')
142       txtget.insert(END, '你好,请问有什么可以帮忙的?')
143   def sendMsg():#发送消息
144     t=txtMsg.get('0.0', END)
145     txtMsg.delete('0.0', END)
146     strMsg = '我:' + time.strftime("%Y-%m-%d %H:%M:%S",
147                                   time.localtime()) + '\n '
148     for i in range(int(txtget.index(END).split(".")[0])-int(txtMsgList.index(END).split(".")[0])+1):
149         txtMsgList.insert(END, '\n')
150     txtMsgList.insert(END, strMsg, 'greencolor')
151     txtMsgList.insert(END, t)
152     txtMsgList.see(END)
153     for i in range(int(txtMsgList.index(END).split(".")[0])-int(txtget.index(END).split(".")[0])+1):
154         txtget.insert(END, '\n')
155         txtget.see(END)
156 ?
157 ?
158 ?
159     strMsg = '小糖:' + time.strftime("%Y-%m-%d %H:%M:%S",
160                                   time.localtime()) + '\n '
161     for i in range(int(txtMsgList.index(END).split(".")[0])-int(txtget.index(END).split(".")[0])+1):
162         txtget.insert(END, '\n')
163     txtget.insert(END, strMsg, 'redcolor')
164     txtget.insert(END, xiaotang(t))
165     txtget.see(END)
166     for i in range(int(txtget.index(END).split(".")[0])-int(txtMsgList.index(END).split(".")[0])+1):
167         txtMsgList.insert(END, '\n')
168         txtMsgList.see(END)
169 ?
170 ?
171   def cancelMsg():#取消消息
172     txtMsg.delete('0.0', END)
173 ?
174   def sendMsgEvent(event): #发送消息事件
175       sendMsg()
176 ?
177   #创建窗口 
178   t = Tk()
179   t.title('小糖助手')
180 ?
181   #创建frame容器
182   frmLT = Frame(width=500, height=320, bg='#F19C8B')
183   frmLC = Frame(width=500, height=150, bg='#F19C8B')
184   frmLB = Frame(width=500, height=30,bg='white')
185   frmRT = Frame(width=200, height=500,bg='#F19C8B')
186 ?
187   #创建控件
188   txtMsgList = Text(frmLT,width=40,bd=0)
189   txtMsgList.tag_config('greencolor', foreground='#008C00')#创建tag
190   txtMsg = Text(frmLC)
191   txtget = Text(frmLT,width=40,bd=0)
192   txtget.tag_config('redcolor', foreground='#DC143C')#创建tag
193   start()
194   #txtMsg.bind("", sendMsgEvent)
195   txtMsg.bind('<Return>',sendMsgEvent)
196   btnSend = Button(frmLB, text='发 送', width = 8, command=sendMsg,bg='#E88384',bd=0)
197   btnCancel = Button(frmLB, text='取消', width = 8, command=cancelMsg,bg='#F3ADA0',bd=0)
198   scollor=Scrollbar(bg='white')
199   scollor.config(command=txtget.yview)
200   scollor.config(command=txtMsgList.yview)
201   txtget.config(yscrollcommand=scollor.set)
202   txtMsgList.config(yscrollcommand=scollor.set)
203   imgInfo = PhotoImage(file = "aa.png")
204   lblImage = Label(frmRT, image = imgInfo)
205   lblImage.image = imgInfo
206 ?
207   #窗口布局
208   frmLT.grid(row=0, column=0, columnspan=2, padx=0, pady=0)
209   frmLC.grid(row=1, column=0, columnspan=2, padx=0, pady=0)
210   frmLB.grid(row=2, column=0, columnspan=2,padx=0)
211   scollor.grid(row=0,column=2,sticky=N+S)
212   frmRT.grid(row=0, column=3, rowspan=3, padx=0, pady=0)
213   #固定大小
214   frmLT.grid_propagate(0)
215   frmLC.grid_propagate(0)
216   frmLB.grid_propagate(0)
217   frmRT.grid_propagate(0)
218 ?
219   btnSend.grid(row=2, column=0)
220   btnCancel.grid(row=2, column=1)
221   lblImage.grid()
222   txtget.grid(row=0,column=0)
223 ?
224   txtMsgList.grid(row=0,column=1)
225 ?
226   txtMsg.grid()
227 ?
228   #主事件循环
229   t.mainloop()
230 ?
231 if __name__ == '__main__':
232     main()

 

原文链接:http://www.cnblogs.com/qun821460695/p/11837790.html