经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 程序设计 » 编程经验 » 查看文章
一键自动化博客发布工具,用过的人都说好(cnblogs篇)
来源:cnblogs  作者:flydean  时间:2024/5/11 8:55:47  对本文有异议

cnblogs和其他的博客平台相比会比较复杂,需要设置的项目也比较多一些,弄懂了cnblogs的实现方式,那么你应该对selenium的整个框架使用已经烂熟于心了。

除了正常的标题,内容,摘要之外,cnblogs还需要设置个人分类,合集,投稿选项,投稿至网站分类,tags标签等内容。

要填的东西比较多,比较复杂。接下来我们会一项项的介绍cnblogs的具体实现方式。

前提条件

前提条件当然是先下载 blog-auto-publishing-tools这个博客自动发布工具,地址如下:https://github.com/ddean2009/blog-auto-publishing-tools

cnblogs的实现

因为需要设置个人分类,合集,投稿选项,投稿至网站分类,tags标签等内容,所以我们需要在配置文件中提供这些内容。

配置文件在config/cnblogs.yaml中。

首先是个人分类和合集部分:

  1. # 个人分类 工具技巧 AIGC
  2. categories:
  3. - 工具技巧
  4. # 添加到合集: 工具技巧 AIGC
  5. collections:
  6. - 工具技巧

这两个部分都是需要你自己提前在cnblogs中创建好的。否则你会找不到这些内容,对应的界面地址如下:

image-20240507171326499

接下来是投顾至网站分类:

image-20240507171845646

cnblogs的这些网站分类是直接用文字来说明的,所以我们需要在配置文件中再定义一个网站分类:

  1. topic: 开源研究

最后就是tag标签了,我们直接设置即可:

  1. tags:
  2. - 人工智能
  3. - aigc
  4. - openai
  5. - ai开发
  6. - 程序那些事

image-20240507172029658

文章标题

不得不说cnblogs的实现就是正规,cnblogs几乎每个输入的标签都是带有ID的,所以我们实现起来特别的简单,这里要给cnblogs点个赞。

  1. # 文章标题
  2. title = driver.find_element(By.ID, 'post-title')
  3. title.clear()
  4. if 'title' in front_matter['title'] and front_matter['title']:
  5. title.send_keys(front_matter['title'])
  6. else:
  7. title.send_keys(common_config['title'])
  8. time.sleep(2) # 等待2秒

我们找到ID,直接调用send_keys方法即可。

文章内容

cnblogs的文章内容是一个textarea,也是带有ID的,所以我们直接根据ID获取即可:

  1. # 文章内容
  2. file_content = read_file_with_footer(common_config['content'])
  3. content = driver.find_element(By.ID, 'md-editor')
  4. content.send_keys(file_content)
  5. time.sleep(5) # 等待5秒

页面滚动

如果你观察cnblogs的页面,可以看到文章内容之后已经占满了整个屏幕,如果我们还需要继续处理后面的内容的话,就需要对页面进行一个滚动操作。

这里我们借用了ActionChains的scroll to element方法。

首先我们找到最下面的发布按钮,然后直接滚动到这个发布按钮即可。

  1. # 滚轮滚到最下面的位置
  2. submit_button = driver.find_element(By.XPATH, '//button[@data-el-locator="publishBtn"]')
  3. ActionChains(driver) .scroll_to_element(submit_button) .perform()
  4. time.sleep(1)

个人分类

个人分类是一个下拉框。

image-20240507173020475

他有一个比较特别的tag name叫做cnb-post-category-select。

所以我们可以通过这个tag name找到这个元素,然后点击他。

因为所有的要选择的元素都是在cnb-post-category-select这个tag内部的,所以我们调用post_category_select.find_element来查找它内部的input元素。

找到之后,我们输入个人分类,然后从下拉框中选择对应的个人分类tag,然后点击回车。

所有的个人分类都选择完毕之后,我们再次点击post_category_select,以关闭下拉框。

对应的代码如下:

  1. # 个人分类
  2. categories = cnblogs_config['categories']
  3. if categories:
  4. post_category_select = driver.find_element(By.TAG_NAME, 'cnb-post-category-select')
  5. post_category_select.click()
  6. for category in categories:
  7. category_search = post_category_select.find_element(By.XPATH, '//nz-select-search/input')
  8. category_search.send_keys(category)
  9. time.sleep(1)
  10. category_select = post_category_select.find_element(By.XPATH, f'//nz-tree-node-title[contains(@title, "{category}")]/div')
  11. category_select.click()
  12. time.sleep(0.5)
  13. post_category_select.click()
  14. time.sleep(2)

添加到合集

添加到合集的实现方式跟个人分类有些类似。

image-20240507173806856

默认情况下,添加到合集这个选项中的内容是隐藏的,所以我们需要首先点击这个选项头,让对应的选项露出来。

这里可以通过name来获取到这个元素。然后点击。

接下来就是通过text属性来查找collection_select中要选择的合集元素,然后点击他们。

注意,这里如果选择的是包含合集文字的span,如下所示。这个span是不可被点击的。

所以我们的解决办法就是找到它的父元素。

通过: collection_item.find_element(By.XPATH, '..') 来实现。

然后点击他的父元素即可。

image-20240507174113523

最终的实现代码如下:

  1. # 添加到合集
  2. collections = cnblogs_config['collections']
  3. if collections:
  4. collection_select = driver.find_element(By.NAME, '添加到合集')
  5. collection_select.click()
  6. # print(collection_select.get_attribute('innerHTML'))
  7. for collection in collections:
  8. collection_item = collection_select.find_element(By.XPATH, f'//span[contains(@class,"item__text") and contains(text(), "{collection}")]')
  9. parent_element = collection_item.find_element(By.XPATH, '..')
  10. # print(parent_element.tag_name)
  11. parent_element.click()
  12. time.sleep(0.5)
  13. time.sleep(2)

投稿选项

投稿选项比较简单,直接通过ID选择即可:

  1. # 投稿选项
  2. post_type = driver.find_element(By.ID, 'site-publish-site-home')
  3. post_type.click()
  4. time.sleep(2)

投顾至网站分类

网站分类的ID就是分类的名字,所以,我们可以下面代码来实现:

  1. # 投顾至网站分类
  2. topic = cnblogs_config['topic']
  3. if topic:
  4. post_type_detail = driver.find_element(By.NAME, '投稿至网站分类')
  5. post_type_detail.click()
  6. topic_item = driver.find_element(By.ID, topic)
  7. topic_item.click()
  8. time.sleep(2)

摘要

摘要也是通过ID来获取的,代码如下:

  1. # 摘要
  2. summary = common_config['summary']
  3. summary_item = driver.find_element(By.ID, 'summary')
  4. summary_item.send_keys(summary)
  5. time.sleep(2)

tag标签

tag标签是一个输入框。所以我们先定位到这个输入框,然后输入tag,等待网站的tag列表出来之后,直接回车即可。

实现代码如下:

  1. # tag标签
  2. tags = cnblogs_config['tags']
  3. if tags:
  4. tag_item = driver.find_element(By.ID, 'tags')
  5. tag_item.click()
  6. for tag in tags:
  7. tag_input = tag_item.find_element(By.TAG_NAME, 'input')
  8. tag_input.send_keys(tag)
  9. time.sleep(1)
  10. tag_input.send_keys(Keys.ENTER)
  11. time.sleep(2)

提交文章

最后就是提交文章啦,这个提交按钮需要根据xpath来获取:

  1. # 提交文章
  2. if auto_publish:
  3. submit_button = driver.find_element(By.XPATH, '//button[@data-el-locator="publishBtn"]')
  4. submit_button.click()

总结

cnblogs的实现还是比较规范的,主要就是各项内容会比较多一些,需要耗费一些时间来实现。

点我查看更多精彩内容:www.flydean.com

原文链接:https://www.cnblogs.com/flydean/p/18181875

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号