经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 大数据/云/AI » 人工智能基础 » 查看文章
利用线性回归模型判断文章类别
来源:cnblogs  作者:Geeksongs  时间:2019/3/27 8:46:03  对本文有异议

平时,可以借助计算机来判定一篇文章是否是体育类的新闻,或者是艺术类的新闻。因此我们可以借助线性回归模型对其进行判定。当然这个数学模型有多种实现手段,比如用分类器,随机梯度下降,感知机等机器学习模型进行判定,这里我们就不用展示了,直接用社会工业界所接受的方法来进行研究,因为自己用上述的方法只有科研才会用到,对于最基本的要求而言只需要知道如何使用这些模型就行了。

     作者我用的Python语言来实现的这个模型,因为此模型的库运用比较多。同时安装使用也比较方便。

一.使用单元线性回归模型判定法
        代码如下:

  1. import random
  2. import matplotlib.pyplot as plt
  3. import numpy as np
  4. from sklearn import datasets, linear_model
  5. from sklearn.metrics import mean_squared_error, r2_score
  6. from matplotlib.font_manager import FontProperties
  7. font = FontProperties(fname=r"c:\windows\fonts\msyh.ttc", size=15)
  8. //这里是将Python当中的绘图库的字体引入我们系统当中的字体,不然的话就会造成绘制的图像当中不会有中文的!

 

二.引入数据集(训练集)

  1. x=([2],[6],[4],[8],[12],[4],[23],[18],[26],[28],[35],[29])
  2. #每一段落当中正面文字出现的次数
  3. y=([46],[53],[57],[60],[63],[65],[66],[68],[69],[71],[72],[73])
  4. #段落当中负面文字出现的次数

 

三.开始绘图同时开始进行线性回归

  1. plt.scatter(x,y)//这里的意思是绘制散点图
  2. plt.title("利用分类器预测文章当中的正面和负面情绪\n制作人:Geeksongs",fontproperties=font)
  3. plt.plot([1,40],[np.mean(great.predict(1)),great.predict(40)],linewidth=3,color="black")
  4. plt.show()

四.求出线性回归模型的斜率 
斜率公式在高中就学过,为k =(y1-y1)/(x1-x2),太简单了。这里我们 引入已经通过线性模型计算好的y和x的values。直接利用if语句进行判断并带入,代码如下:

  1. if((great.predict(12)-great.predict(1))/11)>1:
  2. print("这篇文章当中的负面情绪更多")
  3. else:
  4. print("这篇文章的正面情绪较多")

得解!

原文链接:http://www.cnblogs.com/geeksongs/p/10602727.html

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号