人工智能红利时代已经来临
1、互联网用户数量
中国互联网络信息中心(CNNIC)2018.8.20日发布第42次《中国互联网络发展状况统计报告》显示:截止2018年6月30日,我国网民规模达8.02亿,普及率为57.7%。其中,手机网民规模达7.88亿,网民通过手机接入互联网的比例高达98.3%。我国是互联网用户最多的国家。...[2018/12/17]
机器学习基础机器学习基础
目录
机器学习基础
什么是机器学习
机器学习
应用场景
海量数据
机器学习的重要性
机器学习的基本术语
监督学习和非监督学习
监督学习:supervised learning
非监督学习:unsupervised learning
机器学习工具介绍
Python
非 Python
NumPy...[2018/12/17]
机器学习之k-近邻算法
目录
K-近邻算法
博客园地址:https: www.cnblogs.com/chenyoude/
git 地址:https: github.com/nickcyd/machine_learning
k-近邻算法概述
解析和导入数据
使用 Python 导入数据
实施 kNN 分类算法
测试分类...[2018/12/17]
使用seaborn探索泰坦尼克号上乘客能否获救使用seaborn探索泰坦尼克号上乘客能否获救
titanic数据集是个著名的数据集.kaggle上的titanic乘客生还率预测比赛是一个很好的入门机器学习的比赛.
数据集下载可以去https: www.kaggle.com/c/titanic/data.
本身写这个系列笔记是作为自己机器学习的记录,也为了加深自己对机器学习相关知识的理解...[2018/12/17]
矩阵分解
矩阵分解
矩阵可以分解为多个矩阵的乘积。
这些矩阵的乘积是原矩阵的低秩近似。
一个矩阵的秩一定小于这个矩阵的min(行数,列数)。
\[rank(A) \leq min(M,N)\]
矩阵的秩表达了这个矩阵张成的空间的维度,如果矩阵当前的维度比矩阵的秩大,那么说明在这个矩阵中一定包含线性相...[2018/12/17]
【2018年12月14日】A股最便宜的股票
新钢股份(SH600782) - 当前便宜指数:193.12 - 滚动扣非市盈率PE:2.91 - 动态市净率PB:0.96 - 动态年化股息收益率:1.75% - 新钢股份(SH600782)的历史市盈率走势图
光明地产(SH600708) - 当前便宜指...[2018/12/17]
智慧城市介绍
智慧城市的“智慧”源自何处? 智慧城市的特征在于运用大数据和数字技术提高居民生活质量。机构获得的数据越 全面、越实时,它们就越有能力观测事件发生的详情、分析需求模式的变化,从而采用 响应更及时、成本更低的解决方案。
...[2018/12/17]
论文笔记:语音情感识别(二)声谱图+CRNN
一:An Attention Pooling based Representation Learning Method for Speech Emotion Recognition(2018 InterSpeech)
(1)论文的模型如下图,输入声谱图,CNN先用两个不同的卷积核分别提取时域特征...[2018/12/17]
神经网络MPLClassifier分类神经网络MPLClassifier分类
代码:
1 # -*- coding: utf-8 -*-
2 """
3 Created on Fri Aug 24 14:38:56 2018
4
5 @author: zhen
6 """
7 import gzip
8 import pickle
9 import ...[2018/12/14]
MTCNN算法与代码理解—人脸检测和人脸对齐联合学习 - Mr-Lee
目录
写在前面
算法Pipeline详解
如何训练
损失函数
训练数据准备
多任务学习与在线困难样本挖掘
预测过程
参考
博客:blog.shinelee.me | 博客园 | CSDN
写在前面
主页:https: kpzhang93.github.io/MTCNN_face_dete...[2018/12/14]
原来CNN是这样提取图像特征的。。。
对于即将到来的人工智能时代,作为一个有理想有追求的程序员,不懂深度学习(Deep Learning)这个超热的领域,会不会感觉马上就out了?作为机器学习的一个分支,深度学习同样需要计算机获得强大的学习能力,那么问题来了,我们究竟要计算机学习什么东西?答案当然是图像特征了。将一张图像看做是一个个像...[2018/12/14]
hadoop在CentOS下的安装配置hadoop在CentOS下的安装配置
版本:CentOS-6.8-x86_64-minimal,hadoop2.6.4,jdk1.7.0
首先把jdk、hadoop压缩包下载发送到CentOS下并解压
下载发送不多赘述,解压命令tar -zxvf 压缩包
mv 原文件名 新文件名
(注意空格)
先配置jdk
...[2018/12/13]
Kaggle: Google Analytics Customer Revenue Prediction EDAKaggle: Google Analytics Customer Revenue Prediction EDA
前言内容提要 本文为Kaggle竞赛 Google Analytics Customer Revenue Prediction 的探索性分析 题目要求根据历史顾客访问GStore的数据,预测其中部分顾客在未来的销售额,且预测期与原数据之间不连续 主要切入角度为针对待预测的问题,估计出答...[2018/12/13]
Centos7 kernel 内核升级 GPU显卡驱动程序编译安装
1、NVIDIA官网下载相关显卡驱动
#在服务器上查看网卡型号
lspci -mm | grep NVIDIA
#在NVIDIA官网下载相应型号驱动程序
https: www.geforce.cn/drivers
2、Cento...[2018/12/12]
大数据-Hadoop生态(16)-MapReduce框架原理-自定义FileInputFormat大数据-Hadoop生态(16)-MapReduce框架原理-自定义FileInputFormat
1. 需求
将多个小文件合并成一个SequenceFile文件(SequenceFile文件是Hadoop用来存储二进制形式的key-value对的文件格式),SequenceFile里面存储着多个文件,存储的形式为文件路径+名称为key,文件内容为value
三个小文...[2018/12/12]
从零开始一起学习SLAM | 你好,点云从零开始一起学习SLAM | 你好,点云
本文提纲
先热热身 点云是啥 你知道点云优缺点吗? 点云库PCL:开发者的福音 PCL安装指北 炒鸡简单的PCL实践 留个作业再走 先热热身
小白:hi,师兄,好久不见 师兄:师妹好,上周单应矩阵作业做了吗? 小白:嗯,做了,这个单应矩阵真的挺有意思的。作业之外,我发现了一个新技能。。。 师兄...[2018/12/12]
Hadoop系列006-HDFS概念及命令行操作
本人微信公众号,欢迎扫码关注!
HDFS概念及命令行操作
一、HDFS概念
1.1 概念
HDFS,它是一个文件系统,用于存储文件,通过目录树来定位文件;其次,它是分布式的,由很多服务器联合起来实现其功能,集群中的服务器有各自的角色。
HDFS的设计适合一次写入,多次读出的场景,且不支...[2018/12/11]
Kafka web console安装
参考:
http: www.cnblogs.com/yxwkf/p/5092589.html
1. 安装包下载
下载地址:https: github.com/claudemamo/kafka-web-console/releases
目前最新是2.0.0版本
2.编...[2018/12/11]
Hadoop系列007-HDFS客户端操作
title: Hadoop系列007-HDFS客户端操作
date: 2018-12-6 15:52:55
updated: 2018-12-6 15:52:55
categories: Hadoop
tags: [Hadoop,HDFS,HDFS客户端]
本人微信公众号,欢迎扫码...[2018/12/11]
每个人都在经历淘宝的“大数据杀熟”,这5个办法巧妙避开
01
最近朋友老周和我聊天,闲聊间,他说最近给老婆普及了一下大数据的知识。
事情是这样的。
前些日子他老婆给他买了几件衣服和裤子,但是裤子穿着有点小,他心里想凑合凑合算了,也就...[2018/12/11]
【2018年12月10日】A股最便宜的股票
新钢股份(SH600782) - 当前便宜指数:196.21 - 滚动扣非市盈率PE:2.86 - 动态市净率PB:0.95 - 动态年化股息收益率:1.78% - 新钢股份(SH600782)的历史市盈率走势图
光明地产(SH600708) - 当前便宜指...[2018/12/11]
关于软件开发的几个想法
这段时间从事软件开发已经有了初步的理解,这几年各种各样的框架不断的刷新我的眼球,为了找到一份入门级别的工作,很表面的学习了几门框架(说是学习几门框架倒不如说是学习怎么去实用几门框架,因为都是表面的东西),如今做了一段时间后发现这些东西太多了,如果还是停留在这么表面的使用层面,估计再做几年还是这样子...[2018/12/11]
学习笔记—MapReduce
MapReduce是什么
MapReduce是一种分布式计算编程框架,是Hadoop主要组成部分之一,可以让用户专注于编写核心逻辑代码,最后以高可靠、高容错的方式在大型集群上并行处理大量数据。
MapReduce的存储
MapReduce的数据是存储在HDFS上的,HDFS也是Hadoop的主要...[2018/12/10]
"Regressing Robust and Discriminative 3D Morphable Models with a very Deep Neural Network" 解读 - captain-ly
简介:这是一篇17年的CVPR,作者提出使用现有的人脸识别深度神经网络Resnet101来得到一个具有鲁棒性的人脸模型。
原文链接:https: www.researchgate.net/publication/311668561_Regre ing_Robust_and_Discriminat...[2018/12/10]
【12月06日】A股全市场情绪指标整理分析【12月06日】A股全市场情绪指标整理分析
1. A股全市场的股权质押比例
2018年11月30日,A股全市场,质押股数占全市场总股本数比:9.997%,最近2周出现了3.2%的轻微回落。同历史时期相比,仍然处于高位。
2. A股全市场的解禁市值
2018年12月解禁总市值约为4451.8亿,2018年...[2018/12/10]
kNN--近邻算法
kNN--近邻算法
kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。
在机器学习中常用于分类。
数学内容:
欧氏距离公式,矩阵运算,归一化数值
python模块...[2018/12/10]
机器学习--过度拟合
过度拟合(overfitting)是指数据模型在训练集里表现非常满意,但是一旦应用到真实业务实践时,效果大打折扣;换成学术化语言描述,就是模型对样本数据拟合非常好,但是对于样本数据外的应用数据,拟合效果非常差。在我们数据分析挖掘业务实践中,就是“模型搭建时表现看上去非常好,但是应用到具体业务实践时...[2018/12/10]
ML.NET 0.8特性简介ML.NET 0.8特性简介
本周.NET生态圈内的更新源源不断,除了.NET Core 2.2,ASP.NET Core 2.2和Entity Framework Core 2.2之外,ML.NET 0.8也一并登上舞台。
新的推荐场景
ML.NET使用基于矩阵分解(Matrix Factorization)和场感知分解机...[2018/12/10]
Kaggle-tiantic数据建模与分析
1.数据可视化
kaggle中数据解释:https: www.kaggle.com/c/titanic/data
数据形式:
读取数据,并显示数据信息
data_train = pd.read_csv("./data/train.csv")
print(data_train.info(...[2018/12/10]
ML.NET教程之情感分析(二元分类问题)
机器学习的工作流程分为以下几个步骤:
理解问题
准备数据
加载数据
提取特征
构建与训练
训练模型
评估模型
运行
使用模型
理解问题
本教程需要解决的问题是根据网站内评论的意见采取合适的行动。
可用的训练数据集中,网站评论可能是有毒(toxic)(1)或者无毒(not tox...[2018/12/10]
零基础学习大数据需要掌握的基础
大数据已经成为时代发展的趋势,很多人纷纷选择学习大数据,想要进入大数据行业。大数据技术体系庞大,包括的知识较多,系统的学习大数据可以让你全面掌握大数据技能。学习大数据需要掌握哪些知识? 我还是要推荐下我自己创建的大数据资料分享群142973723,这是大数据学习交流的地方,不管你是小白还是大牛,小编...[2018/12/7]
怎么理解LAXCUS大操作系统系统在云计算体系中的定位
最近一直在做laxcus大数据操作系统的分布式应用开发,因为做得多了,感触也多了。按照云计算三层定义,即iaas(基础设施即服务)、paas(平台即服务)、saas(软件即服务),laxcus属于paas层,它提供了paas层的各种功能,如果做个对标,它实际是OpenStack、Hadoop、...[2018/12/7]
2019年度【计算机视觉&机器学习&人工智能】国际重要会议汇总
简介
每年全世界都会举办很多计算机视觉(Computer Vision,CV)、 机器学习(Machine Learning,ML)、人工智能(Artificial Intelligence ,AI)领域的学术会议。笔者选取了其中影响力较大,有代表性的重要会议进行了汇总,特意按照时间进行了排序,...[2018/12/7]
【12-06】A股主要指数的市盈率(PE)估值高度
全指材料(SH000987) - 2018-12-06日,当前值:12.043,平均值:30.37,中位数:26.0097,当前 接近历史新低。全指材料(SH000987)的历史市盈率PE详情
中证煤炭(SZ399998) - 2018-12-06日,当前值...[2018/12/7]
深度学习模型训练之偏差与方差
此篇 TensorFlow简要教程及线性回归算法示例 介绍了使用TensorFlow进行机器学习的基本流程,此篇 介绍一个快速确定神经网络模型中各层矩阵维度的方法 介绍了在设计神经网络的时候怎么确定各层矩阵的维度(矩阵的行数与列数),接下来就可以开始训练模型了,在训练模型的过程中,怎么...[2018/12/7]
直观理解神经网络最后一层全连接+Softmax - Mr-Lee直观理解神经网络最后一层全连接+Softmax - Mr-Lee
目录
写在前面
全连接层与Softmax回顾
加权角度
模板匹配
几何角度
Softmax的作用
总结
参考
博客:blog.shinelee.me | 博客园 | CSDN
写在前面
这篇文章将从3个角度:加权、模版匹配与几何来理解最后一层全连接+Softmax。掌握了这3种视角,可以更...[2018/12/7]
聚类——人工合成数据集
聚类——人工合成数据集 作者:凯鲁嘎吉 - 博客园 http: www.cnblogs.com/kailugaji/1.Ring function [data,real_label]=generate_ring(large_R,small_R,width,da...[2018/12/6]
介绍一个快速确定神经网络模型中各层矩阵维度的方法
深度学习在设计神经网络结构时需要指定每个隐藏层权重矩阵、偏置项的维度,有的时候容易搞混淆,导致运行时产生维度不对的错误,特别是对于隐藏层既深又宽的网络,更容易出错。下面以一个实例来说明怎么简单快速确定每一层各个矩阵的维度。
假设需要拟合的函数为:y=f(x)=WX+b。
损失函数:J(W,b)...[2018/12/6]
从零开始一起学习SLAM | 不推公式,如何真正理解对极约束?从零开始一起学习SLAM | 不推公式,如何真正理解对极约束?
自从小白向师兄学习了李群李代数和相机成像模型的基本原理后,感觉书上的内容没那么难了,公式推导也能推得动了,感觉进步神速,不过最近小白在学习对极几何,貌似又遇到了麻烦。。。
小白:师兄,对极几何这块你觉得重要吗? 师兄:当然重要啦,这个是多视角立体视觉的核心啊
小白:那师兄一...[2018/12/6]
【2018年12月05日】滚动市盈率PE最低排名
深康佳A(SZ000016) - 滚动市盈率PE:1.69 - 滚动市净率PB:1.13 - 滚动年化股息收益率:4.31% - 消费电子产品 - 深康佳A(SZ000016)的历史市盈率走势图
新钢股份(SH600782)&nb...[2018/12/6]
从零开始一起学习SLAM | 神奇的单应矩阵
小白最近在看文献时总是碰到一个奇怪的词叫“homography matrix”,查看了翻译,一般都称作“单应矩阵”,更迷糊了。正所谓:“每个字都认识,连在一块却不认识”就是小白的内心独白。查了一下书上的推导,总感觉有种“硬凑”的意味,于是又找到了师兄。。。
神奇的单应矩阵 小白:师兄~单应矩阵是...[2018/12/6]
从零开始一起学习SLAM | 三维空间刚体的旋转
刚体,顾名思义,是指本身不会在运动过程中产生形变的物体,如相机的运动就是刚体运动,运动过程中同一个向量的长度和夹角都不会发生变化。刚体变换也称为欧式变换。
视觉SLAM中使用的相机就是典型的刚体,相机一般通过人手持、机载(安装在机器人上)、车载(固定在车辆上)等方式在三维空间...[2018/12/5]
TensorFlow简要教程及线性回归算法示例
TensorFlow是谷歌推出的深度学习平台,目前在各大深度学习平台中使用的最广泛。
一、安装命令
pip3 install -U tensorflow --default-timeout=1800 -i https: mirrors.ustc.edu.cn/pypi/web imple
上...[2018/12/5]
从零开始一起学习SLAM | 为啥需要李群与李代数?
很多刚刚接触SLAM的小伙伴在看到李群和李代数这部分的时候,都有点蒙蒙哒,感觉突然到了另外一个世界,很多都不自觉的跳过了,但是这里必须强调一点,这部分在后续SLAM的学习中其实是非常重要的基础,不信你看看大神们的论文就知道啦。
关于李群李代数,其实高翔的《视觉SLAM十四讲》里推导什么的挺清楚了...[2018/12/5]
【2018年12月04日】钢铁行业的估值高度排名
新钢股份(SH600782),涨跌: (+2.81%),便宜指数: 193.12,滚动市盈率(PE):2.88,股息收益率 %: 1.75%,市净率(PB): 0.96,ROE: 33.39%
太钢不锈(SZ000825),涨跌:&nbs...[2018/12/5]
人脸检测中,如何构建输入图像金字塔 - Mr-Lee
目录
写在前面
人脸检测中的图像金字塔
代码实现
MTCNN
Seetaface
总结
参考
博客:blog.shinelee.me | 博客园 | CSDN
写在前面
在文章《特征,特征不变性,尺度空间与图像金字塔》中我们初步谈到了图像金字塔,在这篇文章中将介绍如何在人脸检测任务中构建...[2018/12/5]
从零开始一起学习SLAM | 相机成像模型
上一篇文章《从零开始一起学习SLAM | 为啥需要李群与李代数?》以小白和师兄的对话展开,受到了很多读者的好评。本文继续采用对话的方式来学习一下相机成像模型,这个是SLAM中极其重要的内容,必须得掌握哦~
小白:师兄,上次听你讲了李群李代数,有种“听君一席话胜读十年书”的赶脚~后来看书感觉容易理...[2018/12/5]
从零开始一起学习SLAM | 为什么要用齐次坐标?
在涉及到计算机视觉的几何问题中,我们经常看到齐次坐标这个术语。本文介绍一下究竟为什么要用齐次坐标?使用齐次坐标到底有什么好处?
什么是齐次坐标? 简单的说:齐次坐标就是在原有坐标上加上一个维度:
使用齐次坐标有什么优势?
齐次坐标的使用能够大大简化在三维空间中的点线面表达方式和旋转平...[2018/12/3]
Pycharm实现服务器端代码的远程调试
Pycharm是很多人在学习机器学习时的常用IDE。但是,当代码需要庞大计算资源的时候,我们往往需要借助远程服务器的GPU资源。很多人都是将代码拷贝到服务器,然后运行,但是当修改调试的时候,很不方便。Pycharm自身就带有远程代码调试功能,可以方便的实现像本地一样远程调试服务器端的代...[2018/12/3]