NumPy 是 Python 语言的一个扩充程序库。支持高级大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库,也是学习 python 必学的一个库。
1. 读取文件
numpy.genfromtxt() 用于读取 txt 文件,其中传入的参数依次为:
- 需要读取的 txt 文件位置,此处文件与程序位于同一目录下
- 分割的标记
- 转换类型,如果文件中既有文本类型也有数字类型,就先转成文本类型
help(numpy.genfromtxt)用于查看帮助文档:
如果不想看 API 可以启动一个程序用 help 查看指令的详细用法
import numpyworld_alcohol = numpy.genfromtxt("world_alcohol.txt", delimiter=",",dtype=str)print(type(world_alcohol))print(world_alcohol)print(help(numpy.genfromtxt))
2. 构造 ndarray
numpy.array()构造 ndarray
numpy.array()中传入数组参数,可以是一维的也可以是二维三维的。numpy 会将其转变成 ndarray 的结构。
vector = numpy.array([1,2,3,4])matrix = numpy.array([[1,2,3],[4,5,6]])
传入的参数必须是同一结构,不是同一结构将发生转换。
vector = numpy.array([1,2,3,4])array([1, 2, 3, 4])
均为 int 类型
vector = numpy.array([1,2,3,4.0])array([ 1., 2., 3., 4.])
转为浮点数类型
vector = numpy.array([1,2,'3',4])array(['1', '2', '3', '4'],dtype='<U21')
转为字符类型
利用 .shape 查看结构
能够了解 array 的结构,debug 时通过查看结构能够更好地了解程序运行的过程。
print(vector.shape)print(matrix.shape)(4,)(2, 3)
利用 dtype 查看类型
vector = numpy.array([1,2,3,4])vector.dtypedtype('int64')
ndim 查看维度
一维
vector = numpy.array([1,2,3,4])vector.ndim1
二维
matrix = numpy.array([[1,2,3], [4,5,6], [7,8,9]])matrix.ndim2
size 查看元素数量
matrix.size9
3. 获取与计算
numpy 能使用切片获取数据
matrix = numpy.array([[1,2,3], [4,5,6], [7,8,9]])
根据条件获取
numpy 能够依次比较 vector 和元素之间是否相同
vector = numpy.array([5, 10, 15, 20])vector == 10array([False, True, False, False], dtype=bool)
根据返回值获取元素
vector = numpy.array([5, 10, 15, 20])equal_to_ten = (vector == 10)print(equal_to_ten)print(vector[equal_to_ten])[False True False False][10]
进行运算之后获取
vector = numpy.array([5, 10, 15, 20])equal_to_ten_and_five = (vector == 10) & (vector == 5)
vector = numpy.array([5, 10, 15, 20])equal_to_ten_or_five = (vector == 10) | (vector == 5)
类型转换
将整体类型进行转换
vector = numpy.array([5, 10, 15, 20])print(vector.dtype)vector = vector.astype(str)print(vector.dtype)int64<U21
求和
sum() 能够对 ndarray 进行各种求和操作,比如分别按行按列进行求和
matrix = numpy.array([[1,2,3], [4,5,6], [7,8,9]])print(matrix.sum())print(matrix.sum(1))print(matrix.sum(0))45[ 6 15 24][12 15 18]
sum(1) 是 sum(axis=1)) 的缩写,1表示按照 x轴方向求和,0表示按照y轴方向求和
4. 常用函数
reshape
生成从 0-14 的 15 个数字,使用 reshape(3,5) 将其构造成一个三行五列的 array。
import numpy as nparr = np.arange(15).reshape(3, 5)arrarray([[ 0, 1, 2, 3, 4], [ 5, 6, 7, 8, 9], [10, 11, 12, 13, 14]])
zeros
生成指定结构的默认为 0. 的 array
np.zeros ((3,4))array([[ 0., 0., 0., 0.], [ 0., 0., 0., 0.], [ 0., 0., 0., 0.]])
ones
生成一个三维的 array,通过 dtype 指定类型
np.ones( (2,3,4), dtype=np.int32 )array([[[1, 1, 1, 1], [1, 1, 1, 1], [1, 1, 1, 1]], [[1, 1, 1, 1], [1, 1, 1, 1], [1, 1, 1, 1]]])
range
指定范围和数值间的间隔生成 array,注意范围包左不包右
np.arange(0,10,2)array([0, 2, 4, 6, 8])
random 随机数
生成指定结构的随机数,可以用于生成随机权重
np.random.random((2,3))array([[ 0.86166627, 0.37756207, 0.94265883], [ 0.9768257 , 0.96915312, 0.33495431]])
5. ndarray 运算
元素之间依次相减相减
a = np.array([10,20,30,40])b = np.array(4)a - barray([ 6, 16, 26, 36])
乘方
a**2array([ 100, 400, 900, 1600])
开根号
np.sqrt(B)array([[ 1.41421356, 0. ], [ 1.73205081, 2. ]])
e 求方
np.exp(B)array([[ 7.3890561 , 1. ], [ 20.08553692, 54.59815003]])
向下取整
a = np.floor(10*np.random.random((2,2)))aarray([[ 0., 0.], [ 3., 6.]])
行列变换
a.Tarray([[ 0., 3.], [ 0., 6.]])
变换结构
a.resize(1,4)aarray([[ 0., 0., 3., 6.]])
6. 矩阵运算
矩阵之间的运算
A = np.array( [[1,1], [0,1]] )B = np.array( [[2,0], [3,4]] )
对应位置一次相乘
A*Barray([[2, 0], [0, 4]])
矩阵乘法
print (A.dot(B))print(np.dot(A,B))[[5 4] [3 4]]
横向相加
a = np.floor(10*np.random.random((2,2)))b = np.floor(10*np.random.random((2,2)))print(a)print(b)print(np.hstack((a,b)))[[ 2. 3.] [ 9. 3.]][[ 8. 1.] [ 0. 0.]][[ 2. 3. 8. 1.] [ 9. 3. 0. 0.]]
纵向相加
print(np.vstack((a,b)))[[ 2. 3.] [ 9. 3.] [ 8. 1.] [ 0. 0.]]
矩阵分割
7. 复制的区别
地址复制
通过 b = a 复制 a 的值,b 与 a 指向同一地址,改变 b 同时也改变 a。
a = np.arange(12)b = aprint(a is b)print(a.shape)print(b.shape)b.shape = (3,4)print(a.shape)print(b.shape)True(12,)(12,)(3, 4)(3, 4)
复制值
通过 a.view() 仅复制值,当对 c 值进行改变会改变 a 的对应的值,而改变 c 的 shape 不改变 a 的 shape
a = np.arange(12)c = a.view()print(c is a)c.shape = 2,6c[0,0] = 9999print(a)print(c)False[9999 1 2 3 4 5 6 7 8 9 10 11][[9999 1 2 3 4 5] [ 6 7 8 9 10 11]]
完整拷贝
a.copy() 进行的完整的拷贝,产生一份完全相同的独立的复制
a = np.arange(12)c = a.copy()print(c is a)c.shape = 2,6c[0,0] = 9999print(a)print(c)False[ 0 1 2 3 4 5 6 7 8 9 10 11][[9999 1 2 3 4 5] [ 6 7 8 9 10 11]]