Numpy的详尽教程

numpy的主要对象是多维数组，数组中元素是同一种的（通常是数字）。numpy中的数组对象叫做ndarray，通常称为数组。

numpy.array和标准Python库类array.array并不相同，后者只处理一维数组和提供少量功能。

在numpy中维度（dimensions）叫做轴（axes），轴的个数叫做秩（rank）。如3D空间中一个点的坐标[1,2,3]是一个秩为1的数组，因为它只有一个轴，这个轴长度为3，在下面的例子中数组的秩为2（它有两个维度）,第一个维度为2，第二个维度为3。

[[ 1., 0., 0.],
 [ 0., 1., 2.]]

1. ndarray对象属性

ndarray.ndim

数组轴的个数，在python的世界中，轴的个数被称作秩
ndarray.shape

数组的维度。这是一个指示数组在每个维度上大小的整数元组。例如一个n排m列的矩阵，它的shape属性将是(n,m)，这个元组的长度显然是秩，即维度或者ndim属性
ndarray.size

数组元素的总个数，等于shape属性中元组元素的乘积。
ndarray.dtype

一个用来描述数组中元素类型的对象，可以通过创造或指定dtype使用标准Python类型。另外NumPy提供它自己的数据类型。
ndarray.itemsize

数组中每个元素的字节大小。例如，一个元素类型为float64的数组itemsiz属性值为8(=64/8),又如，一个元素类型为complex32的数组item属性为4(=32/8).
ndarray.data

包含实际数组元素的缓冲区，通常我们不需要使用这个属性，因为我们总是通过索引来使用数组中的元素。

2. 创建ndarray

2.1. np.array()

从常规的Python列表和元组创造数组。所创建的数组类型由原序列中的元素类型推导而来,数组将序列包含序列转化成二维的数组，序列包含序列包含序列转化成三维数组等等

data1 = np.array([1, 2, 3, 4])
data2 = np.array((1, 2, 3, 4))
data3 = np.array([[1, 2, 3], [4, 5, 6]])
data4 = np.array([(1, 2, 3), (4, 5, 6)])
data5 = np.array([[1, 2], [3, 4]], dtype=complex)	# 数组类型可以在创建时显示指定
# np.array(1, 2, 3, 4)  # 不能这么创建

2.2. np.zeros()&&np.ones()&&np.empty()&&np.eye()

函数zeros创建一个全是0的数组；函数ones创建一个全1的数组；函数empty创建一个内容随机并且依赖与内存状态的数组；eye创建对角都为1，其他元素为0的矩阵（单位矩阵）。

默认创建的数组类型(dtype)都是float64。

data1 = np.zeros(3)
data2 = np.zeros((3, 4))
data3 = np.ones(3)
data4 = np.ones((3, 4), dtype=np.int16)		# 也可以指定元素的类型
data5 = np.empty(3)
data6 = np.empty((2, 3))
data7 = np.eye(5)

2.3. np.arange()---指定步长产生数组

开始值和步长都可以不指定，开始值默认为0，步长默认为1，最终值取不到。

data1 = np.arange(10)		# 默认从0开始到10（10取不到），默认步长为1
data2 = np.arange(0, 18)	# 从0开始到18（18取不到），默认步长
data4 = np.arange(0, 18, 2)

2.4. np.linspace()---指定个数产生数组

开始值和最终值都需要指定，产生个数可以不指定，默认产生50个，最终值取得到。

data1 = np.linspace(0, 49)
data2 = np.linspace(0, 1, 10)

2.5. np.full()

指定元素来提供指定大小的矩阵

data = np.full((2, 3), 8)	# 2*3的矩阵里面的元素都是8

2.6. np.random

data1 = np.random.rand(5)		# 产生一个1*5的矩阵，里面的元素为0-1
data2 = np.random.rand(2, 3)	# 产生一个2*3的矩阵，里面的元素为0-1
data3 = np.random.rand(2, 3)*5	# 产生一个2*3的矩阵，里面的元素为0-5
data4 = np.random.randint(5, size=(2, 3))	# 产生一个2*3的矩阵，里面的元素为0-5
data5 = np.random.randint(5, 10, (2,3))		# 产生一个2*3的矩阵，里面的元素为5-10

3. 常用方法

下面中arr是指ndarray对象

3.1. arr.astype(dtype)---把数组元素转为指定的dtype

arr = np.random.randint(1, 5, (2, 3))
l1 = arr.astype(np.int16)

3.2. arr.tolist()---把ndarray对象转化为python 列表

arr = np.random.randint(1, 5, (2, 3))
l1 = arr.tolist()	
--------------
arr:
[[1 1 2]
 [4 2 3]]
l1:[[1, 1, 2], [4, 2, 3]]

3.3. arr.T---转置

arr = np.random.randint(1, 5, (2, 3))
arrT = arr.T
--------------
arr:
[[1 3 4]
 [3 1 4]]
arrT:
[[1 3]
 [3 1]
 [4 4]]

3.4. arr.reshape(3, 4)

转化矩阵shape为3*4，没有改变元素。通过返回值实现

arr = np.random.randint(1, 5, (3, 4))
arrReshape = arr.reshape((2, 6))	# 等同于arr.reshape(2， 6)
--------------------------
arr:
[[2 1 4 4]
 [2 3 4 3]
 [3 2 2 4]]
arrReshape:
[[2 1 4 4 2 3]
 [4 3 3 2 2 4]]

3.5. arr.resize((3, 5))

转为矩阵shape3*5，多余的值用0填充。直接修改原ndarray对象，引用需要为创建出来的引用

arr = np.random.randint(1, 5, (3, 4))
arr.resize((3, 5))
------------------------
arr:
[[3 1 4 2 1]
 [1 1 4 1 2]
 [1 3 0 0 0]]

'''
下面的这段也会报错
'''
arr = np.random.randint(1, 5, (3, 4))
arr1 = arr.reshape(2, 6)
arr.resize((3, 5))
'''
下面的这段也会报错
'''
arr = np.random.randint(1, 5, (3, 4))
arr1 = arr.reshape(2, 6)
arr1.resize((3, 5))

3.6. arr.sum()&&arr.min()/arr.max()

>>> arr
array([[ 1.,  2.,  3.,  4.],
       [ 5.,  6.,  7.,  8.],
       [ 9., 10., 11., 12.]])
>>> arr.sum()
78.0
>>> arr.max()
12.0
>>> arr.min()
1.0

3.7. np.mean(arr)

>>> arr
array([[ 1.,  2.,  3.,  4.],
       [ 5.,  6.,  7.,  8.],
       [ 9., 10., 11., 12.]])
>>> np.mean(arr)
6.5

3.8. np.array_equal(arr1, arr2)

比较值是否相等，若每个元素的值相等，并且ndarray的shape一样那么就是True

>>> arr
array([[ 1.,  2.,  3.,  4.],
       [ 5.,  6.,  7.,  8.],
       [ 9., 10., 11., 12.]])
>>> arr2
array([[ 1.,  2.,  3.,  4.],
       [ 5.,  6.,  7.,  8.],
       [ 9., 10., 11., 12.]])
>>> np.array_equal(arr, arr2)
True

4. 对ndarray的元素操作

arr[a, b,...]依次取第一维、第二维，如a就代表第一个维度的取值，b代表第二维度的取值

4.1. 取值

>>> import numpy as np
>>> arr = np.linspace(1, 12, 12, dtype=np.int16).reshape(3, 4)
>>> arr
array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]], dtype=int16)
>>> arr[2]	# 对于秩为1来说，取第index=2的元素，对于秩不为1的是在取第一维度index=2的值
array([ 9, 10, 11, 12], dtype=int16)
>>> arr[2, 3]	
12
>>> arr[2][3]
12
>>> arr[0:2]	# 依次取第一维度下index为0、1的值
array([[1, 2, 3, 4],
       [5, 6, 7, 8]], dtype=int16)
>>> arr[0:2, 3]	# 依次取第一维度下index为0、1，第二维度下index为3的值
array([4, 8], dtype=int16)
>>> arr[:2]		# 从index=0开始
array([[1, 2, 3, 4],
       [5, 6, 7, 8]], dtype=int16)
>>> arr[:, 1]	# 第一维度下index全取，第二维度下index为1的值
array([ 2,  6, 10], dtype=int16)

4.2. 赋值

在上面的取值操作后面加上赋值操作就好

>>> arr
array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]], dtype=int16)
>>> arr[2] = 20
>>> arr
array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [20, 20, 20, 20]], dtype=int16)

4.3. 大小判断确定boolean

>>> import numpy as np
>>> arr = np.linspace(1, 12, 12, dtype=np.int16).reshape(3, 4)
>>> arr
array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]], dtype=int16)
>>> arr<5	# 以boolean矩阵的类型返回，小于5的值为True
array([[ True,  True,  True,  True],
       [False, False, False, False],
       [False, False, False, False]])
>>> (arr>5) & (arr<10)	# 以boolean矩阵的类型返回，大于5且小于10的值为True
array([[False, False, False, False],
       [False,  True,  True,  True],
       [ True, False, False, False]])
>>> arr[arr<5]	# 只取boolean值为True的值，即返回arr中小于5的值
array([1, 2, 3, 4], dtype=int16

5. 常用的数学方法

np.add(arr, 1)			# 返回arr每个元素加1之后的结果
np.add(arr1, arr2)		# 返回arr1每个元素与arr2每个元素相加的结果

np.subtract(arr, 2)		# 返回arr每个元素减2之后的结果
np.subtract(arr1, arr2)	# 返回arr1每个元素减arr2每个元素之后的结果

np.multiply(arr, 2)		# 返回与一个标量相乘的结果
np.multiply(arr1, arr2)	# 返回arr1每个元素与arr2每个元素相乘之后的结果

np.divide(arr, 0.5)		# 返回与一个标量相除的结果
np.divide(arr1, arr2)	# 返回arr1每个元素除以arr2每个元素之后的结果

np.power(arr, 2)		# 返回与一个标量幂次方的结果
np.power(arr1, arr2)	# 返回arr1每个元素以对应位置的arr2元素为幂的结果

np.sqrt(arr)			# 返回每个元素平方根之后的结果
np.sin(arr)				# 返回每个元素取sin之后的结果
np.log(arr)				# 返回每个元素取对数（以e为底）之后的结果
np.abs(arr)				# 返回每个元素取绝对值之后的结果
np.ceil(arr)			# 返回每个元素向上取整之后的结果	
np.floor(arr)			# 返回每个元素向下取整之后的结果
np.round(arr)			# 返回每个元素取最近int值之后的结果

本文参考：