Numpy基础之一——数据类型及数组

it2023-07-27 87

Numpy简介 Numpy (Numerical Python) 是Python语言的一个扩展程序库，支持大维度的数组与矩阵运算，此外针对数组元素提供有大量的数学函数库。 Numpy中的几个常量

空值：numpy.nan 空值的三种写法： nan、 NaN、 NAN 注意两个空值是不相等的 import numpy as np print(np.nan == np.nan) print(np.nan != np.nan)

输出

False True

统计一个数组中空值个数

import numpy as np x = np.array([1, 1, 2, np.nan, 8]) print("x:{}".format(x)) y = np.isnan(x) #输出为bool值。若为空值输出True，否则为False print("y:{}".format(y)) z = np.count_nonzero(y) #统计y中非零值的个数，True为非零值。 print("z:{}".format(z))

输出

x:[ 1. 1. 8. nan 10.] y:[False False False True False] z:1 #即：数组x中的空值的个数为1。无穷大：numpy.inf 无穷大的五种写法：Inf、inf、infty、Infinity、PINF 两个无穷大的值是相等的 print(np.inf == np.inf) #True 圆周率：numpy.pi import numpy as np print(np.pi)

输出：

3.141592653589793 自然常数: numpy.e import numpy as np print(np.e)

输出：

2.718281828459045

常见数据类型 Numpy支持的数据类型比Python内置的数据类型多很多，下表是Numpy的数据类型，其中为了和Python内置的数据类型做区分，bool、int、float、complex后面加了 “_” 。

类型长度名称bool_8布尔类型int88整型int1616整型int3232整型int_64整型unit88无符号整型unit1616无符号整型unti3232无符号整型unit6464无符号整型float1616浮点型float3232浮点型float_64浮点型str_字符串datetime64日期时间类型timedelta64表示两个时间之间的间隔

创建数据类型 numpy的数值类型实际上是的dtype对象的实例

class dtype(object); def __init__(self, obj, align=False, copy=False) pass

参数解释: object - 要转换为的数据类型对象 align - 如果为 true，填充字段使其类似 C 的结构体 copy - 复制 dtype 对象，如果为 false，则是对内置数据类型对象的引用每个内建类型都有一个唯一定义它的字符代码，如下表：

字符代码对应类型备注bbooleanb1isigned integeri1, i2, i4, i8uunsigned integeru1, u2, u4, u8ffloating-pointf2, f4, f8mtimedelta64表示两个时间之间的间隔Mdatetime64日期时间类型OobjectS(byte-)stringS3表示长度为3的字符串UUnicodeUnicode 字符串Vvoid

例1. 创建一个布尔类型的变量

import numpy as np a = np.dtype('b1') print(a.type) # 输出a的变量类型 print(a.itemsize) # 输出a的字节数

输出

<class 'numpy.bool_'> 1

由结果可知：变量a为布尔类型且长度为一个字节例2. 创建一个整数类型的变量

import numpy as np a = np.dtype(np.int8) print(a.type) print(a.itemsize)

输出

<class 'numpy.int8'> 1

由结果可知：变量a为整数类型且长度为一个字节 Numpy与Python数据类型差异点 Numpy与Python在整数溢出方面存在着差异，Python整数可以扩展以容纳任何整数并且不会溢出，Numpy中是有范围限制的。

import numpy as np ii16 = np.iinfo(np.int16) print(ii16.min) print(ii16.max) ff16 = np.finfo(np.float16) print(ff16.bits) print(ff16.min) print(ff16.max) print(ff16.eps)

输出：

-32768 32767 16 -65500.0 65500.0 0.000977

由结果分析：Numpy中整数和浮点数都是存在范围的。 datetime64基础 Numpy中可以方便的将字符串转化成日期类型datetime64（python中有一个日期时间库datetime），datetime64是带单位的时间类型，单位如表：

日期单位代码含义时间单位代码含义Y年h小时M月m分钟W周s秒D天ms毫秒利用字符串创建datetime64类型，默认情况下，numpy 会根据字符串自动选择对应的单位。 import numpy as np a = np.datetime64('2020-03-01') print(a, a.dtype) b = np.datetime64('2020-03-08 20:00') print(b, b.dtype)

输出

2020-03-01 datetime64[D] #Numpy默认的单位是D(天) 2020-03-08T20:00 datetime64[m] #Numpy默认的单位是m(分钟) 从字符串创建datatime64类型时，可以强制指定使用的单位。 import numpy as np a = np.datetime64('2020-03','D') print(a,a.dtype) a = np.datetime64('2020-03', 'Y') print(a, a.dtype) # 2020 datetime64[Y]

输出：

2020-03-01 datetime64[D] #单位强制变成了 D 2020 datetime64[Y] #单位强制变成的 Y

实际上，2020-03和2020-03-01代表的是同一天的时间

print(np.datetime64('2020-03') == np.datetime64('2020-03-01')) print(np.datetime64('2020-03') == np.datetime64('2020-03-02'))

输出

True False 由字符串创建datetime64数组时，如果单位不统一，则一律转化成其中最小的单位 import numpy as np a = np.array(['2020-03', '2020-03-08', '2020-03-08 20:00'], dtype = 'datetime64') print(a)

输出：

['2020-03-01T00:00' '2020-03-08T00:00' '2020-03-08T20:00'] 利用arange()创建datetime64数组，可用于生成日期范围。 import numpy as np a = np.arange('2020-08-01', '2020-08-10', dtype = np.datetime64) print(a, a.dtype)

输出：

['2020-08-01' '2020-08-02' '2020-08-03' '2020-08-04' '2020-08-05' '2020-08-06' '2020-08-07' '2020-08-08' '2020-08-09'] datetime64[D] datetime64和timedelta64运算 timedelta64 表示两个 datetime64 之间的差。timedelta64 也是带单位的，并且和相减运算中的两个 datetime64 中的较小的单位保持一致。 import numpy as np a = np.datetime64('2020-03-08') - np.datetime64('2020-03-07') print(a, a.dtype) a = np.datetime64('2020-03') + np.timedelta64(20, 'D') print(a, a.dtype)

输出：

1 days timedelta64[D] 2020-03-21 datetime64[D] numpy.datetime64 与 datetime.datetime 相互转换 import numpy as np import datetime dt = datetime.datetime(year=2020, month=6, day=1, hour=20, minute=5, second=30) dt64 = np.datetime64(dt, 's') print(dt64, dt64.dtype) # 2020-06-01T20:05:30 datetime64[s] dt2 = dt64.astype(datetime.datetime) print(dt2, type(dt2)) # 2020-06-01 20:05:30 <class 'datetime.datetime'>

输出：

2020-06-01T20:05:30 datetime64[s] 2020-06-01 20:05:30 <class 'datetime.datetime'>

datetime64的应用为了允许在只有一周中某些日子有效的上下文中使用日期时间，Numpy中包含“busday”（工作日）功能。 numpy.busday_offset(dates, offsets, roll=‘raise’, weekmask=‘1111100’, holidays=None, busdaycal=None, out=None) 参数含义： dates：要处理的日期数组 offsets：偏移量数组 roll： {‘raise’, ‘nat’, ‘forward’, ‘following’, ‘backward’, ‘preceding’, ‘modifiedfollowing’, ‘modifiedpreceding’}, 可选参数。如何处理非有效日期的日期。默认值为‘raise’。（forward：表示向未来方向；backward：表示向过去方向。）如果当前日期不是工作日，默认报错。可以指定forward或backward避免报错。

import numpy as np a = np.busday_offset('2020-07-11', offsets=1) # 7.11为周六 print(a) #结果报错 a = np.busday_offset('2020-07-10', offsets=1) print(a) # 2020-07-13 a = np.busday_offset('2020-07-11', offsets=0, roll='forward') b = np.busday_offset('2020-07-11', offsets=0, roll='backward') print(a) print(b) a = np.busday_offset('2020-07-11', offsets=1, roll='forward') b = np.busday_offset('2020-07-11', offsets=1, roll='backward') print(a) print(b)

输出：

2020-07-13 2020-07-13 2020-07-10 2020-07-14 2020-07-13

数组的创建

利用现有的数据来创建ndarray （1）利用array()函数进行创建例：分别创建一维、二维和三维数组 import numpy as np # 创建一维数组 a = np.array([0, 1, 2, 3, 4]) b = np.array((0, 1, 2, 3, 4)) print(a, type(a)) print(b, type(b)) # 创建二维数组 c = np.array([[11, 12, 13, 14, 15], [16, 17, 18, 19, 20], [21, 22, 23, 24, 25], [26, 27, 28, 29, 30], [31, 32, 33, 34, 35]]) print(c, type(c)) # 创建三维数组 d = np.array([[(1.5, 2, 3), (4, 5, 6)], [(3, 2, 1), (4, 5, 6)]]) print(d, type(d))

输出：

[0 1 2 3 4] <class 'numpy.ndarray'> [0 1 2 3 4] <class 'numpy.ndarray'> [[11 12 13 14 15] [16 17 18 19 20] [21 22 23 24 25] [26 27 28 29 30] [31 32 33 34 35]] <class 'numpy.ndarray'> [[[1.5 2. 3. ] [4. 5. 6. ]] [[3. 2. 1. ] [4. 5. 6. ]]] <class 'numpy.ndarray'>

(2). 利用asarray()函数来创建 array()和asarray()都可以将结构数据转化为 ndarray，区别是：当数据源是ndarray 时，array()仍然会 copy 出一个副本，占用新的内存；asarray()不会。

import numpy as np x = np.array([[1, 1, 1], [1, 1, 1], [1, 1, 1]]) y = np.array(x) z = np.asarray(x) w = np.asarray(x, dtype=np.int) x[1][2] = 2 print(x,type(x),x.dtype) print(y,type(y),y.dtype) print(z,type(z),z.dtype) print(w,type(w),w.dtype)

输出

[[1 1 1] [1 1 2] [1 1 1]] <class 'numpy.ndarray'> int32 [[1 1 1] [1 1 1] [1 1 1]] <class 'numpy.ndarray'> int32 [[1 1 1] [1 1 2] [1 1 1]] <class 'numpy.ndarray'> int32 [[1 1 1] [1 1 2] [1 1 1]] <class 'numpy.ndarray'> int32

(3). 利用fromfunction()函数进行创建例：通过在坐标上执行一个函数来构造数组

import numpy as np def f(x, y): return 10 * x + y x = np.fromfunction(f, (5, 4), dtype=int) print(x) x = np.fromfunction(lambda i, j: i == j, (3, 3), dtype=int) print(x) x = np.fromfunction(lambda i, j: i + j, (3, 3), dtype=int) print(x)

输出

[[ 0 1 2 3] [10 11 12 13] [20 21 22 23] [30 31 32 33] [40 41 42 43]] [[ True False False] [False True False] [False False True]] [[0 1 2] [1 2 3] [2 3 4]] 根据ones和zeros填充方式 (1). 零数组 zeros()函数：返回给定形状和类型的零数组。 zeros_like()函数：返回与给定数组形状和类型相同的零数组 import numpy as np x = np.zeros(5) print(x) x = np.zeros([2, 3]) print(x) x = np.array([[1, 2, 3], [4, 5, 6]]) y = np.zeros_like(x) print(y)

输出：

[0. 0. 0. 0. 0.] [[0. 0. 0.] [0. 0. 0.]] [[0 0 0] [0 0 0]]

(2). 1数组 ones()函数：返回给定形状和类型的1数组 ones_like()函数：返回与给定数组形状和类型相同的1数组

import numpy as np x = np.ones(5) print(x) # [1. 1. 1. 1. 1.] x = np.ones([2, 3]) print(x) x = np.array([[1, 2, 3], [4, 5, 6]]) y = np.ones_like(x) print(y)

输出：

[1. 1. 1. 1. 1.] [[1. 1. 1.] [1. 1. 1.]] [[1 1 1] [1 1 1]]

(3). 空数组 empty()函数：返回一个空数组，数组元素为随机数 empty_like函数：返回与给定数组具有相同形状和类型的新数组

import numpy as np x = np.empty(5) print(x) x = np.empty((3, 2)) print(x) x = np.array([[1, 2, 3], [4, 5, 6]]) y = np.empty_like(x) print(y)

输出

[0. 0. 0. 0. 0.] [[0. 0.] [0. 0.] [0. 0.]] [[7471207 7143521 4587552] [7077993 7536741 2621472]]

(4). 单位数组 eye()函数：返回一个对角线上为1，其它地方为零的单位数组 identity()函数：返回一个方的单位数组

import numpy as np x = np.eye(4) print(x) x = np.eye(2, 3) print(x) x = np.identity(4) print(x)

输出

[[1. 0. 0. 0.] [0. 1. 0. 0.] [0. 0. 1. 0.] [0. 0. 0. 1.]] [[1. 0. 0.] [0. 1. 0.]] [[1. 0. 0. 0.] [0. 1. 0. 0.] [0. 0. 1. 0.] [0. 0. 0. 1.]]

(5). 对角数组 diag()函数：提取对角线或构造对角数组

import numpy as np x = np.arange(9).reshape((3, 3)) print(x) print(np.diag(x)) # [0 4 8] print(np.diag(x, k=1)) # [1 5] print(np.diag(x, k=-1)) # [3 7] v = [1, 3, 5, 7] x = np.diag(v) print(x)

输出：

[[0 1 2] [3 4 5] [6 7 8]] [0 4 8] [1 5] [3 7] [[1 0 0 0] [0 3 0 0] [0 0 5 0] [0 0 0 7]]

(6). 常数数组 full()函数：返回一个常数数组 full_like()函数：返回与给定数组具有相同形状和类型的常数数组

import numpy as np x = np.full(2, 7) print(x) x = np.full((2, 7), 7) print(x) x = np.array([[1, 2, 3], [4, 5, 6]]) y = np.full_like(x, 7) print(y)

输出：

[7 7] [[7 7 7 7 7 7 7] [7 7 7 7 7 7 7]] [[7 7 7] [7 7 7]] 利用数值范围来创建数组 arange()函数：返回给定间隔内的均匀间隔的值 linspace()函数：返回指定间隔内的等间隔数字 logspace()函数：返回数以对数刻度均匀分布 numpy.random.rand() 返回一个由[0,1)内的随机数组成的数组 import numpy as np x = np.arange(5) print(x) x = np.arange(3, 7, 2) print(x) x = np.linspace(start=0, stop=2, num=9) print(x) x = np.logspace(0, 1, 5) print(np.around(x, 2)) #np.around 返回四舍五入后的值，可指定精度 x = np.linspace(start=0, stop=1, num=5) x = [10 ** i for i in x] print(np.around(x, 2)) x = np.random.random(5) print(x) x = np.random.random([2, 3]) print(x)

输出：

[0 1 2 3 4] [3 5] [0. 0.25 0.5 0.75 1. 1.25 1.5 1.75 2. ] [ 1. 1.78 3.16 5.62 10. ] [ 1. 1.78 3.16 5.62 10. ] [0.60621762 0.01844608 0.82116907 0.57071932 0.18629851] [[0.7274693 0.97445186 0.90204432] [0.08303323 0.2520763 0.462612 ]] 结构数组的创建结构数组，首先需要定义结构，然后利用np.array()来创建数组，其参数dtype为定义的结构。 (1). 利用字典来定义结构 import numpy as np personType = np.dtype({ 'names':['name', 'age', 'weight'], 'formats':['U30', 'i8', 'f8'] }) a = np.array([('Liming', 24, 63.9), ('Mike', 15, 67.), ('Jan', 34, 45.8)], dtype = personType) print(a, type(a))

输出

[('Liming', 24, 63.9) ('Mike', 15, 67. ) ('Jan', 34, 45.8)] <class 'numpy.ndarray'>

(2)利用包含多个元组的列表来定义结构

import numpy as np personType = np.dtype([('name', 'U30'), ('age', 'i8'), ('weight', 'f8')]) a = np.array([('Liming', 24, 63.9), ('Mike', 15, 67.), ('Jan', 34, 45.8)], dtype=personType) print(a, type(a)) print(a[0]) print(a[-2:]) # 我们可以使用字段名作为下标获取对应的值 print(a['name']) # ['Liming' 'Mike' 'Jan'] print(a['age']) # [24 15 34] print(a['weight']) # [63.9 67. 45.8

输出

[('Liming', 24, 63.9) ('Mike', 15, 67. ) ('Jan', 34, 45.8)] <class 'numpy.ndarray'> ('Liming', 24, 63.9) [('Mike', 15, 67. ) ('Jan', 34, 45.8)] ['Liming' 'Mike' 'Jan'] [24 15 34] [63.9 67. 45.8] 数组的属性 numpy.ndarray.ndim用于返回数组的维数（轴的个数）也称为秩，一维数组的秩为 1，二维数组的秩为 2，以此类推 numpy.ndarray.shape表示数组的维度，返回一个元组，这个元组的长度就是维度的数目，即 ndim 属性(秩) numpy.ndarray.size数组中所有元素的总量，相当于数组的shape中所有元素的乘积，例如矩阵的元素总量为行与列的乘积 numpy.ndarray.dtype ndarray 对象的元素类型 numpy.ndarray.itemsize以字节的形式返回数组中每一个元素的大小 import numpy as np b = np.array([[1, 2, 3], [4, 5, 6.0]]) print(b.shape) print(b.dtype) print(b.size) print(b.ndim) print(b.itemsize)

输出：

(2, 3) float64 6 2 8 副本与视图在 Numpy 中，尤其是在做数组运算或数组操作时，返回结果不是数组的副本就是视图。在 Numpy 中，所有赋值运算不会为数组和数组中的任何元素创建副本，numpy.ndarray.copy() 函数创建一个副本。对副本数据进行修改，不会影响到原始数据，它们物理内存不在同一位置。 import numpy as np x = np.array([1, 2, 3, 4, 5, 6, 7, 8]) y = x y[0] = -1 print(x) print(y) x = np.array([1, 2, 3, 4, 5, 6, 7, 8]) y = x.copy() y[0] = -1 print(x) print(y)

输出:

[-1 2 3 4 5 6 7 8] [-1 2 3 4 5 6 7 8] [1 2 3 4 5 6 7 8] [-1 2 3 4 5 6 7 8]

最新回复(0)