Numpy基础之一——数据类型及数组

it2023-07-27  70

Numpy简介 Numpy (Numerical Python) 是Python语言的一个扩展程序库,支持大维度的数组与矩阵运算,此外针对数组元素提供有大量的数学函数库。 Numpy中的几个常量

空值:numpy.nan 空值的三种写法: nan、 NaN、 NAN 注意两个空值是不相等的 import numpy as np print(np.nan == np.nan) print(np.nan != np.nan)

输出

False True

统计一个数组中空值个数

import numpy as np x = np.array([1, 1, 2, np.nan, 8]) print("x:{}".format(x)) y = np.isnan(x) #输出为bool值。若为空值输出True,否则为False print("y:{}".format(y)) z = np.count_nonzero(y) #统计y中非零值的个数,True为非零值。 print("z:{}".format(z))

输出

x:[ 1. 1. 8. nan 10.] y:[False False False True False] z:1 #即:数组x中的空值的个数为1。 无穷大:numpy.inf 无穷大的五种写法:Inf、inf、infty、Infinity、PINF 两个无穷大的值是相等的 print(np.inf == np.inf) #True 圆周率:numpy.pi import numpy as np print(np.pi)

输出:

3.141592653589793 自然常数: numpy.e import numpy as np print(np.e)

输出:

2.718281828459045

常见数据类型 Numpy支持的数据类型比Python内置的数据类型多很多,下表是Numpy的数据类型,其中为了和Python内置的数据类型做区分,bool、int、float、complex后面加了 “_” 。

类型长度名称bool_8布尔类型int88整型int1616整型int3232整型int_64整型unit88无符号整型unit1616无符号整型unti3232无符号整型unit6464无符号整型float1616浮点型float3232浮点型float_64浮点型str_字符串datetime64日期时间类型timedelta64表示两个时间之间的间隔

创建数据类型 numpy的数值类型实际上是的dtype对象的实例

class dtype(object); def __init__(self, obj, align=False, copy=False) pass

参数解释: object - 要转换为的数据类型对象 align - 如果为 true,填充字段使其类似 C 的结构体 copy - 复制 dtype 对象 ,如果为 false,则是对内置数据类型对象的引用 每个内建类型都有一个唯一定义它的字符代码,如下表:

字符代码对应类型备注bbooleanb1isigned integeri1, i2, i4, i8uunsigned integeru1, u2, u4, u8ffloating-pointf2, f4, f8mtimedelta64表示两个时间之间的间隔Mdatetime64日期时间类型OobjectS(byte-)stringS3表示长度为3的字符串UUnicodeUnicode 字符串Vvoid

例1. 创建一个布尔类型的变量

import numpy as np a = np.dtype('b1') print(a.type) # 输出a的变量类型 print(a.itemsize) # 输出a的字节数

输出

<class 'numpy.bool_'> 1

由结果可知:变量a为布尔类型且长度为一个字节 例2. 创建一个整数类型的变量

import numpy as np a = np.dtype(np.int8) print(a.type) print(a.itemsize)

输出

<class 'numpy.int8'> 1

由结果可知:变量a为整数类型且长度为一个字节 Numpy与Python数据类型差异点 Numpy与Python在整数溢出方面存在着差异,Python整数可以扩展以容纳任何整数并且不会溢出,Numpy中是有范围限制的。

import numpy as np ii16 = np.iinfo(np.int16) print(ii16.min) print(ii16.max) ff16 = np.finfo(np.float16) print(ff16.bits) print(ff16.min) print(ff16.max) print(ff16.eps)

输出:

-32768 32767 16 -65500.0 65500.0 0.000977

由结果分析:Numpy中整数和浮点数都是存在范围的。 datetime64基础 Numpy中可以方便的将字符串转化成日期类型datetime64(python中有一个日期时间库datetime),datetime64是带单位的时间类型,单位如表:

日期单位代码含义时间单位代码含义Y年h小时M月m分钟W周s秒D天ms毫秒 利用字符串创建datetime64类型,默认情况下,numpy 会根据字符串自动选择对应的单位。 import numpy as np a = np.datetime64('2020-03-01') print(a, a.dtype) b = np.datetime64('2020-03-08 20:00') print(b, b.dtype)

输出

2020-03-01 datetime64[D] #Numpy默认的单位是D(天) 2020-03-08T20:00 datetime64[m] #Numpy默认的单位是m(分钟) 从字符串创建datatime64类型时,可以强制指定使用的单位。 import numpy as np a = np.datetime64('2020-03','D') print(a,a.dtype) a = np.datetime64('2020-03', 'Y') print(a, a.dtype) # 2020 datetime64[Y]

输出:

2020-03-01 datetime64[D] #单位强制变成了 D 2020 datetime64[Y] #单位强制变成的 Y

实际上,2020-03和2020-03-01代表的是同一天的时间

print(np.datetime64('2020-03') == np.datetime64('2020-03-01')) print(np.datetime64('2020-03') == np.datetime64('2020-03-02'))

输出

True False 由字符串创建datetime64数组时,如果单位不统一,则一律转化成其中最小的单位 import numpy as np a = np.array(['2020-03', '2020-03-08', '2020-03-08 20:00'], dtype = 'datetime64') print(a)

输出:

['2020-03-01T00:00' '2020-03-08T00:00' '2020-03-08T20:00'] 利用arange()创建datetime64数组,可用于生成日期范围。 import numpy as np a = np.arange('2020-08-01', '2020-08-10', dtype = np.datetime64) print(a, a.dtype)

输出:

['2020-08-01' '2020-08-02' '2020-08-03' '2020-08-04' '2020-08-05' '2020-08-06' '2020-08-07' '2020-08-08' '2020-08-09'] datetime64[D] datetime64和timedelta64运算 timedelta64 表示两个 datetime64 之间的差。timedelta64 也是带单位的,并且和相减运算中的两个 datetime64 中的较小的单位保持一致。 import numpy as np a = np.datetime64('2020-03-08') - np.datetime64('2020-03-07') print(a, a.dtype) a = np.datetime64('2020-03') + np.timedelta64(20, 'D') print(a, a.dtype)

输出:

1 days timedelta64[D] 2020-03-21 datetime64[D] numpy.datetime64 与 datetime.datetime 相互转换 import numpy as np import datetime dt = datetime.datetime(year=2020, month=6, day=1, hour=20, minute=5, second=30) dt64 = np.datetime64(dt, 's') print(dt64, dt64.dtype) # 2020-06-01T20:05:30 datetime64[s] dt2 = dt64.astype(datetime.datetime) print(dt2, type(dt2)) # 2020-06-01 20:05:30 <class 'datetime.datetime'>

输出:

2020-06-01T20:05:30 datetime64[s] 2020-06-01 20:05:30 <class 'datetime.datetime'>

datetime64的应用 为了允许在只有一周中某些日子有效的上下文中使用日期时间,Numpy中包含“busday”(工作日)功能。 numpy.busday_offset(dates, offsets, roll=‘raise’, weekmask=‘1111100’, holidays=None, busdaycal=None, out=None) 参数含义: dates:要处理的日期数组 offsets:偏移量数组 roll: {‘raise’, ‘nat’, ‘forward’, ‘following’, ‘backward’, ‘preceding’, ‘modifiedfollowing’, ‘modifiedpreceding’}, 可选参数。如何处理非有效日期的日期。默认值为‘raise’。(forward:表示向未来方向;backward:表示向过去方向。) 如果当前日期不是工作日,默认报错。可以指定forward或backward避免报错。

import numpy as np a = np.busday_offset('2020-07-11', offsets=1) # 7.11为周六 print(a) #结果报错 a = np.busday_offset('2020-07-10', offsets=1) print(a) # 2020-07-13 a = np.busday_offset('2020-07-11', offsets=0, roll='forward') b = np.busday_offset('2020-07-11', offsets=0, roll='backward') print(a) print(b) a = np.busday_offset('2020-07-11', offsets=1, roll='forward') b = np.busday_offset('2020-07-11', offsets=1, roll='backward') print(a) print(b)

输出:

2020-07-13 2020-07-13 2020-07-10 2020-07-14 2020-07-13

数组的创建

利用现有的数据来创建ndarray (1)利用array()函数进行创建 例:分别创建一维、二维和三维数组 import numpy as np # 创建一维数组 a = np.array([0, 1, 2, 3, 4]) b = np.array((0, 1, 2, 3, 4)) print(a, type(a)) print(b, type(b)) # 创建二维数组 c = np.array([[11, 12, 13, 14, 15], [16, 17, 18, 19, 20], [21, 22, 23, 24, 25], [26, 27, 28, 29, 30], [31, 32, 33, 34, 35]]) print(c, type(c)) # 创建三维数组 d = np.array([[(1.5, 2, 3), (4, 5, 6)], [(3, 2, 1), (4, 5, 6)]]) print(d, type(d))

输出:

[0 1 2 3 4] <class 'numpy.ndarray'> [0 1 2 3 4] <class 'numpy.ndarray'> [[11 12 13 14 15] [16 17 18 19 20] [21 22 23 24 25] [26 27 28 29 30] [31 32 33 34 35]] <class 'numpy.ndarray'> [[[1.5 2. 3. ] [4. 5. 6. ]] [[3. 2. 1. ] [4. 5. 6. ]]] <class 'numpy.ndarray'>

(2). 利用asarray()函数来创建 array()和asarray()都可以将结构数据转化为 ndarray,区别是:当数据源是ndarray 时,array()仍然会 copy 出一个副本,占用新的内存;asarray()不会。

import numpy as np x = np.array([[1, 1, 1], [1, 1, 1], [1, 1, 1]]) y = np.array(x) z = np.asarray(x) w = np.asarray(x, dtype=np.int) x[1][2] = 2 print(x,type(x),x.dtype) print(y,type(y),y.dtype) print(z,type(z),z.dtype) print(w,type(w),w.dtype)

输出

[[1 1 1] [1 1 2] [1 1 1]] <class 'numpy.ndarray'> int32 [[1 1 1] [1 1 1] [1 1 1]] <class 'numpy.ndarray'> int32 [[1 1 1] [1 1 2] [1 1 1]] <class 'numpy.ndarray'> int32 [[1 1 1] [1 1 2] [1 1 1]] <class 'numpy.ndarray'> int32

(3). 利用fromfunction()函数进行创建 例:通过在坐标上执行一个函数来构造数组

import numpy as np def f(x, y): return 10 * x + y x = np.fromfunction(f, (5, 4), dtype=int) print(x) x = np.fromfunction(lambda i, j: i == j, (3, 3), dtype=int) print(x) x = np.fromfunction(lambda i, j: i + j, (3, 3), dtype=int) print(x)

输出

[[ 0 1 2 3] [10 11 12 13] [20 21 22 23] [30 31 32 33] [40 41 42 43]] [[ True False False] [False True False] [False False True]] [[0 1 2] [1 2 3] [2 3 4]] 根据ones和zeros填充方式 (1). 零数组 zeros()函数:返回给定形状和类型的零数组。 zeros_like()函数:返回与给定数组形状和类型相同的零数组 import numpy as np x = np.zeros(5) print(x) x = np.zeros([2, 3]) print(x) x = np.array([[1, 2, 3], [4, 5, 6]]) y = np.zeros_like(x) print(y)

输出:

[0. 0. 0. 0. 0.] [[0. 0. 0.] [0. 0. 0.]] [[0 0 0] [0 0 0]]

(2). 1数组 ones()函数:返回给定形状和类型的1数组 ones_like()函数:返回与给定数组形状和类型相同的1数组

import numpy as np x = np.ones(5) print(x) # [1. 1. 1. 1. 1.] x = np.ones([2, 3]) print(x) x = np.array([[1, 2, 3], [4, 5, 6]]) y = np.ones_like(x) print(y)

输出:

[1. 1. 1. 1. 1.] [[1. 1. 1.] [1. 1. 1.]] [[1 1 1] [1 1 1]]

(3). 空数组 empty()函数:返回一个空数组,数组元素为随机数 empty_like函数:返回与给定数组具有相同形状和类型的新数组

import numpy as np x = np.empty(5) print(x) x = np.empty((3, 2)) print(x) x = np.array([[1, 2, 3], [4, 5, 6]]) y = np.empty_like(x) print(y)

输出

[0. 0. 0. 0. 0.] [[0. 0.] [0. 0.] [0. 0.]] [[7471207 7143521 4587552] [7077993 7536741 2621472]]

(4). 单位数组 eye()函数:返回一个对角线上为1,其它地方为零的单位数组 identity()函数:返回一个方的单位数组

import numpy as np x = np.eye(4) print(x) x = np.eye(2, 3) print(x) x = np.identity(4) print(x)

输出

[[1. 0. 0. 0.] [0. 1. 0. 0.] [0. 0. 1. 0.] [0. 0. 0. 1.]] [[1. 0. 0.] [0. 1. 0.]] [[1. 0. 0. 0.] [0. 1. 0. 0.] [0. 0. 1. 0.] [0. 0. 0. 1.]]

(5). 对角数组 diag()函数:提取对角线或构造对角数组

import numpy as np x = np.arange(9).reshape((3, 3)) print(x) print(np.diag(x)) # [0 4 8] print(np.diag(x, k=1)) # [1 5] print(np.diag(x, k=-1)) # [3 7] v = [1, 3, 5, 7] x = np.diag(v) print(x)

输出:

[[0 1 2] [3 4 5] [6 7 8]] [0 4 8] [1 5] [3 7] [[1 0 0 0] [0 3 0 0] [0 0 5 0] [0 0 0 7]]

(6). 常数数组 full()函数:返回一个常数数组 full_like()函数:返回与给定数组具有相同形状和类型的常数数组

import numpy as np x = np.full(2, 7) print(x) x = np.full((2, 7), 7) print(x) x = np.array([[1, 2, 3], [4, 5, 6]]) y = np.full_like(x, 7) print(y)

输出:

[7 7] [[7 7 7 7 7 7 7] [7 7 7 7 7 7 7]] [[7 7 7] [7 7 7]] 利用数值范围来创建数组 arange()函数:返回给定间隔内的均匀间隔的值 linspace()函数:返回指定间隔内的等间隔数字 logspace()函数:返回数以对数刻度均匀分布 numpy.random.rand() 返回一个由[0,1)内的随机数组成的数组 import numpy as np x = np.arange(5) print(x) x = np.arange(3, 7, 2) print(x) x = np.linspace(start=0, stop=2, num=9) print(x) x = np.logspace(0, 1, 5) print(np.around(x, 2)) #np.around 返回四舍五入后的值,可指定精度 x = np.linspace(start=0, stop=1, num=5) x = [10 ** i for i in x] print(np.around(x, 2)) x = np.random.random(5) print(x) x = np.random.random([2, 3]) print(x)

输出:

[0 1 2 3 4] [3 5] [0. 0.25 0.5 0.75 1. 1.25 1.5 1.75 2. ] [ 1. 1.78 3.16 5.62 10. ] [ 1. 1.78 3.16 5.62 10. ] [0.60621762 0.01844608 0.82116907 0.57071932 0.18629851] [[0.7274693 0.97445186 0.90204432] [0.08303323 0.2520763 0.462612 ]] 结构数组的创建 结构数组,首先需要定义结构,然后利用np.array()来创建数组,其参数dtype为定义的结构。 (1). 利用字典来定义结构 import numpy as np personType = np.dtype({ 'names':['name', 'age', 'weight'], 'formats':['U30', 'i8', 'f8'] }) a = np.array([('Liming', 24, 63.9), ('Mike', 15, 67.), ('Jan', 34, 45.8)], dtype = personType) print(a, type(a))

输出

[('Liming', 24, 63.9) ('Mike', 15, 67. ) ('Jan', 34, 45.8)] <class 'numpy.ndarray'>

(2)利用包含多个元组的列表来定义结构

import numpy as np personType = np.dtype([('name', 'U30'), ('age', 'i8'), ('weight', 'f8')]) a = np.array([('Liming', 24, 63.9), ('Mike', 15, 67.), ('Jan', 34, 45.8)], dtype=personType) print(a, type(a)) print(a[0]) print(a[-2:]) # 我们可以使用字段名作为下标获取对应的值 print(a['name']) # ['Liming' 'Mike' 'Jan'] print(a['age']) # [24 15 34] print(a['weight']) # [63.9 67. 45.8

输出

[('Liming', 24, 63.9) ('Mike', 15, 67. ) ('Jan', 34, 45.8)] <class 'numpy.ndarray'> ('Liming', 24, 63.9) [('Mike', 15, 67. ) ('Jan', 34, 45.8)] ['Liming' 'Mike' 'Jan'] [24 15 34] [63.9 67. 45.8] 数组的属性 numpy.ndarray.ndim用于返回数组的维数(轴的个数)也称为秩,一维数组的秩为 1,二维数组的秩为 2,以此类推 numpy.ndarray.shape表示数组的维度,返回一个元组,这个元组的长度就是维度的数目,即 ndim 属性(秩) numpy.ndarray.size数组中所有元素的总量,相当于数组的shape中所有元素的乘积,例如矩阵的元素总量为行与列的乘积 numpy.ndarray.dtype ndarray 对象的元素类型 numpy.ndarray.itemsize以字节的形式返回数组中每一个元素的大小 import numpy as np b = np.array([[1, 2, 3], [4, 5, 6.0]]) print(b.shape) print(b.dtype) print(b.size) print(b.ndim) print(b.itemsize)

输出:

(2, 3) float64 6 2 8 副本与视图 在 Numpy 中,尤其是在做数组运算或数组操作时,返回结果不是数组的 副本 就是 视图。在 Numpy 中,所有赋值运算不会为数组和数组中的任何元素创建副本,numpy.ndarray.copy() 函数创建一个副本。 对副本数据进行修改,不会影响到原始数据,它们物理内存不在同一位置。 import numpy as np x = np.array([1, 2, 3, 4, 5, 6, 7, 8]) y = x y[0] = -1 print(x) print(y) x = np.array([1, 2, 3, 4, 5, 6, 7, 8]) y = x.copy() y[0] = -1 print(x) print(y)

输出:

[-1 2 3 4 5 6 7 8] [-1 2 3 4 5 6 7 8] [1 2 3 4 5 6 7 8] [-1 2 3 4 5 6 7 8]
最新回复(0)