numpy学习回顾-数据类型及数组创建

it2023-09-18 114

* 依据Datawhale的Numpy教程做相应整理

文章目录

数据类型python数组的创建依据现有数据创建ndarray1.array()和asarray()的区别。通过fromfunction()函数创建ndarray依据依据ones和zeros填充方式不同常数类型数组利用数值范围来创建 ndarray**结构数组的创建**数组属性

数据类型

常见数据类型每个内建类型都有一个唯一定义它的字符代码，如下：

python数组的创建

ndarray是numpy提供的最重要的数据结构，是python中list的拓展。在ndarray 中所有元素必须是同一类型，否则会自动向下转换，int->float->str 。

依据现有数据创建ndarray

1.array()和asarray()的区别。

array和asarray都可以将结构数据转化为ndarray，但是主要区别就是当数据源是ndarray时，array()仍然会copy出一个副本，占用新的内存，但asarray()不会。

import numpy as np a = np.array([1,2,3])#切记一定数据源是ndarray b = np.array(a) c = np.asarray(a) a[1] = 9 print(a,type(a)) print(b,type(b)) print(c,type(c))

通过fromfunction()函数创建ndarray

应用：给函数绘图可能会用到fromfunction()，该函数可从函数中创建函数 def fromfunction(function, shape, **kwargs): 通过在每个坐标轴上执行一个函数来构造数组

import numpy as np def f(x, y): return 10 * x + y x = np.fromfunction(f, (2, 3), dtype=int) #自定义函数形式 print(x) ''' [[ 0 1 2] [10 11 12]] ''' x = np.fromfunction(lambda i, j: i == j, (3, 3), dtype=int) #lambda函数形式 print(x) ''' [[ True False False] [False True False] [False False True]] ''' x = np.fromfunction(lambda i, j: i+j, (2,2)) print(x,x.dtype) ''' [[0. 1.] [1. 2.]] float64 '''

依据依据ones和zeros填充方式

背景：在机器学习任务中常做的事就是初始化参数，需要用常数值或者随机值来创建一个固定大小的矩阵。

不同常数类型数组

a.零数组

zeros() 函数：返回给定形状和类型的零数组。zeros_like() 函数：返回与给定数组形状和类型相同的零数组。

b.1数组

ones() 函数：返回给定形状和类型的1数组。ones_like() 函数：返回与给定数组形状和类型相同的1数组。

c.空数组

empty() 函数：返回一个空数组，数组元素为随机数。empty_like 函数：返回与给定数组具有相同形状和类型的新数组。注：直接分配了一块未被清空的内存，数组元素为随机值，所以速度快一点，但要求用户手动设定数组的值

d.单位数组

eye() 函数：返回一个对角线上为1，其它地方为零的单位数组。identity() 函数：返回一个方的单位数组。

e.对角数组

diag() 函数：提取对角线或构造对角数组。 def diag(v, k=0): #k=1为右上偏移，k=-1为左下偏移 import numpy as np x = np.arange(9).reshape((3, 3)) print(x) # [[0 1 2] # [3 4 5] # [6 7 8]] print(np.diag(x)) # [0 4 8] print(np.diag(x, k=1)) # [1 5] print(np.diag(x, k=-1)) # [3 7] print(np.diag(x, k=2))#[2] v = [1, 3, 5, 7] x = np.diag(v) print(x) # [[1 0 0 0] # [0 3 0 0] # [0 0 5 0] # [0 0 0 7]]

f.常数数组

full(shape, fill_value) 函数：返回一个常数数组。full_like(a, fill_value) 函数：返回与给定数组具有相同形状和类型的常数数组。

利用数值范围来创建 ndarray

arange() 函数：返回给定间隔内的均匀间隔的值。（间隔）注意是左开右闭linspace() 函数：返回指定间隔内的等间隔数字。（间隙）logspace() 函数：返回数以对数刻度均匀分布。numpy.random.rand() 返回一个由[0,1)内的随机数组成的数组。

def arange([start,] stop[, step,], dtype=None): 注：参数中的[]表示可选如：b[, c][,d] 表示，c或d可选 def linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None, axis=0): def logspace(start, stop, num=50, endpoint=True, base=10.0, dtype=None, axis=0): def rand(d0, d1, …, dn):

import numpy as np x = np.arange(5) print(x) # [0 1 2 3 4] x = np.arange(3, 7, 2) print(x) # [3 5] x = np.linspace(start=0, stop=2, num=9) print(x) # [0. 0.25 0.5 0.75 1. 1.25 1.5 1.75 2. ] x = np.logspace(0, 1, 5) print(np.around(x, 2)) # [ 1. 1.78 3.16 5.62 10. ] #np.around 返回四舍五入后的值，可指定精度。 # around(a, decimals=0, out=None) # a 输入数组 # decimals 要舍入的小数位数。默认值为0。如果为负，整数将四舍五入到小数点左侧的位置 x = np.linspace(start=0, stop=1, num=5) x = [10 ** i for i in x] print(np.around(x, 2)) # [ 1. 1.78 3.16 5.62 10. ] x = np.random.random(5) print(x) # [0.41768753 0.16315577 0.80167915 0.99690199 0.11812291] x = np.random.random([2, 3]) print(x) # [[0.41151858 0.93785153 0.57031309] # [0.13482333 0.20583516 0.45429181]]

结构数组的创建

有料：结构数组，首先定义结构，然后利用np.array()创建数组，其参数dtype为定义的结构。 a.利用字典定义结构 np.dtype({‘names’: [‘x1’,‘x2’,‘x3’], ‘formats’: [‘format1’, ‘format2’, ‘format3’]}) b.利用包含多个元组的列表来定义结构 np.dtype([(‘name1’, ‘format1’), (‘name2’, ‘format2’)])

import numpy as np #对比1 personType = np.dtype({ 'names': ['name', 'age', 'weight'], 'formats': ['U30', 'i8', 'f8']}) a = np.array([('Liming', 24, 63.9), ('Mike', 15, 67.), ('Jan', 34, 45.8)], dtype=personType) print(a, type(a), a.dtype) # [('Liming', 24, 63.9) ('Mike', 15, 67. ) ('Jan', 34, 45.8)] # <class 'numpy.ndarray'> #[('name', '<U30'), ('age', '<i8'), ('weight', '<f8')] #对比2 personType = np.dtype([('name', 'U30'), ('age', 'i8'), ('weight', 'f8')]) a = np.array([('Liming', 24, 63.9), ('Mike', 15, 67.), ('Jan', 34, 45.8)], dtype=personType) print(a, type(a), a.dtype) # [('Liming', 24, 63.9) ('Mike', 15, 67. ) ('Jan', 34, 45.8)] # <class 'numpy.ndarray'> #[('name', '<U30'), ('age', '<i8'), ('weight', '<f8')] #综合 # 结构数组的取值方式和一般数组差不多，可以通过下标取得元素： print(a[0]) # ('Liming', 24, 63.9) print(a[-2:]) # [('Mike', 15, 67. ) ('Jan', 34, 45.8)] # 我们可以使用字段名作为下标获取对应的值 print(a['name']) # ['Liming' 'Mike' 'Jan'] print(a['age']) # [24 15 34] print(a['weight']) # [63.9 67. 45.8]

数组属性

numpy.ndarray.ndim 用于返回数组的维数（轴的个数）也称为秩，一维数组的秩为1，二维数组的秩为2，以此类推。numpy.ndarray.shape 表示数组的维度，返回一个元组，这个元组的长度就是维度的数目，即ndim 属性(秩)。numpy.ndarray.size 数组中所有元素的总量，相当于数组的shape 中所有元素的乘积，例如矩阵的元素总量为行与列的乘积。numpy.ndarray.dtype ndarray 对象的元素类型。numpy.ndarray.itemsize 以字节的形式返回数组中每一个元素的大小。

最新回复(0)