csv 数据导入及分析(用pyhton实现感知器算法记录)

it2024-01-27  86

import pandas as pd

pd.read_csv(文件路径)就得到dataframe数据了 ,但是 文件路径要将文件的后缀名 加上 比如说 csv 比如说 txt

得到dataframe 数据类型之后,我们可以知道 它有 index 索引性质 有 label 标签性质,这样我就可以对 不同的列和行进行自己的处理

具体的处理方式 可以 上 pandas 官网,里面有tutorial 可以查,挺好用的,比这些个博客

https://pandas.pydata.org/

然后当以pandas库的处理完之后 进行数据 运算的时候,就要返回为 numpy 数据类型了

pandas》》》》》numpy

datax=np.array(trainx)

numpy》》》》》pandas

df = pd.DataFrame(data, columns=iris.feature_names)

后续 numpy 的一些常用函数例子

>>> np.zeros(5) array([ 0., 0., 0., 0., 0.]) >>> np.zeros((5,), dtype=np.int) array([0, 0, 0, 0, 0]) >>> np.zeros((2, 1)) array([[ 0.], [ 0.]]) >>> s = (2,2) >>> np.zeros(s) array([[ 0., 0.], [ 0., 0.]]) >>> np.zeros((2,), dtype=[('x', 'i4'), ('y', 'i4')]) # custom dtype array([(0, 0), (0, 0)], dtype=[('x', '<i4'), ('y', '<i4')]) >>> np.ones(5) array([ 1., 1., 1., 1., 1.]) >>> np.ones((5,), dtype=np.int) array([1, 1, 1, 1, 1]) >>> np.ones((2, 1)) array([[ 1.], [ 1.]]) >>> s = (2,2) >>> np.ones(s) array([[ 1., 1.], [ 1., 1.]])

pandas 的reshape()

reshape(行,列)可以根据指定的数值将数据转换为特定的行数和列数,这个好理解,就是转换成矩阵。

然而,在实际使用中,特别是在运用函数的时候,系统经常会提示是否需要对数据使用reshape(1,-1)或者reshape(-1,1)进行转换,那这两个转换是什么意思呢?难道还有-1行的数据? 跟进numpy库官网的介绍,这里的-1被理解为unspecified value,意思是未指定为给定的。如果我只需要特定的行数,列数多少我无所谓,我只需要指定行数,那么列数直接用-1代替就行了,计算机帮我们算赢有多少列,反之亦然。

所以-1在这里应该可以理解为一个正整数通配符,它代替任何整数。

还有就是要注意 你的label 到底是 -1,1还是0,1,感知器算法就要求是 -1,1,这样的话你就需要进行转换了

机器学习模型评估指标

https://zhuanlan.zhihu.com/p/86120987?from_voters_page=true

最新回复(0)