csv 数据导入及分析（用pyhton实现感知器算法记录）

it2024-01-27 116

import pandas as pd

pd.read_csv(文件路径)就得到dataframe数据了，但是文件路径要将文件的后缀名加上比如说 csv 比如说 txt

得到dataframe 数据类型之后，我们可以知道它有 index 索引性质有 label 标签性质，这样我就可以对不同的列和行进行自己的处理

具体的处理方式可以上 pandas 官网，里面有tutorial 可以查，挺好用的，比这些个博客

https://pandas.pydata.org/

然后当以pandas库的处理完之后进行数据运算的时候，就要返回为 numpy 数据类型了

pandas》》》》》numpy

datax=np.array(trainx)

numpy》》》》》pandas

df = pd.DataFrame(data, columns=iris.feature_names)

后续 numpy 的一些常用函数例子

>>> np.zeros(5) array([ 0., 0., 0., 0., 0.]) >>> np.zeros((5,), dtype=np.int) array([0, 0, 0, 0, 0]) >>> np.zeros((2, 1)) array([[ 0.], [ 0.]]) >>> s = (2,2) >>> np.zeros(s) array([[ 0., 0.], [ 0., 0.]]) >>> np.zeros((2,), dtype=[('x', 'i4'), ('y', 'i4')]) # custom dtype array([(0, 0), (0, 0)], dtype=[('x', '<i4'), ('y', '<i4')]) >>> np.ones(5) array([ 1., 1., 1., 1., 1.]) >>> np.ones((5,), dtype=np.int) array([1, 1, 1, 1, 1]) >>> np.ones((2, 1)) array([[ 1.], [ 1.]]) >>> s = (2,2) >>> np.ones(s) array([[ 1., 1.], [ 1., 1.]])

pandas 的reshape（）

reshape（行，列）可以根据指定的数值将数据转换为特定的行数和列数，这个好理解，就是转换成矩阵。

然而，在实际使用中，特别是在运用函数的时候，系统经常会提示是否需要对数据使用reshape(1,-1)或者reshape(-1,1)进行转换，那这两个转换是什么意思呢？难道还有-1行的数据？跟进numpy库官网的介绍，这里的-1被理解为unspecified value，意思是未指定为给定的。如果我只需要特定的行数，列数多少我无所谓，我只需要指定行数，那么列数直接用-1代替就行了，计算机帮我们算赢有多少列，反之亦然。

所以-1在这里应该可以理解为一个正整数通配符，它代替任何整数。

还有就是要注意你的label 到底是 -1,1还是0,1，感知器算法就要求是 -1,1，这样的话你就需要进行转换了

机器学习模型评估指标

https://zhuanlan.zhihu.com/p/86120987?from_voters_page=true

最新回复(0)