def get_source_data():
DataPath
= '固定路径XXXXXXX'
train1
= pd
.read_csv
(os
.path
.join
(DataPath
, 'XXXXXX.csv'),
parse_dates
=['Date_received', 'Date'])
train2
= pd
.read_csv
(os
.path
.join
(DataPath
, 'XXXXX.csv'), parse_dates
=['Date_received', 'Date'])
test
= pd
.read_csv
(os
.path
.join
(DataPath
, 'XXXXX.csv'), parse_dates
=['Date_received'])
return XXXX
os.path.join()函数:连接两个或更多的路径名组件
1.如果各组件名首字母不包含’/’,则函数会自动加上
2.如果有一个组件是一个绝对路径,则在它之前的所有组件均会被舍弃
3.如果最后一个组件为空,则生成的路径以一个’/’分隔符结尾
其中read_csv(),parse_dates=[‘Date_received’, ‘Date’] 可以对日期型数据进行处理。但会使得加载速度变慢。 如果写成parse_dates=[ [‘Date_received’, ‘Date’] ] 则会将两列的字符串先合并后解析,作为