关于pandas的时间索引问题


  

同一日期的不同写法进行索引会得到同样的结果

通过“年”或“年月”可以轻松切片

使用日期进行切片只对Series有效

通过groupby去除重复索引

 0
 

创建一个数据框,数据框的index是时间戳,columns的第一个字段名是平常的字符串'col',第二个字段是与时间戳相关的'2015'

 

以时间段'2015'索引数据框:

本应该返回2015年的所有行,但返回的是一个Series对象,即,返回了colunmsΦ'2015'字段的那一列 可以说是如果命名冲突,DataFrame优先索引columns而不是index。结果如下:

返回一个所有时间索引在2015年的子数据框:

以时间段'2014'索引数据框:

正常返回時间索引在2014年的数据行组成的数据框由于colunms中没有'2015'这个字段,所以直接按照index索引

总结:如果columns字段名与index中有冲突,优先索引columns中的字段名的那┅列;否则索引index



我们想要将上面的日期再加上時间信息,组成新的索引访问数据。例如:访问 09:35:00 这一分钟的数据具体操作如下:

能够正确获取某一分钟的数据:

我要回帖

 

随机推荐