Python数据分析 知识量:13 - 56 - 232
pandas模块具有两种主要的数据结构:
Series
DataFrame
其中,Series数据结构类似于NumPy的一维数组对象,由一组数据和索引组成。下面是一个Series数据结构的示例:
0 a 1 b 2 c dtype: object
第一列0~2称为索引或数据标签;第二列a~c是真正的数据。索引与数据一一对应。
1、使用pd.Serise()函数来创建Series数据对象,参数可以为一个列表:
import pandas as pd ss=pd.Series(['a','b','c']) print(ss)
运行结果为:
0 a 1 b 2 c dtype: object
2、指定索引。
不指定索引的话,Series数据对象默认以0开始。也可以通过设置index参数指定索引:
import pandas as pd ss=pd.Series(['a','b','c'],index=[4,5,6]) print(ss)
运行结果为:
4 a 5 b 6 c dtype: object
3、利用字典创建Series数据对象。
可以将一个字典作为参数传给Serise()函数,字典的key值将成为索引,value值将成为数据值。
import pandas as pd dic={1:'apple',2:'pear',3:'banana'} ss=pd.Series(dic) print(ss)
运行结果为:
1 apple 2 pear 3 banana dtype: object
使用index方法获取Series对象的所有索引。对于默认索引和指定索引创建的数据对象,显示结果有所不同。
import pandas as pd ss=pd.Series(['a','b','c']) print(ss.index) ss=pd.Series(['a','b','c'],index=[4,5,6]) print(ss.index) dic={1:'apple',2:'pear',3:'banana'} ss=pd.Series(dic) print(ss.index)
运行结果为:
RangeIndex(start=0, stop=3, step=1) Int64Index([4, 5, 6], dtype='int64') Int64Index([1, 2, 3], dtype='int64')
使用values方法获取Series对象的所有值。
import pandas as pd ss=pd.Series(['a','b','c']) print(ss.values) ss=pd.Series(['a','b','c'],index=[4,5,6]) print(ss.values) dic={1:'apple',2:'pear',3:'banana'} ss=pd.Series(dic) print(ss.values)
运行结果为:
['a' 'b' 'c'] ['a' 'b' 'c'] ['apple' 'pear' 'banana']
除了使用values方法获取Series对象的所有值以外,完全可以像数组那样,通过下标获得其某个值。
import pandas as pd dic={1:'apple',2:'pear',3:'banana'} ss=pd.Series(dic) print(ss[2])
运行结果为:
pear
Copyright © 2017-Now pnotes.cn. All Rights Reserved.
编程学习笔记 保留所有权利
MARK:3.0.0.20240214.P35
From 2017.2.6