Python数据分析

Python数据分析 知识量:13 - 56 - 232

2.1 ndarray多维数组><

ndarray数组概述- 2.1.1 -

ndarray是一个多维数组对象,该数组只能存放同一种类型的元素。元素类型一致就可以轻松计算出所需存储空间的大小,更重要的是能够运用向量化运算来处理整个数组,即不需要循环数组元素,可以面向数组对其元素进行批量操作。

ndarray数组由两部分组成:实际数据和元数据。

实际数据就是元素的值,存储在连续的内存块中。当大型数据集作为ndarray数组进行加载时,需要注意有没有足够多的连续内存块。

元数据就是数据的数据,描述的是数组和元素的信息。NumPy中的大部分数组方法和函数都不会直接修改实际数据,而只能修改元数据。

函数range()- 2.1.2 -

生成ndarray数组前,先来熟悉一个常用的函数range()。

range()函数是Python内置函数,其返回值是一个可迭代对象。

range()函数语法为:range(stop)或range(start,stop[,step])。

  • start 表示开始值,包含在内;

  • stop 表示结束值,但不包含在内;

  • step 表示步长,但属于可选项,默认为1。

arr=range(5)
print(arr)
for i in arr:
    print(i)
#
arr=range(0,10,2)
print(arr)
for i in arr:
    print(i)

运行结果为:

range(0, 5)
0
1
2
3
4
range(0, 10, 2)
0
2
4
6
8

range()函数返回的对象不是列表类型,打印的时候不会打印列表。但是可以使用list()函数,将其转换为列表。

arr=range(5)
li=list(arr)
print(li)
#
arr=range(0,10,2)
li=list(arr)
print(li)

运行结果为:

[0, 1, 2, 3, 4]
[0, 2, 4, 6, 8]

python.array- 2.1.3 -

Python本身提供了array模块,但其只支持一维数组,不支持多维数组,同时缺乏各种运算函数,因此不适合数值运算。而NumPy模块提供的ndarray数组功能强大,numpy.array完全取代了python.array的地位。