时间:2023-03-13 12:12:28 | 栏目:Python代码 | 点击:次
在上一期python numpy 模块中对概述介绍了numpy 模块安装、使用方法、特点等入门知识。
Pandas
、Scipy
、scikit-learn
等科学Python中。ndarray
,以及对其进行有效操作的方法。众所周知,numpy 模块中数组对象是其核心功能,我们本期重点来学习numpy 数组相关内容,
数组是numpy 模块核心数据结构。数组是值的网络,它的内部包含有原始数据、如何定义元素以及如何解释元素的信息。我们可以使用各种方式索引元素网格。
ndarray 是 numpy 模块中定义 n维数组类型。ndarray 可以描述同种类型project的集合。
从数组中我们可以提取python对象表示的如索引是numpy 内置数组标量类型之一,我们可以通过使用数组标量来轻松操作复杂的数据排列。
通过以上ndarray 内部结构,我们可以看到 ndarray
主要由 dtype
、shape
、stride
组成
以上四个python
对象就可以在ndarray 中通过索引的方式找到指定位置的数据。
同时我们也调用np.array().flags
获取字节序、读写权限等信息,可知ndarray
底层是C和Fortran 实现的。
C_CONTIGUOUS : True F_CONTIGUOUS : False OWNDATA : True WRITEABLE : True ALIGNED : True WRITEBACKIFCOPY : False UPDATEIFCOPY : False
我们通过numpy.array
方法创建一个2维数组
numpy.array(object, dtype = None, copy = True, order = None, subok = False, ndmin = 0)
import numpy as np a = np.array([[1,2],[4,5],[7,8]]) print("dim:",a.ndim) print("strides:",a.strides) print("dtype:",a.dtype) print("data:",a.data) print("shape:",a.shape) print(a)
通过array
对象调用ndarray
标量对象,可以获知ndarray
维度大小、元素类型、间隔等信息
通过上述图,我们可以知道 ndarray 内存主要划分为两部分:
ndarray
要求所有数据都是同种类型的
所以,综上所述,ndarray
查找数据运行效率比list快,同时ndarray
存储的数据是连续的一段空间,对比list 对象物理地址分散的,ndarray 比 list 更省空间。
总结:
本期对numpy 模块核心之一的ndarray 数组对象内存原理、与python list对比等知识学习。
ndarray 里的所有的project元素都是同类型数据,并且存储空间是连续的。
不管查找数据,还是存储数据,数据计算等功能,都明显优于Python list。