当前位置:首页 > 技术分析 > 正文内容

【Python核武器】:Numpy深度攻略!(一)

ruisui882个月前 (03-16)技术分析23

NumPy - 简介

NumPy 是一个 Python 包。 它代表 “Numeric Python”。 它是一个由多维数组对象和用于处理数组的例程集合组成的库。

Numeric,即 NumPy 的前身,是由 Jim Hugunin 开发的。 也开发了另一个包 Numarray ,它拥有一些额外的功能。 2005年,Travis Oliphant 通过将 Numarray 的功能集成到 Numeric 包中来创建 NumPy 包。 这个开源项目有很多贡献者。

NumPy 操作

使用NumPy,开发人员可以执行以下操作:

  • 数组的算数和逻辑运算。
  • 傅立叶变换和用于图形操作的例程。
  • 与线性代数有关的操作。 NumPy 拥有线性代数和随机数生成的内置函数。

NumPy – MatLab 的替代之一

NumPy 通常与 SciPy(Scientific Python)和 Matplotlib(绘图库)一起使用。 这种组合广泛用于替代 MatLab,是一个流行的技术计算平台。 但是,Python 作为 MatLab 的替代方案,现在被视为一种更加现代和完整的编程语言。

NumPy 是开源的,这是它的一个额外的优势。

NumPy - Ndarray 对象

NumPy 中定义的最重要的对象是称为 ndarray 的 N 维数组类型。 它描述相同类型的元素集合。 可以使用基于零的索引访问集合中的项目。

ndarray中的每个元素在内存中使用相同大小的块。 ndarray中的每个元素是数据类型对象的对象(称为 dtype)。

从ndarray对象提取的任何元素(通过切片)由一个数组标量类型的 Python 对象表示。 下图显示了ndarray,数据类型对象(dtype)和数组标量类型之间的关系。

Ndarray

ndarray类的实例可以通过本教程后面描述的不同的数组创建例程来构造。 基本的ndarray是使用 NumPy 中的数组函数创建的,如下所示:

 
numpy.array 
 

它从任何暴露数组接口的对象,或从返回数组的任何方法创建一个ndarray。

numpy.array(object, dtype = None, copy = True, order = None, subok = False, ndmin = 0)


  • 上面的构造器接受以下参数:

    序号

    参数及描述

    1.

    object 任何暴露数组接口方法的对象都会返回一个数组或任何(嵌套)序列。

    2.

    dtype 数组的所需数据类型,可选。

    3.

    copy 可选,默认为true,对象是否被复制。

    4.

    order C(按行)、F(按列)或A(任意,默认)。

    5.

    subok 默认情况下,返回的数组被强制为基类数组。 如果为true,则返回子类。

    6.

    ndmin 指定返回数组的最小维数。

    看看下面的例子来更好地理解。

    示例 1

     
    import numpy as np 
    a = np.array([1,2,3])  
    print a

    输出如下:

    [1, 2, 3]
    

    示例 2

     
    # 多于一个维度  
    import numpy as np 
    a = np.array([[1,  2],  [3,  4]])  
    print a

    输出如下

    [[1, 2] 
     [3, 4]]
     

    示例 3

     
    # 最小维度  
    import numpy as np 
    a = np.array([1,  2,  3,4,5], ndmin =  2)  
    print a

    输出如下:

    [[1, 2, 3, 4, 5]]
     

    示例 4

     
    # dtype 参数  
    import numpy as np 
    a = np.array([1,  2,  3], dtype = complex)  
    print a

    输出如下:

    [ 1.+0.j,  2.+0.j,  3.+0.j]
     

    **ndarray ** 对象由计算机内存中的一维连续区域组成,带有将每个元素映射到内存块中某个位置的索引方案。 内存块以按行(C 风格)或按列(FORTRAN 或 MatLab 风格)的方式保存元素。


    NumPy - 数据类型

    NumPy 支持比 Python 更多种类的数值类型。 下表显示了 NumPy 中定义的不同标量数据类型。

    序号

    数据类型及描述

    1.

    bool_ 存储为一个字节的布尔值(真或假)

    2.

    int_ 默认整数,相当于 C 的long,通常为int32或int64

    3.

    intc 相当于 C 的int,通常为int32或int64

    4.

    intp 用于索引的整数,相当于 C 的size_t,通常为int32或int64

    5.

    int8 字节(-128 ~ 127)

    6.

    int16 16 位整数(-32768 ~ 32767)

    7.

    int32 32 位整数(-2147483648 ~ 2147483647)

    8.

    int64 64 位整数(-9223372036854775808 ~ 9223372036854775807)

    9.

    uint8 8 位无符号整数(0 ~ 255)

    10.

    uint16 16 位无符号整数(0 ~ 65535)

    11.

    uint32 32 位无符号整数(0 ~ 4294967295)

    12.

    uint64 64 位无符号整数(0 ~ 18446744073709551615)

    13.

    float_ float64的简写

    14.

    float16 半精度浮点:符号位,5 位指数,10 位尾数

    15.

    float32 单精度浮点:符号位,8 位指数,23 位尾数

    16.

    float64 双精度浮点:符号位,11 位指数,52 位尾数

    17.

    complex_ complex128的简写

    18.

    complex64 复数,由两个 32 位浮点表示(实部和虚部)

    19.

    complex128 复数,由两个 64 位浮点表示(实部和虚部)

    NumPy 数字类型是dtype(数据类型)对象的实例,每个对象具有唯一的特征。 这些类型可以是np.bool_,np.float32等。

    数据类型对象 (dtype)

    数据类型对象描述了对应于数组的固定内存块的解释,取决于以下方面:

    • 数据类型(整数、浮点或者 Python 对象)
    • 数据大小
    • 字节序(小端或大端)
    • 在结构化类型的情况下,字段的名称,每个字段的数据类型,和每个字段占用的内存块部分。
    • 如果数据类型是子序列,它的形状和数据类型。

    字节顺序取决于数据类型的前缀<或>。 <意味着编码是小端(最小有效字节存储在最小地址中)。>意味着编码是大端(最大有效字节存储在最小地址中)。

    dtype可由以下语法构造:

    numpy.dtype(object, align, copy)
     

    参数为:

    • Object:被转换为数据类型的对象。
    • Align:如果为true,则向字段添加间隔,使其类似 C 的结构体。
    • Copy ? 生成dtype对象的新副本,如果为flase,结果是内建数据类型对象的引用。

    示例 1

     
    # 使用数组标量类型  
    import numpy as np 
    dt = np.dtype(np.int32)  
    print dt

    输出如下:

    int32
    

    示例 2

     
    #int8,int16,int32,int64 可替换为等价的字符串 'i1','i2','i4',以及其他。  
    import numpy as np 
     
    dt = np.dtype('i4')  
    print dt 

    输出如下:

    int32
     

    示例 3

     
    # 使用端记号  
    import numpy as np 
    dt = np.dtype('>i4')  
    print dt

    输出如下:

    >i4
     

    下面的例子展示了结构化数据类型的使用。 这里声明了字段名称和相应的标量数据类型。

    示例 4

     
    # 首先创建结构化数据类型。  
    import numpy as np 
    dt = np.dtype([('age',np.int8)])  
    print dt 

    输出如下:

    [('age', 'i1')] 
     

    示例 5

     
    # 现在将其应用于 ndarray 对象  
    import numpy as np 
     
    dt = np.dtype([('age',np.int8)]) 
    a = np.array([(10,),(20,),(30,)], dtype = dt)  
    print a

    输出如下:

    [(10,) (20,) (30,)]
     

    示例 6

     
    # 文件名称可用于访问 age 列的内容  
    import numpy as np 
     
    dt = np.dtype([('age',np.int8)]) 
    a = np.array([(10,),(20,),(30,)], dtype = dt)  
    print a['age']

    输出如下:

    [10 20 30]
     

    示例 7

    以下示例定义名为 student 的结构化数据类型,其中包含字符串字段name,整数字段age和浮点字段marks。 此dtype应用于ndarray对象。

     
    import numpy as np 
    student = np.dtype([('name','S20'),  ('age',  'i1'),  ('marks',  'f4')])  
    print student

    输出如下:

    [('name', 'S20'), ('age', 'i1'), ('marks', '<f4')])
     

    示例 8

     
    import numpy as np 
     
    student = np.dtype([('name','S20'),  ('age',  'i1'),  ('marks',  'f4')]) 
    a = np.array([('abc',  21,  50),('xyz',  18,  75)], dtype = student)  
    print a

    输出如下:

    [('abc', 21, 50.0), ('xyz', 18, 75.0)]
     

    每个内建类型都有一个唯一定义它的字符代码:

    • 'b':布尔值
    • 'i':符号整数
    • 'u':无符号整数
    • 'f':浮点
    • 'c':复数浮点
    • 'm':时间间隔
    • 'M':日期时间
    • 'O':Python 对象
    • 'S', 'a':字节串
    • 'U':Unicode
    • 'V':原始数据(void)

    NumPy - 数组属性

    这一章中,我们会讨论 NumPy 的多种数组属性。

    ndarray.shape

    这一数组属性返回一个包含数组维度的元组,它也可以用于调整数组大小。

    示例 1

     
    import numpy as np 
    a = np.array([[1,2,3],[4,5,6]])  
    print a.shape

    输出如下:

    (2, 3)
    

    示例 2

     
    # 这会调整数组大小  
    import numpy as np 
     
    a = np.array([[1,2,3],[4,5,6]]) a.shape =  (3,2)  
    print a 

    输出如下:

    [[1, 2] 
     [3, 4] 
     [5, 6]]
     

    示例3

    NumPy 也提供了reshape函数来调整数组大小。

     
    import numpy as np 
    a = np.array([[1,2,3],[4,5,6]]) 
    b = a.reshape(3,2)  
    print b

    输出如下:

    [[1, 2] 
     [3, 4] 
     [5, 6]]
     

    ndarray.ndim

    这一数组属性返回数组的维数。

    示例 1

     
    # 等间隔数字的数组  
    import numpy as np 
    a = np.arange(24)  print a

    输出如下:

    [0 1  2  3  4  5  6  7  8  9  10  11  12  13  14  15  16 17 18 19 20 21 22 23] 
    

    示例2

     
    # 一维数组  
    import numpy as np 
    a = np.arange(24) a.ndim 
    # 现在调整其大小
    b = a.reshape(2,4,3)  
    print b 
    # b 现在拥有三个维度

    输出如下:

    [[[ 0,  1,  2] 
      [ 3,  4,  5] 
      [ 6,  7,  8] 
      [ 9, 10, 11]]  
      [[12, 13, 14] 
       [15, 16, 17]
       [18, 19, 20] 
       [21, 22, 23]]] 
     

    numpy.itemsize

    这一数组属性返回数组中每个元素的字节单位长度。

    示例 1

     
    # 数组的 dtype 为 int8(一个字节)  
    import numpy as np 
    x = np.array([1,2,3,4,5], dtype = np.int8)  
    print x.itemsize

    输出如下:

    示例 2

     
    # 数组的 dtype 现在为 float32(四个字节)  
    import numpy as np 
    x = np.array([1,2,3,4,5], dtype = np.float32)  
    print x.itemsize


    输出如下:

    4
    

    numpy.flags

    ndarray对象拥有以下属性。这个函数返回了它们的当前值。


    序号

    属性及描述

    1.

    C_CONTIGUOUS (C) 数组位于单一的、C 风格的连续区段内

    2.

    F_CONTIGUOUS (F) 数组位于单一的、Fortran 风格的连续区段内

    3.

    OWNDATA (O) 数组的内存从其它对象处借用

    4.

    WRITEABLE (W) 数据区域可写入。 将它设置为flase会锁定数据,使其只读

    5.

    ALIGNED (A) 数据和任何元素会为硬件适当对齐

    6.

    UPDATEIFCOPY (U) 这个数组是另一数组的副本。当这个数组释放时,源数组会由这个数组中的元素更新


    示例

    下面的例子展示当前的标志。

     
    import numpy as np 
    x = np.array([1,2,3,4,5])  
    print x.flags

    输出如下:

     
    C_CONTIGUOUS : True 
    F_CONTIGUOUS : True 
    OWNDATA : True 
    WRITEABLE : True 
    ALIGNED : True 
    UPDATEIFCOPY : False
     

    NumPy - 数组创建例程

    新的ndarray对象可以通过任何下列数组创建例程或使用低级ndarray构造函数构造。

    numpy.empty

    它创建指定形状和dtype的未初始化数组。 它使用以下构造函数:

    numpy.empty(shape, dtype = float, order = 'C')
     

    构造器接受下列参数:

    序号

    参数及描述

    1.

    Shape 空数组的形状,整数或整数元组

    2.

    Dtype 所需的输出数组类型,可选

    3.

    Order 'C'为按行的 C 风格数组,'F'为按列的 Fortran 风格数组

    示例

    下面的代码展示空数组的例子:

     
    import numpy as np 
    x = np.empty([3,2], dtype =  int)  
    print x

    输出如下:

    [[22649312    1701344351] 
     [1818321759  1885959276] 
     [16779776    156368896]]
     

    注意:数组元素为随机值,因为它们未初始化。

    numpy.zeros

    返回特定大小,以 0 填充的新数组。

    numpy.zeros(shape, dtype = float, order = 'C')
    

    构造器接受下列参数:

    序号

    参数及描述

    1.

    Shape 空数组的形状,整数或整数元组

    2.

    Dtype 所需的输出数组类型,可选

    3.

    Order 'C'为按行的 C 风格数组,'F'为按列的 Fortran 风格数组


    示例 1

     
    # 含有 5 个 0 的数组,默认类型为 float  
    import numpy as np 
    x = np.zeros(5)  
    print x

    输出如下:

    [ 0.  0.  0.  0.  0.]
     

    示例2

     
    import numpy as np 
    x = np.zeros((5,), dtype = np.int)  
    print x

    输出如下:

    [0  0  0  0  0]
     

    示例3

     
    # 自定义类型 
    import numpy as np 
    x = np.zeros((2,2), dtype =  [('x',  'i4'),  ('y',  'i4')])  
    print x

    输出如下:

    [[(0,0)(0,0)]
     [(0,0)(0,0)]]         
     

    numpy.ones

    返回特定大小,以 1 填充的新数组。

     numpy.ones(shape, dtype = None, order = 'C')

    构造器接受下列参数:

    序号

    参数及描述

    1.

    Shape 空数组的形状,整数或整数元组

    2.

    Dtype 所需的输出数组类型,可选

    3.

    Order 'C'为按行的 C 风格数组,'F'为按列的 Fortran 风格数组

    示例 1

     
    # 含有 5 个 1 的数组,默认类型为 float  
    import numpy as np 
    x = np.ones(5)  print x

    输出如下:

    [ 1.  1.  1.  1.  1.]
     

    示例2

     
    import numpy as np 
    x = np.ones([2,2], dtype =  int)  
    print x

    输出如下:

    [[1  1] 
     [1  1]]
     

    NumPy - 来自现有数据的数组

    这一章中,我们会讨论如何从现有数据创建数组。

    numpy.asarray

    此函数类似于numpy.array,除了它有较少的参数。 这个例程对于将 Python 序列转换为ndarray非常有用。

     
    numpy.asarray(a, dtype = None, order = None)
     

    构造器接受下列参数:

    序号

    参数及描述

    1.

    a 任意形式的输入参数,比如列表、列表的元组、元组、元组的元组、元组的列表

    2.

    dtype 通常,输入数据的类型会应用到返回的ndarray

    3.

    order 'C'为按行的 C 风格数组,'F'为按列的 Fortran 风格数组

    下面的例子展示了如何使用asarray函数:

    示例 1

     
    # 将列表转换为 ndarray 
    import numpy as np 
     
    x =  [1,2,3] 
    a = np.asarray(x)  
    print a

    输出如下:

    [1  2  3] 
     

    示例2

     
    # 设置了 dtype  
    import numpy as np 
     
    x =  [1,2,3] 
    a = np.asarray(x, dtype =  float)  
    print a

    输出如下:

    [ 1.  2.  3.] 
     

    示例3

     
    # 来自元组的 ndarray  
    import numpy as np 
     
    x =  (1,2,3) 
    a = np.asarray(x)  
    print a

    输出如下:

    [1  2  3]
     

    示例4

     
    # 来自元组列表的 ndarray
    import numpy as np 
     
    x =  [(1,2,3),(4,5)] 
    a = np.asarray(x)  
    print a

    输出如下:

    [(1, 2, 3) (4, 5)]
     

    numpy.frombuffer

    此函数将缓冲区解释为一维数组。 暴露缓冲区接口的任何对象都用作参数来返回ndarray。

    numpy.frombuffer(buffer, dtype = float, count = -1, offset = 0)
     

    构造器接受下列参数:

    序号

    参数及描述

    1.

    buffer 任何暴露缓冲区借口的对象

    2.

    dtype 返回数组的数据类型,默认为float

    3.

    count 需要读取的数据数量,默认为-1,读取所有数据

    4.

    offset 需要读取的起始位置,默认为0

    示例

    下面的例子展示了frombuffer函数的用法。

     
    import numpy as np 
    s =  'Hello World' 
    a = np.frombuffer(s, dtype =  'S1')  
    print a

    输出如下:

    ['H'  'e'  'l'  'l'  'o'  ' '  'W'  'o'  'r'  'l'  'd']
     

    numpy.fromiter

    此函数从任何可迭代对象构建一个ndarray对象,返回一个新的一维数组。

    numpy.fromiter(iterable, dtype, count = -1)
    

    构造器接受下列参数:


    序号

    参数及描述

    1.

    iterable 任何可迭代对象

    2.

    dtype 返回数组的数据类型

    3.

    count 需要读取的数据数量,默认为-1,读取所有数据


    以下示例展示了如何使用内置的range()函数返回列表对象。 此列表的迭代器用于形成ndarray对象。

    示例 1

     
    # 使用 range 函数创建列表对象  
    import numpy as np 
    list = range(5)  
    print list

    输出如下:

    [0,  1,  2,  3,  4]
     

    示例2

     
    # 从列表中获得迭代器  
    import numpy as np 
    list = range(5) 
    it = iter(list)  
    # 使用迭代器创建 ndarray 
    x = np.fromiter(it, dtype =  float)  
    print x

    输出如下:

    [0.   1.   2.   3.   4.]
     

    #IT##程序员##经验分享##numpy##编程##Python#

    扫描二维码推送至手机访问。

    版权声明:本文由ruisui88发布,如需转载请注明出处。

    本文链接:http://www.ruisui88.com/post/2799.html

    标签: .ndim
    分享给朋友:

    “【Python核武器】:Numpy深度攻略!(一)” 的相关文章

    Linux发行版Debian推出12.2及11.8版本,修复多个安全问题

    IT之家 10 月 9 日消息,Debian 是最古老的 GNU / Linux 发行版之一,也是许多其他基于 Linux 的操作系统的基础,包括 Ubuntu、Kali、MX 和树莓派 OS 等,近日 Debian 推出了 12.2 和 11.8 版本,主要修复了多个安全问题。▲ 图源 Debia...

    Ubuntu 24.10发行版登场:Linux 6.11内核、GNOME 47桌面环境

    IT之家 10 月 11 日消息,Canonical 昨日发布新闻稿,正式推出代号为 Oracular Oriole 的 Ubuntu 24.10 发行版。新版在内核方面升级到最新 6.11 版本,并采用 GNOME 47 桌面环境。Ubuntu 24.10 发行版调整了内核策略,开始选择最新的上游...

    Vue.js 组件通信的 3 大妙招

    在 Vue.js 中,组件化是其核心概念之一,允许你将复杂的界面拆分成多个独立的、可复用的组件。在构建大型应用时,如何高效地在组件之间传递数据和触发事件是非常重要的。Vue.js 提供了多种方式来处理组件间的通信,下面是最常用的 3 种方式:1.父子组件通信:通过 Props 和 Events在 V...

    掌握版本控制:Git的那些常见用法与技巧

    Git作为现代开发中最常用的版本控制系统,它的普及和高效性使得程序员几乎每天都在与它打交道。无论是个人项目,还是团队协作,Git都能帮助我们追踪代码的修改历史,保证代码版本的管理井井有条,并在多人协作时有效地避免冲突。本文将分享一些常见的Git用法与技巧,帮助你更好地掌握Git的强大功能,并提升你在...

    全新斯柯达柯珞克Karoq深度评测:大众替代品

    “斯柯达柯珞克是一款出色的全能家庭 SUV,具有许多有用的功能”价格36,605 英镑- 49,190 英镑优点方便的 VarioFlex 后排座椅非常适合家庭入住驾驶乐趣缺点保修期短保守的内饰性格比Yeti少结论——斯柯达柯珞克是一辆好车吗?斯柯达柯珞克是在辉煌的七座 斯柯达柯迪亚克之后推出的,因...

    再来一波黑科技工具,低调使用

    静读天下静读天下是一个特别优秀的电子书阅读器。它上面有多个在线书库,像古登堡计划,很多种优秀的书杂志,都可以下载来阅读。它还能智能识别章节功能,还支持外置的语音阅读功能。它支持多种文本格式,比如说txt,pdf,epub,mobi等等。为了便于阅读它还有10 种配色方式,还有夜间模式。不过免费版有广...