大数据分析PyTorchx深度学习框架教程-AAA教育

大数据分析PyTorchx深度学习框架教程

时间：2020-08-19来源：www.aaa-cg.com.cn点击量：次作者：Sissi

时间：2020-08-19点击量：次作者：Sissi

　　PyTorch是一个不断发展的深度学习框架，具有许多令人兴奋的附加功能。我们将回顾其基本元素，并逐步演示构建简单的深度神经网络(DNN)的示例。

大数据分析PyTorchx深度学习框架教程

　　PyTorch的基础知识-简介

　　自从2017年初推出它以来， PyTorch 已经成为高度流行且广泛使用的深度学习(DL)框架。自从不起眼的开始以来，它就引起了全世界工业界和学术界的严肃AI研究人员和从业者的注意，并且这些年来已经显着成熟。

　　数十名DL发烧友和专业人士从百度开始了他们的旅程，但是基于TensorFlow的学习曲线一直很艰难。另一方面，PyTorch从一开始就以一种直观的方式进行DL编程，以一种易于理解且易于逐步学习的方式专注于基本线性代数和数据流运算。

　　由于采用了这种模块化方法，与遵循较为严格的TF和基于TF的工具框架相比，使用PyTorch进行复杂的DL架构的构建和试验变得容易得多。此外，PyTorch的构建是为了与Python生态系统的数值计算基础架构无缝集成，而Python是数据科学和机器学习的通用语言，它摆脱了这一日益流行的浪潮。

　　使用PyTorch进行Tensor操作

　　Tensors是任何DL框架的核心。PyTorch为程序员提供了极大的灵活性，使其可以在Tensors流经与相对高级的面向对象API配对的网络(称为计算图)时创建，组合和处理Tensors。

　　什么是Tensors?

　　通过称为Tensors的数据/数学结构来完成表示机器学习(ML)(尤其是DNN)的数据(例如，有关物理世界或某些业务流程的数据) 。Tensors是一个可以容纳N 维数据的容器。Tensors经常与另一个更熟悉的数学对象矩阵 (具体来说是二维Tensors)互换使用。实际上，Tensors是二维矩阵到N维空间的推广。

　　用简单的术语来说，可以将标量矢量矩阵Tensors视为一种流。

　　1)标量是0维Tensors。

　　2)向量是一维Tensors。

　　3)矩阵是二维Tensors

　　4)Tensors是广义的N维 Tensors。N可以是3到无穷大的任何数字。

　　通常，这些尺寸也称为等级。

大数据分析PyTorchx深度学习框架教程

　　为什么Tensors对于ML和DL很重要?

　　考虑一个监督的机器学习问题。您会得到带有某些标签的数据表(可以是数字实体或二进制分类，例如“是/否”答案)。为了使用ML算法对其进行处理，必须将数据作为数学对象进行馈送。表格自然等效于2-D矩阵，其中单个行(或实例)或单个列(或要素)可以视为一维矢量。

　　类似地，黑白图像可以视为包含数字0或1的2-D矩阵。可以将其输入神经网络以进行图像分类或分割任务。

　　时间序列或序列数据(例如，来自监视机的ECG数据或股票市场价格跟踪数据流)是二维(二维)数据的另一个示例，其中一维(时间)是固定的。

　　这些是在经典ML(例如线性回归，支持向量机，决策树等)和DL算法中使用2-DTensors的示例。

　　超越二维，彩色或灰度图像可被视为3-DTensors，其中每个像素都与所谓的“色彩通道”相关联-“ 3-数字”矢量代表红绿蓝中的强度(RGB)光谱。这是一个3-DTensors的例子。

　　类似地，视频可以被认为是时间上的彩色图像(或帧)序列，并且可以被认为是4DTensors。

　　简而言之，可以通过多维Tensors轻松表示来自物理世界，传感器和仪器，商业和金融，科学或社会实验的各种数据，以使其适合在计算机内部通过ML/DL算法进行处理。

　　让我们看看PyTorch如何定义和处理Tensors。

　　在PyTorch中创建和转换Tensors

　　可以从Python列表中定义Tensors，如下所示：

大数据分析PyTorchx深度学习框架教程

　　可以按以下方式访问和索引实际元素

大数据分析PyTorchx深度学习框架教程

　　具有特定数据类型的Tensors可以轻松创建(例如，浮点数)

大数据分析PyTorchx深度学习框架教程

　　尺寸和尺寸易于阅读

大数据分析PyTorchx深度学习框架教程

　　我们可以更改Tensors的视图。让我们从一维Tensors开始，如下所示：

大数据分析PyTorchx深度学习框架教程

　　然后将视图更改为二维Tensors，

大数据分析PyTorchx深度学习框架教程

　　在PyTorchTensors和NumPy数组之间来回切换既简单又有效。

大数据分析PyTorchx深度学习框架教程

　　从熊猫系列对象进行转换也很容易，

大数据分析PyTorchx深度学习框架教程

　　最后，可以转换回Python列表，

大数据分析PyTorchx深度学习框架教程

　　使用PyTorch Tensors的向量和矩阵数学

　　PyTorch提供了一个易于理解的API和编程工具箱，以数学方式处理Tensors。我们在这里显示一维和二维Tensors的基本操作。

　　简单的向量加法

大数据分析PyTorchx深度学习框架教程

　　标量矢量乘法

大数据分析PyTorchx深度学习框架教程

　　线性组合

大数据分析PyTorchx深度学习框架教程

　　元素产品，

大数据分析PyTorchx深度学习框架教程

　　点积

大数据分析PyTorchx深度学习框架教程

　　在Tensors的每个元素上添加标量，即广播，

大数据分析PyTorchx深度学习框架教程

　　从列表中创建二维Tensors，

大数据分析PyTorchx深度学习框架教程

　　矩阵元素的切片和索引

大数据分析PyTorchx深度学习框架教程

　　矩阵乘法

大数据分析PyTorchx深度学习框架教程

　　矩阵转置

大数据分析PyTorchx深度学习框架教程

　　矩阵逆和行列式

大数据分析PyTorchx深度学习框架教程

　　Autograd：自动区分

　　神经网络的训练和预测涉及一遍又一遍地获取各种函数(Tensors值)的导数。Tensor对象支持神奇的Autograd功能，即自动微分，这是通过跟踪和存储在流过网络的Tensors上执行的所有操作来实现的。您可以观看以下精彩的教程视频以进行直观说明：

　　Pytorch autograd 官方文档在这里。

　　我们展示了一些简单的示例来说明PyTorch的autograd功能。

大数据分析PyTorchx深度学习框架教程

　　我们定义一个泛型函数和一个Tensors变量 x，然后定义另一个变量 y，将其分配给x的函数。

大数据分析PyTorchx深度学习框架教程

　　然后，我们在y上使用特殊的向后()方法获取导数，并在给定的x值下计算导数。

大数据分析PyTorchx深度学习框架教程

　　我们还可以处理偏导数!

大数据分析PyTorchx深度学习框架教程

　　我们可以将u 和 v定义为Tensors变量，定义将它们组合在一起的函数，应用反向方法，并计算偏导数。见下文，

大数据分析PyTorchx深度学习框架教程

　　PyTorch仅计算标量函数的导数，但是如果我们传递矢量，则本质上它将按元素计算导数并将它们存储在相同维数的数组中。

大数据分析PyTorchx深度学习框架教程

　　以下代码将针对三个组成矢量计算导数。

大数据分析PyTorchx深度学习框架教程

　　我们可以显示导数的图。注意，二次函数的导数是与抛物线曲线相切的直线。

大数据分析PyTorchx深度学习框架教程

　　建立完整的神经网络

　　除了Tensors和自动微分能力之外，PyTorch的其他核心组件/功能很少，可以对神经网络进行深入定义。

　　用于构建神经分类器的PyTorch的核心组件是，

　　1) Tensors (在PyTorch中央数据结构)

　　2)Tensor 的 Autograd功能(自动微分公式烘焙到

　　3)nn.Module 用来建立任何其他神经分类类类

　　4)优化器 (当然，也有很多可供选择)

　　5)损失函数(一个大的选择是供你选择)

　　我们已经详细描述了Tensor和Autograd。让我们快速讨论其他组件，

　　nn.Module类

　　在PyTorch中，我们通过将其定义为自定义类来构建神经网络。但是，此类不是从本地Python对象派生的，而是从nn.Module类继承的。这为神经网络类注入了有用的属性和强大的方法。这样，在使用神经网络模型时，可以保持面向对象编程(OOP)的全部功能。我们将在大数据分析PyTorchx深度学习框架教程中看到此类定义的完整示例。

　　损失函数

　　在神经网络的架构和操作中，损失函数定义了神经网络的最终预测与地面真实情况(给定标签/类或用于监督训练的数据)之间的距离。损失的定量度量有助于使网络更接近配置(神经元权重的最佳设置)，从而最好地对给定的数据集进行分类或预测总误差最小的数值输出。

　　PyTorch提供了用于分类和回归任务的所有常见损失函数-

　　1)二元和多类交叉熵，

　　2)均方根和绝对绝对误差，

　　3)L1损失平稳

　　4)对数似然损失，甚至

　　5)Kullback-Leibler分歧。

　　可以在大数据分析PyTorchx深度学习框架教程中找到有关这些内容的详细讨论。

　　优化器

　　权重的优化以实现最低的损失是用于训练神经网络的反向传播算法的核心。PyTorch通过torch.optim模块提供了许多优化器来完成这项工作-

　　1)随机梯度下降(SGD)，