品高云的机器学习服务分为非深度学习与深度学习,非深度学习的实践已在《[深度分析 7.0 系列]04 品高云机器学习服务》详细描述。那么,本文即针对深度学习的功能进行实践验证。

深度学习的概念源于人工神经网络的研究,是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据。常见的深度学习算法包括:受限波尔兹曼机(Restricted Boltzmann Machine, RBN)、 Deep Belief Networks(DBN)、卷积网络(Convolutional Network)、 堆栈式自动编码器(Stacked Auto-encoders)。

图像、声音和文本的识别是较为常见的深度学习应用。本文即通过图片识别的方式来验证品高云机器学习服务中的深度学习服务功能。

人识别物体,无需具体的形状颜色描述,人脑就能记住物体的主要特征,再次看到同一类物体,即能判断出。让机器区分不同物体,需找出物体的特征,如颜色、形状等,并将特征以计算机可计算的方式表达出来,再通过机器学习训练做出判断。人为寻找特征耗时耗力。品高云深度学习服务可在大量数据中学习图像数据的特征,通过特征进行学习判断,过程可大大简化,节省大量的时间精力,因而在图像领域应用广泛。

深度学习服务功能进行图片识别的操作步骤包括了容器管理、数据源管理、模型管理和评估、预测管理。

1、容器管理

这个环节主要管理和配置机器学习容器集群所需的部署模板,配置机器学习服务的实例资源。

进入【高级服务→机器学习→机器学习容器管理】,进入机器学习容器管理页面可对已有容器进行管理操作。

图 1 机器学习容器管理页面

点击“新增机器学习容器”按钮,弹出新增机器学习容器页面。依次填入应用名称、容器类型、镜像、实例规模等信息。

图 2 新增机器学习容器页面

完成新增机器学习容器信息设置后,可查看到新增的容器。

图 3 新增的机器学习容器

2、数据源的管理

深度学习需要输入历史图片数据进行模型训练,历史数据源都在 S3 存储上。因此,数据源管理的目的是通过读取存储在 S3 上的基础数据文件,推测目标数据列的数据类型。

图 4 存储在 S3 上的图片数据源信息

进入【高级服务→机器学习→数据源管理】,进入数据源管理页面可对现有数据进行管理操作。

图 5 数据源管理页面

点击“新增数据源”按钮,进入新增数据源页面。

首先,选择数据源类型,以便确认使用的机器学习框架。本次功能实践选择图片识别。

图 6 数据源类型选择页面

第二步,输入数据源信息。填入 S3 数据源地址信息及数据源名称。

图 7 数据源信息页面

通过以上操作完成数据源的创建。

3、模型的管理及评估

深度学习的模型创建前提是已经有数据源了,根据数据源信息,会自动选择模型来进行数据训练。并对创建好的模型进行评估已确定模型的适用性。

3.1 新建模型

进入【高级服务→机器学习→模型管理】,在模型管理页面可对现有模型进行管理操作。

图 8 新增模型页面

点击新增模型,首先,需要选择要训练的图片数据。

图 9 输入数据源页面

第二步,模型设置。设置模型名称、训练次数和评估间隔。训练次数越多则模型越精确;评估间隔代表模型训练多少次之后进行一次评估,间隔设置越短则模型越精确。

图 10 模型设置页面

第三步,容器设置,选择云网络、子网、实例规模和创建的实例数量(实例是用来进行模型训练及预测)设置容器信息。容器信息设置完成后及模型创建成功。

图 11 容器设置页面

3.2 模型评估

模型创建完成后可对模型进行评估,评估结果可通过可视化的图表展现,模型准确率达 60%。

红色线表示训练损失值,浅蓝色线表示验证损失值,深蓝色线表示评估准确值。

图 12 模型评估结果

4、预测的管理

模型训练完成后,可使用训练好的模型进行水果图片预测。

通过在互联网上下载一张水果图片,如图 13 所示。并上传至模型。

图 13 选择需要识别的水果图片

图 14 上传需要识别的图片页面

最后,我们通过图片识别可查看到最后的预测结果,准确率达 97%以上,可以判定图片识别非常准备。

图 15 图片识别结果

目前,机器学习服务已经在品高云 7.0 版本中正式发布,对于这项服务感兴趣的读者,可以访问品高云 7.0 的亮点功能介绍,通过视频的方式增加直观的了解。

视频连接:

也可以通过博客内其他相关文章扩张阅读,以了解更多的机器学习知识。

[深度分析 7.0 系列]04 品高云机器学习服务,文章链接:http://blog.bingocloud.cn/archives/1330

15 个开源的顶级人工智能/机器学习工具,文章链接:http://blog.bingocloud.cn/archives/1452