基于Azure提供的相关文档,搭建一个机器学习分类模型,建立的模型为自动化模型,即不需要代码,完全有Microsoft Azure提供的接口,建立一个用于预测某金融机构客户是否会继续认购定期理财产品的分类模型。

0. 准备工作

1. 创建worksapce

用Azure进行试验、训练以及部署机器学习时,需要使用workspace将Azure订阅和其他资源绑定起来。Azure提供了一个网页控制台,即Azure Machine Learning Studio,用以建立管理workspace。

大致流程如下:

  • 登录到Azure账号
  • 在Azure左上角,选择Create a Resource
  • 在搜索栏搜索“Machine Learning”
  • 进入machine learning后,点击Create

随后对以下字段进行配置:

Field Description
Workspace Name 输入用于标识工作区的唯一名称。使用易于记忆且区别于其他人所创建工作区的名称。
Subscription 选择要使用的 Azure 订阅。
Resource group 使用订阅中的现有资源组,或者输入一个名称,创建新的资源组。 资源组保存 Azure 解决方案的相关资源。
Location 选择离你的用户和数据资源最近的位置来创建工作区。
Workspave edition 选择“Enterprise” 。

完成以上配置后,选择Create

2. 创建并运行试验

在创建好workspace后,就可以通过Azure Machine Learning Studio进行自动化机器学习的创建和试验。(不支持IE浏览器)

  1. 登录Azure Machine Learning Studio

  2. 选择创建好的Subscription 和workspace

  3. 点击Get started

  4. 在左边列表中选择Automated ML

  5. 选择New automated ML run.

  6. Create dataset下拉菜单中选择From local files, 从而创建新的数据集

    1) 选择Brose
    2) 选择已下载好的本地数据集 bankmarketing_train.csv
    3) 选择Tabular作为数据集类型
    4) 为数据集命名
    5) 选择Next, 将数据集上传,随后系统会根据文件类型填充Settings and preview表格.
    6) 验证表格填写完整后,选择Next
    7) 在Schema中对数据表格进行配置,配置完成后选择Next

![](https://docs.microsoft.com/zh-cn/azure/machine-learning/service/media/tutorial-1st-experiment-automated-ml/schema-tab-config.gif)

8) 确认数据无误后,选择 **Create** 完成数据集的创建
9) 查看**Data preview**, 确保正确后选择"OK"
10) 选择**Next**

7) 在Configure Run中填写信息

1)  输入实验名称
2)  选择"y"作为预测结果列,表示用户是否愿意购买定期理财产品.
3) 选择 Create a new compute 配置compute target.compute target是用于运行脚本和部署服务的云端资源.
4) 填写完compute target信息后,选择Next

8) 在Task type and settings中,选择Classification作为机器学习的任务类型
1) 在View additional configuration settings中填写以下表格中的配置

Additional configurations Description Value for this tutorial
Primary metric 对机器学习算法进行度量时依据的评估指标。 AUC_weighted
Automatic featurization 启用预处理。 这包括自动化数据清理、准备和转换,以生成合成特征。 Enable
Blocked algorithms 要从训练作业中排除的算法 None
Exit criterion 如果符合某个条件,则会停止训练作业。 Training job time (hours): 1
Metric score threshold: None
Validation 选择交叉验证类型和测试数。 Validation type: k-fold cross-validation
Number of validations: 2
Concurrency 已执行并行迭代的最大次数和每次迭代使用的最大内核数 Max concurrent iterations: 5
Max cores per iteration: None

9) 选择OK开始运行

3. 浏览模型

Model下可以看到正在运行的算法,以及模型完成后模型的属性、指标和性能图表.

4.部署模型

Azure可以将本文生成的预测模型部署到Web服务中.
在模型运行完成后,返回到Run Detail页,选择Models选项卡.选择Refresh.

在这次实验中, 根据AUC_weighted指标,VotingEnsemble可以被视为最佳模型,所以选择这一模型.

在选择Deploy Best Model后,填写 Deploy a model中的内容:

Field Value
Deployment name Automl_deploy
Deployment description My deply for aure Homework
Compute type Select Azure Compute Instance
Enable authentication Disable
Use custom deployments Disable

选择Deploy

完成以上操作后,就可以得到一个可以正常运行的用来预测结果的Azure Web服务了.

原文链接 http://blog.wuqingzhe.cn/2019/11/30/使用Azure自动化机器学习模型搭建一个分类模型/