日前,虚拟主播、冬奥手语数字人主播频频出圈,相对应的数字虚拟人产业应用路线也逐渐清晰,随之带来的是上市公司在数字虚拟人的加速布局。前有字节跳动旗下火山引擎打造的虚拟人物“卡诺橙”亮相北京台春晚,后有英伟达创始人兼CEO黄仁勋以虚拟数字人形象出现在虚拟甲板上进行简短发言。随后,行业内上市公司“小将们”也加码布局。上市公司加码布局4月19日,宝通科技宣布近期完成虚拟数字人业务近千万元投资,与八点八科技达成战略合作,拟打通虚拟人产品从IP研发到行业解决方案再到SDK云渲染技术授权的全链路服务。拓尔思在日前召开的业绩说明会上表示,针对带货虚拟数字人领域,公司为网红直播带货领域知名C2M公司和上市公司提...... Last article READ

使用 Fast ai 进行图像分类

介绍

从头开始训练深度学习模型可能是一项乏味的任务。你必须找到正确的训练权重,获得最佳学习率,找到最佳超参数以及最适合你的数据和模型的架构。再加上没有足够的质量数据来训练,以及它需要的计算强度会对我们的资源造成严重损失,这些因素在第一轮就把你击倒。但不要害怕,因为 Fast.ai 等深度学习库会充当我们强有力的助手,让你立即重返赛场。

目录

1. Fast.ai概述

2. 我们为什么要使用 Fast.ai?

· 图像数据包

· LR 查找

· fit_one_cycle

3. 案例研究:紧急与非紧急车辆分类

Fast.ai概述

Fast.ai 是建立在 PyTorch 之上的流行深度学习框架。它旨在通过几行代码快速轻松地构建最先进的模型。它极大地简化了深度学习模型的训练过程,而不会影响训练模型的速度、灵活性和性能。Fast.ai 也支持和 NLP 中最先进的技术和模型。

我们为什么要使用 Fast.ai?

除了 Fast.ai 模型的高生产力和易用性之外,它还确保了我们能够自定义高级 API 而无需干预较低级的 API。Fast.ai 还包含一些非常酷的功能,使其成为初学者最喜欢的深度学习库之一。

图像数据包

图像数据包有助于汇集我们的训练、验证和测试数据,并通过执行所有必需的转换和标准化图像数据来处理数据。

LR 查找

学习率会影响我们的模型学习和适应问题的速度。低学习率会减慢训练过程的收敛速度,而高学习率会导致性能出现令人不快的分歧。

因此,良好的学习率对于模型的令人满意的性能至关重要,而找到最佳学习率就像大海捞针一样。Fast.ai 的“lr_find()”是我们的骑士,它将我们从寻找合适学习率的痛苦中解救出来。

recorder.plot()

lr_find() 的工作原理是最初使用非常低的学习率来训练小批量数据并计算损失。然后它以比前一个稍高的学习率训练下一个小批量。这个过程一直持续到我们到达一个合适的学习率。我们可以使用 recorder.plot() 来获取学习率与 Loss 的图,这简化了选择良好的学习率的任务。选择学习率的依据是哪个学习率为我们的损失提供了最陡的斜率,而不是哪个学习率的损失最低。

fit_one_cycle

fit_one_cycle 方法实现了循环学习率的概念。在这种方法中,我们使用在最小和最大界限值之间波动的学习率,而不是使用固定或指数下降的学习率。

循环学习率。训练神经网络的循环学习率 - https://arxiv.org/pdf/1506.01186.pdf

CLR 中的每个循环由 2 个步骤组成,其中学习率从最小值增加到最大值,下一步反之亦然。假设最佳学习率位于所选的最小值和最大值之间。这里,步长表示用于增加或减少每一步的学习率的迭代次数。

我们使用循环学习率,通过循环数来拟合我们的模型。学习率在训练期间的每个循环中在所选的最小学习率到最大学习率之间振荡。CLR 的使用消除了我们的训练模型陷入鞍点的可能性。

fit_one_cycle 方法还实现了学习率 Annealing 的概念,我们在最后几次迭代中使用减少的 LR。最后一次迭代的学习率通常取为所选最小学习率的百分之一。这可以防止在我们接近它时超出最优值。

案例研究:紧急与非紧急车辆分类

让我们尝试使用 Fast.ai 在 Imagenets 数据集中使用预训练的 Resnet50 模型解决紧急与非紧急车辆分类问题。

导入模块

from fastai.vision import *

from fastai.vision.models import resnet50

使用 ImageDataBunch 进行数据增强

tfms = get_transforms(do_flip=True, flip_vert=True, max_rotate=50, max_lighting=0.1, max_warp=0 )

data = ImageDataBunch.from_df('/content/drive/MyDrive/CV_Vehicle_classification/train_data/images', train, ds_tfms=tfms, label_delim= None, valid_pct=0.2, fn_col=0, label_col=1 , size=299,bs=64).normalize(imagenet_stats)

模型训练

t_cnn1 = cnn_learner(data, resnet50, pretrained=True, metrics=[accuracy])

t_cnn1.fit_one_cycle(5)

最初,让我们使用fit_one_cycle 训练我们的模型 5 个时期。这是为了了解模型的工作原理。

使用 fit_one_cycle() 进行模型训练

在这里,验证损失远小于训练损失。这表明我们的模型拟合不足,与我们需要的模型相去甚远。

解冻图层(unfreeze)

让我们解冻预训练模型的层。这样做是为了让我们的模型学习特定于我们数据集的特征。我们再次拟合我们的模型,看看模型现在是如何工作的。

t_cnn1.unfreeze()

t_cnn1.fit_one_cycle(8)

解冻图层并训练模型

学习率查找器

使用 lr_find 和 recorder.plot,我们将能够清楚地了解哪种学习率最适合我们的模型。利用学习率与损失图来选择学习率。

t_cnn1.lr_find()

t_cnn1.recorder.plot()

针对损失图的学习率

可以看到 1e-4 之后的损失逐渐增加。因此,将初始层的学习率选择为 1e-5,将后面的层选择为 1e-4 将是一个明智的想法。

我们再次拟合我们的方法并使用选择的学习率对其进行训练。该模型稍后会被冻结并导出以供以后使用。

t_cnn1.fit_one_cycle(10,max_lr=slice(1e-5, 1e-4))

t_cnn1.freeze()

t_cnn1.export('/content/drive/MyDrive/CV_Vehicle_classification/model/Bmodel_fastai_resnet50.h5')

训练和冻结模型

fit_one_cycle() 中的切片用于实现判别学习。它基本上告诉模型以 1e-5 的学习率训练初始层,以 1e-4 的学习率训练最终层,以及它们之间的层,其值介于这两个学习率之间。

预测

完成所有模型训练后,我们只剩下预测测试数据集的任务了。现在让我们加载我们之前导出的测试数据和 Resnet50 模型,并使用它来预测我们的测试数据。

test_data = ImageList.from_df(test, cols=['image_names'], path='/content/drive/MyDrive/CV_Vehicle_classification/train_data/images')

t_rn50 = load_learner('/content/drive/MyDrive/CV_Vehicle_classification/model/', 'Bmodel_fastai_resnet50.h5', test = test_data)

y_trn50 = t_rn50.TTA(ds_type = DatasetType.Test)
preds = y_trn50[0].argmax(-1)

尾注

瞧!我们现在已经预测了我们的测试数据,而无需花费大量时间来建立一个更大的训练数据集、设计和训练我们的深度学习模型,也不会完全耗尽我们的计算资源。

       原文标题 : 使用 Fast ai 进行图像分类

data-v-1cad739f>本文来自微信公众号:,作者:猫叔在硅谷,题图来源:视觉中国全球最有影响力的社交媒体,掌握在全球财富最多的人手里,这是一件好事吗?关于这起收购,所有的人都在问同一个问题:特朗普会回来吗?面对全球首富马斯克的强势收购,推特董事会只抵挡了十天时间,最终还是同意了每股54.2美元的现金报价,此前抛出的“毒丸计划”也没有实施。这一交易对推特估价为440亿美元。正如他此前所说,马斯克不想讨价还价,就这个价完成收购。这一交易还有待股东大会批准、监管部门放行以及满足相关条件。如果没有出现意外,交易将在今年年内完成,届时推特会在纳斯达克退市,成为马斯克的全资子公司。尽管美国超级富......Next article READ