如何使用Python将给定的图像集进行聚类?

介绍大家好,最近在参加深度学习竞赛时,遇到了一个有趣的问题,即如何将给定的图像集进行聚类,你可能会说,这不是一个简单的分类问题吗?使用卷积神经网络, 就实现,但关键在于没有合适训练数据提供训练。在不想自己收集数据集的情况,我们如何解决这个问题呢?这就是本文的主要内容,即将深度学习直接应用于测试数据(此处为图像),而无需创建训练数据集并在该数据集上训练神经网络。卷积神经网络作为特征提取器首先我们需要讨论为什么需要特征提取器?以及如何使卷积神经网络(CNN)发挥作用。图像数据的特征提取器:假设算法需要像特征一样需要两只眼睛,一只鼻子和一张嘴来将图像分类为面部,但是在不同的图像中,这些特征存在于不同的像素位置,因此简单地将图像扁平化并将其提供给算法是不起作用的。而解决这个问题刚好是CNN的卷积层发挥作用的地方。卷积层作为我们的特征提取器,并将图像分解为越来越精细的细节,我们来看一下下面的例子:

Read More →

清华软件定义芯片团队成果入选固态电路顶会ISSCC 2021

  允中 发自凹非寺  量子位编辑公众号 QbitAI  2021 年 2 月 13 日~22 日,第 68 届国际固态电路会议(ISSCC)通过线上模式顺利召开。清华大学魏少军、刘雷波教授团队作了题为“A 28nm 12.1TOPS/W Dual-Mode CNN Processor Using Effective-Weight-Based Convolution and Error-Compensation-Based Prediction”的学术报告。

Read More →

一文教你使用卷积神经网络进行图像分类

介绍卷积神经网络属于深度学习的子域。深度学习中的算法以与人脑相同的方式来处理信息,但其规模很小,因为我们的大脑太复杂了(我们的大脑大约有860亿个神经元)。为什么使用CNN进行图像分类?图像分类通过从图像中提取特征,以观察数据集中的某些模式。由于可训练参数变得非常大,因此使用ANN进行图像分类最终会在计算上造成很高的成本。例如,如果我们有一张50 X 50的猫图像,并且我们想在该图像上训练传统的ANN,以将其分类为狗或猫,则可训练参数变为–(50 * 50)* 100图像像素乘以隐藏层 + 100 偏差+ 2 * 100 输出神经元+ 2 偏差= 2,50,302我们在使用CNN时使用了过滤器,过滤器根据其用途而存在许多不同类型。

Read More →

卷积神经网络:解决图像分类、语义分割或机器翻译问题

金翅导读卷积神经网络已成功应用于解决诸如图像分类语义分割或机器翻译等问题,其中解决的这些问题的基础数据表示具有网格状结构。但是,目前许多有趣的任务的数据为无法以网格状结构表示的数据,而这些数据位于不规则的域中。用来表示3D网格,社交网络,电信网络,生物网络或大脑连接组的数据就是这种情况。此类数据通常可以以图表的形式表示,并且图形提供了一种直观合理的表示图像关系的方式,所以对图数据的研究日益增多。已经有很多文献中已经涉及到扩展神经网络使其来处理任意结构的图。早期的工作使用递归神经网络来处理,图域表示为有向无环图的数据(Frasconi等人1997年提出,Sperduti和Starita1998年提出)。图神经网络(GNN)作为递归神经网络的一般化,可以直接处理更通用的图类,例如:循环图,有向图和无向图。由Gori等人在2005年以及Scarselli等人于2009年提出。GNN包含一个迭代过程,该过程传播节点状态直至达到平衡;然后结点经过神经网络,该神经网络根据其状态为每个节点生成输出。Li等人于2016年采纳了这个想法并利用Cho等人于2014年提出的门控循环单元在传播阶段对这个想法进行了改进。目前,大家越来越有兴趣将卷积推广到图域中去。其中,图卷积网络的方法可以大致分为空间卷积和频谱卷积方法。

Read More →

用于大规模图像缩放识别的Vision Transformer

在本文中,我想在不作太多技术细节的情况下,解释作者提交给2021 ICLR会议的新论文“an-image-is-worth-16×16-words-transformers-for-image-recognition-at-scale”的研究成果(目前为止匿名)。自1960年以来深度学习就已经问世,但促使深度学习真正来到了前列的,是2012年的AlexNet模型,一个卷积网络,由Alex Krizhevsky设计,赢得了年度ImageNet图像分类竞赛的冠军。在接下来的几年里,深度 技术经历了一场真正的革命,每年都会出现新的卷积体系结构(GoogleNet、ResNet、DenseNet、EfficientNet等),以在ImageNet和其他基准数据集(如CIFAR-10、CIFAR-100)上创下新的精度记录。下图显示了自2011年以来ImageNet数据集上机器学习模型的最高精度的进展情况。

Read More →

机器学习实战:GNN(图神经网络)加速器的FPGA解决方案

1.概述得益于大数据的兴起以及算力的快速提升,机器学习技术在近年取得了革命性的发展。在图像分类、语音识别、 等机器学习任务中,数据为大小维度确定且排列有序的欧氏(Euclidean)数据。然而,越来越多的现实场景中,数据是以图(Graph)这种复杂的非欧氏数据来表示的。Graph不但包含数据,也包含数据之间的依赖关系,比如社交网络、蛋白质分子结构、电商平台客户数据等等。数据复杂度的提升,对传统的机器学习算法设计以及其实现技术带来了严峻的挑战。在此背景之下,诸多基于Graph的新型机器学习算法—GNN(图神经网络),在学术界和产业界不断的涌现出来。

Read More →

关于图像分类的经典

本文介绍十年来最佳图像分类论文,来帮助你快速学习 前言计算机视觉是一门将图像和视频转换成机器可理解信号的学科,有了这些信号,程序员可以基于这种高阶进一步控制机器的行为。在计算机视觉任务中,图像分类是最基本的任务之一,它不仅可以用于许多真实的产品,比如googlephoto的标签和AI内容调节,而且还是许多更高级的视觉任务奠定了基础,比如目标检测和视频理解。自从深度学习技术爆发以来,由于该领域的快速变化,初学者往往会觉得学习起来太困难,与典型的软件工程学科不同,使用DCNN进行图像分类的好书并不多,理解这一领域的最好方法是阅读学术论文。

Read More →

CVPR 2020 |用于3D目标检测的层级图网络

论文:A Hierarchical Graph Network for 3D Object Detection on Point Clouds由于大多数现有的点云对象检测方法不能充分适应点云的特征(例如稀疏性),所以一些关键的语义信息(如物体形状)不能被很好的捕捉到。本文提出了一种基于层级图网络(HGNet)的图卷积(GConv),可以直接将点云作为输入来预测 3D 的边界框。形状注意图卷积(SA-GConv)可以通过剑魔点的位置星系来描述物体形状,基于 SA-GConv 的 U 形网络可以通过改进的 voting 模块获取多层级的特征进而生成候选,然后一个基于图卷积的候选推理模块考虑全局的场景语义来对边界框进行预测。该框架在两个大规模点云数据上的表现超过了目前最先进的模型。

Read More →

目标检测二十年间那些事儿:加速与优化

在上一章中我们简短回顾了目标检测在过去的二十年中如何从传统滑窗算法到基于深度神经网络的全新领域,点击回顾。这次,我们来分享一些近年涌现的各类优化技术,正是这些技术让目标检测一再提速,从而能在工程上应用到各类设备中。

Read More →

“宇宙学探针”:研究发现强引力透镜候选体

  近日,中国科学院云南天文台丽江天文观测站研究员龙潜与云南大学中国西南天文研究所宇宙学研究组教授尔欣中团队合作,利用人工智能深度学习的方法,发现 38 个新的强引力透镜候选体。相关研究成果发表在《英国皇家天文学会月刊》(MNRAS)上。

Read More →