配图来自Canva可画自2014年亚马逊发布全新概念的智能音箱产品后,这种具有语音交互、控制功能的产品,就开始进入国内市场,并在随后迅速走红。与此同时,率先布局的阿里、百度、小米,也迅速在国内市场奠定了各自的优势,并促使国内智能音箱市场,形成了三足鼎立的市场格局。近年来随着华为、美的、海尔等企业的入场,又让国内市场产生了新的变化。天猫精灵、小爱、小度三分天下近两年来,国内智能音箱市场热度开始节节攀升,出货量也迎来了迅猛增长。据前瞻产业研究院报告显示,2019年国内智能音箱市场出货量达到146.9百万台,同比增长70.4%,目前这种高速增长仍在持续。据洛图科技数据显示,在今年双11购物节期间,国...... Last article READ

什么是NLP?NLP的两个核心任务是什么?

01

什么是NLP

NLP(-Natural language processing)就是在机器语言与人类语言之间沟通的桥梁,以实现人机交流的目的。

02

NLP的两个核心任务

NLU:自然语言理解。希望机器像人一样,具备正常人的语言理解能力。NLG:自然语言生成。为了跨越人类和机器之间的沟通鸿沟,将非语言格式的数据转换成人类可以理解的语言格式,如文章、报告等。

学习链接:https://easyai.tech/ai-definition/nlp/

文字也是人类语言之一,文字识别分为两个具体步骤:文字的检测和文字的识别,两者缺一不可,尤其是文字检测,是识别的前提条件,若文字都找不到,那何谈文字识别。

03

自然场景文本检测

自然场景下的文本检测有如下几个难点:

文本存在多种分布,文本排布形式多样;

文本存在多个方向;

多种语言混合。

1、Faster RCNN

Faster RCNN做文本检测感觉问题不大,但是从效果来看,仅套用Faster RCNN来做文本检测效果并不好,原因在于,文本有自己独有的特点,这种通用的文本检测框架并不能很好地解决文本的这些特点。

2、CTPN

CTPN(基于Faster RCNN):目前比较成熟的文本检测框架,精确度较好。但是检测时间较长,有很大的优化空间。

【文献】Detecting Text in Natural Image with Connectionist Text Proposal Network

文本行一般以水平长矩形的形式存在,而且文本行中每个字都有间隔,所以仅套用Faster RCNN来做文本检测效果并不好。

而CTPN剔除一个新奇的想法,我们可以把文本检测的任务拆分,第一步我们检测文本框中的一部分,判断它是不是一个文本的一部分,当对一幅图里所有小文本框都检测之后,我们就将属于同一个文本框的小文本框合并,合并之后就可以得到一个完整的、大的文本框了,也就完成了文本的检测任务。这个想法有点像“分治法”,先检测大物体的一小部分,等所有小部分都检测出来,大物体也就可以检测出来了。

  近日,比特币价格撒欢上涨,不仅首次突破 3 万美元,甚至一度触及 3.45 万美元的高点。那些曾经弄丢比特币的人,肠子都悔青了。   据外媒报道,英国 IT 工程师詹姆斯·豪威尔斯曾不小心将藏有 7500 枚比特币私钥的硬盘当垃圾扔掉,按照 3.2 万美元现价,估算约 2.4 亿美元,他表示后悔莫及,只能在垃圾场里望洋兴叹。   詹姆斯从 2009 年开始,在个人电脑上共开采 7500 枚比特币。但造化弄人,2013 年,他把藏有秘钥的硬盘当垃圾扔掉了。   “昨天,他们告诉我,任何进入到这里的垃圾都会被压缩并填埋”。詹姆斯在垃圾填埋场接受参访时说,&......Next article READ