目前业内有个大部分人都赞同的观点:网络相比较 15 年前速度更慢,而且错误更多。由于不断增加的 JavaScript、框架、Webfonts 和 polyfills,已经抵消了更快的计算性能、网络和协议带来的优势。那么实际情况真的如此吗?   开发者 Lars Eidnes 加载了全球排行前 100 万的网站,追踪每个量化指标,并记录了每个错误、关注每个请求的 URL。他创建首个将网络性能、错误和库联系起来的数据库。而在本文中,他对这些数据进行了分析,并帮助站长找到创建高性能网站的合适方法。   为什么要加载 100 万个网页?   正如文章开头所提及的,当前网络真的要比 15 年前更慢了...... Last article READ

理解代词对象,人工智能要多努力?

文/陈根

具有代替和指示作用的代词,作为实词在句法和文本中具有重要作用。代词令语言简洁且更富有变化性。

对于人类来说,识别代词指代对象并不算困难,凭借对上下文和对句子的理解就可以找出代词的指代对象。然而,对于来说,却并不容易——机器对文本的理解通常需要核心性解析。换言之,能否准确搜索、追踪、分析代词与实体之间的关联,对于人工智能能否准确理解文本内容至关重要。

这种能力被称为共指消解(Conference Resolution),是(NLP)领域的重要研究方向,即通过追踪长句、段落、文章中的代词,找到其对应的指代对象或内容。

尽管目前有很多体量庞大的众包数据集,但它们主要考察模型理解局部语义以及谓词参数结构,涉及共指消解的问题很少见。

针对这一问题,艾伦人工智能研究所的研究团队最近公布了一个新的众包数据集,被称为为 QUOREF,里面包含超过 2400 个广度选择问题,旨在专门考察模型的共指消解能力。这些问题需要在维基百科的 4.7K 多个英文段落中分析并找到各个实体的指代对象。

作为专门测试共指消解能力的数据集,QUOREF 足以证明目前常见的机器阅读理解模型仍有很大的进步空间。通过分析错误答案背后的原因,NLP研究者才能更好地改进模型,实现在复杂、多元、大跨度的文本内容中准确对应实体与代词,做到真正意义上的的语义理解。

“2-3年内,在工业设备噪声检测领域我们没有竞争对手。”硕橙(厦门)科技有限公司总裁瞿千上说道。“为什么说2-3年内没人能成为硕橙科技的对手?”“因为我们走过的坑,后来者也得一个个走。”瞿千上淡然地说道。中国智造发展的“拦路虎”2015年,中国国务院正式印发《中国制造2025》,其目的在于改变现有中国制造业的各类弊端,从而实现“制造”向“智造”迈进。2016年,工信部和财政部也颁布了《智能制造发展规划(2016-2020)》,计划在2020年实现智能制造技术与装备方面的突破。据相关数据显示,在如此大规模政策的推动下,我国工业市场规模将在2020年年底达到2000亿元。但值得注意的是,在我国大力......Next article READ