您现在的位置:上葡京网址公司新闻 > 海燕线缆党员参加滨海新区中小企业协会党支部红色教育实践活动

海燕线缆党员参加滨海新区中小企业协会党支部红色教育实践活动

浏览次数: 日期:2018年9月3日 09:14

导语:超过阿里、百度、约翰霍普金斯大学等企业及高校~云从科技+8ai影响因子活动企业:云从科技操作:刷新记录事项:云从科技刷新一项语音识别纪录开发企业:云从科技操作:刷新记录内容:云从科技刷新一项语音识别纪录更多相关雷锋网(公众号:雷锋网)ai科技评论按:10月29日,云从科技宣布在全球最大的开源语音识别数据集librispeech上,将错词率(worderrorrat97%,并将librispeech的wer指标提升了25%,超过阿里、百度、约翰霍普金斯大学等企业及高校,刷新了原先记录。

将 librispeech数据集上的错词97%librispeech是当前衡量语音识别技术的最权威主流的开源数据集,错词率(worderrorrate,wer)是衡量语音识别技术水平的核心指标。 ds2:百度,espnet:约翰霍普金斯大学,dfsmn-ce:阿里

云从科技在librispeech数据集上将错词率(worderrorrat97%,较之前提升了25%。这项成果有利于语音识别技术的进步,也有助于推动语音识别带来良好的智慧交互体验。

云从科技此次推出的语音识别模型pyramidal-fsmn融合图像识别与语音识别的优势,将残差卷积网络和金字塔记忆模块的序列记忆网络相结合,能够同时有效的提取空间和时间上不同粒度的信息,对比目前业界使用最为广泛的lstm模型,训练速度更快、识别准确率更高。

语音识别技术近年进展2017年3月,ibm结合了lstm模型和带有3个强声学模型的wavenet语言模型。「集中扩展深度学习5%错词率的突破」。相9%。

2017年8月,微软发布新的里程碑,通过改进微软语音识别系统中基于神经网络的听觉和语言模型,在去年基础上降低了大约12%1%,声称超过专业速记员。相对9%,声称超过人类。

2017年12月,谷歌发布全新端到端语音识别系统(state-of-the-artspeechrecognitionwithsequence-to-sequencemodel6%。相对于强大的传统系统有16%的性能提升。

2018年6月,阿里巴巴达摩院推出了新一代语音识别模型dfsmn,将全球语音识别096%。

2018年10月,云从科技发布全新pyramidal-fsmn语音识别模型,将错词率(worderrorrat97%,较之前提升了25%。

pyramidal-fsmn语音识别模型原理解析云从科技提出的新型网络结构,能更加有效的提取空间和时间特征的角度,为语音识别进一步发展提供了一些新的思路: 

模型设计采用一种残差卷积网络和金字塔记忆模块的序列记忆网络相结合的结构; 

训练方式使用lattice-free最大互信息(lattice-freemaximummutualinformation,lf-mmi/chain)与交叉熵(crossentropy,ce)损失函数相结合的多任务学习技术;

解码部分采取rnnlmrescoring的方式,利用rnn提取一个句子中的长期语义信息,从而更有效地帮助声学模型得到准确的句子。

如下图所示,作者采用了由6层residualcnn和10层pyramidal-fsmn相结合的网络结构。前端网络借鉴了图像识别中经典的residualcnn结构,更有效地提取特征与时间相互的关联信息,同时skipconnection避免了cnn网络加深之后梯度消失和梯度爆炸问题。在金字塔记忆模块中,浅层的网络主要聚焦于音素本身的特征学习,所以只需抽取短时上下文信。

针对这些问题,云从科技提出了一种端到端的深度学习文本检测框架

导语:本文将介绍「tencentml-images」项目正式开源情况。腾讯ailab+4ai影响因子开发企业:腾讯操作:开源数据集内容:多标签图像数据集雷锋网ai科技评论按:10月18日,腾讯ailab宣布正式开源「tencentml-