您现在的位置:上葡京网址公司新闻 > 海燕线缆党员参加滨海新区中小企业协会党支部红色教育实践活动

海燕线缆党员参加滨海新区中小企业协会党支部红色教育实践活动

浏览次数: 日期:2018年9月3日 09:14

导语:本文汇总了100期ai研习社大讲堂nlp方向分享回顾视频。机器学习、人工智能领域的研究人员,以及任何学术研究人员,都关心这两件事:分享、传播自己的研究成果让更多人知道,以及了解自己研究方向的最新进展、结识更多的研究人员。雷锋网(公众号:雷锋网)ai研习社大讲堂就是一个供研究人员们分享自己成果、促进广泛沟通互动的直播平台。

自ai大讲堂去年7月上线以来,已经有来自清华大学、北京大学、上海交通大学、香港科技大学、mit、ucberkeley、悉尼科技大学等知名国内外高校的嘉宾进行直播分享,甚至还举办了线下论文分享会,迄今已完成了100期,覆盖影响读者过万人。不仅嘉宾自己的研究成果被直播观众以及读者们了解,也让科技爱好者们、学生们、其它研究人员们增进了对人工智能相关思维、知识、应用的认识,为国内人工智能长期持续发展的氛围出一份力。

下面我们汇总了大讲堂精彩的nlp方向分享回顾。

第12期,word2vec技术在文本分析中的应用

word2vec是通过文本的语序和语境无监督训练出来能将词的语义表征到向量空间中的模型。自从m在2013年提出之后,在文本分析中有着广泛的应用。在这次分享中,我将讲解word2vec模型的基本原理,它的一些变形,以及在一些数据挖掘任务中的应用。

第15期,基于深度学习的语音分离

语音分离的三个方面:语音增强(语音和非语音分离),多说话人分离和语音解混响;

语音分离的四个部分:模型,训练目标,训练数据和单通道分离算法。

第20期,生成式对抗网络在文本生成的探索:基础、前沿以及我们全新的结果

生成式对抗网络(gans)目前已经得到了广泛研究者的关注并且在很多实际场景中得到应用。但是大多数研究工作仍然集中在例如图片和语音的连续稠密数据上,而对例如文本这样的序列离散数据的生成研究得较少。原因是对这类离散数据无法直接求导,导致原版的gan模型无法工作。我们课题组在2017年aaai提出seqgan框架来成功绕过这个问题,通过将文本生成器建模成一个强化学习策略并用reinforce梯度优化来学习这个生成器,seqgan达到了文本生成效果的提升。基于seqgan,我们课题组进一步研究了对抗过程中的信息泄露设置,发现判别器泄露的信息其实能很好地帮助生成器快速学习并最终达到更好的文本生成效果,这个新框架我们命名为leakgan。

第22期,基于lstm-rnn的语音声学建模技术

lstm-rnn可以对长时序列信息进行建模,广泛应用于语音识别声学模型建模中。此次主要介绍近期lstm的一些研究进展包括lc-blstm,2d-lstm等。其中lc-blstm采用了双向lstm结构,并在训练和解码时加入了数帧的未来信息来控制延时,解决了普通双向lstm无法用于实时语音识别的问题;而2d-lstm在时间和频域两个维度上进行循环,同时保存时间轴与频域轴的序列信息,google和微软都在大规模语音识别任务上验证了这类2d-lstm结构的有效性。

第25期,基于深度学习的中文唇语识别

唇语识别,即通过运动的嘴唇,识别其说话内容。通过lstm模型将cnn抽取出来的图片特征进行时序建模,最后引入seq2seq的翻译模型将发音转换成汉字。此次分享,会先简单介绍现有的英文唇语识别的一些工作(《lipreadingsentencesinthewild》和《lipnet:sentencelevellipreading》),随后对中文唇语识别展开详细讨论。

第27期,面向对象的神经规划用于文档理解

0人收藏分享:相关文章projectfigooglefi虚拟

导语:原本八对夫妻参与基因编辑项目,其中一对夫妻在期间退出。雷锋网(公众号:雷锋网)消息,11月28日12点50分,“基因编辑婴儿”事件发酵两天之后,南方科技大学副教授贺建奎现身在香港大学李兆基会议中心的千人大