论文综述
Modern Deep Learning Techniques APPlied to Natural Language Processing
这是一篇在线的概述文章,介绍了NLP的发展历史,以及最新处理NLP任务的方法,从词的分布式表示如word2vec,Glove等词向量模型,到CNN、RNN等分类模型和seq2seq序列到序列模型,已经注意力attention模型,再到并行化注意力Transformer模型,并对比了不同方法在词性标注、句法分析、命名实体识别、语义角色标注、情感分类、机器翻译、问答系统等不同任务上的表现。这个是最近更新,非常值得阅读!!!
英文原文:https://nlpoverview.com/index.html
中文翻译:万字长文概述NLP中的深度学习技术,https://www.jiqizhixin.com/articles/2019-02-28-12
Speech and Language Processing
这个是NLP大牛Daniel Jurafsky的关于语音和语言处理的一本书,NLP领域非常经典的入门教程,语言通俗易通,实例简单形象。最近作者在写最新的第三版,要知道第二版是2008年完成的,最新版除了介绍传统的自然语言处理方法外,如贝叶斯分类、逻辑回归、TF-IDF等,也加入了最新的神经网络和深度学习一类方法,有介绍神经网络语言模型、问答系统、对话系统、机器翻译等。还有信息检索、实体链接分析等。现在第三版还没有完全写完,作者把已经完成的公开在网站上,可供下载。
网站主页:https://web.stanford.edu/~jurafsky/slp3/
网盘地址:链接:https://pan.baidu.com/s/16XaXdqCKWwtle-TATl3Nwg 提取码:expw
An Introduction to conditional Random fields
本篇论文详细介绍了条件随机场(Conditional Random Fields,CRF)模型,了解CRF模型必读论文,包括有四个部分:
第一部分介绍了CRF模型的基础知识图模型,还有判别式模型和生成式模型的区别。
第二部分介绍了两种CRF模型,Linear-chain CRFs和General CRFs,并介绍了CRF中的特征工程和特征选择。
第三部分介绍了CRF模型的参数优化和模型训练,主要是最大似然估计,随机梯度下降法。
第四部分包括CRF的具体应用如NLP中的分词、词性标注、命名实体识别等序列标注任务。
论文下载:https://homepages.inf.ed.ac.uk/csutton/publications/crftut-fnt.pdf
云盘地址:链接: https://pan.baidu.com/s/1dnXLEOvgYeo-Ag8DBz9A_w 密码: q754
Supervised sequence Labelling with Recurrent Neural Networks
该论文详细介绍了神经网络、RNN、LSTM等基础知识,以及数学公式推导和求解过程,还介绍了神经网络方法在有监督的序列标注问题上的应用。具体包括神经网络、多层感知器的介绍,RNN,BiLSTM网络的构建和梯度求解,了解神经网络相关知识必读论文。
论文下载:https://www.cs.toronto.edu/~graves/phd.pdf
云盘地址:链接: https://pan.baidu.com/s/1DE2QMIdgM9qPqnZ_GR7gUQ 密码: uyxs
Sentiment Analysis and Opinion Mining
这个不算是一篇论文,内容较多,其实是一本书,作者详细总结了情感分析(Sentiment Analysis)和意见挖掘(Opinion Mining)领域的所有的研究方向,和一些经典的研究方法。包括文本情感分析的定义,情感分析的问题细分,如句子级别和文档级别。还有细粒度的情感分析,主观和客观的意见分析等。以及观点和意见的摘要生成。总结的方法包括无监督方法:基于词典方法、基于规则的方法、基于主题模型的方法;有监督方法:支持向量机SVM、CRF模型。
论文下载:https://www.cs.uic.edu/~liub/FBS/SentimentAnalysis-and-OpinionMining.pdf
云盘地址:链接: https://pan.baidu.com/s/1HXyDjbJeCobGKVMOkoOwtg 密码: tgf4
Deep Learning for Sentiment Analysis A Survey
该论文总结了深度学习在情感分析领域的应用,包括不同的模型方法,首先介绍了神经网络、深度学习的基础知识,以及实际应用场景,然后分别介绍了不同的模型如何完成情感分析任务,包括词向量word2vec模型、CNN、RNN、LSTM、Attention模型、Memory Network等各种主流模型。对于研究NLP中情感分析领域属于必读论文。
论文下载:https://arxiv.org/ftp/arxiv/papers/1801/1801.07883.pdf
云盘地址:链接: https://pan.baidu.com/s/1eMZPNvNpYg1EU79AiEewTw 密码: 9ad2
recent Trends in Deep Learning based Natural Language Processing
该论文总结了如今深度学习在NLP领域的研究热点和趋势,以及深度学习在解决各类NLP问题上的尝试,从词的表示学习讲起包括词词向量、字符向量、word2vec模型等,到CNN模型的文本分类,到RNN的语言模型、句子分类。递归神经网络(Recursive neural networks)的情感分析,还有注意力Attention、Memory Network在问答系统、对话系统中的应用。
论文下载:https://arxiv.org/pdf/1708.02709.pdf
网盘地址:链接: https://pan.baidu.com/s/1mZmCFAZy9FYhWb3vK3Xv_w 密码: sw34
未完,有时间更新~
相关阅读
摘要:中文分词是中文信息处理的重要基础,本文详细阐述了目前主要的几种中文分词算法的技术原理 、中文分词目前的瓶颈和评价准则,以
如何高效的整理文献并做综述(使用docear) 阅读大量的paper是研究生一项基本的工作,尤其是在做一项课题研究的初期,而有些文献我们在
转载自:https://zhuanlan.zhihu.com/p/32214787 研究的基本问题: 对应流程中的三个过程有三个研究的基本问题: 1.问题分析:如何去