课堂笔记
这次的文章是根据牛津大学的公开课深度学习NLP中关于文本分类的课堂笔记(其实就是一些截图了,因为后来发现这个课程比较基础)。
原视频看这里:https://www.bilibili.com/video/av9817911/?p=7
首先,文本分类都有什么类型呢?
二值分类;
单标签分类;
多标签分类;
聚类(无标签)
那么分类都有哪些方法呢?各有什么优缺点?
这个比较简单,直接截图吧。
我们常用的便是基于statistical的文本分类方法。可以把这个问题表示为P(c|d), d 代表文本的表征,c代表文本的类别。
现在我们就可以把文本分类拆分成两个步骤:
表征文本;
求出文本属于类别c的概率
那表示文本的方法有哪些呢?
求概率的模型又有哪些呢?
下面列举几个常见的模型以及其优缺点:
朴素贝叶斯:
逻辑回归:
CNN:
文章最后发布于: 2018-08-12 20:50:04
相关阅读
写在开头 --这篇bigpipe的笔记早在一年前就想写了,但是一直被耽搁了。终于今天再翻看旧ppt时才想起要补上这篇博客。本文中关于big
王小波曾说,“知识虽然可以带来幸福,但假如把它压缩成药丸子灌下去,就丧失了乐趣。”十几年前,人们痴迷于王小波的文字,在他
00.JavaScript与HTML之间的交互是通过事实实现的。事件,就是文档或浏览器窗口中发生一些特定的交互瞬间。可以使用处理程序来预
Docker学习笔记(五)-fixbug2-Hash sum mismatch
build第一个docker实例docker-whale问题的办法 详细的build步骤,可以参考本人的博客 Docker学习笔记(三)- Dockerfile创建本地镜
Pointer Network Abstract 我们引入了一种新的神经网络结构来学习输出序列的条件概率,其中的元素是与输入序列中的位置对应的