-
【论文阅读】论文泛读系列
最近开始期末考试和大作业,好久都没有看论文。虽然说要坚持看论文,但是要不是组会,还不知道什么时候再开始看。这次的几篇都是选组会论文的时候看的。 Interpretable Emoji Prediction via Label-Wise Attention LSTMs 简介 这是我选的这周组会讲的论文,是一篇很简单的论文了。我觉得可能是实验比较好,而且分析很多。 * 标题:Interpretable Emoji Prediction via Label-Wise Attention…
-
【论文阅读】论文泛读系列
Emmm……我在周报没能每周完成的情况下又开了新的专题,关于论文阅读的,一般应该是有一篇精读,几篇泛读。其实我有一个进行文献管理的软件Mendeley,还是挺好用的,在此做一下安利。 Sentence-State LSTM for Text Representation 简介 这是我选的这周组会讲的论文,所以读的会比较详细一点。这篇论文的基本信息如下: * 标题:Sentence-State LSTM for Text Representation * 作者:Zhang Yue…
-
【实验分析】新浪文本预处理
最近写完模式识别的综述,终于能安安静静坐下来写一段时间的代码,现在的主要工作还是想把师姐的Emotion Detection的Ranking Loss的方法加到LSTM中,虽然怎么加ranking和loss还没有想好。这篇介绍的是文本的数据处理部分。 读取数据 数据这里用的是新浪新闻的数据,一个txt中保存的是一篇新闻对应的信息,包括时间、情感标签(6种)、标题和文本,具体如下。我们需要使用的就是情感标签和文本两个部分。 [url] http://news.sina.com.cn/s/2…
-
【基础方法】基因筛选方法
我对于基因和遗传这方面了解很少,小高考考的生物也早就还给了老师。这次看2016年的建模题,其中B题是基因相关的,长了不少见识。虽然不知道现在看的以后有没有用处,但学了就记录一下,免得忘了。 今天看的是两种基因的筛选方法,通常在预处理阶段完成。方法比较简单,编程也不难。 最小等位基因频率 等位基因频率常用于表示种群内基因的多样性,计算方法如下: $$等位基因频率=\frac{特定等位基因数量}{特定基因座数量}$$ 最小等位基因频率,简称MAF(Minor Allele…
-
【基础方法】聚类方法(K-means、FCM)
以前通常做的都是分类的问题,虽然说聚类也可以用于分类,但是这方面涉及的比较少,只大概了解了相关的概念。这次简单地介绍学习建模时候看到的三种聚类方法:K-means算法和FCM算法。 K-means聚类方法 K-means聚类方法通过均值进行聚类,每个原始的元素经过聚类后都属于并且只属于某一个类。这是一种严格划分的方法,也可称为硬划分(HCM)。 对于给定的含有$n$个元素的数据集$X$,$x_k$是其中第$k$个元素,$1\leqslant k\leqslant n$。将该数据集聚类…
-
【基础方法】Traveling Salesman Problem 问题和解决办法
TSP问题其实之前就学过,但是之前介绍的是递归贪心和动规的方法,这次看论文,看到了2-opt算法和蚁群算法,做一个简单的介绍。 TSP问题简单介绍 TSP(Traveling Salesman Problem),即旅行商问题或货郎担问题。假设有一个商人,需要去$n$个城市进行售卖,要求每个城市去且仅去一次,城市与城市之间的距离为确定值,最后返回出发城市,目标是求得一条最优路线,使得商人所走的路程最短。 这一个NP-hard问题,即在确定多项式时间内无法求解的问题。从图论的角度来看,这…
-
【语言特性】matlab图形界面GUIDE编程
创建图形界面 在命令行直接输入guide创建一个空白的GUIDE程序。 界面设计 坐标轴控件 1. 设置初始不可见 将visible设置为off(框内不打勾)。 按钮控件 1. 设置初始不可点击 将enable设置为false。 下拉框控件 1. 添加下拉选择 在string中添加,回车分隔。 代码 点击按钮,浏览文件,选择图像并显示 [filename,filepath]=uigetfile('*.png…
-
【课程学习】Machine Learning 第三周
Week 3 PROGRAMMING Logistic Regression Visualizing the data 这一段可以自己写,但是在pdf中也有直接的代码可以添加在plotdata.m中: % Find Indices of Positive and Negative Examples pos = find(y==1); neg = find(y == 0); % Plot Examples plot(X(pos, 1), X(pos, 2), 'k+'…
-
【实验分析】考虑平局的投票分类器
在基础分类器中,除了最近邻的方法外,投票也是常用的一种方法。投票的原理是:每一个部分拥有一票或多票,根据一定的规则投给某一个类别,获得最多票数的类别是最终得到的类别。 基础算法 很多matlab的实现投票分类器的代码如下: a=1:c; % c是类别数 for i=1:num h(i,:)=hist(index(i,:),a); % index是一个矩阵,每一个位置都有一个数字,在0到c之间 end [~,ind]=max(h,[],2); 我一开始也是使用这种方法…
-
【课程学习】《统计学习方法》之k近邻法
相似度查询有两种方法: 1. 范围查询,给定阈值。 2. k近邻查询,给定查询点和k。 k近邻法是一种基本分类与回归的方法。其基本思想是:一个样本的k个最相近的样本大多属于某一个类,则该样本也属于这个类。因此,k近邻算法不具有显式的学习过程。k值的选择、距离度量和分类决策规则是k近邻方法的三个基本要素。 k近邻算法 k近邻算法流程 输入:训练数据集$T={(x_1,y_1),(x_2,y_2),…,(x_N,y_N)}$,其中,$x \in X \subseteq R^n$为实…