Hope is a dangerous thing, but I have it.


  1. 【基础方法】基因筛选方法

    我对于基因和遗传这方面了解很少,小高考考的生物也早就还给了老师。这次看2016年的建模题,其中B题是基因相关的,长了不少见识。虽然不知道现在看的以后有没有用处,但学了就记录一下,免得忘了。    今天看的是两种基因的筛选方法,通常在预处理阶段完成。方法比较简单,编程也不难。 最小等位基因频率   等位基因频率常用于表示种群内基因的多样性,计算方法如下: $$等位基因频率=\frac{特定等位基因数量}{特定基因座数量}$$    最小等位基因频率,简称MAF(Minor Allele…

    数学建模, MathJax阅读全文

  2. 【基础方法】聚类方法(K-means、FCM)

    以前通常做的都是分类的问题,虽然说聚类也可以用于分类,但是这方面涉及的比较少,只大概了解了相关的概念。这次简单地介绍学习建模时候看到的三种聚类方法:K-means算法和FCM算法。 K-means聚类方法 K-means聚类方法通过均值进行聚类,每个原始的元素经过聚类后都属于并且只属于某一个类。这是一种严格划分的方法,也可称为硬划分(HCM)。    对于给定的含有$n$个元素的数据集$X$,$x_k$是其中第$k$个元素,$1\leqslant k\leqslant n$。将该数据集聚类…

    数学建模, matlab, 机器学习, MathJax阅读全文

  3. 【基础方法】Traveling Salesman Problem 问题和解决办法

    TSP问题其实之前就学过,但是之前介绍的是递归贪心和动规的方法,这次看论文,看到了2-opt算法和蚁群算法,做一个简单的介绍。 TSP问题简单介绍 TSP(Traveling Salesman Problem),即旅行商问题或货郎担问题。假设有一个商人,需要去$n$个城市进行售卖,要求每个城市去且仅去一次,城市与城市之间的距离为确定值,最后返回出发城市,目标是求得一条最优路线,使得商人所走的路程最短。    这一个NP-hard问题,即在确定多项式时间内无法求解的问题。从图论的角度来看,这…

    算法, 数学建模, MathJax阅读全文

  4. 【语言特性】matlab图形界面GUIDE编程

    创建图形界面 在命令行直接输入guide创建一个空白的GUIDE程序。 界面设计 坐标轴控件 1. 设置初始不可见   将visible设置为off(框内不打勾)。 按钮控件 1. 设置初始不可点击   将enable设置为false。 下拉框控件 1. 添加下拉选择   在string中添加,回车分隔。 代码 点击按钮,浏览文件,选择图像并显示 [filename,filepath]=uigetfile('*.png…

    matlab阅读全文

  5. 【课程学习】Machine Learning 第三周

    Week 3 PROGRAMMING Logistic Regression Visualizing the data 这一段可以自己写,但是在pdf中也有直接的代码可以添加在plotdata.m中: % Find Indices of Positive and Negative Examples pos = find(y==1); neg = find(y == 0); % Plot Examples plot(X(pos, 1), X(pos, 2), 'k+'…

    机器学习, matlab, coursera阅读全文

  6. 【实验分析】考虑平局的投票分类器

    在基础分类器中,除了最近邻的方法外,投票也是常用的一种方法。投票的原理是:每一个部分拥有一票或多票,根据一定的规则投给某一个类别,获得最多票数的类别是最终得到的类别。 基础算法   很多matlab的实现投票分类器的代码如下: a=1:c; % c是类别数 for i=1:num h(i,:)=hist(index(i,:),a); % index是一个矩阵,每一个位置都有一个数字,在0到c之间 end [~,ind]=max(h,[],2);   我一开始也是使用这种方法…

    matlab, 机器学习, 实验阅读全文

  7. 【课程学习】《统计学习方法》之k近邻法

    相似度查询有两种方法:  1. 范围查询,给定阈值。  2. k近邻查询,给定查询点和k。   k近邻法是一种基本分类与回归的方法。其基本思想是:一个样本的k个最相近的样本大多属于某一个类,则该样本也属于这个类。因此,k近邻算法不具有显式的学习过程。k值的选择、距离度量和分类决策规则是k近邻方法的三个基本要素。 k近邻算法 k近邻算法流程 输入:训练数据集$T={(x_1,y_1),(x_2,y_2),…,(x_N,y_N)}$,其中,$x \in X \subseteq R^n$为实…

    机器学习, 统计学习方法, MathJax阅读全文

  8. 【课程学习】Machine Learning 第一周和第二周

    一直有想看Andrew Ng的机器学习课程,但是拖了很久都没有看完。之前也写过一些相关的博客,但是在博客搬家的时候没有保存下来。   第一周和第二周的内容比较少,作业也是在一起布置的。 WEEK 1 Introduction What is machine learning? 1. 机器学习的定义:为了完成某个目标T,从经验E中学习,同时具有一定的判断标准P。 Supervised Learning 1. 监督学习:部分样本已有正确的结果。 2. 分类:  回归…

    机器学习, matlab, coursera, MathJax阅读全文

  9. 【生活总结】从苏大到东南,四年又三年

    保研的所有在9月28日定下来了,最后去了东南大学计算机科学与工程学院,进了PALM实验室,以后可能会做自然语言处理。 前期准备 在我高考炸了报考苏大的时候,就准备读研了。当时还想着读了其他专业转专业到金融来着,但是读了一年计算机觉得也可以,比金融好一些,就放弃了转专业。但是从始至终我都知道自己是要读研究生的,所以也不存在晃晃荡荡的。绩点也还可以,保证我可以拿到校内的保研名额,也没有挂过科。   科研方面,很多人加入了ACM,然后去打比赛,拿铜牌银牌金牌,我认识一个保研去了南大现在在微软实习…

    生活, 总结阅读全文

  10. 【课程学习】《统计学习方法》之感知机

    感知机(perceptron)是一种二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,通常取$+1$和$-1$两值。感知机学习目的是求出将训练数据进行线性划分的分离超平面。 感知机模型 超平面   对于超平面,我们常用以下的方程来表示: $$\omega\cdot x+b=0$$   其中,$\omega$是超平面的法向量,这决定超平面的方向,$b$是超平面的截距,决定超平面到原点的距离。   一般来说,超平面维度都大于3。百度百科上解释超平面是$n$维空间到$n-…

    机器学习, python, 统计学习方法, MathJax阅读全文