Hope is a dangerous thing, but I have it.


  1. 【课程学习】《统计学习方法》之k近邻法

    相似度查询有两种方法:  1. 范围查询,给定阈值。  2. k近邻查询,给定查询点和k。   k近邻法是一种基本分类与回归的方法。其基本思想是:一个样本的k个最相近的样本大多属于某一个类,则该样本也属于这个类。因此,k近邻算法不具有显式的学习过程。k值的选择、距离度量和分类决策规则是k近邻方法的三个基本要素。 k近邻算法 k近邻算法流程 输入:训练数据集$T={(x_1,y_1),(x_2,y_2),…,(x_N,y_N)}$,其中,$x \in X \subseteq R^n$为实…

    机器学习, 统计学习方法, MathJax阅读全文

  2. 【课程学习】Machine Learning 第一周和第二周

    一直有想看Andrew Ng的机器学习课程,但是拖了很久都没有看完。之前也写过一些相关的博客,但是在博客搬家的时候没有保存下来。   第一周和第二周的内容比较少,作业也是在一起布置的。 WEEK 1 Introduction What is machine learning? 1. 机器学习的定义:为了完成某个目标T,从经验E中学习,同时具有一定的判断标准P。 Supervised Learning 1. 监督学习:部分样本已有正确的结果。 2. 分类:  回归…

    机器学习, matlab, coursera, MathJax阅读全文

  3. 【生活总结】从苏大到东南,四年又三年

    保研的所有在9月28日定下来了,最后去了东南大学计算机科学与工程学院,进了PALM实验室,以后可能会做自然语言处理。 前期准备 在我高考炸了报考苏大的时候,就准备读研了。当时还想着读了其他专业转专业到金融来着,但是读了一年计算机觉得也可以,比金融好一些,就放弃了转专业。但是从始至终我都知道自己是要读研究生的,所以也不存在晃晃荡荡的。绩点也还可以,保证我可以拿到校内的保研名额,也没有挂过科。   科研方面,很多人加入了ACM,然后去打比赛,拿铜牌银牌金牌,我认识一个保研去了南大现在在微软实习…

    生活, 总结阅读全文

  4. 【课程学习】《统计学习方法》之感知机

    感知机(perceptron)是一种二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,通常取$+1$和$-1$两值。感知机学习目的是求出将训练数据进行线性划分的分离超平面。 感知机模型 超平面   对于超平面,我们常用以下的方程来表示: $$\omega\cdot x+b=0$$   其中,$\omega$是超平面的法向量,这决定超平面的方向,$b$是超平面的截距,决定超平面到原点的距离。   一般来说,超平面维度都大于3。百度百科上解释超平面是$n$维空间到$n-…

    机器学习, python, 统计学习方法, MathJax阅读全文

  5. 【刷题小结】2016及2013苏州大学复试上机

    2016年保研上机题 题目 0. 请从服务器将两个数据文件input.txt和words.txt下载到本地电脑的D盘根文件夹。   1. 在D盘根文件夹的words.txt中存储了不超过30000条的英文单词,每个单词占一行。单词的最大长度为20,且单词内部没有空格,文件中无重复单词。   2. 在D盘根文件夹的input.txt中存储了一个“丢失”了空格和标点符号的英文文章。每行不超过128个字符,请编写程序把该文章中的第一行和最后一行。   4. 编写程序利用words.txt中的单词…

    刷题, C阅读全文

  6. 【刷题小结】2012-2014年苏州大学上机复试题

    2012年上机题 题目 从服务器上下载数据文件org.dat文件以二进制方式存放一系列整数,每个整数占4个字节。从第一个整数开始,第一个整数和第二个整数构成一个坐标点,依次类推,数据文件中保存了许多坐标点数据。   问题1:   规定处于第一象限的坐标点为有效点,请问数据文件中所有点的个数n为多少?有效点的个数k为多少?   问题2:   每个有效点与坐标原点构成一个的矩形,请问k个有效点与坐标原点构成的k个矩形的最小公共区域面积为多少?   问题3:   寻找有效点中符合下列条件的点:以…

    刷题, C阅读全文

  7. 【刷题小结】2009-2011年苏州大学上机复试题

    2009年上机复试题 题目 (1)用IE浏览器从FTP上下载org.dat,并保存在D盘的根目录下。   (2)此文件中按文本方式存放了一段其他文章,其中有若干长度小于15的十 进制或八进制数字,数字之间用“,”分开,数字内部存在且仅存在空格。   (3)八进制数以起始位“0”作为标示与十进制数区分。   (4)顺序读取这些数字将他们转变为十进制数后按从大到小的顺序排序后,输 出到D盘根目录下new.txt,每个数字一行。 eg:_235_,34_2,_043_1_,1_3 分别是:十进制…

    刷题, C阅读全文

  8. 【刷题小结】2008年苏州大学上机复试题

    2008年上机复试题 题目 (1)用IE从FTP上下载org.dat,并保存在D盘的根目录中。 (2)此文件中按文本方式存放了一段其他文章,其中有若干长度小于15的英 文单词,单词之间用空格分开,无其他符号。 (3)顺序读取这段文章的不同的单词(大小写敏感),同时在读取的过程中排除 所有的单词THE以及变形,即这些单词不能出现在读取的结果中。 (4)将读取的所有单词的首字母转大写后,输出D根目录下new.txt,每个单词一行。 那段文字可以点右键打开方式中用记事本打开,内容是: The c…

    刷题, C阅读全文

  9. 【刷题小结】2005-2007苏州大学上机复试题

    2005年上机题 题目一:把一个数表示成若干个素数的和 #include <stdio.h> #include <math.h> #include <string.h> #include <stdlib.h> bool isPrime(int n); void divideNum(int n); int count = 0; int main() { divideNum(201); system("pause")…

    刷题, C阅读全文

  10. 【生活随笔】道别

    我常常会想起和很多人初见的时候,也常常梦见很多新的初见的时刻,但是对很多人,我往往很难想起我们是在哪一刻离开,也许就是渐渐地变成了陌生人。慢慢地,过去种种,似水无痕。 这让我有的时候有些遗憾,对于要离开的人,没有好好地道个别。有的时候只是匆匆忙忙收拾好了行李,走出了宿舍,或是下了车,挥手说一句:“拜”。有些人只是在某次见面后说了一句:“我先走了。”然后就再也没有见过。 突然想到这些是因为今天有个已经毕业的朋友突然给我来了一条消息:“我是来道别的。”早先时候他和我说过,在到了一个新的地方,会删除所…

    生活阅读全文