-
【语言特性】tf.keras不常见问题汇总
1. tf.keras同样是mse,但是作为loss和metrics的输出结果不一致。 可以参见这个问题。其实就是loss根据Batch算的,而metrics算的是全部的,所以metrics计算的是正确的结果。这个bug我看到在github上面提出来过了,据说已经fix了,但是不知道怎么又在tf2.0中出现了。 2. tf.keras相同模型相同训练集和测试集,相同服务器运行代码,多次的结果对应的…
-
【语言特性】tf.keras多输出和自定义loss
基础Loss tf.keras中自带了很多loss函数,比如回归问题的MSE和分类问题的交叉熵等,通常我们会在model.compile中设置,如下代码所示: model.compile(optimizer='adam', loss='mean_squared_error', metrics=[]) 多个输出,loss计算独立 但是最近做的工作是一个多任务的问题,需要计算多个输出的loss,然后将它们加起来求平均作为最终的Loss,…
-
【语言特性】Python 常用方法
Dataframe 1. 去掉某个元素为空的一行(以免去停后文本为空) data.dropna(inplace=True) 2. 去掉重复项(但是会导致用range进行遍历的时候在删掉位置报错) data = data.drop_duplicates 3. 遍历 for index, row in data.iterrows(): texts.append(row['text']) labels1.append(row['…
-
【实验分析】Evaluation Matrics
因为最近实验歇一阵,所以有时间给我停一下去看一下论文和代码。评估指标的话之前刚来的时候也看过一些,但是那时候也就是看看,也没有写代码,也没有用起来,所以其实后来就忘了,用的时候也就是在用师姐的代码,理解也不够,有时候指标结果不好也说不清为什么。所以现在趁着有机会看一下这些指标。 这里参照了Zhang的论文A review on multi-label learning algorithms和Yang的论文Relevant Emotion Ranking from Text Constr…
-
【课程学习】《统计学习方法》之感知机
感知机(perceptron)是一种二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,通常取$+1$和$-1$两值。感知机学习目的是求出将训练数据进行线性划分的分离超平面。 感知机模型 超平面 对于超平面,我们常用以下的方程来表示: $$\omega\cdot x+b=0$$ 其中,$\omega$是超平面的法向量,这决定超平面的方向,$b$是超平面的截距,决定超平面到原点的距离。 一般来说,超平面维度都大于3。百度百科上解释超平面是$n$维空间到$n-…
-
【基础配置】用jupyter notebook进行hexo博客管理
我很久都没有再发博客,很大一部分的原因是我总是很懒得切换系统去发博客,而且我的linux输入法有问题每次都需要重装,这让我觉得很痛苦。前几天丁丁给我安利了jupyter notebook,我也恰巧想把博客转成一个随记的地方,就配置了试试。 准备工作 我是在服务器上安装jupyter notebook,系统是Linux。这里有一个官方的安装配置的[介绍][1],可以参考下。 [1]: http://jupyter.org/install.html 智障的我一开始以为是本地安装,虽然后面改…