Hope is a dangerous thing, but I have it.


【基础配置】服务器tensorflow-gpu2.0安装

   原来一直用的tensorflow,但是由于它静态图的属性,每次debug都很艰难,要看计算的值都要传出来才能看到,而且要一次搭建成功了才能run。总之说来就是凭着经验和运气在debug,虽然说好像也有一个debug的工具,但是在pycharm上并不可用(或者是我没找到方法)。本来说做完横向就转去学pytorch,实验室似乎除了我和林小可爱就没人用tf了。林海博在此时给我安利了tf2.0,在网上看了一些教程,我也学了两天用它写了个简单的分类的程序,顿时感觉嘤嘤嘤太好用了。本地没有GPU还是跑的慢,所以还是要在服务器上运行。
    服务器上之前装tf-gpu都是直接卸载然后重装就行,但是这次有些问题。首先是到今天,conda还是没有tensorflow-gpu2.0,而且直接用pip装还报了如下的一些错:

ERROR: tensorflow 1.3.0 has requirement tensorflow-tensorboard<0.2.0,>=0.1.0, but you'll have tensorflow-tensorboard 1.5.1 which is incompatible.

ERROR: tensorboard 2.0.0 has requirement setuptools>=41.0.0, but you'll have setuptools 40.2.0 which is incompatible.

ERROR: Cannot uninstall 'wrapt'. It is a distutils installed project and thus we cannot accurately determine which files belong to it which would lead to only a partial uninstall.

    前两个都是版本的问题,第三个是因为旧版本依赖多,不能清晰的删除,此时应该忽略旧版本升级。后来发现下面一个可行的方法。

  1. 在conda中创建一个虚拟环境。anconda作为一个环境管理的工具,我现在才发现它的优秀品质,我错了。然后激活环境。
conda create -n tf2 python=3.6
source activate tf2
  1. 升级pip。
pip install --upgrade pip
  1. 安装cuda10和cudnn7.3
conda install cudatoolkit=10 cudnn=7.3
  1. 安装tf-gpu2.0。要更改到清华源(之前没改下了一夜……)
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tensorflow-gpu==2.0.0

    然后可以使用 conda list 查看当前的环境。或者用如下代码查看:

python
import tensorflow as tf
print(tf.__version__)

exit()