“DeepFaceLab问题整理”的版本间的差异

来自人工智能助力教育知识百科
跳转至: 导航搜索
在学校的GPU集群平台上遇到的问题:
第7行: 第7行:
 
1. Tensorflow-gpu最好安装1.13.1版本的,DFL的requirements.txt里虽然写的是2.4.0,但是真正调用的时候其实用的是1的兼容包<br>
 
1. Tensorflow-gpu最好安装1.13.1版本的,DFL的requirements.txt里虽然写的是2.4.0,但是真正调用的时候其实用的是1的兼容包<br>
 
2. 在DeepFaceLab\models\Model_SAEHD\Model.py中,654行附近有一句multiprocessing.cpu_count(),在这个平台上运行要改成<br>
 
2. 在DeepFaceLab\models\Model_SAEHD\Model.py中,654行附近有一句multiprocessing.cpu_count(),在这个平台上运行要改成<br>
  cpu_count = min(multiprocessing.cpu_count(),8) #8可以改成实际申请到的CPU核心数,如果不改的话会导致环境崩掉,因为读取到的是80,与分配的并不相符
+
  cpu_count = min(multiprocessing.cpu_count(),16) #实测16以内是可以正常运行的。
 +
3. 如何停掉训练,正常操作应该是按ctrl+c,如果ctrl+c无法被响应,可以按ctrl+z暂停进程(按fg可以调回前台继续运行),然后输入
 +
 
 +
与手动一个一个kill掉效果一样,只不过这样更快一些

2021年10月19日 (二) 01:55的版本

百科首页 | 3D虚拟世界 | 音乐与人工智能 | 人工智能机器人 | 关于我们 | 网站首页
背景知识 | DeepFaceLab |DeepFaceLab问题整理 | 研究整理

此版块作用

记录使用DFL踩过的一些坑

在学校的GPU集群平台上遇到的问题:

1. Tensorflow-gpu最好安装1.13.1版本的,DFL的requirements.txt里虽然写的是2.4.0,但是真正调用的时候其实用的是1的兼容包
2. 在DeepFaceLab\models\Model_SAEHD\Model.py中,654行附近有一句multiprocessing.cpu_count(),在这个平台上运行要改成

cpu_count = min(multiprocessing.cpu_count(),16) #实测16以内是可以正常运行的。

3. 如何停掉训练,正常操作应该是按ctrl+c,如果ctrl+c无法被响应,可以按ctrl+z暂停进程(按fg可以调回前台继续运行),然后输入

与手动一个一个kill掉效果一样,只不过这样更快一些