“DeepFaceLab问题整理”的版本间的差异

来自人工智能助力教育知识百科
跳转至: 导航搜索
在学校的GPU集群平台上遇到的问题:
在学校的GPU集群平台上遇到的问题:
第9行: 第9行:
 
  cpu_count = min(multiprocessing.cpu_count(),16) #实测16以内是可以正常运行的。
 
  cpu_count = min(multiprocessing.cpu_count(),16) #实测16以内是可以正常运行的。
 
3. 如何停掉训练,正常操作应该是按ctrl+c,如果ctrl+c无法被响应,可以按ctrl+z暂停进程(按fg可以调回前台继续运行),然后输入
 
3. 如何停掉训练,正常操作应该是按ctrl+c,如果ctrl+c无法被响应,可以按ctrl+z暂停进程(按fg可以调回前台继续运行),然后输入
 +
[[文件:DFL问题整理图1.png]]
  
 
与手动一个一个kill掉效果一样,只不过这样更快一些
 
与手动一个一个kill掉效果一样,只不过这样更快一些

2021年10月19日 (二) 01:58的版本

百科首页 | 3D虚拟世界 | 音乐与人工智能 | 人工智能机器人 | 关于我们 | 网站首页
背景知识 | DeepFaceLab |DeepFaceLab问题整理 | 研究整理

此版块作用

记录使用DFL踩过的一些坑

在学校的GPU集群平台上遇到的问题:

1. Tensorflow-gpu最好安装1.13.1版本的,DFL的requirements.txt里虽然写的是2.4.0,但是真正调用的时候其实用的是1的兼容包
2. 在DeepFaceLab\models\Model_SAEHD\Model.py中,654行附近有一句multiprocessing.cpu_count(),在这个平台上运行要改成

cpu_count = min(multiprocessing.cpu_count(),16) #实测16以内是可以正常运行的。

3. 如何停掉训练,正常操作应该是按ctrl+c,如果ctrl+c无法被响应,可以按ctrl+z暂停进程(按fg可以调回前台继续运行),然后输入 DFL问题整理图1.png

与手动一个一个kill掉效果一样,只不过这样更快一些