解决python bug(关于Paddle分布式训练):Exit with signal X

avatar
作者
筋斗云
阅读量:0

解决python bug[关于Paddle分布式训练]:Exit with signal X

  • 本人在通过Paddle实现多目标检测跟踪时遇到了一个小bug。

Exit with signal X

  • 后来通过查询相关资料得知,引发这个bug的原因是当前使用的服务器为单卡,不是多卡,而代码中调用的是多卡分布式训练方式,所以会引发报错,一种解决方案是将多卡分布式训练转为单卡训练。由于这里使用的是百度的Paddle框架,所以其他框架可能并不适用哈!

多卡训练(需根据自己需求进行更改)

python -m paddle.distributed.launch --log_dir=./mcfairmot_dla34_30e_1088x608_visdrone_vehicle_bytetracker/  --gpus 0 ./PaddleDetection/tools/train.py -c ./PaddleDetection/configs/mot/mcfairmot/mcfairmot_dla34_30e_1088x608_visdrone_vehicle_bytetracker.yml 

单卡训练(需根据自己需求进行更改)

python ./PaddleDetection/tools/train.py -c ./PaddleDetection/configs/mot/mcfairmot/mcfairmot_dla34_30e_1088x608_visdrone_vehicle_bytetracker.yml 

将多卡分布式训练命令转为单卡训练命令,bug就解决啦!!!

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!