Skip to content

XxxuLimei/deeplabv3plus_re

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

30 Commits
 
 
 
 
 
 
 
 

Repository files navigation

deeplabv3plus_re

semantic segmentation on ros

0410:

  1. 学习CityScapes数据集的使用;
  2. 尝试将Citycapes中的图片以ROS格式发布;

0411:

  1. 将Cityscapes数据集下载好后,使用官方的scripts脚本进行处理,之后整理好train和val文件夹;
  2. 组织了半天Cityscapes数据集的文件夹,,,应该将下载好的数据集,解压之后,从文件夹里把子文件夹取出来。
  3. 下载resnet101的权重文件,注意下载好的.pth.tar无需解压,提示解压错误后就说明这本身就是一个权重文件,可以直接使用。
  4. 运行main.py脚本python main.py --model deeplabv3plus_resnet101 --gpu_id 0 --lr 0.1 --crop_size 768 --batch_size 16 --output_stride 16 --ckpt ./result/best_deeplabv3plus_resnet101_cityscapes_os16.pth.tar --test_only --save_val_results --data_root /home/xilm/Cityscapes/ --dataset cityscapes
Device: cuda
Dataset: cityscapes, Train set: 2975, Val set: 500
Downloading: "https://download.pytorch.org/models/resnet101-5d3b4d8f.pth" to /home/xilm/.cache/torch/hub/checkpoints/resnet101-5d3b4d8f.pth
100%|████████████████████████████████████████████████████████████████████| 170M/170M [01:07<00:00, 2.64MB/s]
Model restored from ./result/best_deeplabv3plus_resnet101_cityscapes_os16.pth.tar
125it [12:46,  6.13s/it]

Overall Acc: 0.958689
Mean Acc: 0.837516
FreqW Acc: 0.923537
Mean IoU: 0.762100

运行之后,获得了许多分割结果,这些结果都保存在./results文件夹下。




5. 运行predict.py脚本:python predict.py --model deeplabv3plus_resnet101 --gpu_id 0 --crop_size 768 --output_stride 16 --ckpt ./result/best_deeplabv3plus_resnet101_cityscapes_os16.pth.tar --save_val_results_to ./result/ --dataset cityscapes --input /home/xilm/Cityscapes/leftImg8bit/test/berlin/berlin_000001_000019_leftImg8bit.png

(base) xilm@xilm-MS-7D17:~/fuxian/deeplabv3plus/DeepLabV3Plus-Pytorch-master$ python predict.py --model deeplabv3plus_resnet101 --gpu_id 0 --crop_size 768 --output_stride 16 --ckpt ./result/best_deeplabv3plus_resnet101_cityscapes_os16.pth.tar --save_val_results_to ./result/ --dataset cityscapes --input /home/xilm/Cityscapes/leftImg8bit/test/berlin/berlin_000001_000019_leftImg8bit.png
Device: cuda
Resume model from ./result/best_deeplabv3plus_resnet101_cityscapes_os16.pth.tar
100%|█████████████████████████████████████████████████████████████████████████| 1/1 [00:00<00:00,  2.12it/s]

运行结束后获得了分割结果。


6. 接下来准备将Cityscapes的图片通过ROS的方式发布出去。

  • Cityscapes官网上下载下面的数据集,它包含了三个完整的视频;
  • 编写img_pub.py脚本,对数据集中的图像进行发布,该脚本我放到了pub文件夹下;
  • 编写好之后,右键该文件,勾选Allow executing file as program,使该文件可以通过rosrun进行运行;
  • 运行source devel/setup.bash,然后运行RViz;
  • 接着再次运行source devel/setup.bash,输入rosrun img_seg img_pub.py后,就可以在RViz上进行订阅,然后显示视频了。
  1. 对发布的图像数据进行订阅,用于语义分割,并将语义分割的结果发布出来,在RViz上进行显示。
  • 复现成功,结果如下:

    可以看出,具有一定的延迟,没有办法做到实时。

这个库的功能就到这里啦,接下来继续openpcdet-ros。

About

semantic segmentation on ros

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages