mmsegmentation_train

MMSegmentation 训练脚本

https://github.com/wcnnnn/mmsegmentation_train

Science Score: 44.0%

This score indicates how likely this project is to be science-related based on various indicators:

✓
CITATION.cff file
Found CITATION.cff file
✓
codemeta.json file
Found codemeta.json file
✓
.zenodo.json file
Found .zenodo.json file
○
DOI references
○
Academic publication links
○
Academic email domains
○
Institutional organization owner
○
JOSS paper metadata
○
Scientific vocabulary similarity
Low similarity (2.4%) to scientific vocabulary

Last synced: 6 months ago · JSON representation ·

Repository

MMSegmentation 训练脚本

Basic Info

Host: GitHub
Owner: wcnnnn
License: apache-2.0
Language: Python
Default Branch: main
Size: 5.2 MB

Statistics

Stars: 0
Watchers: 1
Forks: 0
Open Issues: 0
Releases: 0

Created about 1 year ago · Last pushed about 1 year ago

Metadata Files

Readme Contributing License Code of conduct Citation

MMSegmentation 训练脚本

本项目包含多个语义分割模型的训练脚本，基于 MMSegmentation 框架。

项目结构准备

创建必要的目录: bash mkdir data pretrain work_dirs
下载预训练权重到 pretrain/ 目录: ```bash

ResNet-50 预训练权重 (基础卷积模型使用)

wget https://download.pytorch.org/models/resnet50-11ad3fa6.pth -P pretrain/

Swin-Transformer 预训练权重 (Transformer类模型使用)

wget https://github.com/SwinTransformer/storage/releases/download/v1.0.0/swinbasepatch4window12384_22k.pth -P pretrain/

ViT 预训练权重 (ViT-Adapter等模型使用)

wget https://github.com/rwightman/pytorch-image-models/releases/download/v0.1-vitjx/jxvitbasep16384-83fb41ba.pth -P pretrain/

SegFormer 预训练权重

wget https://download.openmmlab.com/mmsegmentation/v0.5/pretrain/segformer/mitb020220624-7e0fe6dd.pth -P pretrain/

PoolFormer 预训练权重

wget https://download.openmmlab.com/mmsegmentation/v0.5/pretrain/poolformer/poolformers128xb256in1k20221230-a59e4e30.pth -P pretrain/ ```

下载并解压 ADE20K 数据集: ```bash # 下载数据集 wget http://data.csail.mit.edu/places/ADEchallenge/ADEChallengeData2016.zip

解压到data目录

unzip ADEChallengeData2016.zip -d data/ade/ ```

环境配置

安装基础依赖: ```bash pip install torch torchvision pip install -U openmim pip install mmengine

安装MMCV (如果在线安装失败，可以尝试以下方法)

1. 从 https://pypi.org/project/mmcv/2.1.0/#files 下载源文件 mmcv-2.1.0.tar.gz

2. pip install mmcv-2.1.0.tar.gz

pip install mmcv>=2.0.0 pip install mmsegmentation ```
安装额外依赖(针对特定模型): ```bash

对于 Mask2Former 等模型

pip install mmdet

对于 PoolFormer 等模型

pip install mmpretrain ```

目录结构

确保项目结构如下: ``` data/ └── ade/ └── ADEChallengeData2016/ ├── annotations/ │ ├── training/ │ └── validation/ └── images/ ├── training/ └── validation/

pretrain/ ├── resnet50-11ad3fa6.pth ├── swinbasepatch4window1238422k.pth ├── jxvitbasep16384-83fb41ba.pth ├── mitb020220624-7e0fe6dd.pth └── poolformers128xb256in1k_20221230-a59e4e30.pth ```

可用模型

| 类别 |:---------------|:------- | 基础卷积 | | PSPNet | | DeepLabV3+ | | UPerNet | | OCRNet | 注意力机制 | | ISANet | | NonLocal | | DNLNet | | PSANet | Transformer| | | Segmenter | | SegNext | | SETR | | ViT-Adapter | 实例分割 | | MaskFormer | | PointRend | | KNet | 轻量级 | | PoolFormer | 其他 | | ResNeSt | | SeMask | | STDC | | Twins | | SWIN | 模型 | 训练脚本 | 说明 | --------------------|:---------------------------------|:-------------------------------------------------------------------------| | FCN | train_fcn.py | 全卷积网络，将全连接层替换为卷积层，输出与输入图像相同大小的分割结果。 | | train_pspnet.py | 金字塔场景解析网络，通过金字塔池化模块捕获不同尺度的上下文信息。 | | train_deeplabv3plus.py | 基于空洞卷积的编解码器结构，捕捉多尺度信息，提高分割精度。 | | train_upernet.py | 统一感知解析网络，处理多种视觉任务，具有较好的通用性和扩展性。 | | train_ocrnet.py | 引入目标上下文信息，提高分割的准确性。 | | GCNet | train_gcnet.py | 全局上下文网络，捕获长距离依赖关系，增强特征表示能力。 | | train_isanet.py | 交互式自注意力网络，增强特征之间的交互信息。 | | train_nonlocal.py | 非局部注意力网络，通过非局部操作捕获长距离依赖关系。 | | train_dnlnet.py | 双重注意力网络，同时捕捉空间和通道维度的信息。 | | train_psanet.py | 点采样注意力网络，提高分割效率。 | SegFormer | train_segformer.py | 分层 Transformer 网络，采用轻量级解码器，高效进行语义分割。 | | train_segmenter.py | 纯 Transformer 分割网络，利用强大的特征提取能力实现高精度分割。 | | train_segnext.py | 结合卷积和 Transformer 优点，提升分割性能。 | | train_setr.py | Transformer 编码器网络，捕捉全局信息，提升分割精度。 | | trainvitdeit.py | 通过适配器将预训练的视觉 Transformer 应用于分割任务。 | | Mask2Former | train_mask2former.py | 掩码注意力网络，处理实例边界，提升实例分割性能。 | | train_maskformer.py | 生成掩码进行实例分割，实现高效分割。 | | train_pointrend.py | 点渲染策略，关键位置精细分割，提升实例分割精度。 | | train_knet.py | 核网络，捕捉实例形状信息，提升实例分割效果。 | | MobileNetV2 | train_mobilenetv2.py | 移动端优化的卷积网络，低计算复杂度，适用于资源受限设备。 | | train_poolformer.py | 池化 Transformer 网络，通过池化操作实现高效特征提取。 | | FastFCN | train_fastfcn.py | 快速全卷积网络，快速卷积操作，提高分割效率。 | | train_resnest.py | 改进的残差结构，增强特征表示能力，提升分割性能。 | | trainsemfpn.py | 语义掩码特征金字塔网络，捕捉不同尺度语义信息，提升分割效果。 | | train_stdc.py | 短时程动态卷积网络，减少计算量，提高分割效率。 | | train_twins.py | 孪生 Transformer 网络，捕捉不同尺度特征信息，提升分割性能。 | | train_swin.py | 层次化窗口 Transformer 网络，减少计算量，提高分割效率。 |

训练说明

所有模型使用统一的训练参数:
批次大小: 2
训练轮次: 80k/160k iterations (根据模型配置)
验证间隔: 4000 iterations
图像尺寸: 512x512
启动训练: ```bash

训练单个模型

python train_fcn.py ```
训练输出:
模型权重保存在: work_dirs/{model_name}_ade20k/
训练日志保存在: work_dirs/{model_name}_ade20k/

Owner

Login: wcnnnn
Kind: user

Repositories: 1
Profile: https://github.com/wcnnnn

Citation (CITATION.cff)

cff-version: 1.2.0
message: "If you use this software, please cite it as below."
authors:
  - name: "MMSegmentation Contributors"
title: "OpenMMLab Semantic Segmentation Toolbox and Benchmark"
date-released: 2020-07-10
url: "https://github.com/open-mmlab/mmsegmentation"
license: Apache-2.0

GitHub Events

Total

Push event: 1
Create event: 2

Last Year

Push event: 1
Create event: 2

Dependencies

.github/workflows/deploy.yml actions

actions/checkout v3 composite
actions/setup-python v4 composite

.circleci/docker/Dockerfile docker

pytorch/pytorch ${PYTORCH}-cuda${CUDA}-cudnn${CUDNN}-devel build

docker/Dockerfile docker

pytorch/pytorch ${PYTORCH}-cuda${CUDA}-cudnn${CUDNN}-devel build

docker/serve/Dockerfile docker

pytorch/pytorch ${PYTORCH}-cuda${CUDA}-cudnn${CUDNN}-devel build

requirements/albu.txt pypi

albumentations >=0.3.2

requirements/docs.txt pypi

docutils ==0.16.0
myst-parser *
sphinx ==4.0.2
sphinx_copybutton *
sphinx_markdown_tables *
urllib3 <2.0.0

requirements/mminstall.txt pypi

mmcv >=2.0.0rc4,<2.2.0
mmengine >=0.5.0,<1.0.0

requirements/multimodal.txt pypi

ftfy *
regex *

requirements/optional.txt pypi

cityscapesscripts *
diffusers *
einops ==0.3.0
imageio ==2.9.0
imageio-ffmpeg ==0.4.2
invisible-watermark *
kornia ==0.6
nibabel *
omegaconf ==2.1.1
pudb ==2019.2
pytorch-lightning ==1.4.2
streamlit >=0.73.1
test-tube >=0.7.5
timm *
torch-fidelity ==0.3.0
torchmetrics ==0.6.0
transformers ==4.19.2

requirements/readthedocs.txt pypi

mmcv >=2.0.0rc1,<2.1.0
mmengine >=0.4.0,<1.0.0
prettytable *
scipy *
torch *
torchvision *

requirements/runtime.txt pypi

matplotlib *
numpy *
packaging *
prettytable *
scipy *

requirements/tests.txt pypi

codecov * test
flake8 * test
ftfy * test
interrogate * test
pytest * test
regex * test
xdoctest >=0.10.0 test
yapf * test

requirements.txt pypi

setup.py pypi

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Open Source Science

mmsegmentation_train

Science Score: 44.0%

Repository

Basic Info

Statistics

Metadata Files

README.md

MMSegmentation 训练脚本

项目结构准备

ResNet-50 预训练权重 (基础卷积模型使用)

Swin-Transformer 预训练权重 (Transformer类模型使用)

ViT 预训练权重 (ViT-Adapter等模型使用)

SegFormer 预训练权重

PoolFormer 预训练权重

解压到data目录

环境配置

安装MMCV (如果在线安装失败，可以尝试以下方法)

1. 从 https://pypi.org/project/mmcv/2.1.0/#files 下载源文件 mmcv-2.1.0.tar.gz

2. pip install mmcv-2.1.0.tar.gz

对于 Mask2Former 等模型

对于 PoolFormer 等模型

目录结构

可用模型

训练说明

训练单个模型

Owner

Citation (CITATION.cff)

GitHub Events

Total

Last Year

Dependencies