cracks-s-d

https://github.com/xh92117/cracks-s-d

Science Score: 44.0%

This score indicates how likely this project is to be science-related based on various indicators:

✓
CITATION.cff file
Found CITATION.cff file
✓
codemeta.json file
Found codemeta.json file
✓
.zenodo.json file
Found .zenodo.json file
○
DOI references
○
Academic publication links
○
Academic email domains
○
Institutional organization owner
○
JOSS paper metadata
○
Scientific vocabulary similarity
Low similarity (3.8%) to scientific vocabulary

Last synced: 9 months ago · JSON representation ·

Repository

Basic Info

Host: GitHub
Owner: xh92117
Language: C++
Default Branch: master
Size: 3.27 MB

Statistics

Stars: 0
Watchers: 0
Forks: 0
Open Issues: 0
Releases: 0

Created 12 months ago · Last pushed 12 months ago

Metadata Files

Readme Citation

YOLO11裂缝检测增强版

这个项目为YOLO11添加了专门针对裂缝检测优化的自定义图像增强算法和CBAM注意力机制，提供了完整的对比实验框架。

🚀 主要特性

✅ 自定义增强算法: 专门针对裂缝检测优化的图像增强
✅ CBAM注意力机制: 集成卷积块注意力模块提升特征表示能力
✅ 对比实验框架: 支持多种配置的自动化对比实验
✅ 完整集成: 无缝集成到YOLO11训练流程中
✅ 模型融合验证: 支持检测和分割模型的加权框融合(WBF)验证

📁 项目结构

yolo11cracks2.0/ ├── ultralytics/ │ ├── data/ │ │ ├── custom_augment.py # 自定义增强算法实现 │ │ └── augment.py # 修改后的YOLO增强模块 │ ├── nn/modules/ │ │ └── conv.py # CBAM注意力机制实现 │ └── cfg/models/11/ │ ├── yolo11.yaml # 基础YOLO11配置 │ └── yolo11-cbam.yaml # 带CBAM的YOLO11配置 ├── valid/ │ ├── wbf_fusion.py # WBF融合算法实现 │ ├── validate.py # 验证脚本 │ └── README.md # 验证工具说明文档 ├── train.py # 原始训练脚本 ├── main.py # 新增主训练脚本(支持对比实验) └── README.md # 项目说明文档

🔧 核心功能

1. 自定义增强算法 (Custom Augment)

专门为裂缝检测设计的图像增强算法，包含以下功能： - 对比度增强: 使用CLAHE算法增强局部对比度 - 边缘增强: 通过Canny边缘检测强化裂缝特征 - 噪声添加: 添加适量噪声提高模型鲁棒性 - 亮度调整: 动态调整图像亮度适应不同光照条件 - Tanh直方图均衡化: 核心算法，动态优化图像对比度

2. CBAM注意力机制

卷积块注意力模块(Convolutional Block Attention Module)： - 通道注意力: 学习特征通道的重要性权重 - 空间注意力: 关注图像中的重要空间位置 - 特征增强: 提升裂缝特征的表示能力 - 轻量级设计: 最小化计算开销

3. 对比实验框架

支持以下实验配置的自动化对比： - 基础YOLO11 vs YOLO11+CBAM - 启用/禁用自定义增强算法 - 不同模型尺寸对比 - 自动生成实验报告

🚀 快速开始

环境要求

bash pip install ultralytics pip install opencv-python pip install scipy pip install pyyaml

基础训练

```bash

使用原始训练脚本

python train.py

使用新的主训练脚本 - 单次训练

python main.py --mode single --custom-augment --cbam

使用新的主训练脚本 - 对比实验

python main.py --mode comparison --epochs 100 ```

详细使用方法

1. 单次训练

```bash

基础YOLO11训练

python main.py --mode single --model yolo11n --data dataset/data.yaml

启用自定义增强

python main.py --mode single --custom-augment --name expcustomaug

使用CBAM注意力机制

python main.py --mode single --cbam --name exp_cbam

同时启用自定义增强和CBAM

python main.py --mode single --custom-augment --cbam --name exp_full ```

2. 对比实验

```bash

运行完整对比实验

python main.py --mode comparison --epochs 300 --batch 32

快速测试(较少轮数)

python main.py --mode comparison --epochs 50 --batch 16 ```

对比实验将自动运行以下4个配置： 1. baseline_no_custom_aug: 基础YOLO11，无自定义增强 2. baseline_with_custom_aug: 基础YOLO11，启用自定义增强 3. cbam_no_custom_aug: YOLO11+CBAM，无自定义增强 4. cbam_with_custom_aug: YOLO11+CBAM，启用自定义增强

3. 传统训练方式

```python from ultralytics import YOLO

基础模型训练

model = YOLO('ultralytics/cfg/models/11/yolo11.yaml') model.train( data='dataset/data.yaml', epochs=300, batch=32, customaugment=1, # 启用自定义增强 customaugment_p=0.5, amp=False )

CBAM模型训练

modelcbam = YOLO('ultralytics/cfg/models/11/yolo11-cbam.yaml') modelcbam.train( data='dataset/data.yaml', epochs=300, batch=32, custom_augment=1, amp=False ) ```

⚙️ 配置参数

自定义增强参数

| 参数 | 默认值 | 说明 | |------|--------|------| | custom_augment | 0 | 启用自定义增强 (0=禁用, 1=启用) | | custom_augment_p | 0.5 | 应用增强的概率 | | custom_augment_black_thresh | 0.05 | 黑色区域阈值 | | custom_augment_white_thresh | 0.1 | 白色区域阈值 | | custom_augment_intensity | 0.4 | 增强强度 | | custom_augment_sigma | 5 | 平滑系数 |

训练参数

| 参数 | 默认值 | 说明 | |------|--------|------| | epochs | 300 | 训练轮数 | | batch | 32 | 批次大小 | | imgsz | 640 | 图像尺寸 | | optimizer | 'SGD' | 优化器 | | amp | False | 混合精度训练 |

📊 实验结果

运行对比实验后，将生成 experiment_summary.yaml 文件，包含： - 各实验的训练状态 - 模型保存路径 - 实验配置信息 - 成功/失败统计

🔍 技术细节

CBAM注意力机制集成

CBAM模块被集成在YOLO11的backbone中的关键位置： - P2特征层后 (256通道) - P3特征层后 (512通道) - P4特征层后 (512通道) - P5特征层后 (1024通道)

自定义增强算法核心

```python

核心增强流程

def call(self, labels): if random.random() > self.p: return labels

# 随机选择增强方法
methods = [
    self.enhance_contrast,    # 对比度增强
    self.enhance_edges,       # 边缘增强
    self.add_noise,          # 噪声添加
    self.adjust_brightness   # 亮度调整
]

enhanced = random.choice(methods)(labels['img'])
labels['img'] = enhanced.astype(np.uint8)
return labels

```

模型融合验证

项目提供了完整的模型融合验证工具，支持： 1. 检测和分割模型的预测结果融合 2. 加权框融合(WBF)算法 3. 可视化验证结果 4. 灵活的参数配置

使用方法： bash python valid/validate.py \ --det-model path/to/detection/model.pt \ --seg-model path/to/segmentation/model.pt \ --image path/to/test/image.jpg \ --output output_directory \ --det-weight 0.6 \ --seg-weight 0.4 \ --conf-threshold 0.25

详细说明请参考 valid/README.md。

代码实现细节

1. 加权框融合(WBF)算法

WBF算法的核心实现在 valid/wbf_fusion.py 中，主要包含以下关键组件：

IOU计算 ```python def calculate_iou(self, box1: np.ndarray, box2: np.ndarray) -> float: """ 计算两个边界框的IOU Args: box1: 第一个边界框 [x1, y1, x2, y2] box2: 第二个边界框 [x1, y1, x2, y2] Returns: IOU值 """

计算交集区域

x1 = max(box1[0], box2[0]) y1 = max(box1[1], box2[1]) x2 = min(box1[2], box2[2]) y2 = min(box1[3], box2[3])

计算交集面积

intersection = max(0, x2 - x1) * max(0, y2 - y1)

计算并集面积

box1area = (box1[2] - box1[0]) * (box1[3] - box1[1]) box2area = (box2[2] - box2[0]) * (box2[3] - box2[1]) union = box1area + box2area - intersection

return intersection / union if union > 0 else 0 ```
预测框融合 ```python def weightedboxesfusion(self, boxes: List[np.ndarray], scores: List[np.ndarray], labels: List[np.ndarray], weights: List[float]) -> Dict: """ 融合多个模型的预测框 Args: boxes: 预测框列表 scores: 置信度列表 labels: 类别标签列表 weights: 模型权重列表 Returns: 融合后的预测结果 """

初始化结果

fusedboxes = [] fusedscores = [] fused_labels = []

遍历所有预测框

for i in range(len(boxes)): if len(boxes[i]) == 0: continue
```
# 计算加权分数
weighted_scores = scores[i] * weights[i]

# 合并重叠框
for j in range(len(boxes[i])):
    box = boxes[i][j]
    score = weighted_scores[j]
    label = labels[i][j]

    # 检查是否与已有框重叠
    overlap = False
    for k in range(len(fused_boxes)):
        if self.calculate_iou(box, fused_boxes[k]) > self.iou_threshold:
            # 更新已有框
            fused_boxes[k] = (fused_boxes[k] + box) / 2
            fused_scores[k] = max(fused_scores[k], score)
            overlap = True
            break

    if not overlap:
        fused_boxes.append(box)
        fused_scores.append(score)
        fused_labels.append(label)
```
return { 'boxes': np.array(fusedboxes), 'scores': np.array(fusedscores), 'labels': np.array(fused_labels) } ```

2. 验证脚本实现

验证脚本 valid/validate.py 的主要功能包括：

模型加载 python def load_models(det_model_path: str, seg_model_path: str): """ 加载检测和分割模型 """ det_model = YOLO(det_model_path) seg_model = YOLO(seg_model_path) return det_model, seg_model
图像处理 ```python def processimage(imagepath: str, detmodel, segmodel, wbffusion, detweight: float = 0.6, segweight: float = 0.4, confthreshold: float = 0.25): """ 处理单张图片 """

读取图片

image = cv2.imread(image_path)

检测模型预测

detresults = detmodel(image, conf=confthreshold)[0] detpred = { 'boxes': detresults.boxes.xyxy.cpu().numpy(), 'scores': detresults.boxes.conf.cpu().numpy(), 'labels': det_results.boxes.cls.cpu().numpy() }

分割模型预测

segresults = segmodel(image, conf=confthreshold)[0] segpred = { 'boxes': segresults.boxes.xyxy.cpu().numpy(), 'scores': segresults.boxes.conf.cpu().numpy(), 'labels': seg_results.boxes.cls.cpu().numpy() }

融合预测结果

fusedpred = wbffusion.fusepredictions( detpred, segpred, detweight=detweight, segweight=seg_weight )

return fused_pred, image ```
结果可视化 ```python def visualizeresults(image, fusedpred, output_path: str): """ 可视化预测结果 """

复制图片用于绘制

vis_image = image.copy()

绘制预测框

for box, score, label in zip(fusedpred['boxes'], fusedpred['scores'], fusedpred['labels']): x1, y1, x2, y2 = map(int, box) cv2.rectangle(visimage, (x1, y1), (x2, y2), (0, 255, 0), 2)
```
# 添加标签和置信度
label_text = f"Class {int(label)}: {score:.2f}"
cv2.putText(vis_image, label_text, (x1, y1 - 10),
           cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2)
```
保存结果

cv2.imwrite(outputpath, visimage) ```

3. 关键参数说明

IOU阈值
默认值：0.5
作用：控制预测框合并的阈值
调整建议：值越大，合并越严格；值越小，合并越宽松
模型权重
检测模型默认权重：0.6
分割模型默认权重：0.4
作用：控制不同模型预测结果的重要性
调整建议：根据模型性能调整权重比例
置信度阈值
默认值：0.25
作用：过滤低置信度的预测结果
调整建议：值越大，预测结果越可靠但可能漏检；值越小，检出率更高但可能有误检

4. 性能优化建议

批处理优化
使用GPU加速模型推理
批量处理多张图片
使用多进程处理IO操作
内存优化
及时释放不需要的张量
使用生成器处理大量图片
控制中间结果的存储
精度优化
根据实际场景调整IOU阈值
优化模型权重分配
调整置信度阈值平衡检出率和准确率

🛠️ 故障排除

常见问题

训练时出现NaN loss
- 解决方案: 设置 amp=False 禁用混合精度训练
CBAM模块未找到
- 确认 ultralytics/nn/modules/conv.py 中包含CBAM实现
自定义增强未生效
- 检查 custom_augment=1 参数是否正确设置
- 确认 ultralytics/data/augment.py 中的集成代码
内存不足
- 减小 batch_size 参数
- 降低 imgsz 图像尺寸

📈 性能优化建议

数据集优化
- 确保标注质量
- 平衡正负样本比例
- 适当的数据增强强度
训练策略
- 使用预训练权重
- 适当的学习率调度
- 早停策略避免过拟合
模型选择
- 小数据集推荐使用yolo11n
- 大数据集可尝试yolo11s/m
- 根据精度要求选择是否使用CBAM

📝 更新日志

v2.0 (当前版本)

✅ 集成CBAM注意力机制
✅ 新增对比实验框架
✅ 优化自定义增强算法
✅ 完善文档和使用说明

v1.0

✅ 基础自定义增强算法
✅ YOLO11集成
✅ 基础训练脚本

🤝 贡献

欢迎提交Issue和Pull Request来改进这个项目！

📄 许可证

本项目基于AGPL-3.0许可证开源。

Owner

Login: xh92117
Kind: user

Repositories: 1
Profile: https://github.com/xh92117

Citation (CITATION.cff)

# This CITATION.cff file was generated with https://bit.ly/cffinit

cff-version: 1.2.0
title: Ultralytics YOLO
message: >-
  If you use this software, please cite it using the
  metadata from this file.
type: software
authors:
  - given-names: Glenn
    family-names: Jocher
    affiliation: Ultralytics
    orcid: 'https://orcid.org/0000-0001-5950-6979'
  - family-names: Qiu
    given-names: Jing
    affiliation: Ultralytics
    orcid: 'https://orcid.org/0000-0003-3783-7069'
  - given-names: Ayush
    family-names: Chaurasia
    affiliation: Ultralytics
    orcid: 'https://orcid.org/0000-0002-7603-6750'
repository-code: 'https://github.com/ultralytics/ultralytics'
url: 'https://ultralytics.com'
license: AGPL-3.0
version: 8.0.0
date-released: '2023-01-10'

GitHub Events

Total

Push event: 5
Create event: 1

Last Year

Push event: 5
Create event: 1

Dependencies

examples/YOLOv8-ONNXRuntime-Rust/Cargo.toml cargo

docker/Dockerfile docker

pytorch/pytorch 2.4.1-cuda12.1-cudnn9-runtime build

examples/YOLOv8-Action-Recognition/requirements.txt pypi

transformers *
ultralytics *

examples/mianju_improved/pyproject.toml pypi

matplotlib >=3.3.0
numpy >=1.23.0
opencv-python >=4.6.0
pandas >=1.1.4
pillow >=7.1.2
psutil *
py-cpuinfo *
pyyaml >=5.3.1
requests >=2.23.0
scipy >=1.4.1
seaborn >=0.11.0
torch >=1.8.0
torch >=1.8.0,!=2.4.0; sys_platform == 'win32'
torchvision >=0.9.0
tqdm >=4.64.0
ultralytics-thop >=2.0.0

ultralytics/nn/backbone/TransNeXt/swattention_extension/setup.py pypi

ultralytics/nn/extra_modules/DCNv4_op/setup.py pypi

ultralytics/nn/extra_modules/cutlass/examples/19_large_depthwise_conv2d_torch_extension/setup.py pypi

ultralytics/nn/extra_modules/mamba/setup.py pypi

causal_conv1d >=1.2.0
einops *
ninja *
packaging *
torch *
transformers *
triton *

ultralytics/nn/extra_modules/ops_dcnv3/setup.py pypi

ultralytics/nn/extra_modules/rational_kat_cu/setup.py pypi

ultralytics/nn/extra_modules/selective_scan/setup.py pypi

einops *
ninja *
packaging *
torch *

cracks-s-d

Science Score: 44.0%

Repository

Basic Info

Statistics

Metadata Files

README.md

YOLO11裂缝检测增强版

🚀 主要特性

📁 项目结构

🔧 核心功能

1. 自定义增强算法 (Custom Augment)

2. CBAM注意力机制

3. 对比实验框架

🚀 快速开始

环境要求

基础训练

使用原始训练脚本

使用新的主训练脚本 - 单次训练

使用新的主训练脚本 - 对比实验

详细使用方法

1. 单次训练

基础YOLO11训练

启用自定义增强

使用CBAM注意力机制

同时启用自定义增强和CBAM

2. 对比实验

运行完整对比实验

快速测试(较少轮数)

3. 传统训练方式

基础模型训练

CBAM模型训练

⚙️ 配置参数

自定义增强参数

训练参数

📊 实验结果

🔍 技术细节

CBAM注意力机制集成

自定义增强算法核心

核心增强流程

模型融合验证

代码实现细节

1. 加权框融合(WBF)算法

计算交集区域

计算交集面积

计算并集面积

初始化结果

遍历所有预测框

2. 验证脚本实现

读取图片

检测模型预测

分割模型预测

融合预测结果

复制图片用于绘制

绘制预测框

保存结果

3. 关键参数说明

4. 性能优化建议

🛠️ 故障排除

常见问题

📈 性能优化建议

📝 更新日志

v2.0 (当前版本)

v1.0

🤝 贡献

📄 许可证

Owner

Citation (CITATION.cff)

GitHub Events

Total

Last Year

Dependencies