https://github.com/abdulmanaf12/pediatric-chest-pneumonia-classification

This project is all about interpreting Chest X-ray images, and the task is to classify whether X-ray image got infected by Pneumonia or not. we also used here GAN and various type of augmentation techniques.

Keywords

chest-xray-images cnn-classification deep-learning gan machine-learning-algorithms pneumonia-classification

Last synced: 10 months ago · JSON representation

Repository

This project is all about interpreting Chest X-ray images, and the task is to classify whether X-ray image got infected by Pneumonia or not. we also used here GAN and various type of augmentation techniques.

Basic Info

Host: GitHub
Owner: AbdulManaf12
Language: Jupyter Notebook
Default Branch: main
Homepage: https://abdulmanaf.me/Pediatric-Chest-Pneumonia-Classification/
Size: 39.6 MB

Statistics

Stars: 5
Watchers: 1
Forks: 1
Open Issues: 0
Releases: 1

Topics

chest-xray-images cnn-classification deep-learning gan machine-learning-algorithms pneumonia-classification

Created over 3 years ago · Last pushed 12 months ago

Metadata Files

Readme

README.md

Pediatric Chest Pneumonia Classification: Leveraging Traditional CNN with GAN for Data Balancing

Abstract

This project presents an innovative approach to pediatric chest pneumonia classification using deep learning techniques. We address the critical challenge of class imbalance in medical imaging datasets by employing Generative Adversarial Networks (GANs) for synthetic data generation, combined with traditional data augmentation methods. Our methodology demonstrates significant improvements in classification accuracy and model robustness for pneumonia detection in pediatric chest X-rays.

System Demo

Introduction

Pneumonia is a leading cause of mortality in children under 5 years globally. Early and accurate diagnosis through chest X-ray analysis is crucial for effective treatment. However, medical imaging datasets often suffer from class imbalance, where normal cases significantly outnumber pneumonia cases. This project addresses this challenge by:

Data Balancing: Using GANs to generate synthetic normal chest X-ray images
Data Augmentation: Applying traditional augmentation techniques
Deep Learning: Implementing a CNN architecture optimized for binary classification
Model Evaluation: Comprehensive comparison across different data balancing strategies

Methodology

1. Data Preprocessing

Image Resizing: All images resized to 148×148 pixels
Normalization: Pixel values normalized to [0,1] range
Grayscale Conversion: Converted to single-channel grayscale images

2. Data Balancing Strategies

Strategy 1: Traditional Data Augmentation

Rotation (±35°)
Width/Height shifts (0.1/0.08)
Shear transformation (0.2)
Zoom (0.2)

Strategy 2: GAN-based Data Generation

Architecture: Deep Convolutional GAN (DCGAN)
Generator: 4-layer transposed convolution network
Discriminator: 4-layer convolution network
Training: 40,000 iterations with RMSprop optimizer
Output: 2,534 synthetic normal X-ray images

Strategy 3: Combined Approach

Integration of augmented and GAN-generated images
Comprehensive dataset balancing

3. Model Architecture

Our CNN architecture consists of:

Convolutional Layers: Multiple Conv2D layers with ReLU activation
Pooling Layers: MaxPooling2D for dimensionality reduction
Normalization: BatchNormalization for training stability
Regularization: Dropout layers to prevent overfitting
Output: Single sigmoid neuron for binary classification

Dataset

Source: Kaggle Chest X-Ray Pneumonia Dataset
Total Images: 5,863 X-ray images
Classes: Normal, Pneumonia
Split: Train (5,216), Validation (16), Test (624)
Image Format: JPEG
Resolution: Variable (resized to 148×148)

Class Distribution

Training Set:
- Normal: 1,341 images
- Pneumonia: 3,875 images
Test Set:
- Normal: 234 images
- Pneumonia: 390 images

Model Architecture

python model = Sequential([ Conv2D(32, (3, 3), input_shape=(148, 148, 1), activation='relu'), MaxPooling2D(pool_size=(2, 2)), BatchNormalization(), Conv2D(64, (3, 3), activation='relu'), MaxPooling2D(pool_size=(2, 2)), Flatten(), Dense(1, activation='sigmoid') ])

Hyperparameters:

Optimizer: Adam
Loss Function: Binary Crossentropy
Batch Size: 132
Epochs: 15-50 (varies by experiment)
Learning Rate: Default Adam (0.001)

Experimental Setup

We conducted four comprehensive experiments:

Baseline: Original imbalanced dataset
Augmentation: Traditional data augmentation
GAN Generation: Synthetic data generation
Combined: Augmentation + GAN generation

Hyperparameter Optimization

Convolutional Layers: [32,64], [32,64,128], [32,64,128,128], [32,64,128,256], [64,128,256,256]
Dense Layers: [], [512], [256], [256,256], [512,256], [512,512]
Dropout Rates: [0.2], [0.5], [0.2,0.2], [0.2,0.5], [0.5,0.5]
Batch Normalization: True/False

Results

Performance Metrics

| Experiment | Accuracy | Precision | Recall | F1-Score | | --------------------- | ---------- | --------- | -------- | -------- | | Baseline (Imbalanced) | 85.26% | 0.85 | 0.85 | 0.85 | | Augmentation | 86.06% | 0.86 | 0.86 | 0.86 | | GAN Generation | 84.78% | 0.85 | 0.85 | 0.85 | | Combined Approach | 87.18% | 0.87 | 0.87 | 0.87 |

Key Findings

Data Balancing Effectiveness: Combined approach achieved highest accuracy (87.18%)
GAN Quality: Generated images maintained realistic chest X-ray characteristics
Model Robustness: Balanced datasets showed improved generalization
Clinical Relevance: High recall for pneumonia detection (87%)

Demo

Live Demo

Hugging Face Space: Try the model online
Web Application: http://abdulmanaf12.pythonanywhere.com/

Features

Real-time chest X-ray classification
Probability scores for predictions
User-friendly web interface
Support for various image formats

Installation

Prerequisites

bash Python 3.8+ TensorFlow 2.x OpenCV Flask NumPy Matplotlib

Setup

```bash

Clone the repository

git clone https://github.com/AbdulManaf12/Pediatric-Chest-Pneumonia-Classification-System.git cd Pediatric-Chest-Pneumonia-Classification-System

Install dependencies

pip install -r requirements.txt

Download the pre-trained model weights

(weights.h5 should be placed in the static/ directory)

```

Usage

Web Application

bash python main.py

Navigate to http://localhost:5000 to access the web interface.

Direct Prediction

```python from Model import MyModel

Initialize model

model = MyModel()

Make prediction (assumes image.png in static/ directory)

prediction, probability = model.predict() print(f"Prediction: {prediction}, Probability: {probability}") ```

Training New Models

Run the Jupyter notebooks in the following order:

notebooks/image_generation.ipynb - GAN training and synthetic data generation
notebooks/Project.ipynb - Main training pipeline
notebooks/xai_experiment.ipynb - Explainable AI experiments

Project Structure

├── Model.py # CNN model definition and prediction logic ├── main.py # Flask web application ├── static/ # Static files (CSS, images, model weights) │ ├── weights.h5 # Pre-trained model weights │ ├── style.css # Web interface styling │ └── ... ├── templates/ # HTML templates │ ├── index.html # Main interface │ └── results.html # Results page ├── notebooks/ # Jupyter notebooks │ ├── Project.ipynb # Main training pipeline │ ├── image_generation.ipynb # GAN implementation │ └── xai_experiment.ipynb # Explainable AI ├── requirements.txt # Python dependencies └── README.md # This file

Technical Implementation

GAN Architecture

Generator Network:

python Dense(image_resize * image_resize * 128) → Reshape → Conv2DTranspose(128) → BatchNorm → ReLU → Conv2DTranspose(64) → BatchNorm → ReLU → Conv2DTranspose(32) → BatchNorm → ReLU → Conv2DTranspose(1) → Sigmoid

Discriminator Network:

python Conv2D(32) → LeakyReLU → Conv2D(64) → LeakyReLU → Conv2D(128) → LeakyReLU → Conv2D(256) → LeakyReLU → Flatten → Dense(1) → Sigmoid

Data Pipeline

Loading: Multi-threaded image loading with OpenCV
Preprocessing: Resize, normalize, convert to grayscale
Augmentation: Real-time augmentation during training
Generation: Batch generation of synthetic images
Balancing: Strategic dataset composition

Evaluation Metrics

Accuracy: Overall classification correctness
Precision: True positive rate for pneumonia detection
Recall: Sensitivity for pneumonia cases
F1-Score: Harmonic mean of precision and recall
Confusion Matrix: Detailed classification breakdown

Future Work

Multi-class Classification: Extend to different types of pneumonia
Advanced Architectures: Implement ResNet, DenseNet, or Vision Transformers
Federated Learning: Enable privacy-preserving collaborative training
Real-time Processing: Optimize for mobile deployment
Clinical Validation: Collaborate with medical institutions for validation

Contributing

We welcome contributions! Please see our contributing guidelines:

Fork the repository
Create a feature branch (git checkout -b feature/AmazingFeature)
Commit your changes (git commit -m 'Add some AmazingFeature')
Push to the branch (git push origin feature/AmazingFeature)
Open a Pull Request

Citation

If you use this work in your research, please cite:

bibtex @article{manaf2024pediatric, title={Pediatric Chest Pneumonia Classification: Leveraging Traditional CNN with GAN for Data Balancing}, author={Abdul Manaf, Nimra Mughal}, journal={arXiv preprint arXiv:2024.xxxxx}, year={2024} }

Acknowledgments

Kaggle for providing the chest X-ray pneumonia dataset
The medical imaging research community
Open-source contributors to TensorFlow and related libraries

License

This project is licensed under the MIT License - see the LICENSE file for details.

Disclaimer: This tool is for research and educational purposes only. It should not be used as a substitute for professional medical diagnosis. Always consult with qualified healthcare professionals for medical decisions.

Owner

Name: Abdul Manaf
Login: AbdulManaf12
Kind: user
Location: Sukkur, Pakistan

Website: https://abdulmanaf12.github.io/
Twitter: Abdul1Manaf
Repositories: 3
Profile: https://github.com/AbdulManaf12

Deep Learning Engineer

GitHub Events

Total

Push event: 2

Last Year

Push event: 2

https://github.com/abdulmanaf12/pediatric-chest-pneumonia-classification

Science Score: 26.0%

Keywords

Repository

Basic Info

Statistics

Topics

Metadata Files

README.md

Pediatric Chest Pneumonia Classification: Leveraging Traditional CNN with GAN for Data Balancing

Abstract

Table of Contents

Introduction

Methodology

1. Data Preprocessing

2. Data Balancing Strategies

Strategy 1: Traditional Data Augmentation

Strategy 2: GAN-based Data Generation

Strategy 3: Combined Approach

3. Model Architecture

Dataset

Class Distribution

Model Architecture

Experimental Setup

Hyperparameter Optimization

Results

Performance Metrics

Key Findings

Demo

Live Demo

Features

Installation

Prerequisites

Setup

Clone the repository

Install dependencies

Download the pre-trained model weights

(weights.h5 should be placed in the static/ directory)

Usage

Web Application

Direct Prediction

Initialize model

Make prediction (assumes image.png in static/ directory)

Training New Models

Project Structure

Technical Implementation

GAN Architecture

Data Pipeline

Evaluation Metrics

Future Work

Contributing

Citation

Acknowledgments

License

Owner

GitHub Events

Total

Last Year

Dependencies