Pneumonia Classification with DenseNet-121

A baseline pneumonia classification system using DenseNet-121 on chest X-ray images with patient-level data splits, multiple preprocessing pipelines, and GradCAM interpretability analysis.

System Status: OPERATIONAL

Real Medical Data: Successfully tested on 5,856 chest X-ray images
GradCAM Interpretability: WORKING - Generates medical AI heatmaps
Performance: AUROC 93.49%, F1 86.75% on 9-epoch training
Production Ready: All OpenCV compatibility issues resolved

Features

Multiple Preprocessing Methods: Raw images, histogram matching, and z-score normalization
Patient-Level Splits: Ensures no patient data leakage between train/validation/test sets
Class Balancing: BCEWithLogitsLoss with configurable class weights
Comprehensive Evaluation: AUROC, F1, calibration metrics, and optimal threshold selection
Interpretability: GradCAM heatmaps for model explanation
Reproducible Experiments: YAML configuration system with full experiment tracking
Flexible CLI: Command-line batch size and epoch overrides

Quick Start

Installation

cd pneumonia_classification
pip install -r requirements.txt

Data Setup

Download the Kaggle Chest X-Ray Pneumonia Dataset and place in this structure:

data/chest_xray_pneumonia/
├── train/
│   ├── NORMAL/           # 1,341 normal chest X-rays
│   └── PNEUMONIA/        # 3,875 pneumonia chest X-rays
├── val/
│   ├── NORMAL/           # 8 normal chest X-rays  
│   └── PNEUMONIA/        # 8 pneumonia chest X-rays
└── test/
    ├── NORMAL/           # 234 normal chest X-rays
    └── PNEUMONIA/        # 390 pneumonia chest X-rays

Training

# Recommended: Real data training with config
python main.py --config configs/real_data_config.yaml --epochs 9 --batch_size 16

# Memory efficient
python main.py --config configs/real_data_config.yaml --epochs 9 --batch_size 8

# Faster training
python main.py --config configs/real_data_config.yaml --epochs 9 --batch_size 32

# Compare preprocessing methods
python main.py --mode compare --epochs 15

# Hyperparameter sweep
python main.py --mode sweep --epochs 10

Latest Results (9 Epochs, Batch Size 16)

Training Configuration: DenseNet-121, Histogram Matching, 9 epochs, batch size 16

Performance Metrics

Metric	Value	Description
AUROC	93.49%	Excellent discrimination ability
F1 Score	86.75%	Strong balanced performance
Accuracy	81.25%	Overall correct predictions
Sensitivity	98.21%	Critical for medical - catches pneumonia
Specificity	52.99%	Normal case identification
Precision	77.69%	Positive prediction accuracy
AUPRC	95.13%	Precision-recall performance

Performance Visualizations

ROC Curve	Precision-Recall Curve
Confusion Matrix	Calibration Curve

GradCAM Interpretability Analysis

The model generates medical AI interpretability heatmaps showing focus areas for pneumonia detection. These visualizations are crucial for clinical AI explainability.

Sample GradCAM Visualizations

Additional GradCAM visualizations available in the images/ directory (20 total samples)

Configuration Options

Command Line Usage

python main.py [OPTIONS]

Options:
  --mode              Training mode: single, compare, sweep
  --preprocessing     Preprocessing method: raw, histogram_matching, zscore
  --config           Path to config file (recommended: configs/real_data_config.yaml)
  --epochs           Number of training epochs
  --batch_size       Training batch size (8, 16, 32)
  --lr               Learning rate
  --backbone         Model backbone (default: densenet121)

Key Configuration Parameters

data:
  data_root: "data/chest_xray_pneumonia"
  preprocessing_type: "histogram_matching"
  image_size: [224, 224]

model:
  backbone: "densenet121"
  pretrained: true
  dropout_rate: 0.3

training:
  num_epochs: 9
  batch_size: 16
  learning_rate: 1.0e-4
  class_balancing: true

evaluation:
  generate_gradcam: true
  num_gradcam_samples: 20

Output Structure

Each experiment creates organized outputs:

outputs/densenet121_histogram_matching_[timestamp]/
├── real_data_test/
│   ├── best_model.pth
│   └── last_model.pth
├── evaluation/
│   ├── evaluation_results.json
│   ├── roc_curve.png
│   ├── confusion_matrix.png
│   ├── calibration_curve.png
│   └── gradcam/
│       ├── gradcam_000_IM-0001-0001.png
│       └── ... (20 interpretability heatmaps)
└── configs/
    └── config.yaml

Troubleshooting

Common Issues

CUDA Out of Memory: Use --batch_size 8
Data Loading Errors: Ensure correct data structure in data/chest_xray_pneumonia/
Poor Performance: Try different preprocessing methods or increase epochs

Performance Tips

Best Results: Use --config configs/real_data_config.yaml
Memory Management: Adjust batch size (8=efficient, 32=fast)
Training Time: Start with 2 epochs for testing, use 9+ for production
Interpretability: GradCAM automatically generated when enabled

Extension for Fusion Architectures

This baseline supports extension to multi-modal fusion:

class FusionClassifier(PneumoniaClassifier):
    def __init__(self, config):
        super().__init__(config)
        self.view1_backbone = self._create_backbone()
        self.view2_backbone = self._create_backbone()
        self.fusion = nn.Linear(self.backbone_features * 2, self.backbone_features)
    
    def forward(self, view1, view2):
        feat1 = self.view1_backbone(view1)
        feat2 = self.view2_backbone(view2)
        fused = self.fusion(torch.cat([feat1, feat2], dim=1))
        return self.classifier(fused)

Citation

@misc{pneumonia_classification_2025,
  title={Pneumonia Classification with DenseNet-121: A Comprehensive Baseline},
  author={Your Name},
  year={2025},
  note={Baseline implementation for medical image classification}
}

License

MIT License - see LICENSE file for details.

Ready for Production: This implementation provides a solid foundation for pneumonia classification with excellent performance (93.49% AUROC) and can be extended to complex fusion architectures for multi-modal medical imaging tasks.

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
configs		configs
images		images
src		src
README.md		README.md
config_test.yaml		config_test.yaml
inspect_layers.py		inspect_layers.py
main.py		main.py
requirements.txt		requirements.txt
setup_real_data.py		setup_real_data.py
test_epochs.py		test_epochs.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Pneumonia Classification with DenseNet-121

System Status: OPERATIONAL

Features

Quick Start

Installation

Data Setup

Training

Latest Results (9 Epochs, Batch Size 16)

Performance Metrics

Performance Visualizations

GradCAM Interpretability Analysis

Sample GradCAM Visualizations

Configuration Options

Command Line Usage

Key Configuration Parameters

Output Structure

Troubleshooting

Common Issues

Performance Tips

Extension for Fusion Architectures

Citation

License

About

Uh oh!

Releases

Packages

Languages

jpoh90/Densenet-Pneumonia-Classification

Folders and files

Latest commit

History

Repository files navigation

Pneumonia Classification with DenseNet-121

System Status: OPERATIONAL

Features

Quick Start

Installation

Data Setup

Training

Latest Results (9 Epochs, Batch Size 16)

Performance Metrics

Performance Visualizations

GradCAM Interpretability Analysis

Sample GradCAM Visualizations

Configuration Options

Command Line Usage

Key Configuration Parameters

Output Structure

Troubleshooting

Common Issues

Performance Tips

Extension for Fusion Architectures

Citation

License

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages