GitHub - populationgenomics/cpg-flow-rdrnaseq

Pipeline Overview

This pipeline implements a comprehensive RNA-seq workflow with four main stages:

Per-sample stages:

TrimAlignRNA: Trims paired FASTQ files using fastp and aligns reads to the genome with STAR. Outputs a CRAM file with index (<dataset_prefix>/cram/<sequencing_group_id>.cram and .crai) and temporary BAM file with index (<tmp_prefix>/bam/<sequencing_group_id>.bam and .bai).
Count: Quantifies gene/transcript read counts from aligned reads using featureCounts. Produces count files (<dataset_prefix>/count/<sequencing_group_id>.count) and summary statistics (<dataset_prefix>/count/<sequencing_group_id>.count.summary).

Cohort-level stages:

Fraser: Performs aberrant splicing analysis across samples in a cohort. Consumes BAM files (preferred) or CRAM files and generates an FDS archive (<dataset_prefix>/fraser/<cohort_id>.fds.tar.gz).
Outrider: Conducts outlier gene expression analysis using count data from all samples in a cohort. Outputs results as R data files (<dataset_prefix>/outrider/<cohort_id>.outrider.RData).

Planned Future Improvements

Integration of additional QC metrics and visualization tools. (Integrating PICARD.)
Updating Fraser to its latest version for improved splicing analysis.
Optimization to improve scalability and efficiency.

Usage

analysis-runner \
    --dataset seqr \
    --image australia-southeast1-docker.pkg.dev/cpg-common/images-dev/rdrnaseq:0.2.0-1 \
    --skip-repo-checkout \
    --description "RNA-seq analysis" \
    -o "output-description" \
    --access-level full \
    --config src/rdrnaseq/config_template.toml \
    python3 src/rdrnaseq/run_workflow.py

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
.github/workflows		.github/workflows
src/rdrnaseq		src/rdrnaseq
test		test
.dockerignore		.dockerignore
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
pull_request_template.md		pull_request_template.md
pyproject.toml		pyproject.toml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Pipeline Overview

Planned Future Improvements

Usage

About

Uh oh!

Releases

Packages

Uh oh!

Languages

License

populationgenomics/cpg-flow-rdrnaseq

Folders and files

Latest commit

History

Repository files navigation

Pipeline Overview

Planned Future Improvements

Usage

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages