scripts

Scripts Directory Structure

This directory contains all analysis and utility scripts organized by function.

Subdirectories

core/

Active pipeline scripts for main analysis phases:

Frequency analysis
Morphology analysis
Semantic analysis
Clustering analysis
Spatial analysis
Character embeddings
N-gram analysis
Semantic composition

preprocessing/

Data preprocessing and validation scripts:

Create preprocessed table
Backup analysis tables
Audit logging and reporting
Validation scripts

analysis/

Analysis utilities and tools:

LLM character labeling
Embedding analysis
Semantic co-occurrence
Semantic network analysis
Lexicon coverage
Cluster analysis

visualization/

Visualization and mapping scripts:

Cluster visualization
Embedding visualization
Semantic network visualization
Spatial maps generation

reporting/

Report generation scripts:

Comprehensive report generator
Analysis results extraction
Chinese showcase creation

query/

Query utilities for database:

Query results
Query tendency
Query spatial tendency

utils/

General utilities:

Database verification
Feature materialization
Export results
Compare runs
Initialize tables

experimental/

Experimental and alternative approaches:

Village-level clustering (KMeans, DBSCAN, GMM)
Hierarchical clustering
Spatial tendency integration

Usage

Run scripts from the project root directory:

# Core pipeline
python scripts/core/run_frequency_analysis.py

# Preprocessing
python scripts/preprocessing/create_preprocessed_table.py

# Analysis
python scripts/analysis/llm_label_characters.py

# Reporting
python scripts/reporting/generate_comprehensive_report.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

Scripts Directory Structure

Subdirectories

core/

preprocessing/

analysis/

visualization/

reporting/

query/

utils/

experimental/

Usage

Name		Name	Last commit message	Last commit date
parent directory ..
admin		admin
analysis		analysis
core		core
debug		debug
experimental		experimental
maintenance		maintenance
preprocessing		preprocessing
query		query
reporting		reporting
utils		utils
verification		verification
visualization		visualization
README.md		README.md
README_PREPROCESSING.md		README_PREPROCESSING.md
check_database_status.py		check_database_status.py

FilesExpand file tree

scripts

Directory actions

More options

Directory actions

More options

Latest commit

History

scripts

Folders and files

parent directory

README.md

Scripts Directory Structure

Subdirectories

core/

preprocessing/

analysis/

visualization/

reporting/

query/

utils/

experimental/

Usage