ARMA Transformer 时间序列预测项目

项目简介

本项目实现了一个基于 ARMA Transformer 的时间序列预测模型，特别适用于电力消耗预测等时间序列数据。该模型结合了 ARMA（自回归移动平均）和 Transformer 架构的优点，能够有效捕捉时间序列数据的长期依赖关系和局部模式。

环境要求

Python 3.7-3.10
PyTorch 1.8+
CUDA（可选，支持CPU训练）
内存：≥8GB
存储空间：≥1GB

完整依赖列表请参见 requirements.txt

快速开始

克隆仓库

git clone https://github.com/yourusername/TSF-ARMA.git
cd TSF-ARMA

环境配置

python -m venv venv
source venv/bin/activate  # Linux/Mac
# 或
venv\Scripts\activate  # Windows
pip install -r requirements.txt

数据准备

python data/small_data/electricity_dataloader.py

训练模型

python experiments/train.py

评估模型

python experiments/evaluate.py --checkpoint checkpoints/model_best.pth

项目结构

TSF-ARMA/
├── configs/            # 配置文件
│   └── config.py      # 模型和训练配置
├── data/              # 数据目录
│   └── small_data/
├── models/            # 模型实现
│   ├── attention.py   # ARMA注意力机制
│   └── arma_tsf.py    # 主模型架构
├── experiments/       # 实验脚本
│   ├── train.py      # 训练脚本
│   └── evaluate.py    # 评估脚本
├── utils/            # 工具函数
│   ├── data_loader.py
│   ├── metrics.py
│   ├── visualization.py
│   └── advanced_training.py
├── results/          # 实验结果
├── checkpoints/      # 模型检查点
└── logs/            # 训练日志

模型架构

ARMA注意力机制

AR分支：使用门控因果空洞卷积捕捉长期依赖
MA分支：使用动态深度可分离卷积处理局部模式
自适应权重分配：动态平衡AR和MA分支的贡献

优化特点

CPU环境优化
- 批处理大小：16
- 模型维度：32
- 注意力头数：2
训练策略
- 课程学习
- 动态采样
- 早停机制

使用说明

配置修改

修改 configs/config.py 中的参数：

model_params = {
    'd_model': 32,
    'n_heads': 2,
    'n_layers': 2,
    'd_ff': 128
}

自定义数据

准备数据文件（CSV格式或txt）
修改 data_loader.py 中的数据加载逻辑
更新配置文件中的数据参数

模型训练

python experiments/train.py --config configs/config.py

模型评估

python experiments/evaluate.py --checkpoint checkpoints/model_best.pth

实验结果复现

使用提供的配置文件
确保数据预处理步骤一致
使用相同的随机种子（42）
训练环境：
- CPU：≥4核
- 内存：≥8GB
- 操作系统：Windows/Linux/MacOS
- Python版本：3.7-3.10

注意事项

数据预处理
- 确保数据标准化
- 处理缺失值
- 检查异常值
训练过程
- 监控内存使用
- 观察损失曲线
- 注意早停条件
模型评估
- 使用多个指标
- 考虑预测区间
- 分析误差分布

常见问题

1. 内存不足

减小批处理大小
降低模型维度
使用梯度累积

2. 训练不稳定

调整学习率
检查梯度裁剪
增加预热轮数

3. 预测偏差

检查数据分布
调整损失权重
优化采样策略

维护者

项目作者：李宇彤
联系方式：16692560959@163.com
项目主页：https://github.com/numbis-li/TSF-ARMA

许可证

本项目采用 MIT 许可证。详见 LICENSE 文件。

更新日志

2024-03-11: 完成基础模型训练和评估
2024-03-08: 实现 ARMA 注意力机制
2024-03-04: 项目初始化

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
configs		configs
data		data
experiments		experiments
models		models
results		results
utils		utils
.gitignore		.gitignore
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.md		README.md
RESULTS.md		RESULTS.md
__init__.py		__init__.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

ARMA Transformer 时间序列预测项目

目录

项目简介

最新实验结果

环境要求

快速开始

项目结构

模型架构

ARMA注意力机制

优化特点

使用说明

配置修改

自定义数据

模型训练

模型评估

实验结果复现

注意事项

常见问题

1. 内存不足

2. 训练不稳定

3. 预测偏差

维护者

许可证

更新日志

About

Uh oh!

Releases

Packages

Languages

License

zlg0124/TSF-ARMA

Folders and files

Latest commit

History

Repository files navigation

ARMA Transformer 时间序列预测项目

目录

项目简介

最新实验结果

环境要求

快速开始

项目结构

模型架构

ARMA注意力机制

优化特点

使用说明

配置修改

自定义数据

模型训练

模型评估

实验结果复现

注意事项

常见问题

1. 内存不足

2. 训练不稳定

3. 预测偏差

维护者

许可证

更新日志

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages