Hanabi-1: Financial Market Transformer

A robust transformer-based model for predicting financial market movements using price and sentiment data.

Overview

Hanabi-1 implements a specialized transformer architecture that predicts:

Direction: Whether the price will move up or down (binary classification)
Volatility: Expected price variation in the future hour
Price Change: Magnitude of price movement in percentage
Spread Estimate: Estimated spread based on volume patterns

The model uses two configurable approaches:

4-hour window → 1-hour prediction
12-hour window → 1-hour prediction

Features

Advanced Transformer Architecture: Multi-head self-attention with temporal feature differentiation
Robust Training: BatchNorm, Xavier initialization, and LeakyReLU for stable learning
Balanced Prediction: Specialized design to avoid extreme prediction biases
Dynamic Evaluation: Automatic threshold calibration with confidence metrics
Ensemble Capability: Support for model ensembles to improve prediction robustness

Data Structure

Required Data Files

Hourly Price Data:
- Located in hourly_data.csv
- Contains 90 days of hourly data with:
  - Timestamp, Price, Volume, Open, High, Low, Close
Fear and Greed Index Data:
- Located in fear_greed_data/fear_greed_index_enhanced.csv
- Contains daily fear and greed index data with:
  - date, fng_value, fng_classification, fng_7d_ma, fng_30d_ma
  - fng_momentum metrics and normalized values

See example_data/ directory for sample data files with the correct format and structure. The example_data/README.md contains detailed specifications on the required data format.

Project Structure

Core Files:
- data_preprocessor.py: Data loading, preprocessing, and sequence creation
- transformer_model.py: Transformer architecture with specialized heads
- train_model.py: Training pipeline with configurable parameters
- predict.py: Prediction generation and performance evaluation
- evaluate_ensemble.py: Comprehensive evaluation and ensemble support
Training Scripts:
- robust_model_4h.sh: Main training script for the 4h model
- robust_model_12h.sh: Main training script for the 12h model
Generated Directories:
- trained_models/: Saved model checkpoints
- logs/: Training and prediction logs
- evaluation/: Evaluation metrics and visualizations
- predictions/: Stored prediction outputs

Usage

Installation

pip install -r requirements.txt

Enhance Fear and Greed Data

Get Fear and Greed data from here (select the range you need) and save it to ./fear_greed_data/fear_greed_index.csv. Then run

python fear_greed_enhancer.py

Training

You can train Hanabi-1 with robust architecture using a window of 4h or 12h:

./robust_model_4h.sh

or

./robust_model_12h.sh

For custom training configuration:

python train_model.py \
    --hourly_data ./hourly_data.csv \
    --fear_greed_data ./fear_greed_data/fear_greed_index_enhanced.csv \
    --window_size 4 \
    --horizon 1 \
    --batch_size 64 \
    --hidden_dim 384 \
    --transformer_layers 8 \
    --num_heads 8 \
    --dropout 0.25 \
    --learning_rate 0.00005 \
    --weight_decay 0.002 \
    --direction_weight 1.0 \
    --focal_gamma 1.5 \
    --epochs 150 \
    --patience 25 \
    --min_price_change 0.005 \
    --direction_threshold 0.5 \
    --save_path ./trained_models \
    --seed 42 \
    --model_suffix "_custom"

Parameter Descriptions

--hourly_data: Path to the hourly data csv file
--fear_greed_data: Path to the fear and greed index csv file
--window_size: Number of hours of historical data to use as input (default: 4)
--horizon: Number of hours ahead to predict (default: 1)
--batch_size: Batch size for training (default: 64)
--hidden_dim: Hidden dimension size for the transformer model (default: 384)
--transformer_layers: Number of transformer encoder layers (default: 8)
--num_heads: Number of attention heads in multi-head attention (default: 8)
--dropout: Dropout rate for regularization (default: 0.25)
--learning_rate: Learning rate for the optimizer (default: 0.00005)
--weight_decay: Weight decay for L2 regularization (default: 0.002)
--direction_weight: Weight for the direction prediction loss component (default: 1.0)
--focal_gamma: Gamma parameter for focal loss to handle class imbalance (default: 1.5)
--epochs: Maximum number of training epochs (default: 150)
--patience: Early stopping patience - stops training if no improvement for this many epochs (default: 25)
--min_price_change: Minimum price change threshold for direction prediction classification (default: 0.005)
--direction_threshold: Threshold for binary direction prediction (default: 0.5)
--save_path: Directory path where trained models will be saved (default: ./trained_models)
--seed: Random seed for reproducibility - if not specified, uses random seed
--model_suffix: Suffix to add to the model filename for identification purposes

Prediction

Generate predictions with a trained model:

python predict.py \
    --model_path trained_models/financial_model_w4_h1_robust.pt \
    --window_size 4 \
    --calibrate_threshold \
    --visualize

Evaluation

Evaluate model performance with rich metrics:

python evaluate_ensemble.py \
    --model_path trained_models/financial_model_w4_h1_robust.pt \
    --window_size 4

Hanabi-1 Architecture Details

Core Components

Input Processing:
- Feature normalization and sequence creation
- Positional encoding to preserve temporal information
Transformer Backbone:
- 8-layer transformer encoder (default)
- 8 attention heads with 384-dimensional hidden states
- Temporal feature extraction (last, average, attention-weighted)
Prediction Pathways:
- Direction (classification): BatchNorm + LeakyReLU for robust learning
- Volatility (regression): Specialized for pricing variation
- Price Change (regression): Calibrated for movement estimation
- Spread (regression): Volume-based spread approximation

Training Innovations

Balanced Learning:
- Validation scoring with penalties for extreme predictions
- Xavier initialization for better weight distribution
- Focal Loss with gamma=1.5 for handling subtle signals
Optimization:
- OneCycleLR scheduler with warmup and annealing
- AdamW optimizer with 8e-5 learning rate
- Gradient clipping to prevent exploding gradients

Key Parameters

HIDDEN_DIM=384         # Size of hidden dimension
TRANSFORMER_LAYERS=8   # Number of transformer layers
NUM_HEADS=8            # Number of attention heads
DROPOUT=0.25           # Dropout rate for regularization
LEARNING_RATE=0.00008  # Learning rate for optimizer
WEIGHT_DECAY=0.001     # Weight decay for regularization
DIRECTION_WEIGHT=1.0   # Weight for direction loss
FOCAL_GAMMA=1.5        # Focal loss gamma parameter
MIN_PRICE_CHANGE=0.005 # Threshold for hourly price movements

Performance and Visualization

The evaluation system provides:

Direction Metrics: Accuracy, F1, precision, recall by confidence level
Regression Metrics: MAE for volatility, price change, and spread
Visual Analysis:
- Time series plots with correct/incorrect predictions
- Confusion matrices for classification performance
- Confidence-accuracy curves for reliability assessment

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Hanabi-1: Financial Market Transformer

Overview

Features

Data Structure

Required Data Files

Project Structure

Usage

Installation

Enhance Fear and Greed Data

Training

Parameter Descriptions

Prediction

Evaluation

Hanabi-1 Architecture Details

Core Components

Training Innovations

Key Parameters

Performance and Visualization

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
example_data		example_data
.gitignore		.gitignore
README.md		README.md
check_data.py		check_data.py
count_parameters.py		count_parameters.py
data_preprocessor.py		data_preprocessor.py
evaluate_ensemble.py		evaluate_ensemble.py
fear_greed_enhancer.py		fear_greed_enhancer.py
predict.py		predict.py
requirements.txt		requirements.txt
robust_model_12h.sh		robust_model_12h.sh
robust_model_4h.sh		robust_model_4h.sh
train_model.py		train_model.py
transformer_model.py		transformer_model.py

Folders and files

Latest commit

History

Repository files navigation

Hanabi-1: Financial Market Transformer

Overview

Features

Data Structure

Required Data Files

Project Structure

Usage

Installation

Enhance Fear and Greed Data

Training

Parameter Descriptions

Prediction

Evaluation

Hanabi-1 Architecture Details

Core Components

Training Innovations

Key Parameters

Performance and Visualization

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages