Initial commit with Xet-backed binaries

Browse files

Files changed (11) hide show

.DS_Store +0 -0
.gitattributes +37 -0
README.md +64 -0
media/demo.gif +3 -0
media/fixed_steps_trend.png +3 -0
media/mean_delay_by_method.png +3 -0
media/mean_queue_length_by_method.png +3 -0
media/random_steps_trend.png +3 -0
media/tuning_results.png +3 -0
models/dqn_fixed_lr_5e-4_225k_final.zip +3 -0
models/dqn_fixed_tui_1e3_225k_unstable.zip +3 -0

.DS_Store ADDED Viewed

Binary file (6.15 kB). View file

.gitattributes ADDED Viewed

	@@ -0,0 +1,37 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text
+*.png filter=lfs diff=lfs merge=lfs -text
+*.gif filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,64 @@

+# Model Card: DQN Traffic Light Controller (Belgradzka-KEN, Warsaw)
+## Model Summary
+This project contains a Deep Q-Network (DQN) model trained to control traffic lights at the **Belgradzka-KEN intersection in Warsaw**.
+The model learns signal switching behavior in a SUMO simulation to improve traffic flow metrics such as queue length and delay.
+## Intended Use
+- **Primary use**: Research and demonstration of reinforcement learning for traffic signal control in SUMO.
+- **Deployment scope**: This model is trained for **one specific intersection only** (Belgradzka-KEN).
+- **Important limitation**: It is **not** expected to work correctly on other intersections without retraining.
+## Training Setup
+- Algorithm: DQN
+- Final selected model:
+	- Training steps: **225,000**
+	- Learning rate: **0.0005**
+- Traffic during training:
+	- Random traffic with fixed car arrival interval
+	- Random traffic with random car arrival interval (closer to real-world variability)
+## Demonstration
+GUI recording showing how the trained model controls traffic lights:
+![DQN GUI demo](media/demo.gif)
+## Training Results
+### Effect of Training Steps (Fixed Arrival Interval)
+This plot shows performance trends for models trained with different numbers of steps on random traffic with fixed car arrival interval:
+![Fixed interval training steps trend](media/fixed_steps_trend.png)
+### Effect of Training Steps (Random Arrival Interval)
+This plot shows performance trends for models trained with different numbers of steps on random traffic with random car arrival interval, intended to better simulate real-world traffic:
+![Random interval training steps trend](media/random_steps_trend.png)
+### Hyperparameter Tuning
+This plot compares how different hyperparameter settings affect model performance, tested on:
+- low fixed arrival interval
+- medium fixed arrival interval
+- high fixed arrival interval
+- truly random traffic (mix of low/medium/high, closer to real world)
+![Hyperparameter tuning results](media/tuning_results.png)
+## Final Evaluation and Stability Comparison
+Two models were compared:
+- **Stable/best model**: selected final model
+- **Unstable model**: model with `target_update_interval = 1000` (instead of 500)
+The comparison highlights the importance of choosing proper hyperparameters.
+### Mean Delay by Method
+![Mean delay comparison](media/mean_delay_by_method.png)
+### Mean Queue Length by Method
+![Mean queue length comparison](media/mean_queue_length_by_method.png)
+## Usage
+If you want to train, evaluate, or use these models yourself, see the repository:
+https://github.com/Tombiczek/rl-traffic-control-sumo