Double Deep Q Learning (DDQN) In PyTorch

DDQN inplementation on PLE FlappyBird environment in PyTorch.

DDQN is proposed to solve the overestimation issue of Deep Q Learning (DQN). Apply separate target network to choose action, reducing the correlation of action selection and value evaluation.

Requirement

Python 3.6
Pytorch
Visdom
PLE (PyGame-Learning-Environment)
Moviepy

Algorithm

In this implementation, I update policy network per episode e not per step t.
Simplify input images for faster convergence.

Usage

HyperParameter in config.py
Train

python main.py --train=True --video_path=./video --logs_path=./logs

Restore Pretrain Model

python main.py --restore=./pretrain/model-98500.pth

Visualize loss and reward curve

python -m visdom.server
python visualize.py --logs_path=./logs

Result

Full Video (with 60 FPS)
Reward

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
assets		assets
pretrain		pretrain
.gitignore		.gitignore
README.md		README.md
agent.py		agent.py
config.py		config.py
main.py		main.py
model.py		model.py
reply_buffer.py		reply_buffer.py
utils.py		utils.py
visualize.py		visualize.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Double Deep Q Learning (DDQN) In PyTorch

Requirement

Algorithm

Usage

Result

Reference

About

Releases

Packages

Languages

chinancheng/DDQN.pytorch

Folders and files

Latest commit

History

Repository files navigation

Double Deep Q Learning (DDQN) In PyTorch

Requirement

Algorithm

Usage

Result

Reference

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages