JuliaPOMDP · zsunberg · Feb 12, 2022 · Feb 3, 2022 · Feb 3, 2022 · Feb 3, 2022
diff --git a/.gitignore b/.gitignore
@@ -3,3 +3,5 @@
 docs/build/
 docs/site/
 *.swp
+*Manifest.toml
+*ipynb_checkpoints/
diff --git a/bench/non-terminal_gw.jl b/bench/non-terminal_gw.jl
@@ -1,13 +1,14 @@
 using POMDPs
 using POMDPModels
 using MCTS
-using POMDPToolbox
+using POMDPSimulators
 using ProgressMeter
-using ProfileView
+using Random
+# using ProfileView
 
 sim = RolloutSimulator(max_steps=100, rng=MersenneTwister(7))
 
-mdp = GridWorld(terminals=[])
+mdp = SimpleGridWorld()
 
 d=20; n=100; c=10.
 @show d, n, c
@@ -16,7 +17,7 @@ solver = MCTSSolver(depth=d, n_iterations=n, exploration_constant=c, rng=Mersenn
 planner = solve(solver, mdp)
 simulate(sim, mdp, planner)
 
-# @code_warntype MCTS.simulate(planner, GridWorldState(1,1,false), 10)
+# @code_warntype MCTS.simulate(planner, GWPos(1,1), 10)
 
 # Profile.clear()
 # @profile for i in 1:100

diff --git a/bench/non-terminal_gw_dpw.jl b/bench/non-terminal_gw_dpw.jl
@@ -1,13 +1,14 @@
 using POMDPs
 using POMDPModels
 using MCTS
-using POMDPToolbox
+using POMDPSimulators
 using ProgressMeter
-using ProfileView
+using Random
+# using ProfileView
 
 sim = RolloutSimulator(max_steps=100, rng=MersenneTwister(7))
 
-mdp = GridWorld(terminals=[])
+mdp = SimpleGridWorld()
 
 d=20; n=1000; c=10.
 @show d, n, c
@@ -23,17 +24,17 @@ solver = DPWSolver(depth=d,
 planner = solve(solver, mdp)
 simulate(sim, mdp, planner)
 
-# @code_warntype MCTS.simulate(planner, GridWorldState(1,1,false), 10)
+# @code_warntype MCTS.simulate(planner, GWPos(1,1), 10)
 
-Profile.clear()
-@profile for i in 1:1
-    simulate(sim, mdp, planner)
-end
-ProfileView.view()
-
-# @show N=100
-# rewards = Array(Float64, N)
-# @time @showprogress for i = 1:N
-#     rewards[i] = simulate(sim, mdp, planner)
+# Profile.clear()
+# @profile for i in 1:1
+#     simulate(sim, mdp, planner)
 # end
-# @show mean(rewards)
+# ProfileView.view()
+
+@show N=100
+rewards = Array{Float64}(undef, N)
+@time @showprogress for i = 1:N
+    rewards[i] = simulate(sim, mdp, planner)
+end
+@show mean(rewards)
diff --git a/docs/src/index.md b/docs/src/index.md
@@ -72,7 +72,7 @@ solver = MCTSSolver(estimate_value=RolloutEstimator(rollout_policy)) # default s
 Since Monte-Carlo Tree Search is an online method, the solve function simply specifies the mdp model to the solver (which is embedded in the policy object). (Note that an MCTSPlanner can also be constructed directly without calling `solve()`.) The computation is done during calls to the action function. To extract the policy for a given state, simply call the action function:
 
 ```julia
-s = create_state(mdp) # this can be any valid state
+s = rand(states(mdp)) # this can be any valid state
 a = action(planner, s) # returns the action for state s
 ```