标签

论文拾萃 8
ADP 9
读书笔记 12
RO 2
B&B 1
B&C 1
BD 2
CG 2
DW 1
SD 1
MDP 4
RL 4
马尔可夫链 1
ML 1
SPO 1

论文拾萃

ADP

读书笔记

<读书笔记> 强化学习：(4)时序差分算法 2024-05-23
<读书笔记> 强化学习：(2)马尔可夫决策过程 2024-05-23
<读书笔记> 强化学习：(1)多臂老虎机问题 2024-05-23
<读书笔记> 什么是P问题、NP问题和NPC问题 2024-02-19
<读书笔记> 强化学习与最优控制——(4)无限时域强化学习 2023-09-13
<读书笔记> 强化学习与最优控制——(3)参数近似 2023-03-13
<读书笔记> 强化学习与最优控制——(2)值空间近似 2023-03-07
<读书笔记> 强化学习与最优控制——(1)精确动态规划 2023-03-06
<读书笔记> Large Scale Optimization 2023-02-22
<读书笔记> IP Chapter 7 Branch and Bound 2022-11-29
<读书笔记> Robust Optimization (2) 2022-11-21
<读书笔记> Robust Optimization (1) 2022-11-19

RO

<读书笔记> Robust Optimization (2) 2022-11-21
<读书笔记> Robust Optimization (1) 2022-11-19

B&B

<读书笔记> IP Chapter 7 Branch and Bound 2022-11-29

B&C

<读书笔记> IP Chapter 7 Branch and Bound 2022-11-29

BD

<读书笔记> Large Scale Optimization 2023-02-22
<论文拾萃> On-Demand Delivery from Stores: Dynamic Dispatching and Routing with Random Demand 2023-02-10

CG

<读书笔记> Large Scale Optimization 2023-02-22
<论文拾萃> On-Demand Delivery from Stores: Dynamic Dispatching and Routing with Random Demand 2023-02-10

DW

<读书笔记> Large Scale Optimization 2023-02-22

SD

<读书笔记> Large Scale Optimization 2023-02-22

MDP

<读书笔记> 强化学习与最优控制——(4)无限时域强化学习 2023-09-13
<读书笔记> 强化学习与最优控制——(3)参数近似 2023-03-13
<读书笔记> 强化学习与最优控制——(2)值空间近似 2023-03-07
<读书笔记> 强化学习与最优控制——(1)精确动态规划 2023-03-06

RL

<读书笔记> 强化学习与最优控制——(4)无限时域强化学习 2023-09-13
<读书笔记> 强化学习与最优控制——(3)参数近似 2023-03-13
<读书笔记> 强化学习与最优控制——(2)值空间近似 2023-03-07
<读书笔记> 强化学习与最优控制——(1)精确动态规划 2023-03-06

马尔可夫链

<读书笔记> CTMC转化成DTMC--均匀化Uniformization 2023-09-27

ML

<论文拾萃> Learning to Solve Large-Scale Security-Constrained Unit Commitment Problems 2024-03-29

SPO

<论文拾萃> Decision Focused Causal Learning for Direct Counterfactual Marketing Optimization 2024-11-29