<读书笔记> 强化学习与最优控制——(3)参数近似

本论文于2022年发表于知名期刊 Manufacturing & Service Operations Management 上。作者对时下流行的按需配送（On-demand Delivery）问题进行了建模，通过参数化分派和路线策略近似值函数，构建了新的结构化近似框架，解决了最后一公里配送系统中的随机动态骑手分派与路线问题，并利用Benders decomp...

<论文拾萃> Dynamic Orienteering on a Network of Queues

2022-12-13

本论文于2018年发表于交通领域知名期刊 Transportation Science 上。本文在队列网络中引入了一个随机定向的问题，旅行者必须在每个节点的时间窗口内到达并进入服务以收集奖励，但旅行者可能在服务开始之前在每个地点经历随机的等待时间。为了最大限度地获得预期奖励，旅行者必须决定去哪些地方，以及在每个地方排队多长时间。本文将该问题建模为一个马尔可夫决策过程，...

<论文拾萃> Perspectives of approximate dynamic programming

2022-12-04

本文为ADP领域著名研究学者Warren B. Powell在2016年发表于著名期刊 Annals of Operations Research 上。全文介绍了ADP的发展历程、限制与新提出的一系列方法，提出了一个统一的框架。

Abstract

动态规划与不确定性下的时序决策问题相关。...

<读书笔记> IP Chapter 7 Branch and Bound

2022-11-29

本笔记为阅读《Integer Programming》中的第7章 Branch and Bound时所作。

7.1 Divide and Conquer

考虑问题：

\[Z=\max\{cx:x\in S\}\]

我们需要将该问题分解为一系列更容易求解的小问题。