<读书笔记> 强化学习与最优控制——(2)值空间近似
Read More<读书笔记> 强化学习与最优控制——(1)精确动态规划
Read More<读书笔记> Large Scale Optimization
1. Introduction
混合整数规划的标准形式为:
\[\begin{align*} min \ & c^Tx \\ s.t. \ & Ax\leq b \\ & x \in Z^p \times R^{n-p} \end{align*} \tag{1}\]此处$A\i...
<论文拾萃> On-Demand Delivery from Stores: Dynamic Dispatching and Routing with Random Demand
本论文于2022年发表于知名期刊 Manufacturing & Service Operations Management 上。作者对时下流行的按需配送(On-demand Delivery)问题进行了建模,通过参数化分派和路线策略近似值函数,构建了新的结构化近似框架,解决了最后一公里配送系统中的随机动态骑手分派与路线问题,并利用Benders decomp...
<论文拾萃> Dynamic Orienteering on a Network of Queues
本论文于2018年发表于交通领域知名期刊 Transportation Science 上。本文在队列网络中引入了一个随机定向的问题,旅行者必须在每个节点的时间窗口内到达并进入服务以收集奖励,但旅行者可能在服务开始之前在每个地点经历随机的等待时间。为了最大限度地获得预期奖励,旅行者必须决定去哪些地方,以及在每个地方排队多长时间。本文将该问题建模为一个马尔可夫决策过程,...
<论文拾萃> Perspectives of approximate dynamic programming
本文为ADP领域著名研究学者Warren B. Powell在2016年发表于著名期刊 Annals of Operations Research 上。全文介绍了ADP的发展历程、限制与新提出的一系列方法,提出了一个统一的框架。
Abstract
动态规划与不确定性下的时序决策问题相关。...
<读书笔记> IP Chapter 7 Branch and Bound
本笔记为阅读《Integer Programming》中的第7章 Branch and Bound时所作。
7.1 Divide and Conquer
考虑问题:
\[Z=\max\{cx:x\in S\}\]我们需要将该问题分解为一系列更容易求解的小问题。
View:
User: