机器学习系列(九)- 拉格朗日对偶问题

拉格朗日乘数法

基础定义

凸问题

凸集

凸函数

拉格朗日函数对偶问题

对偶问题推导

  1. 定义初始问题:

    $\begin{align} min & \enspace f_0(x),x\in\mathbb{R} \newline s.t. & \begin{cases} \enspace f_i(x) \le 0,其中i=1,2,3,…,m \newline \enspace h_i(x) = 0,其中i=1,2,3,…,q \end{cases} \end{align}$

  2. 拉格朗日乘数式:$L(x,\lambda,\nu)=f_0(x)+\sum\lambda_i f_i(x)+\sum \nu_i h_i(x)$

    定义原问题:$\begin{align} & min_{x}max_{\lambda,\nu}L(x,\lambda,\nu) \newline & s.t. \lambda\ge0 \end{align}$

    初始问题与原问题等价证明:

    • 将约束条件融入式中后,则该式 $x$ 可任取值;则存在情况:

      $\begin{align} & min_x\begin{cases} x不在初始问题可行域内:max_{\lambda,\nu}L(x,\lambda,\nu)=f_0(x)+\infty+\infty \newline x在初始问题可行域内:max_{\lambda,\nu}L(x,\lambda,\nu)=f_0(x)+0+0 \end{cases} \newline \Rightarrow & min_x max_{\lambda,\nu}L(x,\lambda,\nu) = min_x{\infty,f_0(x)} = minf_0(x) \end{align}$

  3. 对偶函数:$g(\lambda,\nu)=min_{x}L(x,\lambda,\nu)$

    对偶问题:$\begin{align} & max_{\lambda,\nu}g(\lambda,\nu)=max_{\lambda,\nu}min_{x}L(x,\lambda,\nu) \newline & s.t. \lambda\ge0 \end{align}$

对偶问题性质

原问题与对偶问题等价性

Slater 条件

KKT 条件