变分法

变分法是处理泛函数学领域,和处理函数的普通微积分相对。譬如,这样的泛函可以通过未知函数的积分和它的导数来构造。变分法最终寻求的是极值函数:它们使得泛函取得极大或极小值。有些曲线上的经典问题采用这种形式表达:一个例子是最速降线,在重力作用下一个粒子沿着该路径可以在最短时间从点A到达不直接在它底下的一点B。在所有从A到B的曲线中必须极小化代表下降时间的表达式。

变分法的关键定理是欧拉-拉格朗日方程。它对应于泛函的临界点。在寻找函数的极大和极小值时,在一个解附近的微小变化的分析给出一阶的一个近似。它不能分辨是找到了最大值或者最小值(或者都不是)。

变分法在理论物理中非常重要:在拉格朗日力学中,以及在最小作用量原理量子力学的应用中。变分法提供了有限元方法的数学基础,它是求解边界值问题的强力工具。它们也在材料学中研究材料平衡中大量使用。而在纯数学中的例子有,黎曼调和函数中使用狄利克雷原理

同样的材料可以出现在不同的标题中,例如希尔伯特空间技术,莫尔斯理论,或者辛几何变分一词用于所有极值泛函问题。微分几何中的测地线的研究是很显然的变分性质的领域。极小曲面肥皂泡)上也有很多研究工作,称为普拉托问题

历史

变分法可能是从约翰·伯努利(1696)提出最速曲线(brachistochrone curve)问题开始出现的。[1]它立即引起了雅各布·伯努利洛必达(Marquis de l'Hôpital)的注意。但欧拉首先详尽的阐述了这个问题。他的贡献始于1733年,他的《变分原理》(Elementa Calculi Variationum)寄予了这门科学这个名字。欧拉对这个理论的贡献非常大。

勒让德(1786)确定了一种方法,但在对极大和极小的区别不完全令人满意。牛顿莱布尼茨也是在早期关注这一学科,对于这两者的区别Vincenzo Brunacci(1810)、高斯(1829)、泊松(1831)、Mikhail Ostrogradsky(1834)、和雅可比(1837)都曾做出过贡献。Sarrus(1842)的由柯西(1844)浓缩和修改的是一个重要的具有一般性的成就。Strauch(1849)、Jellett(1850)、Otto Hesse(1857)、Alfred Clebsch(1858)、和Carll(1885)写了一些其他有价值的论文和研究报告,但可能那个世纪最重要的成果是Weierstrass所取得的。他关于这个理论的著名教材是划时代的,并且他可能是第一个将变分法置于一个稳固而不容置疑的基础上的。1900年希尔伯特发表的23个问题中的第20和23个问题促进了其更深远的发展。

在20世纪希尔伯特埃米·诺特列奥尼达·托内利昂利·勒贝格雅克·阿达马等人做出重要贡献。Marston Morse将变分法应用在莫尔斯理论中。Lev Pontryagin、Ralph Rockafellar和Clarke广义变分法最优控制理论发展了新的数学工具。

欧拉-拉格朗日方程

在理想情形下,一函数的极大值及极小值会出现在其导数 的地方。同样地,求解变分问题时也可以先求解相关的欧拉-拉格朗日方程。以下以寻找连接平面上两点  最短曲线的例子,说明求解的过程。曲线的长度为

 

其中

     

函数 至少需为一阶可微的函数。若 是一个局部最小值,而 是一个在端点  取值为零并且至少有一阶导数的函数,则可得到以下的式子

 

其中 为任意接近 的数字。

因此  的导数(A的一阶导数)在 时必为 

 

此条件可视为在可微分函数的空间中, 在各方向的导数均为 。若假设 二阶可微(或至少弱微分存在),则利用分部积分法可得

 

其中 为在两端点皆为0的任意二阶可微函数。这是变分法基本引理的一个特例:

 

其中 为在两端点皆为 的任意可微函数。

若存在 使 ,则在 周围有一区间的H也是正值。可以选择 在此区间外为 ,在此区间内为非负值,因此 ,和前提不合。若存在 使 ,也可证得类似的结果。因此可得到以下的结论:

 

由结论可推得下式:

 

因此两点间最短曲线为一直线。

在一般情形下,则需考虑以下的计算式

 

其中f需有二阶连续的导函数。在这种情形下,拉格朗日量L在极值 处满足欧拉-拉格朗日方程

 

不过在此处,欧拉-拉格朗日方程只是有极值的必要条件,并不是充分条件。

费马原理

费马原理指出:光会沿着两端点之间所需光程最短的路径前进。假设 为光的路径,则光程可以下式表示:

 

其中折射率 依材料特性而定。

若选择 ,则 的一阶导数(  的微分)为:

 

将括号中的第一项用分部积分处理,可得欧拉-拉格朗日方程

 

光线的路径可由上述的积分式而得。

斯乃尔定律

当光进入或离开透镜面时,折射率会有不连续的变化。考虑

 
 

其中  是常数。在x<0或x>0的区域,欧拉-拉格朗日方程均和以上描述的相同。因为折射率在二个区域均为定值,在二个区域光都以直线前进。而在x=0的位置,f必须连续,不过f' 可以不连续。在上述二个区域用分部积分的方式解欧拉-拉格朗日方程,则其变分量为

 

 相乘的系数是入射角的正弦值,和 相乘的系数则是折射角的正弦值。若依照斯涅尔定律,上述二项的乘积相等,因此上述的变分量为0。因此斯涅尔定律所得的路径也就是要求光程一阶变分量为0的路径。

费马原理在三维下的形式

费马原理可以用向量的形式表示:令 ,而t为其参数, 是曲线C参数化的表示,而令 为其法线向量。因此在曲线上的光程长为

 

上述积分和t无关,因此也和C的参数表示方式无关。使曲线最短的欧拉-拉格朗日方程有以下的对称形式

 

其中

 

依P的定义可得下式

 

因此上述积分可改为下式

 

依照上式,若可以找到一个函数ψ,其梯度为P,则以上的积分A就可以由在积分端点上ψ的差求得。以上求解曲线使积分量不变的问题就和ψ的level surface有关。为了要找到满足此条件的函数ψ,需要对控制光线传动的波动方程式进行进一步的研究。

和波动方程的关系

应用

最优控制的理论是变分法的一个推广。

参看

参考

  1. ^ Gelfand, I. M.; Fomin, S. V. Silverman, Richard A. , 编. Calculus of variations Unabridged repr. Mineola, N.Y.: Dover Publications. 2000: 3 [2013-05-22]. ISBN 978-0486414485. (原始内容存档于2019-05-03). 
  • Fomin, S.V. and Gelfand, I.M.: Calculus of Variations, Dover Publ., 2000
  • Lebedev, L.P. and Cloud, M.J.: The Calculus of Variations and Functional Analysis with Optimal Control and Applications in Mechanics, World Scientific, 2003, pages 1-98
  • Charles Fox: An Introduction to the Calculus of Variations, Dover Publ., 1987
  • Forsyth, A.R.: Calculus of Variations, Dover, 1960
  • Sagan, Hans: Introduction to the Calculus of Variations, Dover, 1992
  • Weinstock, Robert: Calculus of Variations with Applications to Physics and Engineering, Dover, 1974
  • Clegg, J.C.: Calculus of Variations, Interscience Publishers Inc., 1968
  • Elsgolc, L.E.: Calculus of Variations, Pergamon Press Ltd., 1962

外部链接