绪论
在均分田地问题 中,gxqcn提出了如下问题
有一块田地需要分给n户家庭,要求各户分得面积都相等。田地内部不同家庭分得的区域将建田埂以分隔(原待分地已有田埂圈定)。现为实现耕地面积最大化,要求新建田埂总长度最小。请问如何规划?
关于这个问题的三维问题,存在Plateau's laws 。
在这块田地是单位正方形,对于n=3,4,5 , KeyTo9_Fans分别给出了很不错的结果:
n=3时, 田埂总长度可以仅为2 3 + π 6 + 3 = 1.623278144157 \frac23+\frac{\pi}6+\sqrt{3}=1.623278144157 3 2 + 6 π + 3 = 1 . 6 2 3 2 7 8 1 4 4 1 5 7 (我们可以搜索到法语论坛相关讨论 得出了相同的结果)
n=4时,田埂总长度可以仅为2 + 1 − 3 + π 3 = 1.975592884782 \sqrt{2}+\sqrt{1-\sqrt{3}+\frac{\pi}3}=1.975592884782 2 + 1 − 3 + 3 π = 1 . 9 7 5 5 9 2 8 8 4 7 8 2 (我们可以搜索到意大利语相关讨论 得出了相同的结果)
n=5时, 田埂总长度可以为2 + ( ( 1 + 3 ) π − 6 ) 2 15 ( ( 2 + 3 ) π − 3 ( 1 + 3 ) ) = 2.502112930427 2+((1+\sqrt{3})\pi-6) \sqrt{\frac{2}{15((2+\sqrt{3})\pi-3(1+\sqrt{3}))}}=2.502112930427 2 + ( ( 1 + 3 ) π − 6 ) 1 5 ( ( 2 + 3 ) π − 3 ( 1 + 3 ) ) 2 = 2 . 5 0 2 1 1 2 9 3 0 4 2 7 (可以网络找到Martin Gardner 包含相同的结果)
对于单位圆形田地,在n=3时,从圆心发出三条两两夹角互为120°的半径就可以等分面积,总长度为3。
在n=4时,我们给出了田埂总长为3.945702967267的方案
在n=5的圆形田地,我们找出了田埂总长为4.833846643527的方案
在n=6的圆形田地,我们找出了田埂总长为5.406796929952的对称方案 。
在n=7的圆形田地zgg__和数学星空指出在田地正中心使用正六边形,每个顶点向圆周引垂线可得田埂总长为6的方案 。
在帖子中,很早就有人发现每段田埂应该是直线段或者圆弧;在区域内部,三条田埂相交于一点时,交点处切向量两两夹角为120°;而且田埂和田地边界相遇时在相遇点的切线要和田地边界在相遇点的切线垂直。后文中,我们会直接用俩田埂的夹角为120°来表示俩田埂相遇于一个交点,而且在交点处的切向量夹角为120°;同样我们会直接用田埂和田地边界垂直代表田埂和田地边界相遇并且在相遇点两者切线相互垂直。
KeyTo9_Fans最早指出田埂两两夹角为120° 。他的思路是如下图,在仅考虑三条田埂相交于点P的情况,分别在三条田埂上各自选择充分接近P点的A、B、C三点。为了达到田埂总长最小值,P点应该移动到三角形ABC的费马点才会让AP+BP+CP取到最小值,由此得出AP、BP、CP两两夹角应该为120°。但是这里稍微有点不严密,因为图中这种移动P到P’的方式会改变周围三个区域的面积,而我们的问题中要求所有区域的面积要求是相等的。
zgg__最早指出,本问题等价于二维肥皂泡稳态问题 ,由此得出每段田埂都必须是圆弧或直线段,而且两两夹角为120°;hujunhua进一步指出利用肥皂泡模型可以说明和田地边界相遇的田埂必然垂直于田地边界;gxqcn紧接着指出在区域数目n充分大时,内部区域应该出现“蜂窝”状。
我们对上面情况进行总结 ,并且尝试用数学方法进行证明:
i)田埂每一段必然是圆弧或直线段(可以看成圆弧的退化情况)。
ii)在内部,最多三个不同的田埂共点,这时田埂之间必然两两夹角相等
iii)田埂和边界接触的地方必然同边界垂直
其中性质i)可以直接用初等方法证明。我们可以利用一个大家所熟知的结论:面积一定的简单平面图形中,圆的周长最短。利用这个结论可以得出一侧为固定线段,另一侧为任意简单曲线围成的面积一定的图形中,在另一侧任意简单曲线为圆弧时,这条简单曲线长度达到最短。
如上图所示,对于围住的面积固定的曲线BAC和固定直线段BC,我们先以线段BC为弦作出和这个图形等面积的弓形BA’C并且补充弓形BA”C形成一个完整的圆BA’CA”。于是图形BACA”和图形BA’CA”等面积,于是我们根据等面积图形中圆的周长最小可以得出(BA"C) ̂+(BA'C) ̂≤(BA"C) ̂+(BAC),所以我们可以得出(BA'C) ̂≤(BAC),得出结论i)。 于是我们得出极值条件所有田埂都是圆弧或直线段(直线段是圆弧的退化情况)。
后面我们均只需要考虑所有田埂都是直线段或圆弧的情况。
对于其中任意一个三条田埂汇聚于一点的P ( x p , y p ) P(x_p,y_p ) P ( x p , y p ) 的情况,假设这三段田埂另一个端点分别为A ( x a , y a ) , B ( x b , y b ) , C ( x c , y c ) A(x_a,y_a ),B(x_b,y_b ),C(x_c,y_c) A ( x a , y a ) , B ( x b , y b ) , C ( x c , y c ) , 而三段圆弧和对应端点连线的有向夹角分别为θ a , θ b , θ c \theta_a,\theta_b,\theta_c θ a , θ b , θ c (对应三段圆弧的弧度分别为2 θ a , 2 θ b , 2 θ c 2\theta_a,2\theta_b,2\theta_c 2 θ a , 2 θ b , 2 θ c )。 其中圆弧关于P点向顺时针方向凸出(也就是对应圆心落在对应直线段的逆时针位置时)对应的θ s \theta_s θ s 看成是正角度;而圆弧逆顺时针凸出时,对应的θ s \theta_s θ s 看成是负角度,比如图中所示θ a , θ b \theta_a,\theta_b θ a , θ b 为负角度,θ c \theta_c θ c 为正角度。另外需要注意的是,一段田埂在一个端点处的角度为θ \theta θ ,那么在另外一个端点处的角度必然是− θ -\theta − θ 。
使用拉格朗日乘数法 ,选择A、B、C三点固定不动,仅让P点保持运动并且让P点周围三个区域的面积保持不变,要求三条田埂长度之和最小,可以得出一些约束方程,
最后可以把极值约束条件化简 为
{ F 1 = sin ( θ a ) L a + sin ( θ b ) L b + sin ( θ c ) L c = 0 F 2 = D a , x + D b , x + D c , x = 0 F 3 = D a , y + D b , y + D c , y = 0 \begin{cases}
F_1=\frac{\sin(\theta_a)}{L_a} +\frac{\sin(\theta_b)}{L_b} +\frac{\sin(\theta_c)}{L_c} =0\\
F_2=D_{a,x}+D_{b,x}+D_{c,x}=0\\
F_3=D_{a,y}+D_{b,y}+D_{c,y}=0
\end{cases} ⎩ ⎪ ⎪ ⎨ ⎪ ⎪ ⎧ F 1 = L a s i n ( θ a ) + L b s i n ( θ b ) + L c s i n ( θ c ) = 0 F 2 = D a , x + D b , x + D c , x = 0 F 3 = D a , y + D b , y + D c , y = 0 (I)
其中
{ D s , x = x s − x p L s cos ( θ s ) + y s − y p L s sin ( θ s ) D s , y = y s − y p L s cos ( θ s ) − x s − x p L s sin ( θ s ) L s = ( x p − x s ) 2 + ( y p − y s ) 2 s ∈ a,b,c \begin{cases}
D_{s,x}=\frac{x_s-x_p}{L_s}\cos(\theta_s)+\frac{y_s-y_p}{L_s}\sin(\theta_s )\\
D_{s,y}=\frac{y_s-y_p}{L_s}\cos(\theta_s)-\frac{x_s-x_p}{L_s}\sin(\theta_s )\\
L_s=\sqrt{(x_p-x_s )^2+(y_p-y_s )^2 }\\
s\in \text{{a,b,c}}
\end{cases} ⎩ ⎪ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎪ ⎧ D s , x = L s x s − x p cos ( θ s ) + L s y s − y p sin ( θ s ) D s , y = L s y s − y p cos ( θ s ) − L s x s − x p sin ( θ s ) L s = ( x p − x s ) 2 + ( y p − y s ) 2 s ∈ a , b , c
上面约束条件(I)中第一条方程代表三段圆弧(或直线段)有向曲率之和为0。而后面两条方程代表三段圆弧在P点处单位切线向量之和为零向量,所以它们两两夹角都相等,均为120°(P点同时为三个单位切线向量末端构成三角形的外心和重心,所以这是一个正三角形)。
对于边界为直线段构成的凸田地,可以想象如果某个田埂的一个端点落在田地边界上,那么将整个田地和所有田埂关于这个边界线做对称图形,然后把原图形和对称图形合并在一起并且将仅被这条分界直线段分隔的区域相互合并,于是变成一个关于更大的田地更多区域的固定面积最优化问题,结果同样需要满足类似的约束条件。于是我们可以看出在原问题中,这个田埂必须垂直于田地边界才符合要求。
另外我们推导了田地边界是圆弧构成的情况 ,同样得出了和边界相遇的田埂必须垂直于圆弧田地边界的条件。
如图,不妨设田地边界这一段圆弧为单位圆的圆弧,设田埂在边界上点为U ( cos ( u ) , sin ( u ) ) U(\cos(u),\sin(u) ) U ( cos ( u ) , sin ( u ) ) ,田埂另外一个端点为点P ( x 0 , y 0 ) P(x_0,y_0 ) P ( x 0 , y 0 ) ,圆弧和俩端点连线夹角为θ \theta θ 。并且设P点极坐标为( r 0 , θ 0 ) (r_0,θ_0 ) ( r 0 , θ 0 ) , 得出的约束条件为
tan ( θ ) − r 0 sin ( u − θ 0 ) 1 − r 0 cos ( u − θ 0 ) = 0 \tan(\theta)-\frac{r_0\sin(u-\theta_0 )}{1-r_0\cos(u-\theta_0 )}=0 tan ( θ ) − 1 − r 0 c o s ( u − θ 0 ) r 0 s i n ( u − θ 0 ) = 0
即E 1 = sin ( θ ) ( 1 − cos ( u ) x 0 − sin ( u ) y 0 ) − cos ( θ ) ( sin ( u ) x 0 − cos ( u ) y 0 ) = 0 E_1=\sin(\theta)(1-\cos(u) x_0-\sin(u) y_0 )-\cos(θ)(\sin(u) x_0-\cos(u) y_0)=0 E 1 = sin ( θ ) ( 1 − cos ( u ) x 0 − sin ( u ) y 0 ) − cos ( θ ) ( sin ( u ) x 0 − cos ( u ) y 0 ) = 0 (II)
这个条件正好就是要求田埂(UP) ̂垂直单位圆田地边界于U点。
利用上面分析结论我们使用计算机将正方形田地均分到最多14个区域 并且将圆形田地均分到最多19个区域 .
但是很快我们发现英国数学家Simon Cox 已经计算到42个区域以内的非常不错的结果。
后来我们利用pari/gp计算出了圆形情况不超过43个区域下的50位精度的高精度结果 。 点击链接可以下载关键点的坐标和圆弧角度的高精度结果 。
另外我们还继续计算得出将圆形划分44~52个区域时的不错结果,如下面是将圆形田地划分为44个区域的划分方案图:
第一部分 理论分析
现在我们可以把这个问题重新描绘为:
定理1 给定边界为最多包含有限个不光滑点的简单曲线围成的区域,在其内部通过简单曲线分割成n个分别给定面积的小区域,那么在这些分割线长度之和达到极小值时,必然满足一下条件:
i)每段分割线必然是圆弧或直线段
ii)如果两段曲率不同的分割线相遇于区域内部一点P,那么必然还有第三段分割线同样和这两段分割线相遇于P点
iii)如果两条分割线相遇于一点P,那么它们的夹角不小于120°。特别的,如果P点在区域内部,那么必然是三条分割线在端点相遇于P点,而且两两夹角正好是120°;而且不会有四条或以上的分割线在区域内部相遇于一点。
iv)如果一条分割线相遇区域边界于点P,那么分割线和边界在点P两个方向的切向量夹角都不小于90°。特别的,如果区域边界在P点光滑,那么分割线这时必然垂直区域边界于P点。
v)如果有三条分割线相遇于区域内部一点P,那么这三条分割线的有向曲率和为0。
证明如下:
其中性质i)在绪论中通过反证法已经给出了比较严密的初等证明。
对于性质ii),我们同样采用类似的反证法,假设这时没有第三条分割线经过P点,由于P点是区域内点,这两条分割线两侧属于两个不同的小区域。在两条分割线上分别选择和P点充分接近的A、B两点,类似绪论中的方法,把非圆弧APB替换成一段圆弧并且保持两边小区域面积不变可以使得分割线总长度减少。由于P时区域内点,在A、B、P充分接近时,这种替换不会和其它分割线相交,所以可以得到一个合法的分割线总长度更小的方案,说明这种方法必然无法达到极小值。
对于性质iii), 同样可以采用反证法(下面的结果暂时还需要依赖数值计算结果)。
如图假设这时有两条分割线AB,AC相遇于一点A而且AB,AC是同一个小区域的两条相邻的边。这个小区域分别还隔着AB或BC和另外两个小区域相邻。选择分割线上的点B、C使得AB=AC而且点B、C充分接近A点,在局部这时可以近似把AB、AC看成直线段,这时我们看看能否找到两条夹角为120°的圆弧(BD) ̂和(DC) ̂使得添加点D并且用(BD) ̂、(DC) ̂、(AD) ̅替换AB、AC后保持三个周边小区域的面积不变。如果这时有(BD) ̂+(AD) ̅+(DC) ̂<(AB) ̅+(AC) ̅,那么我们就可以通过这种替换保持各个小区域面积不变的同时减少了分割线总长度,从而得出原先的方案不是极小值方案。在∠BAC<120°时,我们让D在BC中垂线上从Fermat点移动到A点,保持圆弧BD和AD夹角为120°。当D移动到Fermat点时,显然BDC围成的小区域面积会偏小(另外两个区域的面积都增加了),而当D移动到A点时,(BD) ̂和(DC) ̂分别移动到直线段AB和AC的外侧,所以BDC围成的小区域面积会偏大(另外两个区域面积都减少了),根据中值定理,这中间必然正好存在一个D点,使得三个区域面积都和原先相等。
如图设∠ B A D = θ , ∠ A E B = 2 ψ \angle BAD=\theta, \angle AEB=2\psi ∠ B A D = θ , ∠ A E B = 2 ψ ,其中E为圆弧(BD) ̂的圆心,经计算可以得到关系式c t a n ( θ ) = 2 ψ − sin ( 2 ψ ) + 2 sin ( 2 π 3 − 2 ψ ) sin 2 ( ψ ) 4 sin 2 ( ψ ) sin 3 ( π 3 − ψ ) = 2 ψ − sin ( 2 ψ ) 4 sin 2 ( ψ ) sin 3 ( π 3 − ψ ) + cos ( π 3 − ψ ) sin 2 ( π 3 − ψ ) = u ( ψ ) + v ( ψ ) ctan(\theta)=\frac{2\psi-\sin(2\psi)+2\sin(\frac{2\pi}3-2\psi)\sin^2(\psi)}{4\sin^2(\psi)\sin^3(\frac{\pi}3-\psi)}=\frac{2\psi-\sin(2\psi)}{4\sin^2(\psi)\sin^3(\frac{\pi}3-\psi)}+\frac{\cos(\frac{\pi}3-\psi)}{\sin^2(\frac{\pi}3-\psi)} =u(\psi)+v(\psi) c t a n ( θ ) = 4 s i n 2 ( ψ ) s i n 3 ( 3 π − ψ ) 2 ψ − s i n ( 2 ψ ) + 2 s i n ( 3 2 π − 2 ψ ) s i n 2 ( ψ ) = 4 s i n 2 ( ψ ) s i n 3 ( 3 π − ψ ) 2 ψ − s i n ( 2 ψ ) + s i n 2 ( 3 π − ψ ) c o s ( 3 π − ψ ) = u ( ψ ) + v ( ψ ) ,图上红色曲线给出了0 < θ < π 3 , 0 < ψ < π 3 0\lt \theta\lt\frac{\pi}3,0\lt\psi\lt\frac{\pi}3 0 < θ < 3 π , 0 < ψ < 3 π 时θ , ψ \theta,\psi θ , ψ 的关系图,其中横坐标为θ \theta θ ,纵坐标为ψ \psi ψ ,另外绿色曲线给出((AB) ̅+(AC) ̅)-((BD) ̂+(AD) ̅+(DC) ̂)和(AB) ̅的比例2 − 2 ψ sin ( θ ) sin ( ψ ) sin ( 2 π 3 + ψ ) − sin ( π 3 − θ − ψ ) sin ( 2 π 3 + ψ ) 2-\frac{2\psi\sin(\theta)}{\sin(\psi)\sin(\frac{2\pi}3+\psi)}-\frac{\sin(\frac{\pi}3-\theta-\psi)}{\sin(\frac{2\pi}3+ψ)} 2 − s i n ( ψ ) s i n ( 3 2 π + ψ ) 2 ψ s i n ( θ ) − s i n ( 3 2 π + ψ ) s i n ( 3 π − θ − ψ ) 的图像,可以看出这种情况进行替换总是可以缩短分割线总长度的。
为了证明上图中的性质,我们计算d v ( ψ ) d ψ = sec ( ψ + π 6 ) ( tan 2 ( ψ + π 6 ) + sec 2 ( ψ + π 6 ) ) ≥ 0 \frac{dv(\psi)}{d\psi}=\sec(\psi+\frac{\pi}6)(\tan^2(\psi+\frac{\pi}6)+\sec^2(\psi+\frac{\pi}6))\ge0 d ψ d v ( ψ ) = sec ( ψ + 6 π ) ( tan 2 ( ψ + 6 π ) + sec 2 ( ψ + 6 π ) ) ≥ 0 ,
d u ( ψ ) d ψ = 1 4 csc 2 ( ψ ) sec 3 ( ψ + π 6 ) ( 4 ( 1 − ψ tan ( ψ ) ) + 3 ( 2 ψ − sin ( 2 ψ ) ) tan ( ψ + π 6 ) ) ≥ 0 \frac{du(\psi)}{d\psi}=\frac14\csc^2(\psi)\sec^3(\psi+\frac{\pi}6)(4(1-\frac{\psi}{\tan(\psi)})+3(2\psi-\sin(2\psi))\tan(\psi+\frac{\pi}6))\ge 0 d ψ d u ( ψ ) = 4 1 csc 2 ( ψ ) sec 3 ( ψ + 6 π ) ( 4 ( 1 − t a n ( ψ ) ψ ) + 3 ( 2 ψ − sin ( 2 ψ ) ) tan ( ψ + 6 π ) ) ≥ 0 ,
所以我们确认了θ , ψ \theta,\psi θ , ψ 是递减关系。
另外我们还需要证明2 − 2 ψ sin ( θ ) sin ( ψ ) sin ( 2 π / 3 + ψ ) − sin ( π 3 − θ − ψ sin ( 2 π 3 + ψ ) ≥ 0 2-\frac{2\psi\sin(\theta)}{\sin(\psi)\sin(2\pi/3+\psi)}-\frac{\sin(\frac{\pi}3-\theta-\psi}{\sin(\frac{2\pi}3+\psi)} \ge 0 2 − s i n ( ψ ) s i n ( 2 π / 3 + ψ ) 2 ψ s i n ( θ ) − s i n ( 3 2 π + ψ ) s i n ( 3 π − θ − ψ ≥ 0 即2 ψ − cos ( π 3 − ψ ) sin ( ψ ) sin ( ψ ) sin ( π 3 − ψ ) ≤ 2 − cos ( θ ) sin ( θ ) \frac{2\psi-\cos(\frac{\pi}3-\psi)\sin(\psi)}{\sin(\psi)\sin(\frac{\pi}3-\psi)}\le \frac{2-\cos(\theta)}{\sin(\theta)} s i n ( ψ ) s i n ( 3 π − ψ ) 2 ψ − c o s ( 3 π − ψ ) s i n ( ψ ) ≤ s i n ( θ ) 2 − c o s ( θ ) 。待解决!
对于性质iv),同样假设现在有一条分割线AP和区域边界PC相遇于P点而且θ=∠CPA<90°,其中P点局部放大以后我们可以近似认为PC和PA都接近直线段。我们现在试着用垂直PC的一段圆弧(AD) ̂替换AP使得替换后保持两边小区域的面积不变。设∠ACP=ψ,我们得到条件sin ( ψ ) ψ = sin ( θ ) sin ( θ + ψ ) \frac{\sin(\psi)}{\psi}=\frac{\sin(\theta)}{\sin(\theta+\psi)} ψ s i n ( ψ ) = s i n ( θ + ψ ) s i n ( θ ) ,而(AD) ̂/(AP) ̅ =(ψ sin(θ))/sin(ψ) =sin(θ+ψ)≤1。其中去等号时要求sin(ψ)/ψ=sin(θ)=cos(ψ)即tan(ψ)=ψ只有角度为0时才可能。所以我们同样得出这时不是极小值情况。
对于性质v),对于三条分割线交于区域内部一点P ( x p , y p ) P(x_p,y_p ) P ( x p , y p ) , 假设我们选择不调整点P和三条分割线另外一个端点A ( x a , y a ) , B ( x b , y b ) , C ( x c , y c ) A(x_a,y_a ),B(x_b,y_b ),C(x_c,y_c ) A ( x a , y a ) , B ( x b , y b ) , C ( x c , y c ) 的位置,但是允许调整三条分割线的曲率但是要求保持周边三个小区域的面积不变。直接采用链接拉格朗日乘数法 中的方法,记L a L_a L a =(AP) ̅,L b L_b L b =(BP) ̅,L c L_c L c =(CP) ̅,
最后可以得出取极小值时的必要条件是sin ( θ a ) L a + sin ( θ b ) L b + sin ( θ c ) L c = 0 \frac{\sin(\theta_a)}{L_a} +\frac{\sin(\theta_b)}{L_b} +\frac{\sin(\theta_c)}{L_c} =0 L a s i n ( θ a ) + L b s i n ( θ b ) + L c s i n ( θ c ) = 0 ,即三条分割线的有向曲率之和为0。
对于边界是圆的情况,由于整个图形旋转对称,一个最优结果绕图形中心任意旋转还是最优结果。为了这种情况能够让结果唯一,我们可以选择固定一个和边界相交的分割线在便加上交点的位置,不允许移动,于是在方程中,关于这个分割线在这个点必须垂直边界的约束条件也可以删除了。
更进一步,我们也可以选择在限制某些内部交点位置的情况下的极小值(但是不限制交于这个点的三条分割线的曲率),于是要求三条分割线在这点两两夹角相等的约束条件可以去除,但是需要保留这三条分割线的曲率和为零这个约束条件,即sin ( θ a ) L a + sin ( θ b ) L b + sin ( θ c ) L c = 0 \frac{\sin(\theta_a )}{L_a} +\frac{\sin(\theta_b )}{L_b} +\frac{\sin(\theta_c )}{L_c} =0 L a s i n ( θ a ) + L b s i n ( θ b ) + L c s i n ( θ c ) = 0 。
而三条分割线两两夹角相等的公式形式即方程组
{ ∑ s ∈ a , b , c x s − x p L s cos ( θ s ) + y s − y p L s sin ( θ s ) = 0 ∑ s ∈ a , b , c y s − y p L s cos ( θ s ) − x s − x p L s sin ( θ s ) = 0 \begin{cases}\sum_{s\in {a,b,c}}\frac{x_s-x_p}{L_s}\cos(\theta_s)+\frac{y_s-y_p}{L_s}\sin(\theta_s )=0\\
\sum_{s\in{a,b,c}}\frac{y_s-y_p}{L_s}\cos(\theta_s)-\frac{x_s-x_p}{L_s}\sin(\theta_s)=0
\end{cases} { ∑ s ∈ a , b , c L s x s − x p cos ( θ s ) + L s y s − y p sin ( θ s ) = 0 ∑ s ∈ a , b , c L s y s − y p cos ( θ s ) − L s x s − x p sin ( θ s ) = 0
第二部分 边界约束条件方程分析
对于边界为单位圆的情况,绪论里面给出了边界上点的约束方程为
E 1 = sin ( θ ) ( 1 − cos ( u ) x 0 − sin ( u ) y 0 ) − cos ( θ ) ( sin ( u ) x 0 − cos ( u ) y 0 ) = 0 E_1=\sin(θ)(1-\cos(u) x_0-\sin(u) y_0 )-\cos(θ)(\sin(u) x_0-\cos(u) y_0)=0 E 1 = sin ( θ ) ( 1 − cos ( u ) x 0 − sin ( u ) y 0 ) − cos ( θ ) ( sin ( u ) x 0 − cos ( u ) y 0 ) = 0 。
同样对于边界为一般的圆的情况,假设边界上点为P ( a + r cos ( u ) , b + r sin ( u ) ) P(a+r\cos(u),b+r\sin(u)) P ( a + r cos ( u ) , b + r sin ( u ) ) , 这条分界线另外一个端点为A ( x 0 , y 0 ) A(x_0,y_0 ) A ( x 0 , y 0 ) , 于是PA方向向量为( x 0 − a − r cos ( u ) , y 0 − b − r sin ( u ) ) (x_0-a-r \cos(u),y_0-b-r \sin(u) ) ( x 0 − a − r cos ( u ) , y 0 − b − r sin ( u ) ) ,这个向量顺时针旋转θ度后变为( ( x 0 − a − r cos ( u ) ) cos ( θ ) + ( y 0 − b − r sin ( u ) ) sin ( θ ) , ( y 0 − b − r sin ( u ) ) cos ( θ ) − ( x 0 − a − r cos ( u ) ) sin ( θ ) ) ((x_0-a-r \cos(u) )\cos(θ)+( y_0-b-r\sin(u) )\sin(θ),(y_0-b-r\sin(u) )\cos(θ)-(x_0-a-r\cos(u) )\sin(θ)) ( ( x 0 − a − r cos ( u ) ) cos ( θ ) + ( y 0 − b − r sin ( u ) ) sin ( θ ) , ( y 0 − b − r sin ( u ) ) cos ( θ ) − ( x 0 − a − r cos ( u ) ) sin ( θ ) ) 和切线方向( − sin ( u ) , cos ( u ) ) (-\sin(u),\cos(u)) ( − sin ( u ) , cos ( u ) ) 垂直,所以有( x 0 − a − r cos ( u ) ) sin ( u ) cos ( θ ) + ( y 0 − b − r sin ( u ) ) sin ( u ) sin ( θ ) − ( y 0 − b − r sin ( u ) ) cos ( u ) cos ( θ ) + ( x 0 − a − r cos ( u ) ) cos ( u ) sin ( θ ) = 0 (x_0-a-r\cos(u))\sin(u)\cos(θ)+(y_0-b-r\sin(u))\sin(u)\sin(θ)-(y_0-b-r \sin(u))\cos(u)\cos(θ)+(x_0-a-r\cos(u))\cos(u)\sin(θ)=0 ( x 0 − a − r cos ( u ) ) sin ( u ) cos ( θ ) + ( y 0 − b − r sin ( u ) ) sin ( u ) sin ( θ ) − ( y 0 − b − r sin ( u ) ) cos ( u ) cos ( θ ) + ( x 0 − a − r cos ( u ) ) cos ( u ) sin ( θ ) = 0 , 即E c = cos ( θ ) ( ( x 0 − a ) sin ( u ) − ( y 0 − b ) cos ( u ) ) − sin ( θ ) ( ( y 0 − b ) sin ( u ) + ( x 0 − a ) cos ( u ) − r ) = 0 E_c=\cos(θ) ((x_0-a)\sin(u)-(y_0-b)\cos(u))-\sin(θ) ((y_0-b)\sin(u)+(x_0-a) \cos(u)-r)=0 E c = cos ( θ ) ( ( x 0 − a ) sin ( u ) − ( y 0 − b ) cos ( u ) ) − sin ( θ ) ( ( y 0 − b ) sin ( u ) + ( x 0 − a ) cos ( u ) − r ) = 0 。
而对于边界是直线的情况,结果会更简单一些,比如对于下图边界为x=1的情况
tan ( θ ) + y p − y 0 1 − x 0 = 0 \tan(θ)+\frac{y_p-y_0}{1-x_0}=0 tan ( θ ) + 1 − x 0 y p − y 0 = 0 , 即 E 2 = sin ( θ ) ( 1 − x 0 ) + cos ( θ ) ( y p − y 0 ) = 0 E_2=\sin(θ)(1-x_0 )+\cos(θ) (y_p-y_0 )=0 E 2 = sin ( θ ) ( 1 − x 0 ) + cos ( θ ) ( y p − y 0 ) = 0
类似,对于边界x=0,y=1,y=0,我们分别有约束公式{ E 3 = x 0 sin ( θ ) − ( y p − y 0 ) cos ( θ ) = 0 E 4 = ( 1 − y 0 ) sin ( θ ) − ( x p − x 0 ) cos ( θ ) = 0 E 5 = sin ( θ ) y 0 − ( x 0 − x p ) cos ( θ ) = 0 \begin{cases}E_3=x_0\sin(θ)-(y_p-y_0 )\cos(θ)=0\\E_4=(1-y_0 )\sin(θ)-(x_p-x_0 )\cos(θ)=0\\ E_5=\sin(θ) y_0-(x_0-x_p )\cos(θ)=0\end{cases} ⎩ ⎪ ⎪ ⎨ ⎪ ⎪ ⎧ E 3 = x 0 sin ( θ ) − ( y p − y 0 ) cos ( θ ) = 0 E 4 = ( 1 − y 0 ) sin ( θ ) − ( x p − x 0 ) cos ( θ ) = 0 E 5 = sin ( θ ) y 0 − ( x 0 − x p ) cos ( θ ) = 0 。
为了统一起见,对于边界点的x坐标或y坐标,我们后面有时也会统一用参数u表示,而约束方程统一用形式函数E ( θ , u , x 0 , y 0 ) = 0 E(θ,u,x_0,y_0 )=0 E ( θ , u , x 0 , y 0 ) = 0 表示。
对于一般情况,设直线边界上点为P ( a u + b , c u + d ) P(au+b,cu+d) P ( a u + b , c u + d ) ,于是PA方向向量为( x 0 − a u − b , y 0 − c u − d ) (x_0-au-b,y_0-cu-d) ( x 0 − a u − b , y 0 − c u − d ) ,PA顺时针旋转θ度后变为( ( x 0 − a u − b ) cos ( θ ) + ( y 0 − c u − d ) sin ( θ ) , ( y 0 − c u − d ) cos ( θ ) − ( x 0 − a u − b ) sin ( θ ) ) ((x_0-au-b)\cos(θ)+(y_0-cu-d)\sin(θ), (y_0-cu-d)\cos(θ)-(x_0-au-b)\sin(θ)) ( ( x 0 − a u − b ) cos ( θ ) + ( y 0 − c u − d ) sin ( θ ) , ( y 0 − c u − d ) cos ( θ ) − ( x 0 − a u − b ) sin ( θ ) ) 直线切线方向为(a,c),所以( a ( x 0 − a u − b ) cos ( θ ) + a ( y 0 − c u − d ) sin ( θ ) + c ( y 0 − c u − d ) cos ( θ ) − c ( x 0 − a u − b ) sin ( θ ) ) = 0 (a(x_0-au-b)\cos(θ)+a(y_0-cu-d)\sin(θ)+c(y_0-cu-d)\cos(θ)-c(x_0-au-b) \sin(θ) )=0 ( a ( x 0 − a u − b ) cos ( θ ) + a ( y 0 − c u − d ) sin ( θ ) + c ( y 0 − c u − d ) cos ( θ ) − c ( x 0 − a u − b ) sin ( θ ) ) = 0 ,即E l = cos ( θ ) ( a x 0 + c y 0 − a b − c d − ( a 2 + c 2 ) u ) + sin ( θ ) ( a y 0 − c x 0 + b c − a d ) = 0 E_l=\cos(θ) (ax_0+cy_0-ab-cd-(a^2+c^2)u)+\sin(θ) (ay_0-cx_0+bc-ad)=0 E l = cos ( θ ) ( a x 0 + c y 0 − a b − c d − ( a 2 + c 2 ) u ) + sin ( θ ) ( a y 0 − c x 0 + b c − a d ) = 0 .
第三部分 面积约束条件
另外我们还需要提供每个区域的面积计算公式,如下图部分面积公式可以写成
S a , b , c , d = 1 2 ∑ a , b ( x a y b − x b y a − S D a , b ( 2 θ a − sin ( 2 θ a ) ) 4 sin 2 ( θ a ) = S a v e S_{a,b,c,d}=\frac12\sum_{a,b}(x_ay_b-x_by_a-\frac{SD_{a,b} (2\theta_a-\sin(2\theta_a ))}{4\sin^2(\theta_a)}=S_{ave} S a , b , c , d = 2 1 ∑ a , b ( x a y b − x b y a − 4 s i n 2 ( θ a ) S D a , b ( 2 θ a − s i n ( 2 θ a ) ) = S a v e (IV),
其中S D a , b = ( x a − x b ) 2 + ( y a − y b ) 2 SD_{a,b}=(x_a-x_b )^2+(y_a-y_b )^2 S D a , b = ( x a − x b ) 2 + ( y a − y b ) 2 代表两点间距离平方。
但是某个区域的某条边还有可能不是田埂而是田地的边界,这时其两个端点都在边界上。如果边界这时是单位圆,设两个端点分别为( cos ( u ) , sin ( u ) ) , ( cos ( v ) , sin ( v ) ) (\cos(u), \sin(u)), (\cos(v), \sin(v)) ( cos ( u ) , sin ( u ) ) , ( cos ( v ) , sin ( v ) ) , 那么我们相当于可以上面公式中的θ a θ_a θ a 使用v − u 2 \frac{v-u}2 2 v − u 替换即可。
由此,对于一个n个区域,其中有m个内部交叉点(三条田埂相交)和k个边界交叉点(田埂和边界交叉)的配置,使用欧拉定理可以计算出m+k=2(n-1)。而田埂的数目e满足2e=3m+k且e=m+n-1。
对于m个内部交叉点,每个点可以有横坐标,纵坐标两个变量,共2m个变量,而k各边界交叉点,根据落在边界上的位置,每个边界点需要一个变量,共k个变量。另外每条田埂有一个有向弧度参数θ,所以e条田埂共提供e个变量。由此我们总共定义了2m+k+e个变量。
另外一方面,每个内部交叉点提供了3条(I)中的方程,每个边界交叉点提供了一条类似(II),(III)的方程,共3m+k条方程,另外n个区域的面积约束提供了n-1条独立的方程(IV) (n个区域面积之和为已知常数,所以要去掉一个面积约束,总共只有n-1个面积约束)。所以我们总共有3m+k+n-1=2m+k+e条方程。方程和变量数目相同,理论上已经可以用这些方程把这些变量全部计算出来。
但是由于方程为超越方程,很难有系统的方法找出所有解,我们可以尝试使用牛顿迭代法从某些给定的初始近似解求出符合条件的数值解。
为此我们需要进一步各个表达式的各种一阶偏导数,其中在点或边的形式不同时,由于包含的参数数目不同,偏导数形式可能还会略有不同。
比如:
∂ L s ∂ x s = x s − x p L s , ∂ L s ∂ y s = y s − y p L s \frac{\partial L_s}{\partial x_s}=\frac{x_s-x_p}{L_s} ,\frac{\partial L_s}{\partial y_s}=\frac{y_s-y_p}{L_s} ∂ x s ∂ L s = L s x s − x p , ∂ y s ∂ L s = L s y s − y p ,
∂ L s ∂ x p = − x s − x p L s = − ∂ L s ∂ x s , ∂ L s ∂ y p = − y s − y p L s = − ∂ L s ∂ y s \frac{∂L_s}{∂x_p}=-\frac{x_s-x_p}{L_s} =-\frac{∂L_s}{∂x_s},\frac{∂L_s}{∂y_p}=-\frac{y_s-y_p}{L_s} =-\frac{∂L_s}{∂y_s} ∂ x p ∂ L s = − L s x s − x p = − ∂ x s ∂ L s , ∂ y p ∂ L s = − L s y s − y p = − ∂ y s ∂ L s
∂ D s , x ∂ x s = cos ( θ s L s − D s , x ( x s − x p ) L s 2 , ∂ D s , x ∂ y s = sin ( θ s ) L s − D s , x ( y s − y p ) L s 2 \frac{∂D_{s,x}}{∂x_s}=\frac{\cos(θ_s}{L_s} -\frac{D_{s,x}(x_s-x_p)}{L_s^2},\frac{∂D_{s,x}}{∂y_s}=\frac{\sin(θ_s)}{L_s} -\frac{D_{s,x} (y_s-y_p )}{L_s^2} ∂ x s ∂ D s , x = L s c o s ( θ s − L s 2 D s , x ( x s − x p ) , ∂ y s ∂ D s , x = L s s i n ( θ s ) − L s 2 D s , x ( y s − y p ) ,
∂ D s , x ∂ x p = − ∂ D s , x ∂ x s , ∂ D s , x ∂ y p = − ∂ D s , x ∂ y s \frac{∂D_{s,x}}{∂x_p}=-\frac{∂D_{s,x}}{∂x_s},\frac{∂D_{s,x}}{∂y_p}=-\frac{∂D_{s,x}}{∂y_s} ∂ x p ∂ D s , x = − ∂ x s ∂ D s , x , ∂ y p ∂ D s , x = − ∂ y s ∂ D s , x
∂ D s , y ∂ x s = − sin ( θ s L s − D s , y ( x s − x p ) L s 2 , 、 ∂ D s , y ∂ y s = cos ( θ s ) L s − D s , y ( y s − y p ) L s 2 \frac{∂D_{s,y}}{∂x_s}=-\frac{\sin(θ_s}{L_s} -\frac{D_{s,y} (x_s-x_p )}{L_s^2},、\frac{∂D_{s,y}}{∂y_s}=\frac{\cos(θ_s)}{L_s} -\frac{D_{s,y} (y_s-y_p)}{L_s^2} ∂ x s ∂ D s , y = − L s s i n ( θ s − L s 2 D s , y ( x s − x p ) , 、 ∂ y s ∂ D s , y = L s c o s ( θ s ) − L s 2 D s , y ( y s − y p ) ,
∂ D s , y ∂ x p = − ∂ D s , y ∂ x s , ∂ D s , y ∂ y p = − ∂ D s , y ∂ y s \frac{∂D_{s,y}}{∂x_p}=-\frac{∂D_{s,y}}{∂x_s},\frac{∂D_{s,y}}{∂y_p}=-\frac{∂D_{s,y}}{∂y_s } ∂ x p ∂ D s , y = − ∂ x s ∂ D s , y , ∂ y p ∂ D s , y = − ∂ y s ∂ D s , y
∂ D s , x ∂ θ s = D s , y , ∂ D s , y ∂ θ s = − D s , x \frac{∂D_{s,x}}{∂θ_s}=D_{s,y},\frac{∂D_{s,y}}{∂θ_s}=-D_{s,x} ∂ θ s ∂ D s , x = D s , y , ∂ θ s ∂ D s , y = − D s , x
{ ∂ F 1 ∂ θ s = c o s ( θ s ) L s ∂ F 1 ∂ x s = − s i n ( θ s ) ( x s − x p ) L s 3 , ∂ F 1 ∂ y s = − sin ( θ s ) ( y s − y p ) L s 3 ∂ F 1 ∂ x p = − ∑ s ∈ a , b , c ∂ F 1 ∂ x s , ∂ F 1 ∂ y p = − ∑ s ∈ a , b , c ∂ F 1 ∂ y s \begin{cases}\frac{∂F_1}{∂θ_s}=\frac{cos(θ_s)}{L_s}\\
\frac{∂F_1}{∂x_s}=-\frac{sin(θ_s ) (x_s-x_p )}{L_s^3},\frac{∂F_1}{∂y_s}=-\frac{\sin(θ_s ) (y_s-y_p )}{L_s^3}\\
\frac{∂F_1}{∂x_p}=-\sum_{s\in{a,b,c}}\frac{∂F_1}{∂x_s},\frac{∂F_1}{∂y_p}=-\sum_{s\in{a,b,c}}\frac{∂F_1}{∂y_s}\end{cases} ⎩ ⎪ ⎪ ⎨ ⎪ ⎪ ⎧ ∂ θ s ∂ F 1 = L s c o s ( θ s ) ∂ x s ∂ F 1 = − L s 3 s i n ( θ s ) ( x s − x p ) , ∂ y s ∂ F 1 = − L s 3 s i n ( θ s ) ( y s − y p ) ∂ x p ∂ F 1 = − ∑ s ∈ a , b , c ∂ x s ∂ F 1 , ∂ y p ∂ F 1 = − ∑ s ∈ a , b , c ∂ y s ∂ F 1
∂ F 2 ∂ θ s = ∂ D s , x ∂ θ s = D s , y , ∂ F 3 ∂ θ s = ∂ D s , y ∂ θ s = − D s , x \frac{∂F_2}{∂θ_s}=\frac{∂D_{s,x}}{∂θ_s}=D_{s,y},\frac{∂F_3}{∂θ_s}=\frac{∂D_{s,y}}{∂θ_s}=-D_{s,x} ∂ θ s ∂ F 2 = ∂ θ s ∂ D s , x = D s , y , ∂ θ s ∂ F 3 = ∂ θ s ∂ D s , y = − D s , x
∂ F 2 ∂ x s = ∂ D s , x ∂ x s = cos ( θ s ) L s − D s , x ( x s − x p ) L s 2 \frac{∂F_2}{∂x_s}=\frac{∂D_{s,x}}{∂x_s}=\frac{\cos(θ_s )}{L_s} -\frac{D_{s,x} (x_s-x_p )}{L_s^2} ∂ x s ∂ F 2 = ∂ x s ∂ D s , x = L s c o s ( θ s ) − L s 2 D s , x ( x s − x p ) ,∂ F 2 ∂ y s = ∂ D s , x ∂ y s = sin ( θ s ) L s − D s , x ( y s − y p ) L s 2 \frac{∂F_2}{∂y_s}=\frac{∂D_{s,x}}{∂y_s}=\frac{\sin(θ_s )}{L_s} -\frac{D_{s,x} (y_s-y_p )}{L_s^2} ∂ y s ∂ F 2 = ∂ y s ∂ D s , x = L s s i n ( θ s ) − L s 2 D s , x ( y s − y p )
∂ F 3 ∂ x s = ∂ D s , y ∂ x s = − sin ( θ s ) L s − D s , y ( x s − x p ) L s 2 \frac{∂F_3}{∂x_s}=\frac{∂D_{s,y}}{∂x_s}=-\frac{\sin(θ_s )}{L_s} -\frac{D_{s,y} (x_s-x_p )}{L_s^2} ∂ x s ∂ F 3 = ∂ x s ∂ D s , y = − L s s i n ( θ s ) − L s 2 D s , y ( x s − x p ) ,∂ F 3 ∂ y s = ∂ D s , y ∂ y s = cos ( θ s ) L s − D s , y ( y s − y p ) L s 2 \frac{∂F_3}{∂y_s}=\frac{∂D_{s,y}}{∂y_s}=\frac{\cos(θ_s )}{L_s} -\frac{D_{s,y} (y_s-y_p )}{L_s^2} ∂ y s ∂ F 3 = ∂ y s ∂ D s , y = L s c o s ( θ s ) − L s 2 D s , y ( y s − y p )
∂ F 2 ∂ x p = ∑ s ∈ a , b , c ∂ D s , x ∂ x p = − ∑ s ∈ a , b , c ∂ F 2 ∂ x s \frac{∂F_2}{∂x_p}=\sum_{s\in{a,b,c}}\frac{∂D_{s,x}}{∂x_p}=-\sum_{s∈{a,b,c}}\frac{∂F_2}{∂x_s} ∂ x p ∂ F 2 = ∑ s ∈ a , b , c ∂ x p ∂ D s , x = − ∑ s ∈ a , b , c ∂ x s ∂ F 2 ,
∂ F 2 ∂ y p = ∑ s ∈ a , b , c ∂ D s , x ∂ y p = − ∑ s ∈ a , b , c ∂ F 2 ∂ y s \frac{∂F_2}{∂y_p}=\sum_{s\in{a,b,c}}\frac{∂D_{s,x}}{∂y_p}=-\sum_{s∈{a,b,c}}\frac{∂F_2}{∂y_s} ∂ y p ∂ F 2 = ∑ s ∈ a , b , c ∂ y p ∂ D s , x = − ∑ s ∈ a , b , c ∂ y s ∂ F 2 ,
∂ F 3 ∂ x p = ∑ s ∈ a , b , c ∂ D s , y ∂ x p = − ∑ s ∈ a , b , c ∂ F 3 ∂ x s \frac{∂F_3}{∂x_p}=\sum_{s\in{a,b,c}}\frac{∂D_{s,y}}{∂x_p}=-\sum_{s∈{a,b,c}}\frac{∂F_3}{∂x_s} ∂ x p ∂ F 3 = ∑ s ∈ a , b , c ∂ x p ∂ D s , y = − ∑ s ∈ a , b , c ∂ x s ∂ F 3 ,
∂ F 3 ∂ y p = ∑ s ∈ a , b , c ∂ D s , y ∂ y p = − ∑ s ∈ a , b , c ∂ F 3 ∂ y s \frac{∂F_3}{∂y_p}=\sum_{s\in{a,b,c}}\frac{∂D_{s,y}}{∂y_p}=-\sum_{s∈{a,b,c}}\frac{∂F_3}{∂y_s} ∂ y p ∂ F 3 = ∑ s ∈ a , b , c ∂ y p ∂ D s , y = − ∑ s ∈ a , b , c ∂ y s ∂ F 3 ,
另外我们还要处理各种边界条件和面积约束的一阶偏导数。
{ ∂ E 1 ∂ θ = cos ( θ ) ( 1 − cos ( u ) x 0 − sin ( u ) y 0 ) + sin ( θ ) ( sin ( u ) x 0 − cos ( u ) y 0 ) ∂ E 1 ∂ u = sin ( θ ) ( sin ( u ) x 0 − cos ( u ) y 0 ) − cos ( θ ) ( cos ( u ) x 0 + sin ( u ) y 0 ) ∂ E 1 ∂ x 0 = − sin ( θ ) cos ( u ) − cos ( θ ) sin ( u ) = − sin ( θ + u ) ∂ E 1 ∂ y 0 = − sin ( θ ) sin ( u ) + cos ( θ ) cos ( u ) = cos ( θ + u ) ∂ E 2 ∂ θ = cos ( θ ) ( 1 − x 0 ) − sin ( θ ) ( y p − y 0 ) ∂ E 2 ∂ y p = cos ( θ ) ∂ E 2 ∂ x 0 = − sin ( θ ) ∂ E 2 ∂ y 0 = − cos ( θ ) ∂ E 3 ∂ θ = cos ( θ ) x 0 + sin ( θ ) ( y p − y 0 ) ∂ E 3 ∂ y p = − cos ( θ ) ∂ E 3 ∂ x 0 = sin ( θ ) ∂ E 3 ∂ y 0 = cos ( θ ) ∂ E 4 ∂ θ = cos ( θ ) ( 1 − y 0 ) + sin ( θ ) ( x p − x 0 ) ∂ E 4 ∂ x p = − cos ( θ ) ∂ E 4 ∂ x 0 = cos ( θ ) ∂ E 4 ∂ y 0 = − sin ( θ ) ∂ E 5 ∂ θ = cos ( θ ) y 0 − sin ( θ ) ( x p − x 0 ) ∂ E 5 ∂ x p = cos ( θ ) ∂ E 5 ∂ x 0 = − cos ( θ ) ∂ E 5 ∂ y 0 = sin ( θ ) \begin{cases}
\frac{∂E_1}{∂θ}= \cos(θ)(1-\cos(u) x_0-\sin(u) y_0 )+\sin(θ)(\sin(u) x_0-\cos(u) y_0)\\
\frac{∂E_1}{∂u}= \sin(θ)(\sin(u) x_0-\cos(u) y_0 )-\cos(θ)(\cos(u) x_0+\sin(u) y_0)\\
\frac{∂E_1}{∂x_0}= -\sin(θ)\cos(u)-\cos(θ)\sin(u)=-\sin(θ+u)\\
\frac{∂E_1}{∂y_0}=-\sin(θ)\sin(u)+\cos(θ)\cos(u)=\cos(θ+u)\\
\frac{∂E_2}{∂θ}=\cos(θ)(1-x_0 )-\sin(θ) (y_p-y_0 )\\
\frac{∂E_2}{∂y_p}=\cos(θ)\\
\frac{∂E_2}{∂x_0}=-\sin(θ)\\
\frac{∂E_2}{∂y_0}=-\cos(θ)\\
\frac{∂E_3}{∂θ}=\cos(θ)x_0+\sin(θ) (y_p-y_0 )\\
\frac{∂E_3}{∂y_p}=-\cos(θ)\\
\frac{∂E_3}{∂x_0}=\sin(θ)\\
\frac{∂E_3}{∂y_0}=\cos(θ)\\
\frac{∂E_4}{∂θ}=\cos(θ)(1-y_0)+\sin(θ)(x_p-x_0 )\\
\frac{∂E_4}{∂x_p}=-\cos(θ)\\
\frac{∂E_4}{∂x_0}=\cos(θ)\\
\frac{∂E_4}{∂y_0}=-\sin(θ)\\
\frac{∂E_5}{∂θ}=\cos(θ)y_0-\sin(θ) (x_p-x_0 )\\
\frac{∂E_5}{∂x_p}=\cos(θ)\\
\frac{∂E_5}{∂x_0}=-\cos(θ)\\
\frac{∂E_5}{∂y_0}=\sin(θ)\end{cases} ⎩ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎧ ∂ θ ∂ E 1 = cos ( θ ) ( 1 − cos ( u ) x 0 − sin ( u ) y 0 ) + sin ( θ ) ( sin ( u ) x 0 − cos ( u ) y 0 ) ∂ u ∂ E 1 = sin ( θ ) ( sin ( u ) x 0 − cos ( u ) y 0 ) − cos ( θ ) ( cos ( u ) x 0 + sin ( u ) y 0 ) ∂ x 0 ∂ E 1 = − sin ( θ ) cos ( u ) − cos ( θ ) sin ( u ) = − sin ( θ + u ) ∂ y 0 ∂ E 1 = − sin ( θ ) sin ( u ) + cos ( θ ) cos ( u ) = cos ( θ + u ) ∂ θ ∂ E 2 = cos ( θ ) ( 1 − x 0 ) − sin ( θ ) ( y p − y 0 ) ∂ y p ∂ E 2 = cos ( θ ) ∂ x 0 ∂ E 2 = − sin ( θ ) ∂ y 0 ∂ E 2 = − cos ( θ ) ∂ θ ∂ E 3 = cos ( θ ) x 0 + sin ( θ ) ( y p − y 0 ) ∂ y p ∂ E 3 = − cos ( θ ) ∂ x 0 ∂ E 3 = sin ( θ ) ∂ y 0 ∂ E 3 = cos ( θ ) ∂ θ ∂ E 4 = cos ( θ ) ( 1 − y 0 ) + sin ( θ ) ( x p − x 0 ) ∂ x p ∂ E 4 = − cos ( θ ) ∂ x 0 ∂ E 4 = cos ( θ ) ∂ y 0 ∂ E 4 = − sin ( θ ) ∂ θ ∂ E 5 = cos ( θ ) y 0 − sin ( θ ) ( x p − x 0 ) ∂ x p ∂ E 5 = cos ( θ ) ∂ x 0 ∂ E 5 = − cos ( θ ) ∂ y 0 ∂ E 5 = sin ( θ )
关于区域面积的偏导数,有
{ ∂ S D a , b ∂ x a = 2 ( x a − x b ) ∂ S D a , b ∂ x b = 2 ( x b − x a ) ∂ S D a , b ∂ y a = 2 ( y a − y b ) ∂ S D ( a , b ) ∂ y b = 2 ( y b − y a ) \begin{cases}\frac{∂SD_{a,b}}{∂x_a} =2(x_a-x_b )\\
\frac{∂SD_{a,b}}{∂x_b} =2(x_b-x_a )\\
\frac{∂SD_{a,b}}{∂y_a} =2(y_a-y_b )\\
\frac{∂SD_(a,b)}{∂y_b} =2(y_b-y_a )\end{cases} ⎩ ⎪ ⎪ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎪ ⎪ ⎧ ∂ x a ∂ S D a , b = 2 ( x a − x b ) ∂ x b ∂ S D a , b = 2 ( x b − x a ) ∂ y a ∂ S D a , b = 2 ( y a − y b ) ∂ y b ∂ S D ( a , b ) = 2 ( y b − y a )
得出面积偏导数(区域顶点按顺序排列,d代表a前面一个点,b代表a后面一个点)
{ ∂ S ∂ θ a = − S D a , b ( 1 − θ a c t g ( θ a ) ) 2 sin 2 ( θ a ) ∂ S ∂ x a = 1 2 ( y b − y d − ( 2 θ a − sin ( 2 θ a ) ) x a − x b 2 sin 2 ( θ a ) − ( 2 θ d − sin ( 2 θ d ) ) x a − x d 2 sin 2 ( θ d ) ) ∂ S ∂ y a = 1 2 ( x d − x b − ( 2 θ a − sin ( 2 θ a ) ) y a − y b 2 sin 2 ( θ a ) − ( 2 θ d − sin ( 2 θ d ) ) y a − y d 2 sin 2 ( θ d ) ) \begin{cases}\frac{∂S}{∂θ_a} =-\frac{SD_{a,b} (1-θ_a ctg(θ_a ))}{2 \sin^2(θ_a )}\\
\frac{∂S}{∂x_a} =\frac12 (y_b-y_d-(2θ_a-\sin(2θ_a ) )\frac{x_a-x_b }{2\sin^2(θ_a)}-(2θ_d-\sin(2θ_d ) )\frac{x_a-x_d }{2\sin^2(θ_d )})\\
\frac{∂S}{∂y_a} =\frac12 (x_d-x_b-(2θ_a-\sin(2θ_a ))\frac{y_a-y_b}{2\sin^2(θ_a )}-(2θ_d-\sin(2θ_d ))\frac{y_a-y_d}{2\sin^2(θ_d)})\end{cases} ⎩ ⎪ ⎪ ⎨ ⎪ ⎪ ⎧ ∂ θ a ∂ S = − 2 s i n 2 ( θ a ) S D a , b ( 1 − θ a c t g ( θ a ) ) ∂ x a ∂ S = 2 1 ( y b − y d − ( 2 θ a − sin ( 2 θ a ) ) 2 s i n 2 ( θ a ) x a − x b − ( 2 θ d − sin ( 2 θ d ) ) 2 s i n 2 ( θ d ) x a − x d ) ∂ y a ∂ S = 2 1 ( x d − x b − ( 2 θ a − sin ( 2 θ a ) ) 2 s i n 2 ( θ a ) y a − y b − ( 2 θ d − sin ( 2 θ d ) ) 2 s i n 2 ( θ d ) y a − y d )
下面我们对m个内点进行编号为N 1 , N 2 , … , N m N_1,N_2,\dots,N_m N 1 , N 2 , … , N m ;对k个边界点标号为N ( m + 1 ) , N ( m + 2 ) , … , N ( m + k ) N_(m+1),N_(m+2),\dots,N_(m+k) N ( m + 1 ) , N ( m + 2 ) , … , N ( m + k ) 。
e条田埂编号为E 1 , E 2 , … , E m E_1,E_2,\dots,E_m E 1 , E 2 , … , E m , 而对于这m条田埂并且任意确定一个方向,然后使用E − 1 , E − 2 , … , E − m E_{-1},E_{-2},\dots,E_{-m} E − 1 , E − 2 , … , E − m 分别代表交换这些田埂的起点和终点后得到的有向田埂。
另外还需要n个区域编号为C 1 , C 2 , … , C n C_1,C_2,\dots,C_n C 1 , C 2 , … , C n 。
对于每个内点N i N_i N i 函数a i a_i a i =get_a( N i ) (N_i) ( N i ) , b i b_i b i =get_b( N i ) (N_i) ( N i ) , c i c_i c i =get_c( N i ) (N_i) ( N i ) , 返回三条以内点N i N_i N i 为起点的有向田埂,对于每个边界点N i N_i N i ,函数get_a( N i ) (N_i) ( N i ) 返回以N i N_i N i 为起点的田埂,函数get_b和get_c报错。对于每条田埂E i E_i E i ,有函数get_start( E i ) (E_i) ( E i ) 和get_end( E i ) (E_i) ( E i ) 返回田埂的两个端点。对于每个区域C i C_i C i ,函数get_degree( C i ) (C_i) ( C i ) 返回区域的顶点数目,v[i,h]=get_vertex(C i C_i C i ,h)返回区域C i C_i C i 的第h个顶点,其中所有顶点按逆时针顺序依次排列。另外如果从N i N_i N i 到N j N_j N j 存在田埂,那么get_edge( N i , N j ) (N_i,N_j) ( N i , N j ) 返回这条田埂,不然报错。
另外函数get_x( N i ) (N_i) ( N i ) , get_y( N i ) (N_i) ( N i ) 依次返回N i N_i N i 的横坐标和纵坐标, get_theta( E i ) (E_i) ( E i ) 返回E i E_i E i 的角度θ i θ_i θ i 。而显然有get_theta( E − i ) (E_{-i}) ( E − i ) =- get_theta( E i ) (E_i) ( E i ) =- θ i θ_i θ i 。另外我们可以使用符号θ i , a θ_{i,a} θ i , a 代表get_theta(get_edge( N i (N_i ( N i , get_a( N i ) (N_i) ( N i ) ))。
于是在上面约定下,我们有2m+k+e个变量x 1 , y 1 , x 2 , y 2 , … , x m , y m , u 1 , u 2 , … , u k , θ 1 , θ 2 , … , θ e x_1,y_1,x_2,y_2,\dots,x_m,y_m,u_1,u_2,\dots,u_k,θ_1,θ_2,\dots,θ_e x 1 , y 1 , x 2 , y 2 , … , x m , y m , u 1 , u 2 , … , u k , θ 1 , θ 2 , … , θ e 。
另外对于每个内点N_i,我们有方程
{ ( F 1 ( N i , a i , b i , c i , θ ( i , a ) , θ ( i , b ) , θ ( i , c ) ) = 0 F 2 ( N i , a i , b i , c i , θ ( i , a ) , θ ( i , b ) , θ ( i , c ) ) = 0 F 3 ( N i , a i , b i , c i , θ ( i , a ) , θ ( i , b ) , θ ( i , c ) ) = 0 \begin{cases}(F_1 (N_i,a_i,b_i,c_i,θ_(i,a),θ_(i,b),θ_(i,c) )=0\\
F_2 (N_i,a_i,b_i,c_i,θ_(i,a),θ_(i,b),θ_(i,c) )=0\\
F_3 (N_i,a_i,b_i,c_i,θ_(i,a),θ_(i,b),θ_(i,c))=0\end{cases} ⎩ ⎪ ⎪ ⎨ ⎪ ⎪ ⎧ ( F 1 ( N i , a i , b i , c i , θ ( i , a ) , θ ( i , b ) , θ ( i , c ) ) = 0 F 2 ( N i , a i , b i , c i , θ ( i , a ) , θ ( i , b ) , θ ( i , c ) ) = 0 F 3 ( N i , a i , b i , c i , θ ( i , a ) , θ ( i , b ) , θ ( i , c ) ) = 0 ,
简记为{ ( F 1 ( i ) = 0 F 2 ( i ) = 0 F 3 ( i ) = 0 \begin{cases}(F_1^{(i)}=0\\F_2^{(i)}=0\\F_3^{(i)}=0\end{cases} ⎩ ⎪ ⎪ ⎨ ⎪ ⎪ ⎧ ( F 1 ( i ) = 0 F 2 ( i ) = 0 F 3 ( i ) = 0
对于每个边界点N i N_i N i ,我们有方程E ( i ) ( θ , u , x 0 , y 0 ) = 0 E^{(i)} (θ,u,x_0,y_0 )=0 E ( i ) ( θ , u , x 0 , y 0 ) = 0
对于每个区域(淘汰最后一个区域),我们有方程1 2 ∑ a , b ( x a y b − x b y a − S D a , b ( 2 θ a − sin ( 2 θ a ) ) 4 sin 2 ( θ a ) ) = S a v e \frac12 \sum_{a,b}(x_a y_b-x_b y_a-\frac{SD_{a,b} (2θ_a-\sin(2θ_a ))}{4\sin^2(θ_a) })=S_{ave} 2 1 ∑ a , b ( x a y b − x b y a − 4 s i n 2 ( θ a ) S D a , b ( 2 θ a − s i n ( 2 θ a ) ) ) = S a v e
实际计算发现,使用上面牛顿迭代法进行计算,需要初始值选择的比较接近最总精确值,不然结果会很快发散。但是对于选择比较好的初始值,会快速接近准确值并且达到很高的精度。
为此,我们需要寻找另外一种方法先找到一些较好的近似值,然后再次使用上面的牛顿迭代法获得精确值。
迭代法设计方案
初始一种想法是对于一个可选配图,我们可以每次只调整一个内部点或一个边界点,保持这个点周围区域面积相等并且以这个点为端点的内部边界长度和达到最小。反复应用这个过程,就可以逐步逼近一个全局局部最优解。
设f ( x ) = x sin ( x ) , g ( x ) = 2 x − sin ( 2 x ) 4 sin 2 ( x ) f(x)=\frac{x}{\sin(x)} ,g(x)=\frac{2x-\sin(2x)}{4\sin^2 (x)} f ( x ) = s i n ( x ) x , g ( x ) = 4 s i n 2 ( x ) 2 x − s i n ( 2 x ) ,于是对于只能移动一个点P和改变它和周围三点A,B,C连线的弧度时,我们得出三段弧线长度和为T = L a f ( θ a ) + L b f ( θ b ) + L c f ( θ c ) T=L_a f(θ_a )+L_b f(θ_b )+L_c f(θ_c ) T = L a f ( θ a ) + L b f ( θ b ) + L c f ( θ c ) , 而这时面积约束条件为{ ( S 1 = 1 2 ( x a y p − y a x p + x b y a − x a y b + x p y b − x b y p ) + L a 2 2 g ( θ a ) − L b 2 2 g ( θ b ) S 2 = 1 2 ( x b y p − y b x p + x c y b − x b y c + x p y c − x c y p ) + L b 2 2 g ( θ b ) − L c 2 2 g ( θ c ) \begin{cases}(S_1=\frac12 (x_a y_p-y_a x_p+x_b y_a-x_a y_b+x_p y_b-x_b y_p )+\frac{L_a^2}2 g(θ_a )-\frac{L_b^2}2 g(θ_b )\\S_2=\frac12 (x_b y_p-y_b x_p+x_c y_b-x_b y_c+x_p y_c-x_c y_p )+\frac{L_b^2}2 g(θ_b )-\frac{L_c^2}2 g(θ_c )\end{cases} { ( S 1 = 2 1 ( x a y p − y a x p + x b y a − x a y b + x p y b − x b y p ) + 2 L a 2 g ( θ a ) − 2 L b 2 g ( θ b ) S 2 = 2 1 ( x b y p − y b x p + x c y b − x b y c + x p y c − x c y p ) + 2 L b 2 g ( θ b ) − 2 L c 2 g ( θ c )
作图可以知道函数g ( x ) = 2 x − sin ( 2 x ) 4 sin 2 ( x ) g(x)=\frac{2x-\sin(2x)}{4\sin^2 (x)} g ( x ) = 4 s i n 2 ( x ) 2 x − s i n ( 2 x ) 在(-π,π)上是单调增函数,比如下面两图分别给出了g(x)在( − π 4 , π 4 ) (-\frac{\pi}4,\fracπ4) ( − 4 π , 4 π ) 和(-3<x<3)范围内的图:
所以我们可以做变量替换t a = g ( θ a ) , t b = g ( θ b ) , t c = g ( θ c ) , h ( x ) = f ( g − 1 ( x ) ) t_a=g(θ_a ),t_b=g(θ_b ),t_c=g(θ_c ),h(x)=f(g^{-1} (x)) t a = g ( θ a ) , t b = g ( θ b ) , t c = g ( θ c ) , h ( x ) = f ( g − 1 ( x ) ) ,于是h(x)的图像如下
或更大范围:
而其导函数图像如下
或更大范围
由于h ( g ( θ ) ) = f ( θ ) h(g(θ))=f(θ) h ( g ( θ ) ) = f ( θ ) ,所以h ′ ( g ( θ ) ) = f ′ ( θ ) g ′ ( θ ) = sin ( θ ) , h ′ ′ ( g ( θ ) ) = cos ( θ ) g ′ ( θ ) h^{\prime}(g(θ))=\frac{f^{\prime}(θ)}{g^{\prime} (θ)}=\sin(θ), h^{\prime\prime}(g(θ))=\frac{\cos(θ)}{g^{\prime}(θ)} h ′ ( g ( θ ) ) = g ′ ( θ ) f ′ ( θ ) = sin ( θ ) , h ′ ′ ( g ( θ ) ) = g ′ ( θ ) c o s ( θ ) ,所以在区间( − π 4 , π 4 ) (-\frac π4,\frac π4) ( − 4 π , 4 π ) 中(对应− π 2 ≤ θ ≤ π 2 -\frac π2\le θ\le \frac π2 − 2 π ≤ θ ≤ 2 π )h(x)是下凸函数。但是离开这个范围,函数就不是下凸的了。
于是我们的目标是最小化T = L a h ( t a ) + L b h ( t b ) + L c h ( t c ) T=L_a h(t_a )+L_b h(t_b )+L_c h(t_c ) T = L a h ( t a ) + L b h ( t b ) + L c h ( t c ) ,而约束条件为
{ ( S a = 1 2 ( x a y p − y a x p + x p y b − x b y p − L a 2 t a + L b 2 t b ) S b = 1 2 ( x c y p − y c x p + x p y b − x b y p − L c 2 t c + L b 2 t b ) \begin{cases}(S_a=\frac12(x_a y_p-y_a x_p+x_p y_b-x_b y_p-L_a^2 t_a+L_b^2 t_b )\\S_b=\frac12 (x_c y_p-y_c x_p+x_p y_b-x_b y_p-L_c^2 t_c+L_b^2 t_b ) \end{cases} { ( S a = 2 1 ( x a y p − y a x p + x p y b − x b y p − L a 2 t a + L b 2 t b ) S b = 2 1 ( x c y p − y c x p + x p y b − x b y p − L c 2 t c + L b 2 t b )
于是我们可以从后面两个约束条件中先分别解出t a , t c t_a,t_c t a , t c 代入目标函数T,变成一个只含有三个变参x p , y p , t b x_p,y_p,t_b x p , y p , t b 的最小化问题。
于是
{ ∂ T ∂ x p = ∂ L a ∂ x p h ( t a ) + ∂ L b ∂ x p h ( t b ) + ∂ L c ∂ x p h ( t c ) + L a h ′ ( t a ) ∂ t a ∂ x p + L c h ′ ( t c ) ∂ t c ∂ x p ∂ T ∂ y p = ∂ L a ∂ y p h ( t a ) + ∂ L b ∂ y p h ( t b ) + ∂ L c ∂ y p h ( t c ) + L a h ′ ( t a ) ∂ t a ∂ y p + L c h ′ ( t c ) ∂ t c ∂ y p ∂ T ∂ t b = L a h ′ ( t a ) ∂ t a ∂ t b + L b h ′ ( t b ) + L c h ′ ( t c ) ∂ t c ∂ t b \begin{cases}\frac{\partial T}{\partial x_p}=\frac{\partial L_a}{\partial x_p} h(t_a )+\frac{\partial L_b}{\partial x_p} h(t_b )+\frac{\partial L_c}{\partial x_p}h(t_c )+L_a h^{\prime} (t_a ) \frac{\partial t_a}{\partial x_p}+L_c h^{\prime} (t_c)\frac{\partial t_c}{\partial x_p}\\
\frac{\partial T}{\partial y_p}=\frac{\partial L_a}{\partial y_p}h(t_a )+\frac{\partial L_b}{\partial y_p} h(t_b )+\frac{\partial L_c}{\partial y_p} h(t_c )+L_a h^{\prime} (t_a ) \frac{\partial t_a}{\partial y_p}+L_c h^{\prime} (t_c ) \frac{\partial t_c}{\partial y_p}\\\frac{\partial T}{\partial t_b}=L_a h^{\prime} (t_a ) \frac{\partial t_a}{\partial t_b}+L_b h^{\prime} (t_b )+L_c h^{\prime} (t_c ) \frac{\partial t_c}{\partial t_b}
\end{cases} ⎩ ⎪ ⎪ ⎨ ⎪ ⎪ ⎧ ∂ x p ∂ T = ∂ x p ∂ L a h ( t a ) + ∂ x p ∂ L b h ( t b ) + ∂ x p ∂ L c h ( t c ) + L a h ′ ( t a ) ∂ x p ∂ t a + L c h ′ ( t c ) ∂ x p ∂ t c ∂ y p ∂ T = ∂ y p ∂ L a h ( t a ) + ∂ y p ∂ L b h ( t b ) + ∂ y p ∂ L c h ( t c ) + L a h ′ ( t a ) ∂ y p ∂ t a + L c h ′ ( t c ) ∂ y p ∂ t c ∂ t b ∂ T = L a h ′ ( t a ) ∂ t b ∂ t a + L b h ′ ( t b ) + L c h ′ ( t c ) ∂ t b ∂ t c
其中{ ∂ t a ∂ x p = ( − y a + y b ) + 2 ( x a − x p ) t a − 2 ( x b − x p ) t b L a 2 ∂ t a ∂ y p = ( x a − x b ) + 2 ( y a − y p ) t a − 2 ( y b − y p ) t b L a 2 ∂ t a ∂ t b = L b 2 L a 2 \begin{cases}\frac{\partial t_a}{\partial x_p}=\frac{(-y_a+y_b )+2(x_a-x_p ) t_a-2(x_b-x_p ) t_b}{L_a^2}\\\frac{\partial t_a}{\partial y_p}=\frac{(x_a-x_b )+2(y_a-y_p ) t_a-2(y_b-y_p)t_b}{L_a^2}\\ \frac{\partial t_a}{\partial t_b}=\frac{L_b^2}{L_a^2}\end{cases} ⎩ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎧ ∂ x p ∂ t a = L a 2 ( − y a + y b ) + 2 ( x a − x p ) t a − 2 ( x b − x p ) t b ∂ y p ∂ t a = L a 2 ( x a − x b ) + 2 ( y a − y p ) t a − 2 ( y b − y p ) t b ∂ t b ∂ t a = L a 2 L b 2 ,
{ ∂ t c ∂ x p = ( − y c + y b ) + 2 ( x c − x p ) t c − 2 ( x b − x p ) t b L c 2 ∂ t c ∂ y p = ( x c − x b ) + 2 ( y c − y p ) t c − 2 ( y b − y p ) t b L c 2 ∂ t c ∂ t b = L b 2 L c 2 \begin{cases}\frac{\partial t_c}{\partial x_p}=\frac{(-y_c+y_b )+2(x_c-x_p ) t_c-2(x_b-x_p ) t_b}{L_c^2}\\\frac{\partial t_c}{\partial y_p}=\frac{(x_c-x_b )+2(y_c-y_p ) t_c-2(y_b-y_p)t_b}{L_c^2}\\\frac{\partial t_c}{\partial t_b}=\frac{L_b^2}{L_c^2}\end{cases} ⎩ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎧ ∂ x p ∂ t c = L c 2 ( − y c + y b ) + 2 ( x c − x p ) t c − 2 ( x b − x p ) t b ∂ y p ∂ t c = L c 2 ( x c − x b ) + 2 ( y c − y p ) t c − 2 ( y b − y p ) t b ∂ t b ∂ t c = L c 2 L b 2
∂ L s ∂ x p = x p − x s L s , ∂ L s ∂ y p = y p − y s L s \frac{\partial L_s}{\partial x_p}=\frac{x_p-x_s}{L_s} ,\frac{\partial L_s}{\partial y_p}=\frac{y_p-y_s}{L_s} ∂ x p ∂ L s = L s x p − x s , ∂ y p ∂ L s = L s y p − y s
由于牛顿迭代法无法收敛,我们尝试使用梯度递降法。对于设定的参数λ,我们使用迭代法
{ x p = x p − λ ∂ L c ∂ x p y p = y p − λ ∂ L c ∂ y p t b = t b − λ ∂ L c ∂ t b \begin{cases}x_p=x_p-\lambda\frac{\partial L_c}{\partial x_p}\\y_p=y_p-\lambda\frac{\partial L_c}{\partial y_p}\\t_b=t_b-\lambda\frac{\partial L_c}{\partial t_b}\end{cases} ⎩ ⎪ ⎪ ⎨ ⎪ ⎪ ⎧ x p = x p − λ ∂ x p ∂ L c y p = y p − λ ∂ y p ∂ L c t b = t b − λ ∂ t b ∂ L c
然后根据面积公式计算出新的t a , t c t_a,t_c t a , t c 。
再计算中发现存在大量马鞍点。在这些马鞍点附近,由于各一阶导数接近0,会导致计算结果停留在不是局部最优的马鞍点。
为此,我们在一阶导数均非常接近0时,继续计算其Hessian矩阵。如果这个点是局部最优点,那么其Hessian矩阵应该是非负定的,不然其必然存在负特征值,沿着对应特征向量方向就可以找到更优的点。
在计算中,我们使用了LAPACK库计算矩阵特征值和特征向量以及方程组求解。
上面计算过程还有一个要求,就是开始要求每个区域的面积都已经相等,因为计算过程不改变每个区域的面积。这个可以通过不改变每个内部交点和边界点的位置,仅通过改变每条内部边界的曲率来达到,也就是我们这时把面积约束方程看成各条内部边界对应参数tb的线性方程组。由于边界数目大于区域数目,这时方程是不满秩的,可以通过寻找最小二乘解找出参数t b的初始配置。
对于很大部分比较合理的初始值,使用上面迭代方法可以找出一个不错的局部最优解的近似值。然后再次使用使用牛顿迭代法即可找出一个局部最优解。而上面方法无法总是达到局部最优解的原因是每次我们只寻找移动一个点问题的局部最优解而不是整个问题的局部最优解。也就是虽然对于只移动每一个点的问题的Hessian矩阵都是非负定的,但是这些矩阵都只是整个问题Hessian矩阵的主子阵,它们正定不代表整个问题的Hessian矩阵也是正定的,只是概率足够大了。
下一步问题式是如何设计一些比较合理的初始值,我们的方案是先随机在单位圆或单位正方形中产生n个点,然后将这n个点作为n个区域的“中心”,根据区域中每个点到哪个“中心”最近确定它所归属的区域,可以确定对这个区域的一个初始划分。
另外,理论上划分过程允许出现一个只有一条内部边界的子区域(和另外一条外部边界围成)。但是直觉上这种区域很难成为最优解,所以我们的搜索代码直接放弃了这种情况。
结果汇总
这种搜索方法在搜索的次数足够充足时已经可以有极大的概率找到最优结果 ,而对于n很小的几个数据我们提交到了OEIS
A307234 A307235 A307237 A307238
更多结果比如圆形结果
而正方形结果
此后我们发现关于这个问题Simon Cox 已经对于42个区域以内都给出了很不错的结果。
参考他的结果我们进一步得出圆形43个区域以内划分已知最优结果的高精度表示
3:3
4:3.94570296726718571384289955211179918887483540107474
5:4.83384664352739678365771592855759637171533663888553
6:5.40679692995192887512371620121291651425779887928260
7:6
8:6.64723101838026296233844737117921994339523666826884
9:7.31494334143163622505321129278156560728393436742067
10:7.83705523333972942409003687995175306618088264742072
11:8.33879556032765074482357510437823919631005150791791
12:8.79971992014017690624852935788642518321310930864561
13:9.30306020602751419096827438455278908834415557610568
14:9.74761816428629100908678379829552349051458515109547
15:10.2109247126719321038177523750401521967132677261542
16:10.6002734544885987638741830061081758413742118687960
17:11.0127073444935589178833185607868742400845125059958
18:11.3810573669510245176813557546930807560310942014943
19:11.7268270551468228561661052616043727133110767411489
20:12.1636216798159273193165043412456407781626019889750
21:12.5275158346433593207967816926895353230777818924455
22:12.8982073589909613910094997128832638325464395082337
23:13.2626902433739724934801903945398696525353145329769
24:13.5899427733112380789081642421445386490436077809892
25:13.9344786134661845405039615773941622584465256916494
26:14.2527219956349376669253732438613330396954941339519
27:14.5508630543833282352363828099702501921022260948008
28:14.9050198661742857482436096966259636296125204407745
29:15.2097250229021614186808448690549756246002411984410
30:15.5023171403988526790113198595387272386730251249037
31:15.8295092386907821981649330668063947310730463805898
32:16.1216476819194932861652211864230205567342090983217
33:16.4029560015988280000023634592798483773989151476307
34:16.6873471363621888294345811799032656519722563389863
35:16.9528898952932945688880172700722678012262814419386
36:17.2072231122087160387383238826066663556531642925922
37:17.4609227894969986988120719317066949544443839197065
38:17.7742267467950455711519765606028183970560708248025
39:18.0536598673940756377290095823973019838987283796349
40:18.3202888205424160539674645539489689768434838337940
41:18.5938646562158577835524288084597187124762706151280
42:18.8489703098223545147309884016725110683781594277071
43:19.0920949918223182048671666134662299991492610140510
并且经过长时间计算得出44~52个区域的划分图 ,可以看出对于这些结果蜂窝现象已经很明显了。