Sierpinski Carpetの自己相似構造

$C$に関しては,

\[
C= \sigma_1(\{3,4,5\}^\mathbb{N} \cup \{5,6,7\}^\mathbb{N}) \cup \sigma_2(\{3,4,5\}^\mathbb{N} \cup \{5,6,7\}^\mathbb{N}) \cup \sigma_3(\{7,8,1\}^\mathbb{N} \cup \{5,6,7\}^\mathbb{N}) \cup \sigma_4(\{1,2,3\}^\mathbb{N} \cup \{5,6,7\}^\mathbb{N}) \cup \sigma_5(\{7,8,1\}^\mathbb{N} \cup \{1,2,3\}^\mathbb{N}) \cup \sigma_6(\{3,4,5\}^\mathbb{N} \cup \{7,8,1\}^\mathbb{N}) \cup \sigma_7(\{3,4,5\}^\mathbb{N} \cup \{1,2,3\}^\mathbb{N}) \cup \sigma_8(\{1,2,3\}^\mathbb{N} \cup \{5,6,7\}^\mathbb{N})
\]

\[
\mathcal{P} = \bigcup_{n=1}^{infty} \sigma^n(C_L)  =\{3,4,5\}^\mathbb{N} \cup \{5,6,7\}^\mathbb{N} \cup \{7,8,1\}^\mathbb{N} \cup \{1,2,3\}^\mathbb{N}
\] の各項に対応して眺めると
\[
V_0 = (\{1\} \times [0,1] ) \cup ([0,1] \times \{1\} )\cup ([0,1] \times \{0\} ) \cup  (\{1\} \times [0,1] )
\] がわかる。

$\forall x\in C_K$, $S=\{1,2,\ldots,8\}$に対して
ある$\{i,j\}\in \{ \{1,2\},\{2,3\},\{3,4\},\{4,5\},\{5,6\},\{6,7\},\{7,8\} ,\{8,1\} \}$
により
\[
\{x\in S \mid x \in K_k\}=\{i,j\}
\] これを利用すると,
結果として
\[\pi^{-1}(x) \subset (\sigma_i (\pi^{-1} (F_i^{-1}(x)) )) \cup (\sigma_j (\pi^{-1} (F_j^{-1}(x)) ))  \] がわかって, $y= (F_i^{-1}(x))$とおいて$\pi^{-1}(x)$を計算すると, $\# \pi^{-1}(x) =\# \pi^{-1}(F_i^{-1}(x)) \leq 2$. 同様に$\# \pi^{-1}(F_j^{-1}(x)) \leq 2$.

このことから結局
\[
\# \pi^{-1}(x) \leq 4
\]

  • 参考:
    講義ノートpdfファイル (2.4MB)(2014年2月23日更新:2.3節の内容を一部修正)
    応用解析学特論I(京都大学大学院情報学研究科 2013年度集中講義)フラクタル上の解析学入門

 

ハルトークス(Hartogs)の定理1.

Definition.
[調和関数] $u : \Omega \to \mathbb{R}$ が\textbf{調和関数}であるとは,
\[
\Delta u = \frac{\partial^2 u}{\partial x^2} + \frac{\partial^2 u}{\partial y^2} = 0
\] が成り立つことをいう.
Lemma.
$f(z) = u(x,y) + iv(x,y)$ が正則ならば,$u$ および $v$ はともに調和関数である.
[proof] $f$ が正則であることから,Cauchy–Riemann 方程式が成立する:
\[
\frac{\partial u}{\partial x} = \frac{\partial v}{\partial y}, \qquad
\frac{\partial u}{\partial y} = -\frac{\partial v}{\partial x}.
\] 1本目を $x$ で,2本目を $y$ で微分すると,
\[
\frac{\partial^2 u}{\partial x^2} = \frac{\partial^2 v}{\partial x \partial y}, \qquad
\frac{\partial^2 u}{\partial y^2} = -\frac{\partial^2 v}{\partial y \partial x}.
\] 正則関数は $C^\infty$ 級であるから混合偏微分の順序が交換可能,すなわち
\[
\frac{\partial^2 v}{\partial x \partial y} = \frac{\partial^2 v}{\partial y \partial x}.
\] したがって,
\[
\Delta u
= \frac{\partial^2 u}{\partial x^2} + \frac{\partial^2 u}{\partial y^2}
= \frac{\partial^2 v}{\partial x \partial y} – \frac{\partial^2 v}{\partial y \partial x}
= 0.
\] 全く同様の議論により $\Delta v = 0$ も従う.\qedhere
[/proof]
Lemma.
$f(z_0) \neq 0$ の近傍では $\log f$ が正則に定義でき,
\[
\log|f| = \operatorname{Re}(\log f)
\] は調和関数となる($f$ が正則で $f \not\equiv 0$ ならば,$f$ の零点は孤立していることに注意しておく. これは冪級数展開したらわかる.).調和関数は劣調和(平均値の等式が成立)であるから,
$\log|f|$ は劣調和関数である(f(z_0=0$の場合は、それはそれで劣調和の条件を満たす。)).
[proof] $f(z) = |f(z)|e^{i\arg f(z)}$だから
 
\[ \log f(z) = \log|f(z)| + i\arg f(z), \]
[/proof]

 

[definiton] $\Omega \subset \mathbb{C}^2$とし, $\{v_k(z)\}$を$\Omega$で定義された関数列とする. このとき, $\{v_k(z)\}$が$K \subset \Omega$上で、上に一様有界であるとは、
ある$M>0$が存在して, 任意の$k\in \mathbb{Z}_{+}$, $z\in K$に対して$v_k(z)< M$ で或ることを言う.
[/definition]
Lemma.
$\Omega \subset \mathbb{C}^2$とし, $\{v_k(z)\}$を$\Omega$で定義された劣調和関数列とする. $\{v_k(z)\}$が、任意のコンパクト集合$K$上で、上に一様有界で, 定数$C>0$が存在して, $\limsup_{k \to \infty} v_k(z) \leq C$ $(z\in \Omega)$が成り立つと仮定する. すると, 任意の$\varepsilon >0$と任意のコンパクト集合$K$に対して, 正整数$N$が存在して, $\forall k > N$ならば, $v_k(z)\leq C + \varepsilon $ $(z\in K)$が成り立つ.
[proof] $K \subset \Omega$をコンパクト集合とする.  コンパクト集合$K_1$を、$K \subset K_1^o \subset K_1 \subset \Omega$を満たすようにできる.  この時, $K_1^o $を$\Omega$とみなすことで, $\{v_k(z)\}$が、$\Omega$上で、上に一様有界として良い. すると, $M >0$が存在して, $v_k(z)\leq M$ $(z\in \Omega, k=1,2,\ldots)$. さらに, 表記を簡単にするために一般性を失わずに, $v_k(z)$のかわりに, $v_k(z)-M$を考えることで, $v_k(z)\leq 0$ $(z\in \Omega, k=1,2,\ldots)$として良い. $r>0$を$K\subset \{z\in \Omega \mid d(z,\partial \Omega) >3r\}$となるように十分小さくとる($K\ni z \mapsto d(z, \partial \Omega)$は連続関数で、最小値が$0$の場合は$z \in \partial \Omega$になるからそうはならない. ). そこで,  平均値の定理の(劣調和関数の)不等式ver.から
$z\in K$, $0< \rho \leq r$に対して
\[
2\pi v_k(z) \leq \int_{0}^{2\pi} v_k(z + \rho e^{i \theta}) d\theta
\] が成り立つ. 上式に$\rho$をかけて$\rho$について$0$から$r$まで積分すると,
\[
\pi r^2 v_k(z) \leq \int \int_{\abs{z-z’}<r} v_k(z’) dx’ dy’ \quad (z’ = x’ + i y’)
\] が成り立ち, Fatouの補題と補題の仮定を使うと、
\[
\limsup_{k\to \infty}\int \int_{\abs{z-z’}<r} v_k(z’) dx’ dy’ \leq \int \int_{\abs{z-z’}<r} \limsup_{k\to \infty} v_k(z’) dx’ dy’ \leq \pi C r^2
\] ここで, $\limsup_{k\to \infty}$の性質に立ち返ると,
$z \in K$に対して, $k_0(z) \in \mathbb{Z}_+$が存在して, $\forall k \geq k_0(z)$に対して
\[
\int \int_{\abs{z-z’}<r} v_k(z’) dx’ dy’ \leq \pi (C + \frac{\varepsilon}{2}) r^2
\]

ところで, $0 < \delta < r$とすると, $\abs{z-w}<\delta$を満たす任意の$w$に対して
\[
\{z’ \mid \abs{z’-z}<r\} \subset \{z’ \mid \abs{z’-w}<r + \delta\}
\] $v_k \leq 0$と劣調和による不等式を使うと, $k \geq k_0(z)$ならば
\begin{align}
\pi (r + \delta)^2 v_k(w) & \leq \int \int_{\abs{z-z’}<r + \delta} v_k(z’) dx’ dy’ \\
& \leq \int \int_{\abs{z-z’}<r} v_k(z’) dx’ dy’ \leq  \pi (C + \frac{\varepsilon}{2}) r^2
\end{align}

よって, $k \geq k_0(z)$ならば
\[
v_k(w) \leq (r/(r+\delta))^2 (C+\frac{\varepsilon}{2})
\] $r$も$\delta$も, $z$や$k$に依存していないことに注意.

$\delta$を十分小さくとると,
$k \geq k_0(z)$ならば, $\abs{z-w}<\delta$の時に$v_k(w)  < C + \varepsilon$
が成り立つ.
ここで, $K$はコンパクト集合だから, $z^1,\ldots, z^m \in K$が存在して, $K \subset \bigcup_{i=1}^m B(z^i,\delta)$とできる. そこで, $N= \max_{1\leq i\leq m} k_0(z^i)$とする. そうすると, 任意の$w\in K$に対して, $i \in \{1\leq i\leq m\}$ が存在して, $w\in B(z^i,\delta)$を満たし, 言い換えれば$\abs{w-z^i}<\delta$だから, 任意の$k > N$で$v_k(w) < C + \varepsilon$を満たす.
[/proof]

Schwartzの補題

Lemma.
$f(z)$は単位円板$B(0,1)\subset \mathbb{C}$において正則で, $f(0)=0$且つ$\abs{f(z)}\leq 1 \quad (\abs{z}<1)$を満たすとする. この時,
\[
\abs{f(z)}\leq \abs{z} (\abs{z}<1) \quad \abs{f'(0)} \leq 1
\] が成り立つ. さらに, 或る$z\neq 0$に対して, $\abs{f(z)} = \abs{z}$となるか, または $\abs{f'(0)} =1$ならば$f(z)=\alpha z$と表すことができる。 ここで, $\abs{\alpha}=1$で或る.
Lemma.
関数$f(z)$は$B(0,r)\subset \mathbb{C}$で正則で、 定数$M>0$が存在して,
$\abs{f(z)}\leq M$を満たするとする. この時、 次が成立する:
\[
\abs{f(z_1)-f(z_2)} \leq 2M \frac{r_j \abs{z_2 – z_1}}{\abs{r_j^2-\overline{z_1}z_2}} \quad z_1, z_2 \in B(0,r)
\]
[proof] $w_1 = f(z_1)$, $w_2 = f(z_2)$とおく. 一次分数変換$\Phi\colon B(0,r) \to B(0,1)$と$\Psi\colon B(0,M) \to B(0,1)$を
\[
\Phi(z)
= \frac{ r (z – z_1) }{ r^2 – \overline{z_1} z }, \quad \Psi(w)=
\frac{ M (w – w_1) }{ M^2 – \overline{w_1} w }
\]

によって定義する. $\Psi\circ f \circ \Phi^{-1}:B(0,1) \to B(0,1)$
は$0$を$0$に写す正則関数であるから, Schwartzの補題から,
$\abs{\Psi\circ f \circ \Phi^{-1}(z)}\leq \abs{z} $が成り立つ. $z=\Phi(z_2)$と置くと, $\abs{\Psi(w_2)}\leq \abs{\Phi(z_2)} $
[/proof]

有界な場合のHartogsの定理(これを2. で使う.)

Lemma.
$\Omega \subset \mathbb{C}^n$は開集合で、 $f(z)$は$\Omega$上で定義された有界関数とする. $f(z)$は各変数$z_j$ $1\leq j \leq n$に関して正則である.
このとき, $f(z)$は$\Omega$で連続である(つまり, $f(z)$は正則である.).
[proof] $f(z)$は有界であるから, 或る$M>0$が存在して, $\abs{f(z)}\leq M$が成り立つ.
連続性は局所的な問題なので, $\Omega= P(0,r),\quad r=(r_1,\ldots,r_n)$としても問題ない.
ここで直前の補題を用いると,
\begin{align}
&\abs{f(z) – f(\xi)} = \abs{f(z_1,\ldots, z_n) – f(\xi_1,\ldots, \xi_n)} \\
&\leq \sum_{j=1}^n \abs{f(z_1,\ldots,\xi_{j-1},z_j,\ldots, z_n) – f(\xi_1,\ldots,\xi_j,z_{j+1} \ldots,\xi_n)} \\
&\leq \sum_{j=1}^n 2M \frac{r_j \abs{z_j – \xi_j}}{\abs{r_j^2-\overline{\xi_j}z_j}}
\end{align}
となるから、 $z\to \xi$で$f(z)\to f(\xi)$が成り立つ. よって ,$f(z)$は$\Omega$で連続である. 従って, $f(z)$は$\Omega$上で正則でもある.
[/proof]

ハルトークスの定理2

ハルトークスの定理

というのがある。これは、多変数複素解析の場合は、各変数($z, w \mathbb{C}$)で偏微分可能ならば、多変数(複素)関数としての連続性もついてくるという主張である。
(多変数複素解析学入門: ヘルマンダーか一松 信の複素解析の本に載ってたと思います。)

Theorem.
(Hartogsの定理)
$\Omega \subset \mathbb{C}^n$が開集合で, $f(z)$が$\Omega$で定義された多変数複素関数とする. この時, $f(z)$が各変数$z_j\,(1\leq j \leq n)$に対して正則ならば, $f(z)$は$\Omega$上で正則である.
変数の数$n$に関する帰納法で示す:
$n=1$の時は明らかである.
定理の$n-1$の場合が成り立つと仮定する. この仮定のもとで, 補題2つを示していく。

最初の定理は, 正則性がほんの小さいところでしか保証されていなくてもCauchyの積分定理、$n$成分を固定して$f$を冪級数展開した時の係数の強い有界性から導かれる.

Lemma.
任意に$R>0$を考える. $f(z)$は多重円板$P(z^0, R)\subset \mathbb{C}^n$で定義された多変数複素関数で, 各変数$z_j (1\leq j \leq n)$に関して正則であるとする. この時$0< r(< R)$が存在して, $f(z)$は$Q = B(z_1,r)\times B(z_j,r)\times B(z_{n-1},r)\times B(z_n,R)$上で正則かつ有界であるとする. この時, $f(z)$は$P(z,R)$で正則になる.
[proof] 一般性を失わずに$z^0 = (z_1^0,\ldots, z_n^0)=(0,\ldots,0)$と仮定して良い. そこで, $P=P(0,R)$と置くことにする. Hartogs定理の帰納法の仮定から, $f(z’,z_n)$は$z’$の関数として正則だから,
\[
f(z) = \sum_{\alpha_1, \ldots, \alpha_{n-1}=1}^{\infty} c_{\alpha}(z_n)(z’)^{\alpha}
\] と表すことができる.
(上式を偏微分するか, Cauchyの積分公式から冪級数展開するところに立ち返ればでてくることだが,) $c_{\alpha}(z_n)= D^{\alpha}f(0)/ \alpha !$である.
$0<q<r$に対して, $Q=B(0,q)\subset \mathbb{C}$と置く.
この時, Cauchyの積分公式から,
\[
c_{\alpha}(z_n) \alpha ! =D^{\alpha} f(0,z_n) = \frac{\alpha !}{(2\pi i)^{n-1}} \int_{\partial Q} \cdots \int_{\partial Q} \frac{f(\xi_1,\ldots, \xi_{n-1},z_n)}{\xi_1^{\alpha_1+1} \cdots \xi_{n-1}^{\alpha_{n-1}+1} } d\xi_1 \cdots d\xi_{n-1}
\] と表される. 積分記号下で, ディーバー作用素
\[
\frac{\partial}{\partial \bar{z}}
\frac{1}{2}
\left(
\frac{\partial}{\partial x}
+
i,\frac{\partial}{\partial y}
\right)
\] を作用させると, $\partial c_{\alpha} (z_n)/ \partial \overline{z_n} =0$となるから,
$c_{\alpha}(z_n)$は$z_n$の関数として正則である(後に, この関数の絶対値に$\log$を合成したものが劣調和で或ることを使う.).

さて, $R’, R_1, R_2$を$0<R_1<R_2<R'<R$を満たすようにとる.
固定した$z_n$に対して$f(z’,z_n)$は$z’ $の関数として$P_{n-1}=B(0,R)\times \cdots \time B(0,R) $($n-1$回)で正則であるから, $B’=B(0,R’)\subset \mathbb{C}$とすると,
\[
D^{\alpha} f(0,z_n) = \frac{\alpha !}{(2\pi i)^{n-1}} \int_{\partial B’} \cdots \int_{\partial B’} \frac{f(\xi_1,\ldots, \xi_{n-1},z_n)}{\xi_1^{\alpha_1+1} \cdots \xi_{n-1}^{\alpha_{n-1}+1} } d\xi_1 \cdots d\xi_{n-1}
\] が成り立つから, 絶対値を取って被積分関数をsupで抑えれば,
\[
\abs{D^{\alpha} f(0,z_n) } \leq alpha !(R’)^{-\abs{\alpha}}\sup_{z’ \in  P'(0,R’)}\abs{f(z’,z_n)}
\] 但し, $P'(0,R’) = $B(0,R’)\times \cdots \time B(0,R’) $.
固定した$z_n (\abs{z_n}<R)$に対して
\[
\abs{c_{\alpha}}R_2^{\abs{\alpha}} \leq  \abs{\frac{ R_2}{R’}}^{\abs{\alpha}}\sup_{z’ \in  P'(0,R’)}\abs{f(z’,z_n)}\to 0\quad(\abs{\alpha} \to \infty)
\] が成り立つから,
固定した$z_n (\abs{z_n}<R)$に対して$\abs{\alpha}$が十分大きいならば,
\[
\abs{c_{\alpha}}R_2^{\abs{\alpha}} <1
\] が成り立つ.
他方, 仮定から定数$M>0$が存在して, 任意の$z\in Q$に対して$\abs{f(z)}\leq M$が成立する. このことと$c_{\alpha}(z_n) $のCauchyの積分公式による表示から$\abs{c_{\alpha}(z_n)}\leq M/(q)^{\abs{\alpha}}$が成り立つ. $q \uparrow r$とすると,
任意の$\abs{z_n}<R$
\[
\abs{c_{\alpha}(z_n)} r^{\abs{\alpha}} \leq M
\] を得る.

ここで, $\abs{c_\alpha(z_n)}$を評価していく.
まず, 二つのmulti-index $\alpha=(\alpha_1,\ldots, \alpha_{n-1})$, $\beta=(\beta_1,\ldots,\beta_n)$に対して次のような順序(辞書式順序)を入れる:
$\alpha < \beta$であるとは、ある$1\leq i \leq n-1$が存在して
\[
\alpha_1 = \beta_1,\ldots, \alpha_{i-1} = \beta_{i-1}, \alpha_i < \beta_i
\] が成り立つこととする.

$alpha=(\alpha_1,\ldots, \alpha_{n-1})$, $\abs{\alpha}\neq 0$に対して, $\varphi_{\alpha}(z_n)=(1/ \abs{\alpha})\log (\abs{c_{\alpha}(z_n)})$とする.
すると、 ハルトークスの定理1で示したように$c_{\alpha}(z_n)$の正則性から, $\abs{z_n}<R$における劣調和関数である. また, $\{v_k(z_n)\}$を上の辞書式順序で$\{ \varphi_{\alpha}(z_n) \}$を並び替えたものとする. この時, $k\to \infty$の時, $\abs{\alpha}\to \infty$である.
任意の$\abs{z_n}<R$
\[
\abs{c_{\alpha}(z_n)} r^{\abs{\alpha}} \leq M
\] を使うと,
$\abs{\alpha}\neq 0$, 任意の$\abs{z_n}<R$に対して,
\[
\varphi_{\alpha}(z_n)=\frac{1}{\abs{\alpha}} \log (\abs{c_{\alpha}(z_n)}) \leq -\log r + \frac{1}{\abs{\alpha}} \log M \leq -\log r + \log M
\] が成り立つから, $\{v_k(z_n)\}$は$\abs{z_n}<R$において上に一様有界である.

$\abs{\alpha}$を十分大きくとると,
\[
\abs{c_{\alpha}(z_n)}R_2^{\abs{\alpha}} <1
\] から
\[
\log \frac{\abs{c_{\alpha}(z_n)}}{\abs{\alpha}} < -\log R_2
\] が成り立つ. 言い換えると, $k$を十分大きくすると, $v_k(z_n)< – \log R_2$. つまり, $\limsup_{k\to \infty } v_k(z_n)\leq – \log R_2$がなりたつ.
1. での 上への一様有界性の補題から、 $k$を十分大きくとると, $v_k(z_n)\leq – \log R_1$が一様に$\abs{z_n}<R_1$で成り立つ.
言い換えれば、 $\abs{\alpha}$が十分大きければ,
\[
\abs{c_{\alpha}(z_n)}} R_1^{\abs{\alpha}} \leq 1 (\forall \abs{z_n}<R_1 )
\] が成り立つ($\log \abs{c_{\alpha}(z_n)}} \leq \log R_1^{\abs{\alpha}} $から対数をtとれば良い).

(一様収束性の証明ために)任意の$K\subset P(0,R)$をとる. ここで、 (必要があれば先ほどの$R_1$を縮めることで) $K \subset P(0,R’), R'<R_1$となるように$R’, R_1$を選ぶ.
今, 直前で示した
\[
\abs{c_{\alpha}(z_n)}} R_1^{\abs{\alpha}} \leq 1 (\forall \abs{z_n}<R_1 )
\] から
$z\in K$上で, $\abs{c_{\alpha}(z_n)}z’} \leq \abs{R’/R_1}^{\abs{\alpha}}$となるから, $\sum_{\alpha_1,\ldots,\alpha_{n-1}}c_{\alpha}(z_n) (z’)^{\alpha}$は$K$上で一様収束する. だから, $f(z)$は$K$上で連続である. $K$は任意であったから, $f(z)$は$P(0,R)$上で連続である. 従って, $f(z)$は$P(0,R)$で正則である.
[\proof]

 

下の証明の最後の最後までは, Cauchyの積分定理を使っていない. ここで言っているのは、あくまで、 $P$の(気持ちはすごく小さい或る特定の)部分集合$Q$では正則だと言っているだけ。 こういうすごく小さくてもいいから、条件を満たす集合を見つけたいときに時折Baireのカテゴリー定理がでてくる。

Lemma.
関数$f(z)$は開集合$\Omega \subset \mathbb{C}^n$において, 各変数$z_j\,(1\leq j\leq n)$に関して, $1$変数複素関数として正則であると仮定する. 更に, 多重円盤$P=P_1 \times \dots \times P_n$は$\overline{P} \subset \Omega$を満たすと仮定する. この時, 各$(1\leq j \leq n)$に対して, 開円板$Q_j \subset P_j $が存在して, $Q_n = P_n$かつ $f(z)$は$Q= Q_1 \times \dots \times Q_n$において有界となる. 従って, 前の補題から$f(z)$は$Q$で正則となる。
[proof] $E_M(z_n)=\{z’ \in  \overline{P_1} \times \overline{P_2} \times \dots \times \overline{P_{n-1}} \mid \abs{f(z’,z_n)} < M\}$とし, $E_M = \bigcap_{z_n \in \overline{P_n}}E_M(z_n)$とする. 今, 帰納法の仮定から, Hartogsの定理は$n-1$では使えるから, $f(z’,z_n)$は$z’ \in \overline{P_1} \times \overline{P_2} \times \dots \times \overline{P_{n-1}} $の連続関数である. 従って, 逆像を考えれば, 各$z_n \in \overline{P_n}$に対して $E_M(z_n)$は閉集合である. 言い換えれば, $\overline{P_1} \times \overline{P_2} \times \dots \times \overline{P_{n-1}} \setminus E_M(z_n)$は開集合である.
ところで, $w’ \in \overline{P_1} \times \overline{P_2} \times \dots \times \overline{P_{n-1}}$を任意にとると, $f(z’,z_n)$は$n$番目の変数$z_n$について正則, 連続だから, 或る$M \in \mathbb{Z}_{+}$が存在して, $\forall z_n \in \in \overline{P_n}$, $\abs{f(z’,z_n)} < M$である. つまり, $z’ \in E_M \subset \bigcup_{M\geq 1} E_M$である.
\[
\bigcup_{M\geq 1} E_M = \overline{P_1} \times \overline{P_2} \times \dots \times \overline{P_{n-1}}
\] である.
直近二つのこととBaireのカテゴリー定理を用いる:
今, $E_M\, (M=1,2,\ldots, \ldots)$が全て内点を持たないと仮定する.  この時, 各$M \in \mathbb{Z}_{+}$に対して, $F_M = ( \overline{P_1} \times \overline{P_2} \times \dots \times \overline{P_{n-1}}) \setminus E_M$は稠密な開集合である(位相空間$\overline{P_1} \times \overline{P_2} \times \dots \times \overline{P_{n-1}}$にとって). 従って, Baireのカテゴリ定理から, $\bigcap_{M\geq 1} F_n$は稠密な集合になる. ところで, $\bigcap_{M\geq 1} F_n = ( \overline{P_1} \times \overline{P_2} \times \dots \times \overline{P_{n-1}}) \setminus (\bigcup_{M\geq 1} E_M ) = \emptyset$だから, この両者の事柄は矛盾する.
よって, ある$M \in \mathbb{Z}_{+}$が存在して, $E_M$は内点をもつ. 多重円板$Q= Q_1 \times \dots \times Q_n$を$Q\subset E_M \times P_n$, $Q_n = P_n$となるように選ぶことができる($\overline{P_1} \times \overline{P_2} \times \dots \times \overline{P_{n-1}}) $に直積位相が入っていると思ってよく, $E_M$の内部は各座標による十分小さな開円盤$Q_1 \times \dots \times Q_{n-1}$に含まれることからわかる.).
結果として, 任意の$z\in Q$に対して, $\abs{f(z)}\leq M$が成り立つ.
そして, 二つ前の補題から, $f(z)$は$Q$で正則であることがわかる.
[/proof]

$\xi =(\xi_1, \ldots, \xi_n ) \in \Omega$を任意にとる. $R>0$を$P(0,R)\subset \Omega$を満たすようにとる. 直前の補題(を$P=P(\xi,R)$で使う)から, $r>0$, $z^0=(z_1^0,\ldots,z_n^0)\in P(\xi,R)$が存在して, $Q_j = B(z^0_j,r) (1\leq j \leq n-1)$と置くと,  $Q_j \subset R_j $ (1\leq j \leq n-1)$且つ $z_n^0 = \xi_n$が成り立ち, $f(z)$は$Q_1\times Q_{n-1}\times P_n (\subset P(\xi, R))$上で正則且つ有界である.  これと, Hartogsの定理の仮定である”$f(z)$は$P(z^0,R)$は各変数$z_j\, (1\leq j \leq n)$に関して正則である”ことからを合わせると二つ前の補題から,
$f(z)$は$P(z^0,R)$で正則になる. $\xi \in P(z^0,R)$だから, $f(z)$は任意の$\xi$で正則である.

局所中心極限定理

 

\[
\varphi(\theta)
:= \frac{1}{d}\sum_{k=1}^d \cos \theta_k,
\qquad \theta = (\theta_1,\dots,\theta_d)\in \mathbb{R}^d.
\]

一次微分(勾配)
各成分について
\[
\partial_{\theta_j}\varphi(\theta)
= \partial_{\theta_j}\left(\frac{1}{d}\sum_{k=1}^d \cos\theta_k\right)
= -\frac{1}{d}\sin\theta_j.
\]

したがって勾配の二乗ノルムは
\[
|\nabla \varphi(\theta)|^2
= \sum_{j=1}^d \left(-\frac{1}{d}\sin\theta_j\right)^2
= \frac{1}{d^2}\sum_{j=1}^d \sin^2\theta_j.
\]

二次微分とラプラシアン
\[
\partial_{\theta_j}^2 \varphi(\theta)
= \partial_{\theta_j}\left(-\frac{1}{d}\sin\theta_j\right)
= -\frac{1}{d}\cos\theta_j.
\]

よってラプラシアンは
\[
\Delta \varphi(\theta)
= \sum_{j=1}^d \partial_{\theta_j}^2 \varphi(\theta)
= -\frac{1}{d}\sum_{j=1}^d \cos\theta_j
= -\varphi(\theta).
\]

合成関数の公式
\[
\Delta(f^n)
= n(n-1)f^{\,n-2}|\nabla f|^2
+ n f^{\,n-1}\Delta f
\] を \(f=\varphi\) に適用すると
\[
\Delta \varphi^n(\theta)
= n(n-1)\varphi^{n-2}(\theta)\,
\frac{1}{d^2}\sum_{j=1}^d \sin^2\theta_j
+ n\varphi^{n-1}(\theta)\,(-\varphi(\theta)).
\]

整理して
\[
\boxed{
\Delta \varphi^n(\theta)
= n(n-1)\varphi^{n-2}(\theta)
\left(\frac{1}{d^2}\sum_{j=1}^d \sin^2\theta_j\right)
– n\varphi^n(\theta)
}
\]

$d$ 次元変数 $\theta \in \mathbb{R}^d$ に対して、

\[
G_n(\theta) = \exp\left(- \frac{n}{2d} |\theta|^2 \right), \quad |\theta|^2 = \sum_{j=1}^d \theta_j^2
\]

を考える。

任意の滑らかな関数 $f:\mathbb{R}^d \to \mathbb{R}$ に対して、

\[
\Delta e^f = (\lvert \nabla f \rvert^2 + \Delta f) e^f
\]

が成り立つ。ここで

\[
\nabla f = \left( \frac{\partial f}{\partial \theta_1}, \dots, \frac{\partial f}{\partial \theta_d} \right), \quad
\Delta f = \sum_{j=1}^d \frac{\partial^2 f}{\partial \theta_j^2}.
\]

$f(\theta) = – \frac{n}{2d} |\theta|^2$ とすると、

\[
\frac{\partial f}{\partial \theta_j} = – \frac{n}{d} \theta_j \quad \Rightarrow \quad
|\nabla f|^2 = \sum_{j=1}^d \left( -\frac{n}{d} \theta_j \right)^2 = \frac{n^2}{d^2} |\theta|^2,
\]

\[
\frac{\partial^2 f}{\partial \theta_j^2} = – \frac{n}{d} \quad \Rightarrow \quad
\Delta f = \sum_{j=1}^d \frac{\partial^2 f}{\partial \theta_j^2} = -n.
\]

上記の式を用いると、

\[
\Delta G_n(\theta) = (\lvert \nabla f \rvert^2 + \Delta f) e^f
= \left( \frac{n^2}{d^2} |\theta|^2 – n \right) \exp\left(- \frac{n}{2d} |\theta|^2 \right)
= \left( \frac{n^2}{d^2} |\theta|^2 – n \right) G_n(\theta).
\]

\[
\text{スケーリング: } \theta = \frac{\alpha}{n}
\]

${\Delta \varphi}_n$ の展開:
\[
\varphi\Big(\frac{\alpha}{n}\Big) = 1 – \frac{|\alpha|^2}{2dn} + O(n^{-2})
\] \[
\varphi^{\,n-2}\Big(\frac{\alpha}{n}\Big) \approx e^{-|\alpha|^2 / 2d}
\] \[
\sum_{j=1}^d \sin^2\Big(\frac{\alpha_j}{n}\Big) = \sum_{j=1}^d \left(\frac{\alpha_j^2}{n^2} + O(n^{-4})\right) = \frac{|\alpha|^2}{n} + O(n^{-2})
\]

 

\begin{align}
\phi\!\left(\frac{\alpha}{n}\right)
&= 1 – \frac{|\alpha|^2}{2d n} + O(n^{-2}), \\
\phi^n\!\left(\frac{\alpha}{n}\right)
&= \left( 1 – \frac{|\alpha|^2}{2d n} + O(n^{-2}) \right)^n
\approx e^{- \frac{|\alpha|^2}{2d}} \left( 1 + O(n^{-1}) \right).
\end{align}

これらを $\Delta {\varphi}_n$ に代入すると:
\[
\Delta \varphi_n\Big(\frac{\alpha}{n}\Big)
\approx n(n-1) \cdot e^{-|\alpha|^2 / 2d} \cdot \frac{d}{2} \cdot \frac{|\alpha|^2}{n} – n \, e^{-|\alpha|^2 / 2d}
\] \[
= \left(n \frac{d}{2} |\alpha|^2 – n\right) e^{-|\alpha|^2 / 2d} + O(1)
\]

${\Delta G}_n$ の展開:
\[
\Delta G_n\Big(\frac{\alpha}{n}\Big) = \left(\frac{d}{2} n^2 \frac{|\alpha|^2}{n} – n\right) e^{-|\alpha|^2 / 2d} = \left(n \frac{d}{2} |\alpha|^2 – n\right) e^{-|\alpha|^2 / 2d}
\]

差のオーダーは:
\[
\Delta \varphi_n\Big(\frac{\alpha}{n}\Big) – \Delta G_n\Big(\frac{\alpha}{n}\Big) = O(1)
\] である。
主要な  $O(n) $項はキャンセルされ、残るのは $O(1) $項のみである。

結果、

\[
\begin{aligned}
|x|^2E(n,x)
&=  (2\pi)^{-d}
\int_{[-\pi,\pi]^d}
e^{-i x \cdot \theta} \,
\Biggl[
-\Delta_\theta
\Bigl( \varphi_n(\theta) – G_n(\theta) \Bigr)
\Biggr] \, d\theta \\
&\quad \overset{\theta = \alpha / \sqrt{n}}{=}
(2\pi)^{-d}
\int_{[-\pi \sqrt{n}, \pi \sqrt{n}]^d}
e^{-i x \cdot (\alpha / \sqrt{n})} \,
\Biggl[
-\Delta_\alpha
\Bigl( \varphi_n(\alpha / \sqrt{n}) – G_n(\alpha / \sqrt{n}) \Bigr)
\Biggr] \, n^{-d/2} \, d\alpha
= O(n^{-d/2})
\end{aligned}
\]

参考:

Intersections of Random Walks (Modern Birkhäuser Classics) (English Edition) 

自己平行部分多様体

Definition.
$\Omega$上の関数$C(\omega), F_1(\omega),F_2(\omega),\ldots,F_k(\omega)$, 及び$\mathbb{R}^k$の領域( 連結開集合 )$\Theta$上を動く$k$次元パラメータ$\theta=(\theta^1,\ldots,\theta^k)\in \Theta$を用いて
\[
p_{\theta}(\omega)=\exp \left[ C(\omega) + \sum_{i=1}^k \theta^i F_i(\omega) -\phi(\theta) \right] \] と表される確率分布の族$M=\{p_{\theta}\}_{\theta \in \Theta}$を指数分布族という. 但し, $\phi$は$p_{\theta}$が確率分布となるように調整するための関数である:
\[
\phi(\theta)
= \log \left\{
\sum_{\omega \in \Omega}
\exp\left[
C(\omega) + \sum_{i=1}^k \theta^i F_i(\omega)
\right] \right\}
\]
Remark.
指数分布族は, 正規分布, 指数分布, Poisson分布の形をした分布の族も指数分布族である。

さらに, $\{F_1, \ldots, F_k, 1_{\Omega}\}$が一次独立である事を仮定する。
この仮定の下で, $k+1 \leq n$である.

前回のことから、$S$自身が指数分布族であることがわかる($C=0$, $F_i = \delta_i$としたらそうなる。)。

Theorem.
Sの部分多様体$M$に対して, $M$が$\nabla^{(e)}$- 自己平行部分多様体である iff $M$が指数分布族であることである。

[proof] 先ず, $S$は双対平坦だから、勿論平坦である。
ここで、任意の部分多様体に対して, $\nabla^{(e)}$- 自己平行部分多様体であるためのiff 条件は, その部分多様体($\{\eta_j\}_{1\leq j \leq k}$)が$S$の$\nabla^{(e)}$- アファイン座標系$(\theta_i)_{1\lrq i \leq n-1}$のアファイン部分空間に対応することである。
そこで、
$M$が指数分布族と仮定する。
この時, 部分空間であることから,
\[
C(\omega) + \sum_{j=1}^k \eta F_j(\omega) – \varphi(\eta) = \sum_{i=1}^{n-1} \theta^i(\eta) \delta_i(\omega) -\psi(\theta(\eta))
\] が任意の$\omega \in \Omega$成立する. そこで, $\eta_{\beta} \,(1\leq \beta \leq k)$で偏微分すると,
\[
\sum_{j=1}^k \eta F_j(\omega) -\frac{\partial \varphi(\eta)}{\partial \eta_\beta}(\eta) = \sum_{i=1}^{n-1}\frac{\partial theta^i(\eta) }{\partial \eta_\beta} \\delta_i(\omega) –  \sum_{i=1}^{n-1} \frac{ \partial \psi(\theta(\eta))}{\partial \theta^i}(\theta(\eta)) \frac{\partial \theta^i}{\partial \eta_\beta}(\eta)
\] となり,
\[
F_\beta = \sum_{i=1}^{n-1} f_i^\beta \delta_i(\omega)
\]

と表せるから、 一次独立性から

$1\leq i \leq n$に対して,
\[
f_i = \frac{\partial \theta^i}{\partial \eta_\beta}
\] だから, $\theta^i(\eta)$は$\eta$の一次式で表すことができることがわかった。これは逆に辿れる。
[/proof]

Theorem.
$S$の$\nabla^{(e)}$-自己平行部分多様体である指数型分布族
\[
M= \{ p_{\theta}(\omega) \in S; \log p_{\theta}(\omega) = C(\omega) + \sum_{i=1}^k \theta^i F_i(\omega) – \psi(\theta)  \}
\] に対し,
\[
\eta := E_{p_{\theta}}[F_i] = \sum_{\omega \in \Omega} p_{\theta}(\omega) F_i(\omega)
\] とおけば,
$\eta = (\eta_1, \ldots, \eta_k)$は$M$の局所座標系を与える。
そして, $\{(\theta^i), (\eta_i)\}$は双対構造$(\tilde{g}, \tilde{\nabla^{(e)}}, \tilde{\nabla^*})$
に関する双対アファイン座標系をなす。
[proof] 上でおいた写像写像$\theta \mapsto \eta$のJacobi行列を計算する:
$$
\begin{align}
\frac{\partial \eta_i}{\partial \theta^j}
&= \sum_{\omega \in \Omega} \left( \partial_j p_{\theta}(\omega)\, F_i(\omega) \right) \\
&= \sum_{\omega \in \Omega} \left( \partial_j p_{\theta}(\omega)\, (\partial_i \log p_{\theta}(\omega)) \right)
\end{align}
[/proof]

$S_{n-1}$の双対幾何1.

ここからは, $4$つ組$(S,g,\nabla^{(e)},\nabla^{(m)})$を統計多様体という.

\[
p(\omega) = \sum_{a=1}^{n-1}\\eta_i \delta_i(\omega) + (1 – \sum_{a=1}^{n-1} \eta_i ) \delta_n(\omega)
\] は, $\nabla^{(-1)}=\nabla^{(m)}$- アファイン座標系であることをみた.
\[
\frac{\partial}{\partial \xi^a}p(\omega) = \delta_a(\omega) – \delta_n(\omega)
\] だから, $\nabla^{(m)}$の接続係数
\[
\Gamma_{ij,k}^{(m)} =\Gamma_{ij,k}^{(-1)} =\sum_{\omega=1}^n (\partial^i \partial^j p(\omega)) (\partial^k \log p(\omega)) =0
\] が$1\leq i,jk,\leq n-1$で成立する.
ユークリッドの接続では, 大域的にクリストッフェル記号が$0$だから, 接続$\nabla^{(m)}$は, ユークリッド接続を$S$に制限してものに一致する.

そこで, $(\eta_i)$の双対アファイン座標系をみる. $\nabla^{(e)}=\nabla^{(+1)} $の接続係数
\[
\Gamma_{ij,k}^{(e)} =\Gamma_{ij,k}^{(1)} =\sum_{\omega=1}^n (\partial_i \partial_j \log p(\omega)) (\partial_k  p(\omega))
\] の形から, $\log p$を見る必要があることがわかる.
そこで, $\log p$を書き換える.
任意の$1 \leq \omega \leq n-1$に対して,
\[
\log p(\omega) = \sum_{i=1}^{n-1} \left( \log \frac{p(i)}{p(n)}\right) + \log p(n)
\] と書き直せる. これは, 任意の$1 \leq i \leq n-1$に対して, $ \log p(n) \delta_i(\omega)=0$であることから, $\sum_{i=1}^{n-1} \log p(n) \delta_i(\omega)=0$であることからわかる.
ここで, 任意の$1 \leq i \leq n-1$にたいして,
\[
\theta^i := \log \frac{p(i)}{p(n)}
\] とおく. 確率分布であること$\sum_{\omega =1}^n p(\omega) =1$と $e^{\theta^i }=\frac{p(i)}{p(n)}$から$\sum_{i=1}^{n-1}e^{\theta^i }=\sum_{i=1}^{n-1}  \frac{p(i)}{p(n)}$であることに注意すると,
\[
1+\sum_{i=1}^{n-1}e^{\theta^i } = 1+   \frac{\sum_{i=1}^{n-1} p(i)}{p(n)} =    \frac{\sum_{i=1}^{n} p(i)}{p(n)} = \frac{1}{p(n)}
\] したがって,
\[
p(n) =\frac{1}{1+\sum_{i=1}^{n-1}e^{\theta^i }}
\] という関係式が成り立ち,
前の方にあった$\log p(\omega)$は
\[
\log p(\omega) = \sum_{i=1}^{n-1} \theta^i \delta_i(\omega) – \log \left( 1+\sum_{i=1}^{n-1}e^{\theta^i } \right)
\] であることがわかる.
更に, この式の右側の部分を$\psi$とおく: つまり,
\[
\psi(\theta) := \log \left( 1+\sum_{i=1}^{n-1}e^{\theta^i } \right) = -\log p(n)
\] とおく.
こうすると, 結局のところ, $\log p(\omega)$は
\[
\log p(\omega) = \left( \sum_{i=1}^{n-1} \theta^i \delta_i(\omega) \right) – \psi(\theta)
\] と書ける.
ここで, $\theta = (\theta^1, \ldots, \theta^{n-1})$を$S$の座標系として計算をする.
$\partial_j \log p(\omega) = \delta_j(\omega) -\partial_j \psi(\theta)$であって, $\partial_i \partial_j \log p(\omega) = -\partial_i \partial_j \psi(\theta)$である. つまり, $\partial_i \partial_j \log p(\omega) $は$\omega$に依存しない.  だから, この座標系での接続係数は,
\[
\Gamma_{ij,k}^{(e)}= – (\partial_i \partial_j \psi(\theta)) \sum_{\omega =1}^n  \partial_k p(\omega) = \partial_k( \sum_{\omega =1}^n   p(\omega) ) = \partial_k(1) =0
\] となって, $(\theta^i)$が$\nabla^{(e)}$のアファイン座標系になっていることがわかる.

さて, 実は$(\eta_i)$と$(\theta^j)$は双対アファイン座標系になっていることがわかる.
それには例によって, $1\leq i,j \leq n-1$, $1\leq \omega \leq n$においては, $\delta_n(\omega)\delta_j(\omega)=0$であることと, $\frac{\partial \psi}{\partial \theta^j}$が$\omega$に依らないことに注意する.
\begin{align}
g(\frac{\partial \psi}{\partial \eta_i}, \frac{\partial}{\partial \theta^j})&= \sum_{\omega =1}^n (\delta_i(\omega)-\delta_n(\omega)) \left( \delta_j(\omega) – \frac{\partial \psi}{\partial \theta^j} \right) \\
&=\sum_{\omega =1}^n (\delta_i(\omega)-\delta_n(\omega)) \delta_j (\omega) \\
& \delta_{ij}
\end{align}

Markov埋め込み

Definition.
$n,l$は$2\leq n \leq l$をみたす自然数. 次のように構成される写像$f\colon S_{n-1} \to S_{l-1}$をMarkov埋め込みという.
1) $\Omega_l$を空でない, 互いに交わらない部分集合の族$\{C_1, \ldots, C_n\}$に分割する.

2) 各$j$ (1\leq j \leq n)に対して, $C_j$に台をもつ$\Omega_l$上の確率分布
\[
Q_{(j)} = (Q_{(j)}^1, \ldots, Q_{(j)}^l)
\] ここで, $Q_{(j)}^k = a1_{C_j}(k)$である($a$は$k,j$に依存する適当な正数).

3) $(y^1,\ldots, y^l) = f(x^1,\ldots, x^n)$を
\[
y^k = \sum_{j=1}^n x^j Q_{(j)}^k
\] で定義する.

Remark.
(1)を$Q_{(j)}$をつかって言い換える. まず,
任意の$1\leq i \leq n$に対して, 或る$k_i \in \Omega_l$が存在して, $C_{(l)} \ni k_i$である. つまり, $Q_{(j)}^{k_i} >0$で, $Q_{(j)}^{k_i}=0$ ($i \neq j$)
Lemma.
上のようにして作った写像は本当に埋め込み写像である
[proof] 1) 上のRemarkから
\[
\begin{pmatrix}
Q_{(1)}^{1} & Q_{(2)}^{1} & \cdots & Q_{(l)}^{1} \\
Q_{(1)}^{2} & Q_{(2)}^{2} & \cdots & Q_{(l)}^{2} \\
\vdots & \vdots & \ddots & \vdots \\
Q_{(1)}^{n} & Q_{(2)}^{n} & \cdots & Q_{(l)}^{n}
\end{pmatrix}
\] はランク$n$である. だから, $(df)\colont T_pS_{n-1} \to T_{f(p)}S_{l-1}$は次元定理から単射になる.
2) $S_{n-1}$と$f(S_{n-1})$が同相であることは, $S_{n-1}$がコンパクトで, $f$連続, $f(S_{n-1})$はHausdorffだから, 単射性のみみればよいが, 単射性も上のremarkを
\[
\sum_{j=1}^n (x^j – z^j) Q^k_j= 0
\] が$1\leq k \leq l$で成立していることと合わせればわかる.
[/proof]

指数型接続と混合接続

 

(i)の二個目の等号は、$S$が対称テンソルだからそう.

$Xg(Y,Z)= g(\nabla_X Y, Z) + g(\nabla_Y X, Z) $で、$\alpha + (-\alpha) = 0$だから, $\alpha S_p(X,Y,Z) + (-\alpha) S_p(X,Z,Y) = \alpha S_p(X,Y,Z) + (-\alpha) S_p(X,Y,Z) = 0$

$g(\nabla^{(\alpha)}_{\partial_i} \partial_j ,\partial_k)= g((\overline{\nabla}_{\partial_i} \partial_j ,\partial_k) – \frac{\alpha}{2} S(X,Y,Z)$

\[
\partial_j \log p(\omega) = \frac{\partial_j p(\omega)}{p(\omega)}
\] と, $\log$の二回微分の計算
\[
\partial_i\partial_j \log p(\omega)
= \frac{(\partial_i\partial_j p(\omega)),p(\omega)-(\partial_i p(\omega))(\partial_j p(\omega))}{p(\omega)^2}.
\]、あるいは別表現

\[
\partial_i\partial_j \log p(\omega)
= \frac{\partial_i\partial_j p(\omega)}{p(\omega)}-\frac{\partial_i p(\omega),\partial_j p(\omega)}{p(\omega)^2} = \frac{\partial_i\partial_j p(\omega)}{p(\omega)} -\quad  (\partial_i \log p(\omega)) (\partial_j \log p(\omega))
\] を使う.

上の $\log$の二回微分の計算を使うと,
\begin{align}
\Gamma_{ij,k}^{(-1)} &= \sum_{\omega =1}^n p(\omega) \{ (\partial_i \log p(\omega))(\partial_j \log p(\omega)) + \partial_i\partial_j \log p(\omega)  \} (\partial_k \log p(\omega)) \\
&= \sum_{\omega =1}^n  (\partial_i \partial_j p(\omega) ) (\partial_k \log p(\omega))
\end{align}

\[ \partial_b p(\omega)= \delta_b(\omega) – \delta_n(\omega)  \]だから,
$ \partial_a\partial_b p(\omega)= 0$である.
したがって, $\Gamma_{ij,k}^{(-1)} =0$がわかる.

$\alpha$-接続

$((f_*)T) (X,Y) = T((df)_*X,(df)_*Y)$ ($X, Y \in T_p\mathcal{S}_{n-1}$)は, $(df)_* \colon T_p\mathcal{S}_{n-1} \to T_p\mathcal{S}_{l-1}$ ($n\leq l$)による$\mathcal{S}_{n-1}$上の$(0,2)$テンソルである.
さて, 計量$g$を持っている場合テンソルを上げ下げ($T$と$S$の一対一対応)できるのであった。
だから,
$g_p^{[l]}(T(X, Y),Z)=S_p^{[n]}(X,Y,Z)$と, $g_{f(p)}^{[l]}(((df)_*T)((df)_*X, (df)_*Y),(df)_*Z)=S_p^{[n]}((df)_*X,(df)_*Y,(df)_*Z)$

だから, $(0,3)$テンソルの仮定は, $(0,2)$テンソルのChentsovの定理(に$T$を代入して存在)の仮定でいう
\[
g_p^{[l]}(T(X, Y),Z) = g_{f(p)}^{[l]}(((df)_*T)((df)_*X, (df)_*Y),(df)_*Z)
\] を導く.

ここで, $T(X,Y)= \overline{\nabla_X^{[n]}}Y$とする ($ \overline{\nabla^{[n]}}$は計量$g$に付随するRiemanian接続. ).
このとき, 次のようにして, $(0,2)$テンソルの Chentsovの定理から,
\[
g_p^{[l]}(T(X, Y),Z) = g_{f(p)}^{[l]}(((df)_*T)((df)_*X, (df)_*Y),(df)_*Z)
\]

が導ける.

それには, $\Gamma_{ij,k}=\frac{1}{2}(\partial_i g_{jk} +\partial_j g_{ki} + \partial_k g_{ij})$
を用いて,
\begin{align}
g_{f(p)}^{[l]}\!\left( \overline{\nabla^{[l]}_{(df)_*X}}(df)_*Y ,(df)_*Z \right)
&= \frac12 \Big\{
((df)_*\partial_i)\, g_{f(p)}^{[l]}\big((df)_*\partial_j, (df)_*\partial_k\big) \\
&\quad + ((df)_*\partial_j)\, g_{f(p)}^{[l]}\big((df)_*\partial_k, (df)_*\partial_i\big)
+ ((df)_*\partial_k)\, g_{f(p)}^{[l]}\big((df)_*\partial_i, (df)_*\partial_j\big)
\Big\} \\
&= \frac12 \Big\{
\partial_i\, g_{p}^{[n]}(\partial_j, \partial_k)
+ \partial_j\, g_{p}^{[n]}(\partial_k, \partial_i)
+ \partial_k\, g_{p}^{[n]}(\partial_i, \partial_j)
\Big\} \\
&= g_{p}^{[n]}\big( \nabla^{[n]}_{X} Y , Z \big).
\end{align}

この上で, $T(X,Y)= \nabla_X^{[n]}Y- \overline{\nabla_X^{[n]}}Y$から導かれる$(0,3)$テンソルの不変性から,
\[
g_p^{[n]}(\nabla_X^{[n]}Y- \overline{\nabla_X^{[n]}}Y,Z)= -\frac{\alpha}{2}S_p^{[n]}(X,Y,Z)
\] をみたす. つまり, $(\nabla^{[n]}$と$\alpha$が一対一に対応する.

ここまでの一連の示したことを、定理の形に書くと次のようになる。

Theorem.
Markov埋め込みの下で, 計量の不変性を満たすとき,
当該のRiemann計量は,
\[
g_p(X,Y) = \sum_{\omega =1}^n p(\omega)(X\log p(\omega))(Y\log p(\omega))
\] に限られる.

不変性を満たすアファイン接続$\nabla^{\alpha}$では,
\[
g_p^{[n]}(\nabla_X^{\alpha}Y,Z)= g_p^{[n]}(\overline{\nabla_X^{[n]}}Y,Z) -\frac{\alpha}{2}S_p^{[n]}(X,Y,Z)
\] により, 実数$\alpha$と一対一に対応する.
ここで, $S_p$は, $(0,3)$-テンソルのChentovの定理で出てきた
\[
S_p(X,Y,Z)= \sum_{\omega =1}^n p(\omega)(X\log p(\omega))(Y\log p(\omega))(Zlog p(\omega))
\]

Definition.
上の定理での$g$をFisher計量, $\nabla^{\alpha}$を$\alpha$接続という.

Chentsovの定理(1: (0,2)-テンソルの場合)

アファイン写像は凸結合を保つので、次のような補題がわかる.

Lemma.
(V) と (W) を実ベクトル空間とする。
写像 ($f : V \to W$) がアフィン、すなわち
\[
f(x)=A x + a
\] ((A) は線形写像、($a\in W$))
であるとする。このとき、任意の点$ (x_1,\dots,x_m\in V)$ と凸結合
\[
x=\sum_{i=1}^m \lambda_i x_i,\qquad
\lambda_i\ge 0,\ \sum_{i=1}^m \lambda_i=1,
\] に対して、
\[
f(x)=\sum_{i=1}^m \lambda_i f(x_i)
\] が成り立つ。
[proof] アフィン性より
\[
f(x)=A\left(\sum_{i=1}^m \lambda_i x_i\right)+a
=\sum_{i=1}^m \lambda_i A x_i + a
=\sum_{i=1}^m \lambda_i (A x_i + a)
=\sum_{i=1}^m \lambda_i f(x_i).
\] [/proof] 前補題を ($\lambda_i=1/n$) に適用すればよい
Lemma.
$(v_1,\dots,v_n\in V) $の重心
\[
b=\frac1n\sum_{i=1}^n v_i
\] に対し、アフィン写像 ($f:V\to W$) は
\[
f(b)=\frac1n\sum_{i=1}^n f(v_i)
\] を満たす。

 

Theorem.
$\mathcal{S}_{n-1}$上の(0,2)テンソル場$g^{[n]}$からなる列$\{g^{[n]} \mid n=2,3,\ldots, \}$であって, 任意のMarkov埋め込み$f$に関する不変性
\[ g^{[n]}_p(X,Y) = g^{[n]}_{f(p)} (f_*X, f_*Y) \] を満たすものは定数倍を除いて、
\[.g^{[n]}_p(X,Y)= \sum_{\omega =1 }^n p(\omega)(X \log p(\omega))(Y \log p(\omega)) \] に限られる.
[proof] [Step. 0] Markov埋め込み写像$f\colon \mathbb{R}^n_{>0} \to \mathbb{R}^l_{>0}$に次のようにして自然に拡張される:つまり,
\[
f\colon \mathbb{R}^n_{>0} \to \mathbb{R}^l_{>0}; (x^1, \ldots, x^n) \mapsto (\sum_{j=1}^n x^jQ^{1}_{(j)}, \ldots, \sum_{j=1}^n x^jQ^{l}_{(j)})
\] であって, $f\rvert_{S_{n-1}}$は$S_{n-1}$上では, $S_{l-1}$にはいる($f(S_{n-1})\subset S_{l-1} \subset R^{l-1}_{>0}$.)
が, 別に, $f\rvert_{\mathbb{R}^{n}_{>0} \setminus S_{n-1}}$は別に$S_{l-1}$にはいらなくてもいい.

[Step.1] $\mathcal{S}_{n-1}$の重心
\[ p_0=(\frac{1}{n},\ldots,\frac{1}{n})\] で考える. Markov埋め込みによる不変性の特殊なケースとして、$l=n$の場合, つまり、(ラベルを入れ替える写像として$f$を考えるということ。)事象のラベル付けの不変性から、
\[. g^{[n]}_{p_0}(\frac{\partial }{\partial x^i},\frac{\partial }{\partial x^i}) \] は$1\leq i \leq n$によらない。 また$1\leq i\neq j \leq n$に対し,
\[. g^{[n]}_{p_0}(\frac{\partial }{\partial x^i},\frac{\partial }{\partial x^j}) \] は$i,j$によらない。
したがって,
ある定数の列$A^{[n]},B^{[n]}$が存在して,
\[ g^{[n]}_{p_0}(\frac{\partial }{\partial x^i},\frac{\partial }{\partial x^j}) = \delta_{ij}A^{[n]} + B^{[n]} \] となる. (実際, $A^{[n]}= g^{[n]}_{p_0}(\frac{\partial }{\partial x^1},\frac{\partial }{\partial x^1})$, $B^{[n]}$を$g^{[n]}_{p_0}(\frac{\partial }{\partial x^1},\frac{\partial }{\partial x^2})$とおけばよい。)
実は, $B^{[n]}=0$としても一般性が失われないことが次のようにしてわかる:
まず, $X\in T_{p_0}\mathcal{S}$を
\[X=\sum_i X^i \frac{\partial }{\partial x^i}\] と成分表示すると,
\[\sum_i X^i =0\] となる。何故ならば、$\mathbb{R}^n_{>0}$上の関数$h(x^1,\ldots,x^n)=x^1+\cdots + x^n$は$\mathcal{S}_{n-1}$上は常に値$1$を取る定数関数だから, $X(h)=X(1)=0$である. したがって,
\[ 0=X(h)=X(\sum_i  x^i) = (\sum_i X^i \frac{\partial }{\partial x^i})(\sum_i  x^i) = \sum_i X^i \] 以上により, 任意の$X,Y \in T_{p_0}\mathcal{S}$に対し,
\[. g^{[n]}_{p_0}(X,Y) = \sum_{i,j=1}^n X^iY^j(\delta_{ij}A^{[n]} + B^{[n]} ) = A^{[n]}   \sum_{i=1}^n X^iY^i \] となるから、$B^{[n]}=0$としても一般性が失われない。(X^i, Y^i一方のみのときは直前のことから消える。)
[Step2] 任意の$l$に対して、ある自然数$k$が存在して, $l=nk$となっている状況で、
\begin{align}
f(x^1,\ldots,x^n)&=(\frac{x^1}{k},\ldots,\frac{x^1}{k}, \ldots, \frac{x^n}{k},\ldots,\frac{x^n}{k},) \\
&=: (y^{1_1},\ldots, y^{1_k},\ldots,y^{n_1},\ldots, y^{n_k})
\end{align}
という$\mathcal{S^{l-1}}\subset \mathbb{R}^{l}$へのMarkov埋め込みを考える。
実際、 $1\leq j \leq n$に対して, $C_{(j)}=\{(j-1)k+1,\ldots, jk\}$とし, $Q_{(j)}=(\frac{1}{k}1_{C_{(j)}}(1),\ldots, \frac{1}{k}1_{C_{(j)}}(n))$とすれば確かにMarkov埋め込みの条件を$f$が満たしていることがわかる。
さて, このとき, $f_{*}\colon T_p \mathcal{S}_{n-1} \to T_p \mathcal{S}_{l-1}$を考えると, これは、 $\frac{\partial }{\partial x^i}\mapsto \sum_{j=1}^{l} \frac{\partial y^j}{\partial x^i} (\frac{\partial }{\partial y^j} )= \frac{1}{k} \sum_{r=l}^n \frac{\partial }{\partial y^l} $
であり、$\mathcal{S^{l-1}}$の重心$p_0$の$f$による像は$f$の定義から, $\mathcal{S}_{l-1}$の重心である。

実際, 行列 (A\in\mathbb{R}^{(nk)\times n}) による線形写像

\[
y = A x
\] で表せる。ここで (A) の成分は次のようになる:行番号を $( (i-1)k + j) ((i=1,\dots,n), (j=1,\dots,k))$と取ると
\[
A_{(i-1)k + j, \ell} =
\begin{cases}
1 & (\ell=i) \\
0 & (\ell\neq i)
\end{cases}.
\]

したがって、不変性により,
\begin{align}
A^{[n]} &= g^{[n]}_{p_0}(\frac{\partial }{\partial x^i},\frac{\partial }{\partial x^i}) \\
&=g^{[n]}_{f(p_0)}(f_*\frac{\partial }{\partial x^i},f_*\frac{\partial }{\partial x^i}) \\
&=g^{[n]}_{f(p_0)}( \frac{1}{k} \sum_{r=1}^n \frac{\partial }{\partial y^l}  , \frac{1}{k} \sum_{r=1}^n \frac{\partial }{\partial y^l} )\\
&= \frac{1}{k^2} \sum_{r,s =1}^n g^{[n]}_{f(p_0)}(  \frac{\partial }{\partial y^l}  ,  \frac{\partial }{\partial y^l} ) \\
&= \frac{1}{k^2} \sum_{r,s =1}^n \delta_{i_r,i_s} A^{[l]} \\
&=\frac{1}{k} A^{[l]}
\end{align}
これにより,

\[
\frac{A^{[n]}}{n} = \frac{A^{[l]}}{nk} = \frac{A^{[l]}}{l}
\]

したがって、ある定数$\lambda$が存在して,
\[
A^{[n]}= \lambda n
\] となる.
[Step3.] 今までの計算を使って、$(0.2)$テンソルの中身の基底の計算が別の場合を示していく。

$\mathcal{S}_{l-1}$上の有理点$p$を任意にとり, それを共通の分母$l$にもつ(通分しておくということ)分数で,
\[
p = (\frac{m_1}{l},\ldots, \frac{m_n}{l})
\] と表しておく.、
そして,
\begin{align}
f(x^1,\ldots,x^n)&=(\frac{x^1}{m_1},\ldots,\frac{x^1}{m_1}, \ldots, \frac{x^n}{m_n},\ldots,\frac{x^n}{m_n},) \\
&=: (y^{1_1},\ldots, y^{1_k},\ldots,y^{n_1},\ldots, y^{n_{m_n}})
\end{align}

ここで, 一般に
\[
\sum_{r=1}^{m_1} \sum_{s=1}^{m_2} \delta_{rs} = \sum_{r=1}^{m_1} 1_{\{ s \mid s\leq m_2 \}}(r)=m_1 \wedge m_2
\] であるから,
\[
\frac{1}{m_i m_j}\sum_{r=1}^{m_i} \sum_{s=1}^{m_j} \delta_{ij} \delta_{rs} A^{[l]} = \frac{\delta_{ij}}{m_i m_j} \times (m_i \wedge m_j ) A^{[l]} = \frac{\delta_{ij}}{m_i \vee  m_j} A^{[l]}
\] となることに注意する.

すると、任意の点$p\in \mathcal{S}_{l-1}$に対し
\[p(\omega) = \sum_{a=1}^{n-1}\xi^a \delta_a(\omega) + (1 – \sum_{a=1}^{n-1} \xi^a ) \delta_a(\omega) \] をみたす正の実数の組$(\xi^1,\ldots, \xi^{n-1})$が唯一つ定める($\xi^1(p),\ldots, \xi^{n-1}(p)$に関する微分方程式が解けるからそういうこと。)。
$a$方向に偏微分すると,
\[
\frac{\partial}{\partial \xi^a}p(\omega) = \delta_a(\omega) – \delta_n(\omega)
\] がわかる.

$1\leq a,b \leq n$に対して, $\delta_a(\omega)\delta_n(\omega)=0$, $\delta_b(\omega)\delta_n(\omega)=0$であることに注意すればよい.

[/proof]