多項分布

多項分布の確率密度関数は以下の式で表されます。$$f(x_1,x_2 \cdots x_k) =\frac{n!}{x_1!x_2! \cdots x_k!}p_1^{x_1}p_2^{x_2} \cdots p_k^{x_k}$$      \([ x_1+x_2+ \cdots +x_k=n, x_i \geq 0, x_i \in \mathbb{Z} \)
        \(p_i \geq 0, p_1+p_2+ \cdots +p_k=1 (1 \leq i \leq k) ]\)

また、期待値及び分散は$$E[X_i]=np_i, V[X_i]=np_i(1-p_i)$$共分散は$$C[X_i,X_j]=-np_ip_j$$


(1) 全確率が「1」であることを確認します。多項定理を用います。
\begin{alignat}{2}
&\displaystyle\sum_{x_1+x_2+\cdots +x_k=n} f(x_1,x_2, \cdots ,x_k)=\displaystyle\sum_{x_1+x_2+\cdots +x_k=n} \frac{n!}{x_1!x_2! \cdots x_k!}p_1^{x_1}p_2^{x_2} \cdots p_k^{x_k}\\
&                         =(p_1+p_2+ \cdots +p_k)^n=1
\end{alignat}


(2) 期待値を求めます。\((1 \leq i \leq k)\)
\begin{alignat}{2}
&E[Xi]=\displaystyle\sum_{x_1+x_2+\cdots+x_i+ \cdots +x_k=n} x_if(x_1,x_2, \cdots ,x_i,\cdots ,x_k) \\
&     =\displaystyle\sum_{x_1+x_2+\cdots+x_i+ \cdots +x_k=n} x_i \cdot \frac{n!}{x_1!x_2! \cdots x_i! \cdots x_k!}p_1^{x_1}p_2^{x_2} \cdots p_i^{x_i} \cdots p_k^{x_k} \\
&     =\displaystyle\sum_{x_1+x_2+\cdots+x_i+ \cdots +x_k=n} \frac{n!}{x_1!x_2! \cdots (x_i-1)! \cdots x_k!}p_1^{x_1}p_2^{x_2} \cdots p_i^{x_i} \cdots p_k^{x_k}
\end{alignat}\(np_i\) をシグマの外に出します。
シグマの和の取り方を示す式の両辺に \(-1\) を加えて調整します。$$ =np_i\displaystyle\sum_{x_1+x_2+\cdots+(x_i-1)+ \cdots +x_k=n-1} \frac{(n-1)!}{x_1!x_2! \cdots (x_i-1)! \cdots x_k!}p_1^{x_1}p_2^{x_2} \cdots p_i^{x_i-1} \cdots p_k^{x_k} $$多項定理を用います。$$=np_i(p_1+p_2+ \cdots +p_i+ \cdots +p_k)^{n-1}=np_i \cdot 1^{n-1}=np_i$$



(3) 分散を求めるために、まず \(E[X_i^2]\) を求めます。
   下の3行の変形は(2)と同じです。
\begin{alignat}{2}
&E[X_i^2]=\displaystyle\sum_{x_1+x_2+\cdots+x_i+ \cdots +x_k=n} x_i^2f(x_1,x_2, \cdots ,x_i,\cdots ,x_k) \\
&     =\displaystyle\sum_{x_1+x_2+\cdots+x_i+ \cdots +x_k=n} x_i^2 \cdot \frac{n!}{x_1!x_2! \cdots x_i! \cdots x_k!}p_1^{x_1}p_2^{x_2} \cdots p_i^{x_i} \cdots p_k^{x_k} \\
&     =np_i\displaystyle\sum_{x_1+x_2+\cdots+(x_i-1)+ \cdots +x_k=n-1} x_i \cdot \frac{(n-1)!}{x_1!x_2! \cdots (x_i-1)! \cdots x_k!}p_1^{x_1}p_2^{x_2} \cdots p_i^{x_i-1} \cdots p_k^{x_k} \\
\end{alignat}\(x_i-1\) を作り出すために \(1\) を引いて加えて、
シグマを切り離します。
\begin{alignat}{2}
&=np_i\displaystyle\sum_{x_1+x_2+\cdots+(x_i-1)+ \cdots +x_k=n-1} \{(x_i-1)+1\} \cdot \frac{(n-1)!}{x_1!x_2! \cdots (x_i-1)! \cdots x_k!}p_1^{x_1}p_2^{x_2} \cdots p_i^{x_i-1} \cdots p_k^{x_k}\\
&=np_i\displaystyle\sum_{x_1+x_2+\cdots+(x_i-1)+ \cdots +x_k=n-1} (x_i-1) \cdot \frac{(n-1)!}{x_1!x_2! \cdots (x_i-1)! \cdots x_k!}p_1^{x_1}p_2^{x_2} \cdots p_i^{x_i-1} \cdots p_k^{x_k}\\
&   +np_i\displaystyle\sum_{x_1+x_2+\cdots+(x_i-1)+ \cdots +x_k=n-1} \frac{(n-1)!}{x_1!x_2! \cdots (x_i-1)! \cdots x_k!}p_1^{x_1}p_2^{x_2} \cdots p_i^{x_i-1} \cdots p_k^{x_k}
\end{alignat}前のシグマについて \((n-1)p_i\) をシグマの外に出し \(x_i-1\) で約分します。
さらに、シグマの和の取り方を示す式の両辺に \(-1\) を加えて調整します 。
\begin{alignat}{2}
&=n(n-1)p_i^2\displaystyle\sum_{x_1+x_2+\cdots+(x_i-2)+ \cdots +x_k=n-2} \frac{(n-2)!}{x_1!x_2! \cdots (x_i-2)! \cdots x_k!}p_1^{x_1}p_2^{x_2} \cdots p_i^{x_i-2} \cdots p_k^{x_k}\\
&   +np_i\displaystyle\sum_{x_1+x_2+\cdots+(x_i-1)+ \cdots +x_k=n-1} \frac{(n-1)!}{x_1!x_2! \cdots (x_i-1)! \cdots x_k!}p_1^{x_1}p_2^{x_2} \cdots p_i^{x_i-1} \cdots p_k^{x_k}
\end{alignat} 両方のシグマにおいて多項定理を用います。
\begin{alignat}{2}
&=n(n-1)p_i^2(p_1+p_2+ \cdots +p_i+ \cdots +p_k )^{n-2}+np_i( p_1+p_2+ \cdots +p_i+ \cdots +p_k)^{n-1}\\
&=n(n-1)p_i^2\cdot1^{n-2}+np_i\cdot 1^{n-1}=n(n-1)p_i^2+np_i
\end{alignat}以上より分散 \(V[X]\) は
\begin{alignat}{2}
&V[X]=E[X^2]-E[X]^2=n(n-1)p_i^2+np_i-n^2p_i^2\\
&    =n^2p_i^2-np_i^2+np_i-n^2p_i^2\\
&    =np_i-np_i^2=np_i(1-p_i)
\end{alignat}



(4) 共分散を求めるために、まず \(E[X_i,X_j]\) を求めます。
\begin{alignat}{2}
&E[X_i,X_j]=\displaystyle\sum_{x_1+x_2+\cdots+x_i+ \cdots +x_j+ \cdots+x_k=n} x_ix_jf(x_1,x_2, \cdots ,x_i,\cdots ,x_j, \cdots,x_k)\\
& =\displaystyle\sum_{x_1+x_2+\cdots+x_i+ \cdots +x_j+ \cdots+x_k=n} x_ix_j \frac{n!}{x_1!x_2! \cdots x_i! \cdots x_j! \cdots x_k!}p_1^{x_1}p_2^{x_2} \cdots p_i^{x_i} \cdots p_j^{x_j} \cdots p_k^{x_k}
\end{alignat}
\(n(n-1)p_ip_j\) をシグマの外に出し \(x_ix_j\) で約分します。
さらに、シグマの和の取り方を示す式の両辺に \(-2\) を加えて調整します 。
$$=n(n-1)p_ip_j\displaystyle\sum_{x_1+x_2+\cdots+(x_i-1)+ \cdots +(x_j-1)+ \cdots+x_k=n-2} \frac{(n-2)!}{x_1!x_2! \cdots (x_i-1)! \cdots (x_j-1)! \cdots x_k!}p_1^{x_1}p_2^{x_2} \cdots p_i^{x_i-1} \cdots p_j^{x_j-1} \cdots p_k^{x_k}$$多項定理を用います。
\begin{alignat}{2}
&=n(n-1)p_ip_j(p_1+p_2+ \cdots +p_i+ \cdots +p_j+ \cdots +p_k)^{n-2}\\
&=n(n-1)p_ip_j\cdot1^{n-2}= n(n-1)p_ip_j
\end{alignat}よって共分散は
\begin{alignat}{2}
&C[X_i,X_j]=E[X_i,X_j]-E[Xi]E[X_j]\\
&        =n(n-1)p_ip_j-np_inp_j\\
&        =n^2p_ip_j-np_ip_j-n^2p_ip_j=-np_ip_j
\end{alignat}

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です