ZADANIE 3

Kristína Mečiarová


Zvážme náhodný vektor \(\mathbf{X} \sim \textit{N}_2 \bigg( \begin{pmatrix} 1 \\ 2 \end{pmatrix}, \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix} \bigg)\) a podmienený náhodný vektor \(\mathbf{X|Y} \sim \textit{N}_2 \bigg( \begin{pmatrix} X_1 \\ X_1+X_2 \end{pmatrix}, \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} \bigg).\) Spočítame rozdelenenie náhodného vektoru \(\mathbf{W}=\mathbf{X}-\mathbf{Y}\) a podmienené rozdelenie \(Y_2|Y_1\) a graficky si obe rozdelenia zobrazíme. K tomu využijeme výsledky z príkladu z cvičenia, konkrétne:

Majme náhodný vektor \(\mathbf{X}_1 \sim \textit{N}_q(\mu_1,\mathbf{\Sigma_{11}})\) a \((\mathbf{X}_2|\mathbf{X}_1=\mathbf{x}_1)∼\textit N_{p−q}(\mathbb{A}\mathbf{x}_1+\mathbf{b},\mathbf{\Omega})\), kde \(\mathbf{\Sigma}\) nezávisí na \(\mathbf{x}_1 \in \mathbb{R}^q.\) Potom platí \((\mathbf{X}_1^⊤,\mathbf{X}_2^⊤)^⊤∼\textit{N}_p(\mathbf{\mu},\mathbf{\Sigma}),\) kde

\[ \mathbf{\mu}= \begin{pmatrix} \mu_1 \\ \mathbb{A}\mathbf{\mu_1}+\mathbf{b} \end{pmatrix}, \; \Sigma= \begin{pmatrix} \mathbf{\Sigma_{11}} & \mathbf{\Sigma}_{11}\mathbb{A}^T \\ \mathbb{A}\mathbf{\Sigma}_{11} & \mathbb{A}\mathbf{\Sigma}_{11}\mathbb{A}^T +\mathbf{\Omega} \end{pmatrix} .\] V našom prípade máme \(\mathbf{b}= \begin{pmatrix} 0 \\ 0 \end{pmatrix}, \; \mathbb{A}= \begin{pmatrix} 1 & 0\\ 1 & 1 \end{pmatrix}.\) Dosadením do všeobecného vzorca tak dostaneme \[ \begin{pmatrix} X_1 \\ X_2\\ Y_1\\ Y_2 \end{pmatrix} \sim \textit{N}_4 \begin{pmatrix} \begin{pmatrix} 1 \\ 2 \\ 1 \\ 3 \end{pmatrix} , \begin{pmatrix} 2 & 1 & 2 & 3 \\ 1 & 2 & 1 & 3 \\ 2 & 1 & 3 & 3 \\ 3 & 3 & 3 & 7 \end{pmatrix} \end{pmatrix}. \]

Odtiaľ použitím vzorca \(var(\mathbf{X}-\mathbf{Y})=var(\mathbf{X})+var(\mathbf{Y})-cov(\mathbf{X},\mathbf{Y})- cov(\mathbf{Y},\mathbf{X})\) dostaneme: \[ \begin{pmatrix} W_1 \\ W_2 \end{pmatrix} \sim \textit{N}_2 \Bigg( \begin{pmatrix} 0 \\ -1 \end{pmatrix}, \begin{pmatrix} 1 & 0 \\ 0 & 3 \end{pmatrix} \Bigg) \] a zo vzorca \[ Y_2|Y_1 \sim \textit{N}(\mu_2+\sigma_{21}\sigma_{11}^{-1}(x_1−\mu_1), \; \sigma_{22}−\sigma_{21}\sigma_{11}^{-1}\sigma_{12}),\] kde\(\begin{pmatrix} Y_1 \\ Y_2 \end{pmatrix} \sim \textit{N}_2 \Bigg( \begin{pmatrix} \mu_1 \\ \mu_2 \end{pmatrix}, \begin{pmatrix} \sigma_{11} & \sigma_{12} \\ \sigma_{21} & \sigma_{22} \end{pmatrix} \Bigg) = \textit{N}_2 \Bigg(\begin{pmatrix} 1 \\ 3 \end{pmatrix}, \begin{pmatrix} 3 & 3 \\ 3 & 7 \end{pmatrix} \Bigg)\), dostaneme \(Y_2|Y_1 \sim \textit{N}(3+(Y_1-1),4).\)

Na nasledujúcich obrázkoch môžeme vidieť združené rozdelenia náhodných vektorov \(\mathbf{X}, \mathbf{Y}\) a \(\mathbf{W}\) a podmienené rozdelenie \(Y_2|Y_1\). Obrázky potvrdzujú naše výpočty.

library("mvtnorm")
n <- 100
set.seed(1234)
X<- rmvnorm(n, c(1, 2), matrix(c(2, 1, 1, 2),2,2))
Y_X<- rmvnorm(n, c(mean(X[,1]), mean(X[,1])+mean(X[,2])), matrix(c(1, 0, 0, 1),2,2))

A<-cbind(c(1,1),c(0,1))

#joint dist. of X
x<- seq(-5,9,0.01)
contour(x,x,outer(x,x,function(x,y){dmvnorm(cbind(x,y),mean=c(mean(X[,1]),mean(X[,2])),sigma=var(X))}), col = "blue", main="Združené rozdelenie (X1,X2)")

#joint distr. of Y
SigmaY<-A%*%var(X)%*%t(A)+matrix(c(1, 0, 0, 1),2,2)
contour(x,x,outer(x,x,function(x,y){dmvnorm(cbind(x,y),mean=A%*%c(mean(X[,1]),mean(X[,2])),sigma=SigmaY)}), col = "blue", main="Združené rozdelenie (Y1,Y2)")

#joint dist. of X-Y
muW<-c(mean(X[,1]),mean(X[,2]))-A%*%c(mean(X[,1]),mean(X[,2]))
SigmaW<-var(X)+SigmaY-var(X)%*%t(A)-A%*%var(X)
contour(x,x,outer(x,x,function(x,y){dmvnorm(cbind(x,y),mean=muW,sigma=SigmaW)}), col = "blue", main="Združené rozdelenie (W1,W2)")

#joint distr. of Y
SigmaY<-A%*%var(X)%*%t(A)+matrix(c(1, 0, 0, 1),2,2)
contour(x,x,outer(x,x,function(x,y){dmvnorm(cbind(x,y),mean=A%*%c(mean(X[,1]),mean(X[,2])),sigma=SigmaY)}), col = "blue", main="Združené rozdelenie (Y1,Y2)")

### marginals
mu1<-(A%*%c(mean(X[,1]),mean(X[,2])))[1]
mu2<-(A%*%c(mean(X[,1]),mean(X[,2])))[2]
Y1<-dnorm(x,mu1,SigmaY[1,1])
Y2<- dnorm(x,mu2,SigmaY[2,2])
lines(x, Y1 - abs(min(x)), lty = 1, lwd = 2, col = "gray30")
lines(Y2 - abs(min(x)), x, lty = 1, lwd = 2, col = "gray30")

abline(v=1, lwd=2, lty=2, col = "red")
text(0.75, -3, labels=expression(Y[1]==1), col = "red", pos = 4)

### conditional distribution of Y2 | Y1 = 1
Y21 <- dnorm(x, mean = mu2+(1-1), sd=sqrt(SigmaY[2,2]-SigmaY[2,1]/SigmaY[1,1]*SigmaY[1,2]))
lines(Y21-abs(min(x)),x,lty=2,lwd=2, col = "red")

Ako príklad dvoch marginálne normálne rozdelených veličín, ktoré nie sú združene normálne uvažujme nasledujúce:

Majme náhodnú veličinu \(X \sim \textit{N}(0,1)\), náhodnú veličinu \(B \sim \textit{Alt}(1/2)\) a \(Y=X \cdot(2B−1)\).Teda \(Y= \pm X\) s pravdepodobnosťou 1/2. Ukážeme, že náhodná veličina má normálne rozdelenie.

\(P(Y \leq y)=1/2(P(Y\leq y|B=1)+P(Y \leq y|B=0)),\) kde

\(P(Y \leq y|B=0)=P(−X \leq y)=1−P(X \leq −y)=1−\Phi(−y)=\Phi(y)\) a \(P(Y \leq y|B=1)=P(X \leq y)=\Phi(y)\). Teda \(P(Y \leq y)= \Phi(y)\).

Ďalej ukážeme, že združené rozdelenie náhodného vektoru \((X,Y)^T\) nie je normálne. K tomu nám stačí ukázať, že existuje lineárna kombinácia veličín X a Y, ktorá nemá normálne rozdelenie. Vezmime si náhodnú veličinu \[ X+Y= \begin{cases} 2X, & B=1,\\ 0, & B=0. \end{cases} \] Teda vidíme, že takáto lineárna kombinácia nemá normálne rozdelenie, teda ani náhodný vektor \((X,Y)^T\) nemôže mať združene normálne rozdelenie. Poďme sa na to teraz pozrieť graficky. 

n <- 1000
set.seed(1234)
X<-rnorm(n,0,1)
B<-rbinom(n,1,1/2)
Y<-(2*B-1)*X

par(mar = c(5, 5, 5, 4) + 0.4)
hist(X,prob=TRUE,main="Histogram X",cex.main=1.5,cex.axis=1.5,cex.lab=1.5)
curve(dnorm(x,mean=mean(X),sd=sd(X)),add=T,col="red", lwd=2)

par(mar = c(5, 5, 5, 4) + 0.4)
hist(Y,prob=TRUE,main="Histogram Y",cex.main=1.5,cex.axis=1.5,cex.lab=1.5)
curve(dnorm(x,mean=mean(Y),sd=sd(Y)),add=T,col="red", lwd=2)

Na oboch histogramoch vidno pekne normálne rozdelenie oboch náhodných veličín. Keď sa však pozrieme na ich súčet:

Z<-X+Y

par(mar = c(5, 5, 5, 4) + 0.4)
hist(Z,prob=TRUE,main="Histogram Z",cex.main=1.5,cex.axis=1.5,cex.lab=1.5)
curve(dnorm(x,mean=mean(Z),sd=sd(Z)),add=T,col="red", lwd=2)

##boxplot
par(mar = c(5, 5, 5, 4) + 0.4)
boxplot(Z,cex.lab=1.5,cex.main=1.5,cex.axis=1.5,main="Boxplot", col="green");

##QQ-graf
qqnorm(Z)
qqline(Z)

Vidíme, že sa jednoznačne o normálne rozdelenie nejedná.