Capítulo 7 Modelos de distribuições contínuas

7.1 Distribuição uniforme contínua

Definição 7.1 Dizemos que a variável aleatória $X$ tem distribuição uniforme contínua no intervalo $[a,b]$, se sua função de densidade é \[ f(x) = \begin{cases} \frac{1}{b-a} & a \leq x \leq b, \\ 0, & \text{caso contrário} \end{cases} \] Notação: $X\sim$ Uniforme Contínua($[a,b]$)

A função de distribuição de uma variável uniforme contínua no intervalo $[a,b]$ é

\[ F(x) = \begin{cases} 0, & x<a\\ \frac{x-a}{b-a}, & a\leq x \leq b\\ 1, & x \geq b \end{cases} \]

Proposição 7.1 Se $X \sim$ Uniforme Contínua($[a,b]$), então \[ E(X) = \frac{a+b}{2} \text{ e } Var(X) = \frac{(b-a)^2}{12} \]

Exemplo 7.1 A eficiência $X$ de um certo componente eletrico é modelada por uma variável aleatória contínua com distribuição uniforme no intervalo $[0,100]$. Qual a probabilidade de que $X$

esteja entre 60 e 80 unidades
seja menor que 90 unidades

Solução. Seja $X$: eficiencia do componente eletrico

$P(60 \leq X \leq 80) = F(80) - F(60) = 0,20$.
$P(X\leq 90) = F(90)=0,90.$

7.2 Distribuição exponencial

Definição 7.2 Dizemos que a variável aleatória $X$ tem distribuição exponencial de parâmetro $\lambda > 0$ se, sua função de densidade é \[ f(x) = \begin{cases} \lambda e^{-\lambda x} & x \geq 0 \\ 0, & \text{caso contrário} \end{cases} \] Notação: $X\sim$ Exponencial($\lambda$).

A função de distribuição de uma variável exponencial de parâmetro $\lambda$ é

\[\begin{align*} F(x) = \begin{cases} 1-e^{-\lambda x}, & x \geq 0 \\ 0, & \text{caso contrário} \end{cases} \end{align*}\]

Proposição 7.2 Se $X \sim$ Exponencial($\lambda$), então \[ E(X) = \frac{1}{\lambda} \text{ e } Var(X) = \frac{1}{\lambda^2} \]

Exemplo 7.2 O tempo de atendimento, em minutos, a um cliente em um serviço de informação de uma biblioteca é uma variável aleatória contínua com distribuição exponencial, com um tempo médio de atendimendo de 5 minutos. Qual a probabilidade de que o atendimento a um cliente dure mais de 10 minutos ?

Solução. Seja $X$: Tempo de atendimento, em minutos, a um cliente em um serviço de informação de uma biblioteca $\sim$ Exponencial($\lambda = 1/5$).

\[ P(X > 10) = 1- P(X\leq 10) = 1-F(10) = e^{-10/5} = 0,1353.\]

7.3 Distribuição normal

A distribuição normal é a distribuição contínua utilizada com mais frequência nas aplicações da teoria da probabilidade. Ela constitui a base para o desenvolvimento de muitos dos métodos da Estatística.

Definição 7.3 Dizemos que a variável aleatória $X$ tem uma distribuição normal de parâmetros $\mu \in \mathbb R$ e $\sigma^2>0$, se sua função de densidade é \[ f(x) = \frac{1}{\sqrt{2\pi} \sigma} e^{-(x-\mu)^2/2\sigma^2}, \; x \in \mathbb R. \] Notação: $X\sim$ N($\mu$,$\sigma^2$).

A distribuição normal também é conhecida como a distribuição de Laplace-Gauss. No seguinte gráfico apresentamos várias curvas da normal para diferentes valores dos parâmetros $\mu$ e $\sigma^2$.

A função de distribuição da normal é

\[ F(x) = \frac{1}{\sqrt{2\pi}\sigma} \int_{-\infty}^x e^{-(t-\mu)^2/2\sigma^2} dt, \; x\in \mathbb R. \]

7.3.1 Propriedades da distribuição normal

A densidade $f$ é simétrica em torno de $\mu$, isto é: $f(\mu+ x) = f(\mu - x)$ para qualquer $x\in \mathbb R$.
Para qualquer $x\in\mathbb R$, $F(\mu + x) + F(\mu-x) = 1$.
$x=\mu$ é o único ponto de máximos de $f$, e o valor máximo é $\frac{1}{\sigma \sqrt{2\pi}}$.
$f$ tem dois pontos de inflexão: $x=\mu - \sigma$ e $x=\mu + \sigma$.
$\lim_{x\to \pm \infty} f(x) = 0$.
O desvio padrão $\sigma$ determina a largura da curva da normal: quanto maior $\sigma$ tem-se uma curva mais larga e achatada, dito de ooutra maneira, quanto maior $\sigma$ menos concentrada perto de $\mu$ a densidade é (veja a figura a continuação).

7.3.2 A distribuição normal padrão

A distribuição normal padrão resulta quando os parâmetros de uma distribuição normal correspondem a $\mu = 0$ e $\sigma^2 = 1$. Ou seja, dizemos que a variável $Z\sim$ N(0,1) se sua função de densidade é

\[ \phi(z) = \frac{1}{\sqrt{2\pi}} e^{-z^2/2}, \; z\in \mathbb R. \]

A função de distribuição de uma normal padrão é denotada pela letra grega $\Phi$ maiúscula e é dada por

\[ \Phi(z) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^z e^{-t^2/2} dt, \; x\in\mathbb R. \]

Observação. Os valores de $\Phi(z)$ não são possíveis de obter analiticamente, no entanto, podem ser aproximados numericamente e encontram-se tabelados para os valores de $z\geq 0$. Note que se $z<0$, podemos calcular $\Phi(z)$ através de $\Phi(z) = 1-\Phi(-z)$.

A continuação apresentamos alguns resultados úteis para o cálculo de probabilidades envolvendo uma distribuição normal.

Proposição 7.3 Seja $X$ uma variável aleatória com média $\mu$ e variância $0<\sigma^2<\infty$. Se \[ Z = \frac{X-\mu}{\sigma}, \] então $E(Z) = 0$ e $Var(Z)=1$.

Proposição 7.4 Seja $X\sim$ N($\mu,\sigma^2$), e defina $Y=aX + b$, então $Y\sim$ N($a\mu + b$, $a^2 \sigma^2$).

Prova. \[\begin{align*} F_Y(y) &= P(Y \leq y) \\ &= P(aX + b \leq y) \\ &=P\left(X\leq\frac{y-b}{a}\right)\\ &=F_X\left(\frac{y-b}{a}\right) \end{align*}\] Logo, \[\begin{align*} f_Y(y) &= F_Y'(y)\\ &=\frac{1}{a} F_X'\left(\frac{y-b}{a}\right) \\ &=\frac{1}{a}f_X\left(\frac{y-b}{a}\right)\\ &=\frac{1}{\sqrt{2\pi} (a\sigma)} e^{-(y-(a\mu + b))^2/2(a^2\sigma^2)} \end{align*}\]

Corolário 7.1 Seja $X\sim$ N($\mu,\sigma^2$), então $Z=\frac{X-\mu}{\sigma}\sim$ N(0,1).

Corolário 7.2 Seja $Z\sim$ N(0,1), então $X = \sigma Z + \mu \sim$ N($\mu,\sigma^2$)

Proposição 7.5 Se $X\sim$ N($\mu,\sigma^2$), então \[ E(X) = \mu \text{ e } Var(X) = \sigma^2. \]

Prova. Podemos escrever $X = \sigma Z + \mu$, onde $Z\sim N(0,1)$, logo $E(X) = \sigma E(Z) + \mu = \mu$ e $Var(X)=\sigma^2 Var(Z) = \sigma^2$.

7.3.3 Calculando probabilidades de uma $N(\mu,\sigma^2)$ a partir da $N(0,1)$

Seja $F$ a função de distribuição de uma variável aleatória normal com média $\mu$ e variância $\sigma^2$, e $\Phi$ a função de distribuição de uma normal padrão, para qualquer $a\in \mathbb R$, tem-se que

\[ F(a)=P(X\leq a) = P\left(Z \leq \frac{a-\mu}{\sigma}\right) = \Phi\left(\frac{a-\mu}{\sigma}\right). \]

Exemplo 7.3 Suponha que os diâmetros das bolas de golf produzidas por uma companhia seguem uma distribuição normal com $\mu = 1,96$ polegadas e $\sigma = 0,04$ polegadas. Uma bola de golf é considerada defeituosa se seu diâmetro é menor que 1,90 polegadas ou maior que 2,02 polegadas. Qual a porcentagem de bolas de golf defeituosas fabricadas pela companhia?

Solução. Seja $X$: Diâmetro de uma bola de golf fabricada pela companhia. Logo, \[\begin{align*} P(X < 1,90 \text{ ou } X> 2,02) &= 1- P(1,90 \leq X \leq 2,02) \\ &=1-[F(2,02)-F(1,90)]\\ &=1-\left[\Phi\left(\frac{2,02 -1,96}{0,04}\right) -\Phi\left(\frac{1,90 -1,96}{0,04}\right)\right]\\ &=1-[\Phi(1,5)-\Phi(-1,5)]\\ &=2-2\Phi(1,5)\\ &=2-2(0,9331)=0,1336 \end{align*}\]

7.4 Quantis da distribuição normal

Seja $X$ uma variável aleatória contínua com função de distribuição $F$ e seja $p\in(0,1)$, definimos o $p$-ésimo quantil como o valor $Q(p)$ tal que $F(Q(p)) = p$.

No caso de $X \sim$ $N(\mu,\sigma^2)$, temos que

\[\begin{align*} F(Q(p)) = \Phi\left(\frac{Q(p) - \mu}{\sigma}\right) = p. \end{align*}\]

Note que devemos encontrar o $p$-ésimo quantil da normal padrão, denotado por $z(p)$ e logo $Q(p)$ será o valor tal que $z(p) = \frac{Q(p) - \mu}{\sigma}$, isto é, $Q(p) = \mu + \sigma z(p)$.

Por exemplo, se $p=0,05$, queremos achar o valor $z(p)$ tal que $\Phi(z(p)) = p = 0,05$, Neste caso, procurando na tabela da normal, temos que $z(0,05)=-1.64$ e $Q(0.05) = \mu + 0,05 \sigma$. Veja a figura a seguir:

Em Inferência Estatística, os quantis de uma distribuição normal padrão recebem o nome de valores críticos e frequentemente é usada a notação: $z_\alpha= z(1-\alpha), \; \alpha \in (0,1)$ e eles tem um papel fundamental na definição de intervalos de confiança e a região crítica de testes de hipóteses.

Exemplo 7.4 Numa população o nível sérico de colesterol em adultos (medido em mg/dl) é uma variável aleatória com distribuição normal com parâmetros $\mu=225$ e $\sigma=75$. Calcule o valor acima do qual se encontra o colesterol de 10% da população que tem os níveis mais elevados.

Solução. Seja $X$: Nível de colesterol de uma pessoa selecionada aleatoriamente dessa população $\sim$ N(225,$75^2$), logo \[ Z = \frac{X - 225}{75} \sim \text{N(0,1)}. \] Queremos achar valor $a$ tal que $P(X > a) = 0.10 \iff P(X \leq a)=0.90$, ou seja, $a=Q(0.90)$. Logo, $a=\mu + \sigma z(0.90)= 225 + 75 \times 1,28 = 321$.

Portanto, 10% da população tem um nível de colesterol acima de 321 mg/dl.

7.5 Aproximação normal à binomial

Lembre que uma variável aleatória $X$ tem distribuição binomial com parâmetros $n$ e $p$ se sua função de probabilidade é dada por

\[ p(x) = \binom{n}{x} p^x (1-p)^{n-x}, \; x=0,1,\ldots, n. \]

Quando $n$ é muito grande por veces resulta inviável calcular a probabilidade de que $X$ assuma um certo conjunto de valores. Consideremos o seguinte exemplo:

Exemplo 7.5 Durante um longo período tem se determinado que 70% dos advogados que apresentam o exame da OAB são aprovados. Suponha que 500 advogados que apresentam o exame, qual a probabilidade de que pelo menos 370 deles sejam aprovados.

Seja $X$: Número de advogados que aprovam o exame dentre os 500 $\sim$ Binomial(500,0.70). \[ P(X \geq 370) = \sum_{x=370}^{500} \binom{500}{x} (0.70)^x (0.30)^{500-x} \] Nesse caso teriamos que calcular 131 probabilidades binomiais, o que resulta uma tarefa bastante tediosa se tivessemos que usar uma calculadora ou pior se tivessemos que realizar o cálculo “à mão”.

Diante dessa situação podemos usar a distribuição normal para aproximar probabilidades binomiais. O seguinte teorema mostra como isso pode ser feito.

Teorema 7.1 Seja $X\sim$ Binomial($n,p$). Se $n$ é suficientemente grande, então para $x=0,1,\ldots,n$

\[\begin{align*} P(X \leq x) = P(X \leq x+0,5) &\approx \Phi\left( \frac{x + 0,5 - np}{\sqrt{np(1-p)}} \right) \\ P(x \leq X \leq y) = P(x - 0,5\leq X \leq y+0,5) &\approx \Phi\left(\frac{ y + 0,5 - np}{\sqrt{np(1-p)}}\right) - \Phi\left(\frac{ x - 0,5 - np}{\sqrt{np(1-p)}}\right) \end{align*}\]

Observação. O procedimento de substrair e somar 0,5 é conhecido como correção de continuidade de Fisher e fornece uma aproximação mais precisa, especialmente quando $n$ não for muito grande.

Dois critérios que oferecem uma boa aproximação comumente usados são: $np\geq 5$ e $n(1-p) \geq 5$ ou $np(1-p)\geq 10$.

A continuação apresentamos a função de probabilidade de uma distribuição binomial e a densidade da distribuição normal para diferentes valores de $n$ e $p$.

Agora, usaremos o Teorema 9.1. para responder ao Exemplo 9.4. Nesse caso $\mu = 500\times 0.70 = 350$ e $\sigma^2 = 500 \times 0.70 \times 0.30 = 105$

\[\begin{align*} P(X\geq 370) &= 1 - P(X \leq 369) \\ &=1-\Phi\left( \frac{369 +0,5 - 350}{\sqrt{105}} \right)\\ &=1-\Phi(1.90)\\ &=1-0,9713\\ &=0.0287. \end{align*}\] Portanto, a probabilidade de pelo menos 370 advogados aprovem o exame da OAB é aproximadamente de 2%.

Exemplo 7.6 Um fabricante sabe por experiência que o 4% de um lote contendo um certo produto é rejeitado por defeitos. Se um novo lote de 800 unidades vai ser inspecionado. Qual a probabilidade aproximada de que menos de 35 unidades sejam rejeitadas?

Solução. Seja $X$: Número de produtos rejeitados por defeito $\sim$ Binomial(800,0,04), podemos usar a distribuição normal com $\mu = 800 \times 0,04 = 32$ e $\sigma^2 = 800 \times 0,04 \times 0,96 = 30,72$. Logo, \[ P(X<35) = P(X\leq 34) = \Phi\left( \frac{34+0,5 - 32}{\sqrt{30,72}}\right) = \Phi(0,45)=0,6736. \]

Exemplo 7.7 O tamanho ideal de uma turma de primeiro ano em uma faculdade particular é de 150 alunos. A faculdade, sabendo de experiências anteriores que, em média, apenas 30% dos alunos aceitos vão de fato seguir o curso, usa a prática de aprovar os pedidos de matrícula de 450 estudantes. Calcule a probabilidade de que mais de 150 estudantes de primeiro ano frequente as aulas nesta faculdade.

Solução. Seja $X$: Número de estudantes que seguem o curso, então $X$ é uma variável binomial com distribuição binomial com parâmetros $n=450$ e $p=0,3$. Usando a aproximação normal à binomial, temos que

\[\begin{align*} P(X\geq 150) &\approx 1-\Phi\left( \frac{150 + 0,5 - (450)(0,3)}{\sqrt{(450)(0,3)(0,7)}} \right) \\ &=1-\Phi(1,59) \\ \approx 0,0559. \end{align*}\] Portanto, menos do 6% das vezes mais que 150 dos 450 estudantes aceitos vão de fato seguir o curso.

7.6 A curtose e a distribuição normal

A curtose é uma medida de forma que mostra o achatamento da curva da função de densidade de probabilidade de uma variável aleatória.

Definição 7.4 Tomando a distribuição normal como referência, diremos que uma distribuição pode ser menos “achatada” que a normal (LEPTOCÚRTICA) ou mais “achatada” que a normal (PLATICÚRTICA). A distribuição normal desde o ponto de vista da curtose, é chamada de MESOCÚRTICA.

Definição 7.5 Seja $X$ uma variável aleatória (discreta ou contínua) com média $\mu$ e variância $\sigma^2$. Então, o coeficiente de curtose de $X$ é definida como

\[ \kappa = \frac{E[(X-\mu)^4]}{\sigma^4} - 3 \]

Critério

Se $\kappa < 0$, então a distribuição de $X$ é leptocúrtica.
Se $\kappa = 0$, então a distribuição de $X$ é mesocúrtica.
Se $\kappa > 0$, então a distribuição de $X$ é platicúrtica.

7.7 Distribuição Gama

Definição 7.6 A função Gama de Euler $\Gamma: (0,\infty) \rightarrow \mathbb R$ é definida por \[ \Gamma(\alpha) = \int_{0}^\infty x^{\alpha-1} e^{-x} dx, \] e possui as seguintes propriedades:

$\Gamma(\alpha + 1)= \alpha \Gamma(\alpha)$, $\alpha >0$.
$\Gamma(n+1) = n!$ para $n\geq 0$ inteiro.

Definição 7.7 Dizemos que uma variável aleatória $X$ tem distribuição gama com parâmetros $\alpha >0$ e $\lambda>0$ se, sua função de densidade é \[ f(x) = \begin{cases} \frac{\lambda^\alpha}{\Gamma(\alpha)} x^{\alpha -1} e^{-\lambda x}, & x >0 \\ 0, & \text{caso contrário} \end{cases} \] Notação: $X \sim$ Gama($\alpha,\lambda$)

O parâmetro $\alpha$ é um parâmetro de forma, ao passo que o parâmetro $\lambda$ é um parâmetro de escala, podemos reparametrizar essa distribuição introduzindo a mudança $\theta = 1/\lambda$, neste caso $\theta$ é chamado de taxa da distribuição.

A continução apresentamos várias curvas da densidade da gama para diferentes valores de $\alpha$ e $\lambda$.

Como $f$ é uma função de densidade, temos que: \[ \int_{0}^\infty x^{\alpha - 1}e^{-\lambda x} dx = \frac{\Gamma(\alpha)}{\lambda^\alpha}, \; \alpha, \lambda > 0. \]

Além disso,

Se $\lambda = 1$, a distribuição é chamada de gama padrão e, sua função de densidade é dada por

\[ f_1(x;\alpha) = \frac{1}{\Gamma(\alpha)} x^{\alpha-1} e^{-x}, \; x>0 \]

Se $\alpha=1$, então Gama($1,\lambda$) $\equiv$ Exponencial($\lambda$).

A função de distribuição de uma gama padrão é definida por

\[ F_1(x;\alpha) = \int_0^x \frac{1}{\Gamma(\alpha)} x^{\alpha-1} e^{-x}, \; x>0, \] e recebe o nome de função gama incompleta.

Proposição 7.6 Seja $X\sim$ Gama($\alpha,\lambda$), então

\[ F_X(x) = F_1(\lambda x;\alpha) \]

Prova. Seja $x>0$, logo \[\begin{align*} \frac{d}{dx} F_1(\lambda x;\alpha) &= \lambda f_1(\lambda x;\alpha) \\ &=\frac{\lambda^\alpha}{\Gamma(\alpha)} x^{\alpha-1} e^{-\lambda x}\\ &=f_X(x) \end{align*}\] Portanto, $F_1(\lambda x;\alpha) = F_X(x)$.

Proposição 7.7 Seja $X\sim$ Gama($\alpha,\lambda$), então: \[E(X) =\frac{\alpha}{\lambda} \text{ e } Var(X) = \frac{\alpha}{\lambda^2}\]

Exemplo 7.8 Suponha que o tempo de sobrevivência de um rato macho em semanas exposto a 240 rads de radiação gamma tem uma uma distribuição gama com $\alpha = 8$ e $\lambda = 1/15$. Determine

a probabilidade de que um rato sobreviva entre 60 e 120 semanas.
a probabilidade de que um rato sobreviva pelo menos 30 semanas.
o tempo médio de sobrevivência de um rato.

Solução. Seja $X$: Tempo de sobrevivência de um rato, em semanas, exposto a 240 rads de radiação gamma $\sim$ Gama($\alpha=8$,$\lambda=1/15$). Logo

Queremos calcular $P(60 \leq X \leq 120)$. Com efeito, \[\begin{align*} P(60 \leq X \leq 120) &= F_X(120)- F_X(60) \\ &=F_1\left(\frac{120}{15};8\right) - F_1\left(\frac{30}{15};8\right) \\ &=F_1(8;8)-F_1(4;8) = 0,547 - 0,051 = 0,496. \end{align*}\]
$P(X \geq 30) = 1-F_X(30)=1 - F_1\left(\frac{30}{15};8\right) = 1 - F(2) = 1- 0,001 = 0,999$
$E(X) = \frac{\alpha}{\lambda} = (8)(15) = 120$ semanas.

7.8 Distribuição qui-quadrada

Definição 7.8 Dizemos que uma variável aleatória $X$ tem distribuição qui-quadrada com $\nu$ graus de liberdade se, sua função de densidade é \[ f(x) = \begin{cases} \frac{1}{2^{\nu/2}\Gamma(\nu/2)} x^{(\nu/2)-1}e^{-x/2}, x>0 \\ 0, \text{caso contrário} \end{cases} \]

Observação. Note que, se $\alpha = \nu/2$ e $\lambda = 1/2$, então Gama($\nu/2,1/2$) $\equiv$ $\chi^2_{\nu}$.

A figura abaixo mostra diferentes curvas da função de densidade de uma qui-quadrado para diferentes valores de $\nu$.

7.9 Distribuição t-Student

Definição 7.9 Dizemos que uma variável aleatória $X$ tem distribuição $t$-Student com $\nu$ graus de liberdade se, sua função de densidade é

\[ f(x) = \frac{\Gamma(\frac{\nu + 1}{2})}{\sqrt{\nu \pi}\Gamma(\nu/2)} \frac{1}{(1+x^2/\nu)^{(\nu + 1)/2}}, \; x \in \mathbb R. \]

A figura abaixo mostra diferentes curvas da função de densidade de uma t-Student para diferentes valores de $\nu$. Além disso, adicionamos uma normal padrão, note que a distribução t-Student é uma distribuição com “caudas mais pesadas” que a normal.

As distribuições qui-quadrado e t-Student estão relacionadas com a distribuição normal como segue:

Se $Z_1,\ldots,Z_n$ são variáveis aleatórias independentes e identicamente distrbibuídas com distribuição normal padrão, então a variável $Y = \sum_{i=1}^n Z_i^2$ tem distribuição qui-quadrado com n graus de liberdade.
Se $Z$ e $Y$ são variáveis aleatórias independentes, $Z\sim N(0,1)$ e $Y\sim \chi^2_{\nu}$, então a variável \[ T = \frac{Z}{\sqrt{Y/\nu}},\] tem distribuição t de Student com n graus de liberdade

7.9.1 Amostragem de uma população normal

Definição 7.10 Seja $F$ uma distribuição de probabilidade. Uma amostra aleatória de tamanho $n$ de uma população $F$ é uma sequência finita $X_1,X_2,\ldots, X_n$ de variáveis aleatórias independentes e identicamente distribuídas com distribuição $F$.

Nesta seção lidamos com amostras obtidas a partir de uma população normal. A amostragem oriundas de populações normais conduz a diversas propriedades úteis da amostragem estatística e também a muitas distribuições amostrais amplamente conhecidas.

Proposição 7.8 Seja $X_1, X_2, \ldots, X_n$ uma amostra aleatória de uma população normal com média $\mu$ e variância $\sigma^2$, defina, $\bar X = \frac{X_1 + \ldots + X_n}{n}$ e $S^2 = \frac{1}{n-1} \sum_{i=1}^n (X_i - \bar X)^2$ como média amostral e variância amostral de $X_1,\ldots, X_n$, respectivamente. Então $\bar X$ e $S^2$ são independentes, com

$\bar X \sim N(\mu,\sigma^2/n)$
$\frac{(n-1)S^2}{\sigma^2} \sim \chi^2_{n-1}$
$\frac{\sqrt{n}(\bar X -\mu)}{S} \sim t_{n-1}$

7.10 Distribuição de Cauchy-Lorentz

Definição 7.11 Dizemos que uma variável aleatória $X$ tem distribuição de Cauchy (ou Cauchy-Lorentz) com parâmetros $\alpha \in \mathbb R$ e $\beta > 0$ se, sua função de densidade é \[ f(x)=\frac{1}{\pi \beta \{1+[(x-\alpha)/\beta]^2\}}, \; x\in\mathbb R \]

A seguir apresentamos várias curvas da densidade da Cauchy para diferentes valores de $\alpha$ e $\beta$.

Observação. Quando $\alpha=0$ e $\beta = 1$, temos a distribuição Cauchy padrão, cuja função de densidade é

\[ f(x) = \frac{1}{\pi (1+x^2)}, \; x\in\mathbb R \]

É possível mostrar que a média da distribuição de Cauchy não existe. De fato, se tentamos calcular a média de $X\sim$ Cauchy(0,1), temos que para qualquer $t\in\mathbb R$:

\[\begin{align*} E(X) &= \int_{-\infty}^\infty \frac{x}{\pi (1+x^2)} dx\\ &= \int_{-\infty}^t \frac{x}{\pi (1+x^2)} dx + \int_{t}^\infty \frac{x}{\pi (1+x^2)} dx \\ &= \frac{1}{\pi}\left[\int_{-\infty}^{1+t^2} \frac{du}{u} + \int_{1+t^2}^{\infty} \frac{du}{u} \right] \\ &= \frac{1}{\pi}\left[ \ln(1+t^2) - \ln(-\infty) + \ln(\infty) - \ln(1+t^2) \right] \\ &=\infty - \infty \; (\text{não definido}) \end{align*}\] Portanto, $E(X)$ não existe.

Observação. De fato $E(|X|) = \infty$, portanto não existem os momentos $E(X^n)$ para qualquer $n\geq 1$. Em particular, a função geradora de momentos não existe.

A pesar de não existir a média da distribuição de Cauchy é possível mostrar, por exemplo, que a médiana é $\tilde \mu = \alpha$. Para simplificar os cálculos assuma que $X\sim$ Cauchy(0,1), mostraremos que $\tilde \mu = 0$:

\[\begin{align*} F(0)=P(X\leq 0) &= \frac{1}{\pi}\int_{-\infty}^0 \frac{dx}{1+x^2}\\ &=\frac{1}{\pi} \left[\mathrm{arctg}(x)\right]_{-\infty}^0\\ &=\frac{1}{\pi} (0-(-\pi/2)) = 1/2. \end{align*}\]

Portanto, $\tilde \mu = 0$.

Exemplo 7.9 Mostraremos nesse exemplo como a distribuição de Cauchy descreve a distância horizontal à qual um segmento de linha inclinado a um ângulo aleatório com distribuição uniforme contínua em [$-\pi/2, \pi/2$] corta o eixo $x$. A situação é apresentada na figura abaixo.

Solução. Seja $\Theta$ o ângulo daquele segmento, com um ponto fixo de rotação, que faz com o eixo $x$ (como mostrado na figura acima). Então $\Theta \sim$ Uniforme Contínua[$-\pi/2,\pi/2$]. Além disso,

\[\begin{align*} F_X(x)=P(X \leq x) &= P(\mathrm{tg}(\Theta)\leq \frac{x}{\beta})\\ &=P(\Theta \leq \mathrm{arctg}(x/\beta))\\ &=F_{\Theta}(\mathrm{arctg}(x/\beta))\\ &= \frac{1}{\pi}\left[\mathrm{arctg}(x/\beta) + \pi/2\right] \end{align*}\] Logo,

\[\begin{align*} f_X(x) = \frac{d F(x)}{dx} &= \frac{1}{\pi \beta} \left(\frac{1}{1+(x/\beta)^2}\right) \end{align*}\] Portanto, $X\sim$ Cauchy(0,$\beta$).

7.11 Distribuição Beta

Definição 7.12 A função $B:(0,\infty) \times (0,\infty) \rightarrow \mathbb R$ é definida por \[ B(\alpha,\beta) = \int_0^1 x^{\alpha -1} (1-x)^{\beta - 1} dx, \]

Observação. A função beta está relacionada à função gama por meio da seguinte identidade: $B(\alpha,\beta) = \frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha + \beta)}$.

Definição 7.13 Dizemos que uma variável aleatória $X$ tem distribuição beta com parâmetros $\alpha>0$ e $\beta>0$ se, sua função de densidade é

\[ f(x) = \begin{cases} \frac{1}{B(\alpha,\beta)}x^{\alpha-1} (1-x)^{\beta -1}, & x \in (0,1) \\ 0 & \text{caso contrário} \end{cases} \]

A função de distribuição de uma variável aleatória beta, em geral, recebe o nome de função beta incompleta e é dada por

\[ F(x) = \int_0^x \frac{1}{B(\alpha,\beta)} t^{\alpha - 1} (1-t)^{\beta - 1} dt. \]

Se $\alpha$ e $\beta$ são inteiros, então

\[\begin{align*} F(x) &= \int_0^x \frac{1}{B(\alpha,\beta)} x^{\alpha - 1} (1-x)^{\beta - 1}\\ &= \sum_{i=\alpha}^n \binom{n}{i} x^i(1-x)^{n-i}, \end{align*}\] onde $n=\alpha+\beta-1$.

Proposição 7.9 Seja $X\sim$ Beta($\alpha,\beta$), então \[ E(X) = \frac{\alpha}{\alpha + \beta} \text{ e } Var(X) = \frac{\alpha\beta}{(\alpha + \beta)^2 (\alpha + \beta +1)} \]

Prova. Pela definição de esperança, temos

\[\begin{align*} E(X) &=\frac{1}{B(\alpha,\beta)}\int_{0}^1 x^\alpha (1-x)^{\beta -1} dx\\ &=\frac{B(\alpha+1,\beta)}{B(\alpha,\beta)}\\ &=\frac{\Gamma(\alpha + \beta)}{\Gamma(\alpha) \Gamma(\beta)}\times \frac{\Gamma(\alpha+1) \Gamma(\beta)}{\Gamma(\alpha + \beta + 1)}\\ &=\frac{\alpha}{\beta}. \end{align*}\]

O cálculo da variância é deixado como exercício.

Exemplo 7.10 Um distribuidor de combustível tem tanques de armazenamento de grande capacidade com um abastecimento fixo, que são cheios cada segunda. Ele deseja saber se a porcentagem de combustível vendido durante a semana. Depois de várias semanas de observação descobre que essa porcentagem pode ser bem modelada por uma variável aleatória com distribuição beta com $\alpha=4$ e $\beta = 2$. Qual a probabilidade de que venda pelo menos 90% de suas existências em uma semana?

Solução. Seja $X$: porcentagem de combustível vendido durante a semana $\sim$ Beta(4,2).

\[\begin{align*} P(X>0.90) &= 1-\int_0^{0.90} \frac{1}{B(4,2)} t^{3} (1-t) dt\\ &=1- F(0.90)\\ &=0.08. \end{align*}\]

7.12 Distribuição Log-Normal

Definição 7.14 Dizemos que uma variável aleatória $X$ tem distribuição Log-Normal com parâmetros $\mu\in\mathbb R$ e $\sigma^2 > 0$ se sua função de densidade é dada por:

\[ f(x) = \frac{1}{x\sigma\sqrt{2\pi}}e^{-(\ln x - \mu)^2/2\sigma^2}, \; x \geq 0. \]

Notação: $X\sim$ Log-Normal($\mu,\sigma^2$).

Observação. $X\sim$ Log-Normal($\mu,\sigma^2$) se $Y=\ln X\sim$ N($\mu,\sigma^2$) ou equivalentemente, se $Y \sim$N($\mu,\sigma^2$), então $X=e^Y\sim$ log-normal($\mu,\sigma^2$).

A função de distribuição de $X$ é dada por

\[\begin{align*} F(x) = P(X \leq x) &= P(\ln X \leq \ln x)\\ &=P(Y \leq \ln x)\\ &=P\left(Z\leq \frac{\ln x - \mu}{\sigma}\right)\\ &=\Phi\left(\frac{\ln x - \mu}{\sigma}\right) \end{align*}\]

Agora, se $X\sim$ Log-Normal($\mu,\sigma^2$), $Y\sim$N($\mu,\sigma^2$) e $Z\sim$ N(0,1), temos que

\[ E(X) = E(e^Y) = E(e^{\mu + \sigma Z}) = e^\mu E(e^{\sigma Z}) = e^\mu M_Z(\sigma) = e^{\mu + (\sigma^2t^2)/2}. \]

\[ E(X^2) = E(e^{2Y}) = E(e^{2\mu + 2\sigma Z}) = e^{2\mu} E(e^{2\sigma Z}) = e^{2\mu}M_{Z}(2\sigma) = e^{2\mu+2\sigma^2}. \]

Portanto,

\[ Var(X) = e^{2\mu+2\sigma^2} - e^{2\mu+\sigma^2}. \]

Em geral, o $n$-ésimo momento de $X\sim$ log-normal($\mu,\sigma^2$).

\[ E(X^n) = e^{n\mu - n^2\sigma^2/2}. \]

Observação. A função geradora de momentos da distribuição Log-Normal não existe.

Exemplo 7.11 Suponha que o preço de uma ação (em dólares) negociada na bolsa de valores segue uma distribuição Log-Normal com parâmetros $\mu = 5$ e $\sigma^2 = 1$. Determine:

a probabilidade de que o preço daquela ação não supere os $250.
o p-ésimo quantil do preço daquela ação.

Solução. Seja $X$; preço da ação $\sim$ log-normal($5,1$),

P(X < 250) &= ()\ &=(0.52) .
Seja $Q(p)$ o p-ésimo quantil de $X$, então \[ F_X(Q(p)) = p \iff \Phi\left(\frac{\ln(x) - 5}{1}\right) = p, \] logo: $z(p) = \ln(Q(p)) - 5 \iff Q(p) = e^{z(p) + 5}$.

Observação. Em geral, se $X\sim$ log-normal($\mu,\sigma^2$), o $p$-ésimo quantil de $X$ vem dado por: \[ Q(p) = e^{\sigma z(p) + \mu}. \]

7.13 Distribuição de Pareto

Definição 7.15 Dizemos que a variável aleatória $X$ tem distribuição de Pareto com parâmetros $\alpha,\beta >0$, se sua função de densidade é

\[ f(x) =\begin{cases} \frac{\alpha \beta^\alpha}{x^{\alpha + 1}}, & x\geq \beta \\ 0, & x < \beta \end{cases} \]

A função de distribuição de $X$ é dada por

\[\begin{align*} F(x) &= \int_\beta^x \frac{\alpha\beta^\alpha}{t^{\alpha+1}} dt \\ &=\alpha\beta^\alpha \int_\beta^x t^{-\alpha-1} dt \\ &=\alpha \beta^\alpha \left[-\frac{t^{-\alpha}}{\alpha}\right]_\beta^x \\ &= 1 - \left(\frac{\beta}{x}\right)^\alpha, \; x \geq \beta \end{align*}\]

Em suma

\[\begin{align*} F(x) = \begin{cases} 1- \left(\frac{\beta}{x}\right)^\alpha, & x\geq \beta \\ 0 & x < \beta \end{cases} \end{align*}\]

Proposição 7.10 Seja $X\sim$ Pareto($\alpha,\beta$), então

\[ E(X) = \begin{cases} \frac{\alpha\beta}{\alpha - 1}, & \alpha > 1,\\ \infty, & \alpha \leq 1 \end{cases} \]

\[ Var(X) = \begin{cases} \frac{\beta^2\alpha}{(\alpha - 1)^2(\alpha - 2)}, & \alpha >2,\\ \infty & \alpha \geq 2 \end{cases} \]

Prova. \[\begin{align*} E(X) &= \int_\beta^\infty x \frac{\alpha\beta^\alpha}{x^{\alpha+1}} dx\\ &= \int_\beta^\infty \frac{\alpha\beta^\alpha}{x^\alpha} dx \\ &= \alpha\beta^\alpha \left[ - \frac{\beta^{-\alpha + 1}}{-\alpha +1}\right]_\beta^\infty = \begin{cases} \frac{\alpha\beta}{\alpha - 1}, & \alpha > 1,\\ \infty, & \alpha \leq 1 \end{cases} \end{align*}\]

\[\begin{align*} E(X^2) &= \int_\beta^\infty x \frac{\alpha\beta^\alpha}{x^{\alpha+1}} dx\\ &= \alpha\beta^\alpha\left[ \frac{x^{-\alpha + 2}}{-\alpha + 2}\right]_\beta^\infty = \begin{cases} \frac{\alpha\beta^2}{\alpha - 2}, & \alpha > 2,\\ \infty, & \alpha \leq 2 \end{cases} \end{align*}\] O resultado segue, calculando $Var(X) = E(X^2) - [E(X)]^2$

Exercício 7.1 Mostre que para $n\geq 1$ \[ E(X^n) = \begin{cases} \frac{\alpha\beta^n}{\alpha - n}, & \alpha > n,\\ \infty, & \alpha \leq n \end{cases} \]

Exemplo 7.12 Suponha que a renda em reais de uma certa população tem distribuição de Pareto com parâmetro de forma $\alpha = 3$ e parâmetro de escala $\beta = 1000$. Encontre:

a proporção da população com renda entre 2000 e 4000 reais.
A renda media da população.
A renda mediana da população.

Solução. Seja $X:$ Renda da população $\sim$ Pareto(3,1000)

$P(2000 < X < 4000) = F(4000) - F(2000) = \left(\frac{2}{4}\right)^3 - \left(\frac{1}{4}\right)^3 \approx 10.93 \%$
$E(X) = \frac{\alpha\beta}{\alpha - 1} = 1500$ reais.
É deixado como exercício ao leitor.

7.14 Distribuição de Weibull

Definição 7.16 Dizemos que uma variável aleatória $X$ tem distribuição de Weibull com parâmetros $\alpha > 0$ e $\lambda > 0$ se sua função de densidade é dada por \[ f(x) = \lambda \alpha x^{\alpha - 1} e^{-\lambda x^\alpha}, \; x>0 \]

Notação: $X\sim$ Weibull($\alpha,\lambda$).

Observação. Quando $\alpha = 2$ e $\lambda = 1/\theta^2$ a distribuição é conhecida como distribuição de Rayleigh.

A função de distribuição de $X$ é dada por

\[ F(x) = \begin{cases} 1-e^{-\lambda x^\alpha}, & x \geq 0 \\ 0, & x < 0 \end{cases} \]

Proposição 7.11 Seja $X\sim$ Weibull($\alpha,\lambda$), então

\[ E(X) = \lambda^{-1/\alpha} \Gamma(1+1/\alpha) \text{ e } Var(X) = \lambda^{-2/\alpha} \left[\Gamma(1+2/\alpha) - [\Gamma(1+1/\alpha)]^2)\right] \]

7.15 Distribuição de Laplace (dupla exponencial)

Definição 7.17 Dizemos que uma variável aleatória $X$ tem distribuição de Laplace (ou dupla exponencial) com parâmetros $\mu\in\mathbb R$ e $\lambda>0$ se sua função de densidade é dada por \[ f(x) = \frac{1}{2} e^{-\lambda|x - \mu|}, \; x \in \mathbb R \] Notação: $X\sim$ Laplace($\mu,\lambda$)

A função de distribuição de $X$ é dada por

\[\begin{align*} F(x) = \begin{cases} \frac{1}{2} e^{\lambda(x - \mu)}, & x< \mu,\\ 1-\frac{1}{2}e^{-\lambda(x-\mu)}, & x\geq \mu \end{cases} \end{align*}\]

Proposição 7.12 Seja $X\sim$Laplace($\mu,\lambda$), então \[E(X) = \mu \text{ e } Var(X) = \frac{2}{\lambda^2} \]

Probabilidade

Capítulo 7 Modelos de distribuições contínuas

7.1 Distribuição uniforme contínua

7.2 Distribuição exponencial

7.3 Distribuição normal

7.3.1 Propriedades da distribuição normal

7.3.2 A distribuição normal padrão

7.3.3 Calculando probabilidades de uma \(N(\mu,\sigma^2)\) a partir da \(N(0,1)\)

7.4 Quantis da distribuição normal

7.5 Aproximação normal à binomial

7.6 A curtose e a distribuição normal

7.7 Distribuição Gama

7.8 Distribuição qui-quadrada

7.9 Distribuição t-Student

7.9.1 Amostragem de uma população normal

7.10 Distribuição de Cauchy-Lorentz

7.11 Distribuição Beta

7.12 Distribuição Log-Normal

7.13 Distribuição de Pareto

7.14 Distribuição de Weibull

7.15 Distribuição de Laplace (dupla exponencial)