Prévia do material em texto
ESTATÍSTICA APLICADA À
ENGENHARIA
Roberto Carlos Lourenço
2
SUMÁRIO
1 ANÁLISE COMBINATÓRIA E PROBABILIDADES ......................................... 3
2 PRINCÍPIOS BÁSICOS DE ESTATÍSTICA .................................................... 15
3 GRÁFICOS ESTATÍSTICOS ....................................................................... 25
4 MEDIDAS ............................................................................................... 31
5 TESTE DE HIPÓTESE ............................................................................... 47
6 FERRAMENTAS ESTATÍSTICAS ................................................................ 55
3
1 ANÁLISE COMBINATÓRIA E PROBABILIDADES
Neste bloco, estudaremos a Análise Combinatória e Probabilidades. Onde será possível
compreender como realizar cálculo dos números de arranjos, permutação,
combinação e fatorial.
Ainda nesse bloco, vamos estudar Teoria das probabilidades, probabilidade
condicional e total, conhecendo a definição dos conjuntos denominados como Espaço
Amostral e Evento, para assim, compreender como calcular a probabilidade de um
determinado Evento diante de um Espaço Amostral. E para terminar, conheceremos a
definição da Distribuição de Probabilidades, uma tabela muito importante que é
utilizada na Estatística.
1.1 Cálculo dos números de arranjo, permutação, combinação e fatorial
Fatorial de um número
Nesse infográfico vamos estudar Análise Combinatória, sendo um tópico muito
importante da Matemática e fundamental para desenvolver muitos problemas da
Probabilidade e Estatística.
Para começar, vamos entender como funciona o número fatorial.
Para um número natural qualquer, n ϵ N, temos:
n! = n . (n – 1) . ( n – 2) . (n – 3). ... . 1
1! = 1
Considera-se 0! = 1
Exemplos:
5! = 5 . (5 – 1) . (5 – 2) . (5 – 3). (5 – 4) = 5 . 4 . 3. 2. 1 = 120
7! = 7 . 6 . 5. 4. 3. 2. 1 = 5040
4
10! = 10. 9. 8. 7. 6. 5. 4. 3. 2. 1 = 3 628 800
Podemos indicar:
n! = n . (n – 1)!
12! = 12 . 11. 10!
7! = 7. 6!
Permutações simples e com elementos repetidos
Quando temos n elementos de um determinado grupo e todos são utilizados, onde
ocorre uma troca de posicionamento, trabalhamos com a permutação, indicado por:
!nPn =
Exemplos
1. Quantos são os anagramas da palavra ANTIGO?
Importante: Anagramas são diferentes posições das letras de uma palavra.
Resolução: Para resolver esse problema trabalhamos com !66 =P .
720120.6!5.6!66 ====P
Isso ocorre, pois são 6 letras distintas e cada letra pode mudar de posição, gerando
palavras com significado ou não. Dessa forma, podemos afirmar que existem 720
anagramas da palavra ANTIGO.
Como por exemplos: ANTIOG, ANTGIO, GIOANT, ...
2. Com os elementos do conjunto A = {1, 2, 3, 4} podemos formar quantos números de
quatro algarismos distintos?
5
Resolução:
M C D U
4 opções 3 opções 2 opções 1 opções
Novamente para resolver trabalhamos com !44 =P
241.2.3.4!44 ===P
1234 1243 1324 1342 1423 1432
2134 2143 2314 2341 2413 2431
3124 3142 3214 3241 3412 3421
4123 4132 4213 4231 4312 4321
Portanto, existem 24 números.
Agora, quando existem elementos repetidos trabalhamos com:
!!...!.
!
21
,..,, 21
k
bbb
n bbb
nP k =
Onde n é a quantidade de elementos do conjunto e !!...!. 21 kbbb indica quantas vezes
um determinado elemento está se repetindo.
Exemplo
3. Apresente os anagramas da palavra ARARA:
AAARR AARAR ARAAR RAAAR RAARA
RARAA RRAAA ARRAA AARRA ARARA
Repare que o R repete 2 vezes e o A repete 3 vezes, dessa forma temos:
10
12
120
1.2.3.1.2
1.2.3.4.5
!3!.2
!53,2
5 ====P
6
Arranjos simples
Arranjos simples de n elementos tomados k a k, onde n ≥ k, são os agrupamentos
ordenados diferentes que se podem formar com k dos n elementos dados.
Fórmula:
)!(
!
, kn
nA kn −
=
Exemplos
1. Um cofre possui um disco com 26 letras. A combinação do cofre é formada por 3
letras distintas em uma certa ordem. Se o dono esquecesse essa combinação, qual o
número máximo de tentativas que ele precisaria fazer para abrir o cofre?
Resolução:
Como nesse caso a senha é composta por 3 letras distintas que seguem uma ordem,
podemos resolver esse problema utilizando arranjos simples.
1560024.25.26
!23
!23.24.25.26
!23
!26
)!326(
!26
3,26 ====
−
=A
Portanto, se o dono esquecesse a senha, o número máximo de tentativas para
conseguir abrir o cofre seria de 15 600.
Combinações simples
Combinações simples de n elementos tomados k a k, onde n ≥ k, são os subconjuntos
com exatamente k elementos que se podem formar com os n elementos dados.
Fórmula:
)!(!
!
, knk
nC kn −
=
Exemplo:
1. Num encontro internacional composto por 12 homens e 13 mulheres, cada qual de
um país diferente, deve ser feita a escolha de uma comissão de 5 pessoas. Determine o
número de possíveis comissões, se a comissão deve composta:
7
a) sem nenhuma restrição.
Resolução:
Como não existe nenhuma restrição, podemos afirmar que a comissão pode ser
composta por 5 mulheres e nenhum homem, ou ainda, 4 mulheres e 1 homem, ou 3
mulheres e 2 homens, e assim por diante.
Pensando assim, temos 5 das 13 + 12 = 25 pessoas no total para escolher.
Como não pode ter uma repetição e não existe uma ordem na escolha, trabalhamos
com combinações simples.
5313021.22.23.5
!20.1.2.3.4.5
!20.21.22.23.24.25
!20!.5
!25
)!525(!5
!25
5,25 ====
−
=C
Portanto, existem 53 130 maneiras de formar uma comissão com as 25 pessoas.
b) de 2 homens e 3 mulheres.
Resolução:
Nesse caso, a comissão precisa ter 2 homens e 3 mulheres. Sendo assim, trabalhamos
com combinações simples da seguinte forma:
Para escolher 2 homens Para escolher 3 mulheres
6611.6
!10.1.2
!10.11.12
!10!.2
!12
)!212!.(2
!12
2,12
===
=
−
=C
28611.2.13
!10.1.2.3
!10.11.12.13
!10!.3
!13
3,13
==
==C
Agora multiplicamos os dois resultados para obter o total de possibilidades de
comissões:
66. 286 = 18 876
8
Portanto, existem 18 876 maneiras de formar uma comissão escolhendo 2 homens e 3
mulheres.
1.2 Teoria das probabilidades, probabilidade condicional e total
Para conhecer a definição de probabilidades é necessário conhecer os conjuntos
Espaço Amostral e Evento.
Espaço amostral
Espaço amostral S: conjunto de todos os resultados possíveis de experimento ou
situação.
Exemplo: Lance uma moeda três vezes e observe a sequência de caras (K) e coroas (C)
que ocorre. Apresente um espaço amostral para esse experimento.
S = {(KKK), (KKC), (KCK), (CKK), (CCK), (CKC), (KCC), (CCC)}
Evento
Evento A: subconjunto de S é qualquer conjunto de resultados possíveis relativamente
ao experimento ou situação referidos no espaço amostral.
Exemplo: Ao lançar três vezes uma moeda, foi possível obter o espaço amostral S =
{(KKK), (KKC), (KCK), (CKK), (CCK), (CKC), (KCC), (CCC)}. Para esse experimento, qual é o
evento onde ocorrem duas faces caras?
A = {(KKC), (KCK), (CKK)}
Definição de probabilidades
Chamamos de probabilidade de um evento A (com A contido em S) o número real P(A),
tal que:
9
Onde:
n(A) é o número de elementos do evento A;
n(S) é o número de elementos do espaço amostral S.
Ou seja, Probabilidade de um Evento A é o NÚMERO REAL resultante da RAZÃO
(divisão) entre o número de elementos do evento n(A) e o número de elementos do
espaço amostral n(S).
Certeza e Impossibilidade, pelo que vimos até agora podemos concluir que a
probabilidade de um evento E qualquer é P(E), tal que 0 ≤ P(E) ≤ 1.
Isso significa que a probabilidade só pode assumir valores de zero a 1.
Eventos complementares
Sabemos que um evento pode ocorrer ou não.
Sendo “p” a probabilidade de que ele ocorra (sucesso) e “q” a probabilidade de que ele
não ocorra (fracasso), para um mesmo evento existe sempre a relação:p - 1 q 1 q p =⇒=+
Probabilidade condicional
Denotamos por A/B “o evento A condicionado ao fato de que o evento B já ocorreu” e
por P(A/B) a probabilidade condicional de ocorrer A, tendo ocorrido B.
10
Exemplos
1. Considerando o lançamento de uma moeda e o evento A “obter cara”, obter a
probabilidade de ocorrência do evento A:
a) Espaço Amostral S = { K , C }
b) Número de elementos do espaço amostral n(S) = 2
c) Evento A = { K }
d) Número de elementos do Evento A n(A) = 1
e) P(A) =
2
1
)(
)(
=
Sn
An
2. Considerando um baralho com 52 cartas, sendo 13 cartas de cada um dos quatro
naipes e o evento C “obter um 3”. Sorteia-se uma carta ao acaso. Qual a probabilidade
de ocorrer o número 3?
a) n(S) = 52
b) n(C) = 4
c)
52
4
(S) n
(C) n
==)(CP
3. Lançamos dois dados simultaneamente. Qual a probabilidade de obtermos 2 no
primeiro lançamento e 3 no segundo?
11
4. No experimento do lançamento de dois dados, se a soma dos pontos deu maior que
6, qual a probabilidade de que tenha ocorrido em ambos os dados um número par?
1º momento temos: Espaço Amostral S = {(1; 1), (1; 2), (1; 3), ..., (6; 6)}
2º momento temos: A soma dos pontos deu maior que 6, gerando o evento A = {(1; 6),
(2; 5), (2; 6), (3; 4), (3; 5), (3; 6), (4; 3), (4; 4), (4; 5), (4; 6), (5; 2), (5; 3), (5; 4), (5; 5), (5;
6), (6; 1), (6; 2), (6; 3), (6; 4), (6; 5), (6; 6)}
3º momento temos: Em ambos os dados um número par, quando a soma dos pontos
deu maior que 6, gerando o evento B = {(2; 6), , (4; 4), (4; 6), (6; 2), (6; 4), (6; 6)}
7
2
21
6)/( ==ABP
Portanto, a probabilidade de que tenha ocorrido em ambos os dados um número par
se a soma dos pontos deu maior que 6 é igual a
7
2 .
1.3 Distribuição de probabilidades
Definição
Seja X uma variável aleatória que pode assumir os valores:
nxxxx ,...,,, 321
A cada valor correspondem pontos do espaço amostral. Associamos, então cada valor
ix a probabilidade ip de ocorrência de tais pontos no espaço amostral.
Assim, temos
1...321 =++++=∑ ni ppppp
12
Exemplo
A tabela a seguir informa o número de acidentes diários em um estacionamento:
Com os dados da tabela desenvolva cada item:
a) Em um dia, qual a probabilidade de não ocorrer acidente?
6,0
30
18
1 ==p
b) Em um dia, qual a probabilidade de ocorrer um acidente?
2,0
30
6
2 ==p
c) Em um dia, qual a probabilidade de ocorrer dois acidentes?
13,0
30
4
3 ==p
d) Em um dia, qual a probabilidade de ocorrer três acidentes?
07,0
30
2
4 ==p
13
Com os resultados obtidos podemos formar a Distribuição de Probabilidade:
A função probabilidade é definida por
)()( ixXPxf ==
A função probabilidade determina a distribuição de probabilidade da variável aleatória
X.
Para o lançamento de um dado, a variável X, definida por valor da face do dado, pode
ser indicado por 1, 2, 3, 4, 5, 6.
Formando a tabela:
14
Conclusão
Neste bloco, estudamos Análise Combinatória e Probabilidades, passando pelos
tópicos envolvendo o cálculo dos números de arranjos, permutação, combinação e
fatorial, Teoria das probabilidades, probabilidade condicional e total, definições do
Espaço Amostral, Evento, a probabilidade de um determinado Evento diante de um
Espaço Amostral e Distribuição de Probabilidades.
REFERÊNCIAS
CRESPO, A. A. Estatística fácil. São Paulo: Saraiva, 2009.
DANTE, L. R. Matemática. São Paulo: Ática, 2009. V. único.
DOWNING, D.; CLARK, J. Estatística aplicada. São Paulo: Saraiva, 2011.
LEVIN, J.; FOX, J. A.; FORDE, D. R. Estatística para ciências humanas. São Paulo: Pearson,
2014.
SMOLE, K. C. S. Matemática. São Paulo: Saraiva, 1999. v. 1.
______.; DINIZ, M. I. Matemática Ensino Médio. São Paulo: Saraiva, 2003. v. 1.
15
2 PRINCÍPIOS BÁSICOS DE ESTATÍSTICA
Neste bloco, vamos iniciar os tópicos indicados por diversos autores como princípios
básicos de estatística, começando com as regras de arredondamento de dados,
passando pela caracterização de População e Amostra.
Vamos seguir nossos estudos falando sobre tipos de variáveis e representação de
dados amostrais e concluímos com Distribuição de Frequências.
2.1 Arredondamento de dados e caracterização de População e Amostra
Nesse tópico vamos compreender as regras para realizar o arredondamento de dados
e a caracterização de população e amostra.
De acordo com o Instituto Brasileiro de Geografia e Estatística (IBGE), temos:
i. Quando o primeiro algarismo a ser retirado é 0, 1, 2, 3 ou 4, não altera o último algarismo a
permanecer.
Exemplos
Aproximação de uma casa decimal:
73,74 73,7
Aproximação de duas casas decimais:
34,913453 34,91
ii. Quando o primeiro algarismo a ser retirado é 6, 7, 8 ou 9, aumenta uma unidade o
algarismo a permanecer.
16
Exemplos
Aproximação de uma casa decimal:
72,3823 72,4
25,0712 25,1
35,9951 36,0
iii. Quando o primeiro algarismo a ser retirado é 5, temos duas soluções:
1º Se ao 5 seguir, em qualquer casa, um algarismo diferente de zero, aumenta-se uma
unidade ao algarismo que permanecer.
Exemplos
Aproximação de uma casa decimal:
71,352 71,4
25,65001 25,7
2º Se ao 5 o número que se seguir for o último algarismo ou se ao 5 só se seguirem
zeros, o último algarismo a ser conservado só será aumentado de uma unidade se for
ímpar.
Exemplos
Aproximação de uma casa decimal:
24,75 24,8
24,65 24,6
17
Porcentagem
População e amostra
População é o conjunto de todos os elementos envolvidos no fenômeno a ser
estudado.
Amostra é o conjunto de elementos retirados da população para a realização do
estudo.
Exemplos:
1. Queremos obter informações sobre os alunos da escola Educação de Qualidade.
População: é o conjunto de todos os alunos matriculados na escola Educação de
Qualidade.
Amostra: é o conjunto dos alunos que serão entrevistados.
18
2. Em uma escola existem 300 alunos matriculados, sendo 60 do 1º ano, 50 do 2º ano,
40 do 3º ano, 80 do 4º ano e 70 do 5º ano. Obtenha uma amostra de 60 alunos
preenchendo a tabela a seguir:
O resultado é a tabela:
2.2 Tipos de variáveis e representação de dados amostrais
Nesse tópico vamos estudar os tipos de variáveis, sendo importante entender que
variável é o conjunto de resultados possíveis de um fenômeno.
Variável qualitativa: quando seus valores são expressos por atributos, como: cor de
pele, gênero, hábito de fumar, grau de instrução etc.
Na variável qualitativa nominal não existe ordenação em seus possíveis resultados.
Exemplos: sexo, hábito de fumar, turma, nacionalidade, cor da pele etc.
Na variável qualitativa ordinal existe certa ordem em seus possíveis resultados.
19
Exemplos: grau de instrução, tamanho (P, M, G, GG), classe social etc.
Variáveis quantitativas: seus valores são números e resultantes de uma contagem ou
mensuração, como: idade, salário, distância de um local até outro local, número de
filhos, número de pessoas por família etc.
Na variável quantitativa discreta seus possíveis valores formam um conjunto finito de
números que resultam frequentemente de uma contagem.
Exemplos: número de alunos de uma escola, número de torcedores em uma partida de
futebol, número de moradores de um condomínio etc.
Na variável quantitativa contínua seus possíveis valores formam um intervalo de
números reais que resultam de uma mensuração.
Exemplos: peso, altura, valor de um produto, distância entre dois corpos etc.
Representação de dados amostrais
Em pesquisas realizadas, normalmente, trabalhamos com amostra de uma população,
isso ocorre por impossibilidade ou inviabilidade econômica ou temporal, onde reduz o
estudo de umadeterminada população para uma parte da mesma.
Amostragem
Os métodos de escolha da amostra devem garantir a representatividade do grupo.
Desse modo, podemos recorrer a diferentes formas de amostragem: amostragem
aleatória simples, amostragem sistemática e amostragem estratificada proporcional.
Amostragem aleatória simples
Esse tipo de amostragem é equivalente a um sorteio lotérico.
Exemplo: Para uma pesquisa sobre rendar familiar de um grupo composto por 500
pessoas, vamos escolher uma amostra com, no mínimo, 50 pessoas (sendo 10% de
500), selecionadas através de amostragem aleatória simples, onde em primeiro lugar,
é necessário elaborar uma lista com todas as pessoas do grupo numeradas de 1 a 500,
20
para em seguida serem submetidos a um sorteio. Ao mesmo tempo utilizamos bolas
ou cartões numerados de 1 a 500.
241 001 137 421 ... 094
Ao sortear os 50 números distintos, podemos selecionar essas pessoas para
participarem da pesquisa.
Amostragem sistemática
Quando os elementos da população já se acham ordenados, como prontuários
médicos de um hospital, os prédios de uma rua, as linhas de produção etc. Nestes
casos, a escolha dos elementos que constituirão a amostra pode ser feita por um
sistema imposto pelo pesquisador.
Exemplo: Para uma pesquisa sobre rendar familiar de um grupo composto por 500
pessoas, vamos escolher uma amostra com, no mínimo, 50 pessoas (sendo 10% de
500), selecionadas através de amostragem sistemática, onde em primeiro lugar, é
necessário elaborar uma lista com todas as pessoas do grupo numeradas de 1 a 500,
para em seguida serem submetidos a um sorteio da seguinte maneira:
Sorteamos um número de 1 a 10, ao acaso. Supondo que o número sorteado seja 7,
ele será o primeiro elemento da amostra e os demais serão determinados em
intervalos de dez unidades. Formando essa relação de pessoas:
007 017 027 037 ... 497
Amostragem estratificada proporcional
Em muitos casos uma pesquisa estuda uma população que possui subpopulações, pois
a mesma se divide em grupos denominados como estratos.
Dessa forma, quando empregamos a amostragem estratificada proporcional, que,
além de considerar a existência dos estratos, obtém os elementos da amostra
proporcional ao número de elementos dos mesmos.
21
Exemplo:
Precisa realizar uma pesquisa da estatura de 90 alunos de uma escola. Desses, 54 são
meninas e 36 são meninos. Com o objetivo de entrevistar 10% dos alunos, temos uma
amostragem estratificada proporcional formada da seguinte maneira:
1º Passo
Sexo População 10% Amostra
F 54 0,1 . 54 = 5,4 5
M 36 0,1 . 36 = 3,6 4
Total 90 0,1 . 90 = 9 9
2º Passo
Ao numerar cada aluno de 01 a 90, onde de 01 a 54 são as meninas e de 55 a 90, os
meninos.
3º Passo
Realizamos o sorteio dos números para escolher as 5 meninas e os 4 meninos.
13 41 25 37 52
61 55 72 85 ---------------
2.3 Distribuição de frequências
Nesse tópico vamos compreender e realizar a organização dos dados realizando a
distribuição de frequências.
Denominamos frequência o número de elementos que fica relacionado a um
determinado valor da variável. A tabela que apresenta os dados organizados utilizando
as frequências é chamada de distribuição de frequências.
22
Exemplo
23
Resolução
Conclusão
Neste bloco, estudamos os princípios básicos de estatística, conhecendo as regras de
arredondamento de dados, População e Amostra, os tipos de variáveis, representação
de dados amostrais e concluímos com Distribuição de Frequências.
24
REFERÊNCIAS
CRESPO, A. A. Estatística fácil. São Paulo: Saraiva, 2009.
DANTE, L. R. Matemática. São Paulo: Ática, 2009. V. único.
DOWNING, D.; CLARK, J. Estatística aplicada. São Paulo: Saraiva, 2011.
LEVIN, J.; FOX, J. A.; FORDE, D. R. Estatística para ciências humanas. São Paulo: Pearson,
2014.
SMOLE, K. C. S. Matemática. São Paulo: Saraiva, 1999. v. 1.
______.; DINIZ, M. I. Matemática Ensino Médio. São Paulo: Saraiva, 2003. v. 1.
25
3 GRÁFICOS ESTATÍSTICOS
Neste bloco, estudaremos uma ferramenta muito importante da Estatística, onde os
dados coletados em determinada pesquisa são representados por meio de gráficos.
Por isso, vamos conhecer os tipos de gráficos, passando pelo Histograma e Polígono de
Frequência e concluímos esse bloco com o Digrama de Ramo-e-folhas.
3.1 Tipos de gráficos
Nesse momento será possível entender que o gráfico estatístico é uma ferramenta que
apresenta os dados estatísticos, colaborando para uma melhor compreensão do
fenômeno em estudo.
3.2 Histograma e polígono de frequência
Nesse tópico vamos desenvolver e compreender os dados representados em
histograma e polígono de frequência.
Histograma
Por definição temos que o histograma é um tipo de gráfico formado por retângulos
justapostos, onde cada base fica localizada sobre o eixo horizontal, e dessa forma,
seus pontos médios coincidem com os pontos médios dos intervalos de classe.
26
Exemplos
1. Veja um exemplo de histograma:
2. Apresente um histograma utilizando os dados da tabela a seguir.
Resolução:
27
Polígono de frequência
O polígono de frequência é um gráfico em linhas, sendo as frequências marcadas sobre
perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de
classe.
Veja um exemplo:
Exemplo
Apresente o polígono de frequência para os dados da tabela a seguir:
Resolução:
28
3.3 Diagrama de Ramo-e-folhas
Por definição temos que um diagrama de ramo-e-folhas é um gráfico de frequências
construído para pontos amostrais de dois ou três algarismos, onde utilizamos o último
algarismo como um contador para a classe de frequência correspondente aos algarismos
iniciais. Em geral, os gráficos ramo-e-folhas são traçados com o ramo (algarismos iniciais)
disposto verticalmente, e os últimos algarismos (que formam as folhas) dispostos
horizontalmente. É normal identificar o comprimento de cada folha informando à esquerda do
ramo.
Exemplo:
(3) 3 147
(5) 4 35679
(2) 6 28
(1) 8 5
Exemplo
1. Um professor aplicou uma atividade para 25 alunos. Os valores a seguir são as notas
dos alunos:
24 79 98 47 45
27 48 59 58 62
61 73 92 49 55
57 61 69 65 91
74 64 63 28 77
Apresente um diagrama de Ramo-e-folhas para representar as notas desses alunos.
29
Resolução
1º Passo
Identifique o primeiro algarismo de cada número, gerando o ramo:
2
4
5
6
7
9
2º Passo
Identifique o segundo algarismo de cada número, gerando as folhas:
2 478
4 8795
5 7985
6 1149352
7 4937
9 821
30
3º Passo
Informamos a frequência de cada linha, concluindo a construção do Diagrama de
Ramo-e-folhas para os dados apresentados:
(3) 2 478
(4) 4 8795
(4) 5 7985
(7) 6 1149352
(4) 7 4937
(3) 9 821
Conclusão
Neste bloco, estudamos os tipos de gráficos, uma ferramenta muito importante na
Estatística, conhecemos o Histograma e Polígono de Frequência e concluímos esse
bloco com o Digrama de Ramo-e-folhas.
REFERÊNCIAS
CRESPO, A. A. Estatística fácil. São Paulo: Saraiva, 2009.
DANTE, L. R. Matemática. São Paulo: Ática, 2009. V. único.
DOWNING, D.; CLARK, J. Estatística aplicada. São Paulo: Saraiva, 2011.
LEVIN, J.; FOX, J. A.; FORDE, D. R. Estatística para ciências humanas. São Paulo: Pearson,
2014.
SMOLE, K. C. S. Matemática. São Paulo: Saraiva, 1999. v. 1.
______.; DINIZ, M. I. Matemática Ensino Médio. São Paulo: Saraiva, 2003. v. 1.
31
4 MEDIDAS
Neste bloco, estudaremos os métodos para calcular a média aritmética simples, a
mediana, a moda e os quatis, que são as medidas de posição.
Dando sequência aos nossos estudos, vamosconhecer as medidas de dispersão,
ferramenta fundamental na Estatística, sendo assim, o cálculo de Amplitude Total,
Variância, Desvio padrão, Coeficiente de Variação e intervalos interquartil, estarão
complementando nossos estudos.
4.1 Medidas de posição – média, mediana, moda e quartil
Média Aritmética Simples ou Média - x
Para dados não agrupados é a soma dos valores da variável dividida pelo total de
observações.
Exemplo:
Após realização de uma pesquisa sobre qual quantia, em reais, cada pessoa estava
disposta a pagar em um lanche de rua, foram coletados os valores: 9, 13, 6, 12 e 5.
Qual é a média referente os valores coletados?
32
Para dados agrupados:
Mediana (md)
Para dados não agrupados: é o valor da variável que ocupa a posição central dos dados
ordenados.
Exemplo:
Calcular a mediana dos valores 9, 12, 8, 6, 14, 11, 5.
Primeiro: coloque os números em ordem, seja, crescente ou decrescente.
5, 6, 8, 9, 11, 12, 14
Segundo: se o número de elementos é ímpar, temos como mediana o único elemento
central: md = 9
Outro caso
Calcular a mediana dos valores 9, 12, 8, 6, 14, 11.
Primeiro: coloque os números em ordem, seja, crescente ou decrescente.
6, 8, 9, 11, 12, 14
33
Depois, calculamos a média dos dois valores centrais, por se tratar de quantidade par
de elementos:
Para dados agrupados
Exemplo
34
Moda (mo)
Para dados não agrupados: é o valor da variável mais frequente da distribuição.
Exemplo
1. Determine a moda para o seguinte conjunto de dados:
65, 87, 49, 58, 65, 60, 80, 65, 90
mo = 65 (por aparecer 3 vezes)
35
2. Determine a moda para o seguinte conjunto de dados:
65, 80, 87, 49, 58, 65, 80, 65, 90, 80,
mo = 65 (por aparecer 3 vezes)
mo = 80 (por aparecer 3 vezes)
Temos duas modas, sendo uma distribuição bimodal.
Para dados agrupados
Exemplo
36
Os quartis
Temos como definição que os quartis são os valores de uma série que a dividem em
quatro partes iguais.
Existem três quartis
Primeiro quartil Q1 – valor situado de tal modo na série que 25% dos dados são
menores que ele e 75% restantes são maiores.
Segundo quartil Q2 – coincide com a mediana.
Terceiro quartil Q3 – valor situado de tal modo na série que 75% dos dados são
menores que ele e 25% restantes são maiores.
Para determinar cada quartil trabalhamos da seguinte maneira:
37
Exemplo:
38
4.2 Medidas de dispersão – amplitude, variância e desvio padrão
As medidas de dispersão servem para quantificar a variabilidade dos valores da
variável, isto é, a dispersão dos dados, ou a forma como os valores de cada conjunto se
espalha ao redor das medidas de tendência central.
Exemplo
Valores de duas carteiras de ações na Bolsa de Valores:
A média em ambas carteiras, x = R$ 1,50
Mediana da carteira A, md = R$ 1,50
Mediana da carteira B, md = R$ 1,51
39
Observando os dados pelo gráfico a seguir, é possível identificar uma maior oscilação
da carteira A comparando com a carteira B, mostrando que um investidor mais
conservador iria optar pela carteira B, por apresentar uma menor oscilação de valores
dentro do período apresentado.
Além do gráfico podemos utilizar a Medida de Dispersão para estudar a variabilidade
entre os valores.
Amplitude total (R)
Diferença entre o maior e o menor valor de um conjunto de dados.
Variância (σ² ou S²)
É um estudo sobre os desvios em torno da média aritmética, determinando a média
dos quadrados dos desvios.
)()²(² alpopulacion
n
xxs i −Σ
=
)(
1
)²(² amostral
n
xxs i
−
−Σ
=
40
Propriedades
1. Somando ou subtraindo um valor constante k a todos os valores de uma variável, o
desvio padrão não altera.
2. Multiplicando todos os valores de uma variável por uma constante k não nula, o
desvio padrão fica multiplicado por essa constante k.
41
Exemplo
Calcule a amplitude total, variância, desvio padrão e coeficiente de variação para a
variável Idade da tabela a seguir:
Acrescentamos uma nova coluna para colaborar:
Amplitude total
42
43
4.3 Medidas de dispersão – intervalo interquartil e coeficiente de
variação
Na estatística trabalhamos com dados que por sua vez precisam de interpretações,
onde conhecer a medida de posição (média aritmética, mediana ou moda) não é o
suficiente para uma análise mais ampla.
Dessa forma, chamando de dispersão ou variabilidade a maior ou a menor
diversificação dos valores de uma variável em torno de um valor de tendência central
tomado como ponto de comparação, a Estatística recorre às medidas de dispersão ou
de variabilidade.
Nesse tópico vamos estudar o intervalo interquartil e o coeficiente de variação.
Intervalo interquartil
Outra ferramenta útil para calcular uma medida de variabilidade é conhecida como
variação interquartil ou intervalo interquartil (IQR, do inglês inter-quartile range), onde
podemos afirmar que quanto maior a IQR, maior a distribuição ou a variabilidade.
A IQR é obtida por meio do cálculo:
IQR = Q3 – Q1
É a diferença entre o primeiro e o terceiro quartis.
Por definição, temos que a variação de interquartil inclui 50% de valores do meio na
distribuição quando estes são organizados em ordem crescente ou decrescente. Isso
acontece, pois:
44
Primeiro quartil Q1 – valor situado de tal modo na série que 25% dos dados são
menores que ele e 75% restantes são maiores.
Segundo quartil Q2 – coincide com a mediana.
Terceiro quartil Q3 – valor situado de tal modo na série que 75% dos dados são
menores que ele e 25% restantes são maiores.
Exemplo
Considere as 20 notas a seguir, obtidas em uma prova de Gestão de Negócios:
1º Passo
Encontramos Q1 e Q3
Posição de Q3 = 0,75 . (20 + 1) = 15,75
Posição de Q1 = 0,25 . (20 + 1) = 5,25
5,63
2
65621 =
+
=Q
5,84
2
85843 =
+
=Q
45
2º Passo
Calculamos IQR:
IQR = Q3 – Q1
IQR = 84,5 – 63,5 = 21
Portanto, a variação interquartil é igual a 21.
Coeficiente de variação
O Coeficiente de Variação é um cálculo que colabora no estudo de medida de
dispersão, sendo indicado como CV:
%100.
x
sCV =
Onde s é o desvio padrão e x representa a média aritmética dos valores.
Exemplo:
Tomemos os resultados das medidas das estaturas das massas de um mesmo grupo de
indivíduos:
média Desvio padrão
Estaturas (em cm) 175 5,0
Massas (em kg) 68 2,0
Verifique qual variável apresenta maior grau de dispersão.
Resolução
%86,2%100.
175
5
≅=ECV - Coeficiente de variação para a variável Estatura em cm.
%94,2%100.
68
2
≅=MCV - Coeficiente de variação para a variável Massa em kg.
46
Portanto, podemos afirmar que para esse grupo de indivíduos, as massas apresentam
maior grau de dispersão que as estaturas.
Conclusão
Neste bloco, estudamos a média aritmética simples, a mediana, a moda e os quatis,
que são as medidas de posição, que são chamadas de medidas de posição. E
completamos nossos estudos desse bloco conhecendo as medidas de dispersão, que
são Amplitude Total, Variância, Desvio padrão, Coeficiente de Variação e intervalos
interquartil.
REFERÊNCIAS
CRESPO, A. A. Estatística Fácil. São Paulo: Saraiva, 2009.
DANTE, L. R. Matemática. São Paulo: Ática, 2009. V. único.
DOWNING, D.; CLARK, J. Estatística aplicada. São Paulo: Saraiva, 2011.
LEVIN, J.; FOX, J. A.; FORDE, D. R. Estatística para ciências humanas. São Paulo: Pearson,
2014.
SMOLE, K. C. S. Matemática. São Paulo: Saraiva, 1999. v. 1.
______.; DINIZ, M. I. Matemática Ensino Médio. São Paulo: Saraiva, 2003. v. 1.
47
5 TESTE DE HIPÓTESE
Neste bloco, estudaremos o Teste de Hipótese, conhecendo a Aplicação de Teste de
Hipóteseapós definições da Hipótese Nula e Hipótese Alternativa, passando pelas
possibilidades para teste de hipóteses e complementando com os Erros do Tipo 1 e
Tipo 2.
Ainda nesse bloco, teremos a oportunidade de estudar a Significância e poder do Teste
de hipótese e concluímos esse momento com o Intervalo de confiança para média
populacional.
5.1 Aplicação de Teste de Hipótese
A Hipótese Nula (H0) e a Hipótese Alternativa (Ha)
Nesse momento teremos a oportunidade de estudar o teste de hipóteses, sendo um
conteúdo teórico, mas fundamental para realizar um estudo profundo e detalhado
com os dados coletados em uma determinada pesquisa.
Podemos pensar que ao trabalhar com duas amostras extraídas da mesma população,
onde a média (M1) da amostra A ser diferente da média (M2) referente amostra B, será
que esta diferença é consequência da casualidade na escolha da amostra, ou será que
esta diferença representa a diferença entre os dois grupos pesquisados?
Dessa forma, ocorrem duas hipóteses:
Hipótese Nula (H0): Não há diferença entre as médias. Considerando a diferença
apresentada como um erro amostral. Onde M1 = M2.
Hipótese Alternativa (Ha): Existe uma diferença entre as médias. Implicando em os
grupos A e B serem diferentes mediante algum fator ou até mesmo por serem
amostras de populações diferentes. Onde M1 ≠ M2.
48
Possibilidades para teste de hipóteses
Uma hipótese estatística que contém uma afirmação indicada pelos sinais = (igual), ≥
(maior ou igual) ou ≤ (menor ou igual) é denominada Hipótese Nula (H0).
Se, para toda afirmação existe um complemento, temos que para uma Hipótese Nula
existe uma Hipótese Alternativa (Ha ou H1), em outras palavras, para a Hipótese Nula
ser falsa a Hipótese Alternativa precisa ser verdadeira, ou para H0 ser verdadeira logo
Ha é falsa. Em Ha temos os sinais ≠ (diferente), > (maior) ou < (menor).
Esquema para estudar as hipóteses, onde µ representa a média populacional e k é um
número real:
≠
=
kH
kH
a µ
µ
:
:0 Teste bilateral
>
=
kH
kH
a µ
µ
:
:0 Teste unilateral
49
<
=
kH
kH
a µ
µ
:
:0 Teste unilateral
<
≥
kH
kH
a µ
µ
:
:0 Teste unilateral
>
≤
kH
kH
a µ
µ
:
:0 Teste unilateral
50
Erros do Tipo 1 e Tipo 2
Estudando as duas hipóteses (H0 e Ha) concluímos que podemos acertar de duas
maneiras, seja aceitando a hipótese quando ela é verdadeira, ou rejeitando-a quando
ela é falsa. Por outro lado, temos duas possibilidades de estarmos errados: rejeitando
a hipótese quando ela é verdadeira, ou aceitando-a quando ela é falsa. No primeiro
caso temos o Erro Tipo 1 e no segundo caso temos o Erro Tipo 2. Observe a tabela:
5.2 Significância e poder do Teste de hipótese
A leitura indicada aborda uma explicação sobre níveis de significância e o poder do
Teste de Hipótese, sendo uma ferramenta da estatística para verificar o resultado da
diferença de uma população real e um erro amostral.
5.3 Intervalo de confiança para média populacional
Nesse tópico o objetivo será compreender e desenvolver os cálculos para determinar o
intervalo de confiança para média populacional.
51
A média populacional
A média populacional (μ) é á média aritmética determinada pelos dados envolvendo
toda a POPULAÇÃO da pesquisa!
Em muitos casos isso é impossível de ter a plena certeza, sendo assim, trabalhamos
com:
30.;. ≤⇒
+−∈ n
n
stx
n
stxµ
Usar tabela de distribuição t
30.;. >⇒
+−∈ n
n
szx
n
szxµ
Usar tabela de distribuição normal
Exemplos
1. Em uma determinada fábrica, o tempo médio, por operário, para realizar uma
tarefa, estava em 92 minutos. Após treinamentos específicos foi constatada uma
diminuição nesse tempo, e a prova disso foi um novo estudo com 81 funcionários. O
novo tempo médio foi de 84 minutos e o desvio padrão foi de 9 minutos.
Considerando um nível de confiança de 95%, podemos declarar que os resultados
trazem evidências estatísticas da melhora desejada?
Resolução
52
Para determinar o valor de z seguimos esse passo a passo:
53
2. O instituto de pesquisa Power informou que o preço médio do produto A, na cidade
X, é de R$ 14,50. Com o objetivo de verificar a informação, outro instituto selecionou
uma amostra de 8 estabelecimentos da cidade X, constatando os valores a seguir:
R$ 15,80, R$ 16,20, R$ 15,40, R$ 16,10, R$ 14,60, R$ 15,10, R$ 15,40 e R$ 15,40.
Trabalhando com 95% de confiança, use as evidências estatísticas para determinar se a
afirmação do Instituto Power está correta.
Resolução:
54
Conclusão
Neste bloco, estudamos o Teste de Hipótese, passando pela Aplicação de Teste de
Hipótese, as definições da Hipótese Nula e Hipótese Alternativa, possibilidades para
teste de hipóteses, os Erros do Tipo 1 e Tipo 2, a Significância e poder do Teste de
Hipótese e concluímos com o Intervalo de confiança para média populacional.
REFERÊNCIAS
CRESPO, A. A. Estatística fácil. São Paulo: Saraiva, 2009.
DANTE, L. R. Matemática. São Paulo: Ática, 2009. v. único.
DOWNING, D.; CLARK, J. Estatística aplicada. São Paulo: Saraiva, 2011.
LEVIN, J.; FOX, J. A.; FORDE, D. R. Estatística para ciências humanas. São Paulo: Pearson,
2014.
SMOLE, K. C. S. Matemática. São Paulo: Saraiva, 1999. v. 1.
SMOLE, K. C. S.; DINIZ, M. I. Matemática Ensino Médio. São Paulo: Saraiva, 2003. v. 1.
55
6 FERRAMENTAS ESTATÍSTICAS
Neste último bloco, estudaremos a comparação entre duas médias, realizando uma
análise de variância, coeficiente de correlação de Pearson, compreendendo a
correlação entre duas variáveis, ainda a Regressão Linear e concluímos com a aplicação
das funções estatísticas do MS Excel.
6.1 Comparação entre duas médias e análise de variância
Nesse momento teremos a oportunidade de estudar a comparação entre duas médias
e análise de variância, mais uma ferramenta estatística para comparar os dados
apresentados em uma determinada pesquisa.
6.2 Coeficiente de correlação de Pearson
Correlação
Na estatística existe a necessidade de comparar dados de variáveis que possuem
unidades diferentes, como peso e altura, uso do cigarro e incidência de câncer, e
nesses casos, sendo a relação entre as variáveis de natureza quantitativa, utilizamos a
correlação como um instrumento adequado para calcular e realizar a comparação
entre as variáveis.
Portanto, quando duas variáveis estão ligadas por uma relação estatística, podemos
afirmar que existe uma correlação entre elas.
56
Diagrama de Dispersão
Nesse momento vamos analisar um exemplo de diagrama de dispersão.
A tabela a seguir apresenta notas de 10 alunos de uma turma formada por 78 alunos.
Considerando as notas de Física como ix e as notas de Cálculo como iy , geramos os
pares ordenados dados por ( ix , iy ) e dessa forma temos o diagrama de dispersão:
57
Correlação linear
Uma correlação pode ser:
i. linear positiva - isso ocorre quando os pontos do diagrama de dispersão têm como
“imagem” uma reta ascendente, como uma função linear crescente.
ii. linear negativa - isso ocorre quando os pontos do diagrama de dispersão têm como
“imagem” uma reta descedente, como uma função linear decrescente.
58
iii. não linear – isso ocorre quando os pontos do diagrama de dispersão têm como
“imagem” uma curva.
Coeficiente de correlação de Pearson
O coeficiente de correlação de Pearson (r) é uma ferramenta da Estatística para
calcular o grau de intensidade da correlação entre duas variáveis, indicando o sentido
dessa correlação como positiva ou negativa.
A fórmula para calcular o coeficiente de correlação de Pearson é:
( )( )
( )[ ] ( )[ ]2222 ...
..
∑∑∑ ∑
∑ ∑∑
−−
−
=
iiii
iiiiyynxxn
yxyxn
r , onde n é o número de observações.
Para ser possível descrever uma relação por meio do coeficiente de correlação de
Pearson é fundamental que a mesma se aproxime de uma função linear. Dessa forma
podemos afirmar que:
i. o valor de r pertence ao intervalo [-1; +1];
ii. sendo r = +1, há uma correlação perfeita e positiva entre as variáveis;
iii. sendo r = -1, há uma correlação perfeita e negativa entre as variáveis;
iv. sendo r = 0, isso indica que não há correlação entre as variáveis ou a relação entre
as variáveis não é linear.
v. se 6,03,0 <≤ r , há uma correlação relativamente fraca entre as variáveis;
59
vi. se 3,00 << r , há uma correlação é muito fraca, onde será impossível apresentar
uma conclusão sobre a relação entre as variáveis em estudo.
6.3 Regressão linear
Regressão linear
O trabalho com Regressão Linear tem como objetivo desenvolver um estudo sobre a
relação de duas variáveis partindo de n observações das mesmas. Esse tópico na
Estatística é chamado de análise de regressão, onde construímos por aproximação
uma linha reta, gerando um determinado patrão, ou conjunto, de pontos que indicam
uma relação entre as duas variáveis em estudo.
Dessa forma, sejam duas variáveis X (variável independente) e Y (variável dependente),
entre as quais exista uma correlação acentuada, e mesmo que não perfeita, mas sendo
uma correlação retilínea, de modo que é possível ajustar uma reta, sendo uma imagem
para a função dada por:
Y = a . X + b
Onde:
( )∑ ∑
∑ ∑ ∑
−
−
= 22.
...
ii
iiii
xxn
yxyxn
a e xayb .−=
n é o número de observações, x é a média de ix e y é a média de iy .
E para construir a reta após determinar a função Y = a . X + b, basta determinar dois
pontos distintos, pois dois pontos distintos determinam uma única reta pelo axioma da
Geometria Euclidiana.
60
Exemplo
A tabela a seguir apresenta notas de 10 alunos de uma turma formada por 78 alunos.
Apresente a função que determina a Regressão Linear para as notas dos alunos da
tabela.
Resolução:
1º Passo, adicionamos duas colunas na tabela anterior:
61
2º Passo, calculamos as médias:
5,6
10
65
==x
5,6
10
65
==y
3º Passo, determinamos o valor de a:
( )
8632,0
585
505
42254810
42254730
²65481.10
65.65473.10
.
...
22
≅=
−
−
=⇔
−
−
=⇒
−
−
=
∑ ∑
∑ ∑ ∑ aa
xxn
yxyxn
a
ii
iiii
4º Passo, determinamos o valor de b:
8892,05,6.8632,05,6. =−=⇒−= bxayb
Para facilitar a construção do gráfico podemos arredondar os valores de a e b:
a = 0,86 e b = 0,89
5º Passo, determinamos a função:
Y = a . X + b
Onde Ŷ assume o papel de estimativa para a verdadeira equação da regressão linear,
temos:
89,0.86,0ˆ += XY
62
6º Passo, determinamos os dois pontos distintos atribuindo dois valores para X:
7° Passo, construímos a reta que representa a Regressão Linear no diagrama de
dispersão das variáveis:
Portanto, a Regressão Linear gerada é uma reta que está entre os pontos do diagrama
de dispersão.
6.4 Aplicação das funções estatísticas do MS Excel
Na Estatística existem inúmeras funções matemáticas que denominamos como
Funções Estatísticas.
Exemplos: Medidas de Posição: média, mediana e moda; Medidas de Dispersão:
amplitude, variância, desvio padrão, coeficiente de variação e Intervalo de confiança.
Nesse momento vamos utilizar o MS Excel para determinar algumas dessas funções
utilizando suas respectivas fórmulas.
Microsoft Office Excel é um editor de planilhas produzido pela Microsoft. Trabalhando
com esse office podemos realizar inúmeras tarefas envolvendo cálculos, construção de
tabelas e gráficos.
63
Função média aritmética:
Função mediana:
Função moda:
64
Agora, sem precisar fazer um passo a passo, é possível calcular e determinar essas e
outras funções utilizando a ferramenta Análise de Dados do MS Excel.
Em seguida:
65
E concluímos com a tabela que apresenta o resumo das funções:
Portanto, podemos afirmar que o MS Excel é uma ferramenta muito importante para
desenvolver inúmeras tarefas da Estatística, mas não podemos nos esquecer da
necessidade de dominar e compreender os métodos estudados sem o uso desse
programa.
66
Conclusão
Neste bloco, estudamos a comparação entre duas médias, a análise de variância,
coeficiente de correlação de Pearson, a correlação entre duas variáveis, a Regressão
Linear e concluímos com a aplicação das funções estatísticas do MS Excel.
REFERÊNCIAS
CRESPO, A. A. Estatística Fácil. São Paulo: Saraiva, 2009.
DANTE, L. R. Matemática. São Paulo: Ática, 2009. v. único.
DOWNING, D.; CLARK, J. Estatística Aplicada. São Paulo: Saraiva, 2011.
LEVIN, J.; FOX, J. A.; FORDE, D. R. Estatística para ciências humanas. São Paulo: Pearson,
2014.
SMOLE, K. C. S. Matemática. São Paulo: Saraiva, 1999. v. 1.
______.; DINIZ, M. I. Matemática Ensino Médio. São Paulo: Saraiva, 2003. v. 1.