Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Prévia do material em texto

ESTATÍSTICA
	É o conjunto de métodos e técnicas adotados para o planejamento, coleta, organização, apresentação, análise e interpretação de dados. Ela pode ser dividida em estatística descritiva e inferência estatística.
A estatística descritiva procura descrever e analisar um certo fenômeno. É responsável pela coleta, organização e descrição dos dados. A inferência estatística procura chegar à conclusões a partir da análise dos dados e em que condições essas conclusões foram obtidas.
	O aspecto essencial da Estatística é o de proporcionar métodos inferenciais, que permitam conclusões que transcendam aos dados obtidos inicialmente.
	Convencionou-se chamar de Bioestatística o conjunto de métodos estatísticos usados no tratamento da variabilidade nas ciências médicas e biológicas. (SOARES e SIQUEIRA, 1999). 
CONCEITOS BÁSICOS
POPULAÇÃO é o conjunto de todos os elementos envolvidos no fenômeno a ser estudado, ou seja, é o conjunto de todos os elementos que tem determinadas características em comum e pré-determinadas. 
AMOSTRA é um conjunto finito de uma população, ou seja, é o conjunto dos elementos da população escolhidos para a realização de um estudo. A amostra escolhida deve possuir as mesmas característica da população de origem, isto é, deve ser representativa.
VARIÁVEL é o conjunto de todos os resultados possíveis de um fenômeno. É o que se quer conhecer sobre o fenômeno. As variáveis podem ser classificadas em:
1. Qualitativas: quando seus valores são expressos por atributos, características não numéricas. Podem ser:
- Nominal: agrupam as variáveis por mostrar semelhanças ou diferenças em relação a uma qualidade ou característica. Exemplo: cor da pele, sexo.
- Ordinal: quando os dados têm uma ordenação natural. Exemplo: grau de instrução, estágio de uma doença.
2. Quantitativas: quando seus valores são expressos por números. Podem ser:
- Discretas: só assumem valores pertencentes a um conjunto finito, enumerável. Exemplos: número de filhos, número de animais de um rebanho, número de sacos de um cereal.
- Contínuas: resultam de números infinitos de valores possíveis que podem ser associados a pontos em uma escala. Podem assumir quaisquer valores entre dois limites. Exemplos: peso, estatura.
PARÂMETRO: é um valor que resume, na população, a informação relativa a uma variável. Os parâmetros são difíceis de serem obtidos pois implicam o estudo de toda a população.
AMOSTRAGEM
	Quando são coletadas informações de toda a população, diz-se que foi feito um recenseamento. Censo é o conjunto de dados obtidos através de recenseamento.
 Quando são coletadas informações de apenas uma parte da população, diz-se que foi feita uma amostragem. Amostra é tanto a parte retirada da população para estudo como, também, o conjunto de dados obtidos dessa parte da população.
	A principal qualidade de uma amostragem é a sua representatividade, que corresponde a ela ter ou reproduzir as mesmas propriedades da população considerada. 
	O levantamento por amostragem, quando comparado com o levantamento total, apresenta as seguintes vantagens:
- menor custo;
- resultados em menor tempo;
- objetivos mais amplos e 
- dados mais fidedignos.
ETAPAS DE UM LEVANTAMENTO POR AMOSTRAGEM
1ª Explicitação dos objetivos com bastante clareza, a fim de evitar dúvidas ou esquecimentos, devendo ficar bem definida a unidade de análise a ser trabalhada.
2ª Definição da população a ser amostrada.
3ª Escolha das variáveis a serem observadas (os dados colhidos devem ser relevantes para a pesquisa).
4ª Especificação do grau de precisão desejado. 
5ª Escolha dos instrumentos de medida e da forma de abordagem.
6ª Escolha da unidade amostral. Uma unidade amostral pode ser o próprio elemento de estudo (criança, cobaia) ou um conjunto de elementos (classe). As unidades amostrais devem cobrir toda a população. À lista de unidades amostrais chama-se sistema de referência ou fundamentos da pesquisa.
7ª Execução de prova experimental. É a testagem dos instrumentos de medidas, questionários, pessoal de campo. Orienta os reajustes necessários e pode dar informações sobre a duração e custo da pesquisa e ainda indicações da variabilidade do fenômeno pesquisado, facilitando o cálculo da amostra.
8ª Seleção da amostra, após decidido qual deve ser seu tamanho.
TIPOS DE AMOSTRAGEM
	São as maneiras adotadas para escolher os elementos que irão compor a amostra. Conforme a técnica utilizada as amostras podem ser:
Amostra casual simples ou aleatória: é aquela formada por elementos retirados ao acaso da população, normalmente através de sorteio. Sua importância se deve ao fato de todos os elementos da população terem a mesma probabilidade de ser coletados.
Amostra sistemática: os elementos são escolhidos por meio de um sistema. Por exemplo, os alunos com números de inscrição terminados em zero. Esta técnica é adotada preferencialmente quando a população se encontra organizada.
Amostra estratificada: é utilizada quando dispomos de informações de que a população apresenta características heterogêneas; a população heterogênea é transformada em sub populações homogêneas que têm o nome de estratos (os estratos devem ser mutuamente exclusivos). O tamanho do estrato será determinado em função da variância da característica a estudar em cada estrato ou então deve-se considerar o número de elementos da população e calcular um percentual ( estratificada proporcional).
Amostra de conveniência: é formada por elementos que o pesquisador reuniu simplesmente porque dispunha deles. Os estatísticos têm muitas restrições ao seu uso, mas mesmo assim, elas são muito comuns na área da saúde.
Amostra por área: utiliza mapas geográficos de cidades, estados, etc. As unidades que comporão a amostra serão sorteadas em função da variabilidade existente. A população é dividida em seções, em seguida escolhe-se algumas dessas seções e, finalmente, tomam-se todos os elementos das seções escolhidas.
O pesquisador que trabalha com amostras sempre pretende fazer inferência, isto é, estender os resultados da amostra para toda a população. Então é muito importante caracterizar bem a amostra e estender os resultados obtidos na amostra apenas a população de onde a amostra proveio.
MÉTODO ESTATÍSTICO
É o conjunto de meios usados para atingir um resultado quando não é possível manter as causas, que influem em um fenômeno, constantes. Nele, as causas presentes são admitidas e variadas, registrando-se as variações e procurando determinar as influências de cada uma delas para o resultado final.
FASES DO MÉTODO ESTATÍSTICO
1ª Coleta de dados: após a determinação das características mensuráveis do fenômeno que se quer pesquisar inicia-se a coleta de dados necessários à sua descrição.
A coleta pode ser direta ou indireta. A coleta é direta quando feita sobre elementos informativos de registro obrigatório (nascimentos, óbitos), ou quando os dados são coletados pelo próprio pesquisador através de inquéritos e questionários.
A coleta é indireta quando feita a partir de elementos conhecidos (coleta direta) ou do conhecimento de outros fenômenos relacionados com o fenômeno estudado.
Quanto ao fator tempo, a coleta pode ser:
- contínua: quando feita continuamente, tal como a de nascimentos e óbitos;
- periódica: quando feita em intervalos constantes de tempo, como os censos e as avaliações mensais dos alunos;
- ocasional: quando feita extemporaneamente, a fim de atender a uma conjuntura ou a uma emergência, como nos casos de epidemias.
2ª Crítica dos dados: os dados devem ser cuidadosamente analisados à procura de possíveis falhas e imperfeições, a fim de que não se incorra em erros que possam influir nos resultados.
	A crítica é externa quando visa às causas dos erros por parte do informante, por distração ou má interpretação das perguntas que lhe foram feitas; é interna quando visa observar os elementos originais dos dados coletados.
3ª Apuração dos dados:é a soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação. A apuração pode ser total ou parcial, simples ou cruzada.
4ª Apresentação dos dados: os dados devem ser apresentados sob forma de tabelas ou gráficos, tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico para posterior obtenção de medidas.
5ª Análise dos resultados: é a elaboração de conclusões a partir do trabalho realizado. Não existe um critério a ser utilizado, e sim que o analisador tenha muita sensibilidade com os dados que ora estão sendo manipulados.
 
Exercícios
Estabeleça a população e a amostra nos seguintes casos. Identifique o tipo de amostragem utilizado.
Um sociólogo seleciona 30 homens e 30 mulheres das turmas da área da saúde, da universidade na qual trabalha, para conhecer suas opiniões sobre uso de embriões em pesquisas científicas.
Um médico veterinário escolhe, aleatoriamente, cinco dos portadores de sinomose internados no hospital, no qual trabalha, para tomar conhecimento sobre drogas usadas no combate à doença.
Obtém-se uma amostra de um produto extraindo-se cada 50ª unidade da linha de produção. Deseja-se determinar a porcentagem de cada componente da fórmula por unidade produzida.
Um enfermeiro utiliza as fichas dos prontuários do hospital, no qual trabalha, onde os nomes dos pacientes estão organizados em ordem alfabética, e toma o 4º de cada paciente atendido, visando conhecer os procedimentos clínicos adotados nos seus tratamentos. 
Querendo obter informações sobre o fator determinante na escolha de ração canina, um pesquisador distribuiu 300 questionários aleatoriamente, na saída de um grande hipermercado.
Classifique as variáveis em qualitativas (ordinal ou nominal) ou quantitativas (discreta ou contínua).
cor dos olhos 
salários 
quantidade de ração, em gramas, ingeridas por cães
número de crias de uma vaca
peso de um bezerro
tipo sanguíneo 
raça
religião
profissão
volume de água contido num recipiente
Aberta e fechada são dois tipos de questões usadas no desenvolvimento de pesquisas. Uma questão aberta permite uma resposta livre, enquanto uma questão fechada comporta apenas uma resposta fixa. 
Observe os exemplos:
Questão aberta:
Na opinião do leitor, que se pode fazer para reduzir o crime?
Questão fechada:
Qual das seguintes medidas mais contribuiria para a redução da criminalidade?
( ) Contratar mais policiais
( ) Fazer com que os pais eduquem melhor os filhos
( ) Melhorar as condições sociais e econômicas nas favelas
( ) Ampliar os esforços para reabilitação nas cadeias
( ) Aplicar sentenças mais severas aos criminosos
Que tipo de questão é mais fácil de analisar com processos estatísticos formais? Por quê?
Faça o que se pede:
Havendo interesse em fazer um estudo que pudesse estabelecer a relação entre faixa salarial e conhecimento sobre produtos transgênicos, foi considerado um grupo de 1.800 pessoas. O quadro a seguir indica o número de pessoas por faixa salarial. Estratifique uma amostra com 225 pessoas.
	Faixa salarial
(salários mínimos)
	Número de pessoas
	Até 3 salários
	883
	De 3 a 6 salários
	479
	De 6 a 9 salários
	285
	Acima de 9 salários
	153
Comente os seguintes planos de amostragem, apontando incoerências, quando for o caso.
- Com a finalidade de estudar o perfil dos consumidores de uma loja de departamentos, observam-se os consumidores que comparecem a loja no último sábado do mês.
- Para avaliar a qualidade de um produto, observou-se um item, saído da linha de produção, a cada meia hora, durante um dia.
- Para fazer uma estimativa do número de empresas que investiram em novas tecnologias nos últimos dois anos, enviou-se um questionário a todas as empresas da região. A amostra foi formada pelas empresas que responderam ao questionário.
SÉRIE ESTATÍSTICA
	É a denominação dada a toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época (temporal ou evolutiva), do local (geográfica) ou da espécie (categórica).
Vendas do vermífugo X, Cruz Alta, 2004-09
	Ano
	Vendas (em R$1.000,00)
	2004
	5642
	2005
	7550
	2006
	10.009
	2007
	11.728
	2008
	18.873
	2009
	15.234
Vendas de computadores por Empresa, 2010 (Alagoinhas - Bahia)
	Empresa Controladora
	Número de computadores vendidos
	A
	279
	B
	321
	C
	194
	D
	112
	E
	228
Regime de trabalho dos profissionais da saúde - 2010 (Londrina)
	Regime de Trabalho
	Porcentagem (%)
	Horista
	29
	Tempo Parcial
	36
	Tempo Integral
	35
TABELA
É um tipo de quadro que resume um conjunto de observações. Os elementos que constituem uma tabela são:
- corpo: conjunto de linhas e colunas que contêm informações sobre a variável em estudo;
- cabeçalho: parte superior da tabela que especifica o conteúdo das colunas;
- casa: espaço destinado a um só número;
- título: conjunto de informações, as mais completas possíveis, respondendo às perguntas: o quê? quando? onde?, localizada no topo da tabela;
- total: deve ser sempre destacado de alguma forma;
- laterais da tabela: não devem ser fechadas. Caso se feche, passa a ser chamado QUADRO.
	Há ainda os elementos complementares que são: fonte, notas e chamadas colocados no rodapé.
- fonte: órgão que fornece os dados para a elaboração da tabela;
- notas: informações de natureza geral, que especificam qualquer critério utilizado na confecção da tabela;
- chamada: informações sobre determinada parte da tabela, servindo para esclarecer qualquer fato ocorrido em alguma casa ou linha.
	TÍTULO DA TABELA
	
CORPO DA TABELA
	RODAPÉ
De acordo com a Resolução nº 886 do IBGE, não pode existir casa em branco, portanto deve-se adotar os seguintes critérios:
- um traço horizontal (-) quando o valor é zero, não só quanto à natureza das coisas, como quanto ao resultado do inquérito;
- três pontos (...) quando não temos o dado;
- um ponto de interrogação (?) quando temos dúvida quanto à exatidão de determinado valor;
- parágrafo (#) quando o dado retifica informação anteriormente publicada;
- zero (0) quando o valor é muito pequeno para ser expresso pela unidade utilizada. Se os valores são expressos em numerais decimais, precisamos acrescentar à parte decimal de um número correspondente de zeros (0,0; 0,00;...)
GRÁFICOS ESTATÌSTICOS
	O gráfico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir uma impressão mais rápida e viva do fenômeno estudado.
	Existem normas nacionais para a construção de gráficos, ditadas pelo IBGE. Assim, todo gráfico deve apresentar título e escala. O título pode ser colocado tanto acima como abaixo do gráfico. As legendas explicativas devem ser colocadas, de preferência, à direita do gráfico.
	A representação gráfica deve obedecer a certos requisitos, que são:
simplicidade: o gráfico deve ser destituído de detalhes de importância secundária e de traços desnecessários;
clareza: deve permitir uma correta interpretação dos valores representativos do fenômeno em estudo;
veracidade: expressar a verdade sobre o fenômeno.
Os principais tipos de gráficos são:
DIAGRAMAS: são gráficos geométricos de, no máximo, duas dimensões; para sua construção, em geral, fazemos uso do sistema de coordenadas cartesianas.
REGRAS PARA A CONFECÇÃO DE DIAGRAMAS
1ª A primeira série de variáveis deverá ficar no eixo das abscissas (x) e a segunda no eixo das ordenadas (y).
2ª As escalas devem crescer da esquerda para a direita e de baixo para cima.
3ª As distâncias que indicam as unidades da escala devem ser rigorosamente uniformes.
4ª A linha que representa graficamente uma variável deve ser feita com traço mais forte do que as linhas auxiliares.
5ª Ao lado da escala da abscissa deve ser escrita a característicarelativa à mesma. Em cima da escala da ordenada deve constar a característica correspondente. 
	A razão da altura para a largura pode variar de 60 a 80% para que a figura tenha boas proporções.
6ª As linhas dos eixos coordenados devem ser em traço mais grosso que os demais eixos relativos às escalas.
7ª Toda a representação gráfica deve ter título, escala e fonte dos dados, de forma a dispensar qualquer esclarecimento adicional.
8ª A numeração dos gráficos, quando necessária, é feita utilizando-se algarismos arábicos. 
	Os tipos de diagramas são:
Gráfico em linha ou em curva: é a representação das funções num sistema de coordenadas cartesianas. Normalmente é usado quando trabalhamos com séries cronológicas (séries que envolvem o fator tempo). Os anos (tempos) devem ser marcados no eixo das abcissas (x) e as quantidades no eixo das ordenadas (y).
	Determinados todos os pontos da série a união das coordenadas nos dará uma poligonal em linha ou em curva.
	Para melhorar o aspecto visual do gráfico podemos hachurar ou sombrear o gráfico.
	Podemos representar dois fenômenos no mesmo gráfico. Nesse caso, teremos duas poligonais que deverão ser representadas de cores diferentes e será preciso colocar uma legenda dizendo o que cada uma representa.
	Se por alguma razão, for impossível indicar o “zero” e se essa omissão puder levar o observador a conclusões errôneas, é prudente chamar atenção para a omissão do mesmo.
Gráfico em barras ou em colunas: é usado para representar variáveis qualitativas ou quantitativas discretas. É a representação de uma série por meio de retângulos, dispostos verticalmente ou horizontalmente. Os comprimentos dos retângulos são proporcionais aos respectivos dados.
	Sempre que os dizeres a serem inscritos são extensos, deve-se dar preferência ao gráfico em colunas.
	As colunas ou barras devem ser desenhadas separadas e o espaço entre elas deve ficar em torno da metade da sua largura (altura)
Gráfico em barras duplas ou múltiplas: é empregado quando queremos representar, simultaneamente dois ou mais fenômenos com o propósito de comparação.
Gráfico em setores: é usado para representar variáveis qualitativas. É construído com base em um círculo, e empregado sempre que se deseja ressaltar a participação do dado em relação ao total.
	O total é representado pelo círculo que fica dividido em tantos setores quantos são os valores da variável. Os setores são proporcionais aos dados da série.
	Obtêm-se cada setor por meio de uma regra de três simples e direta, lembrando que o 100% da série corresponde ao 360°.
CARTOGRAMA: é a representação sobre uma carta geográfica. Tem o objetivo de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas
 
PICTOGRAMA: é a representação gráfica por meio de figuras. Na sua confecção tem-se que usar a criatividade para chamar a atenção do leitor.
DISTRIBUIÇÃO DE FREQUÊNCIAS
	É denominada frequência o número de vezes que cada variável aparece. Se for feita uma tabela relacionando a variável com a sua frequência tem-se uma distribuição de frequências.
	Elementos de uma distribuição de frequências
- classe: são intervalos de variação da variável. As classes são representadas simbolicamente por i, sendo i = 1, 2, 3, ..., k (onde k é o número total de classes da distribuição).
- limites de classes: são os extremos de cada classe. O menor é o limite inferior da classe (li) e o maior é o limite superior da classe (Li).
Os intervalos de classe devem ser escritos, segundo a Resolução 886/66 do IBGE, em termos de desta quantidade até menos aquela, empregando o símbolo |-- (inclusive li e sem Li). 
- amplitude de um intervalo de classe: é a medida do intervalo, ou seja, hi= Li – li
- amplitude total (At): é a diferença entre o limite superior da última classe e o inferior da primeira classe. Se as classes possuem o mesmo intervalo, então:
k = At/hi
- amplitude amostral (AA): é a diferença entre o valor máximo e o valor mínimo da amostra.
- ponto médio: é o ponto que divide o intervalo de classes em duas partes iguais,
 Xi = (li + Li) / 2. É o valor que representa a classe. 
- número de classes (i): para a determinação do número de classes de uma distribuição de frequências usa-se a regra de Sturges, que dá o número de classes em função do número de valores da variável.
 i = 1 + 3,3. log n, onde i é o número de classes e n é o total de dados
Decidido o número de classes temos que determinar a amplitude do intervalo de classe, o que conseguimos dividindo a amplitude total pelo número de classes (h = AT / i)
Tabela primitiva:
Rol
Tabela de distribuição de frequências sem intervalo de classes:
Tabela de distribuição de frequências com intervalos de classes:
TIPOS DE FREQUÊNCIAS
FREQUÊNCIA SIMPLES OU ABSOLUTA (fi) são os valores que representam o número de dados existentes em cada classe. A soma das frequências simples é sempre igual ao número total de dados.
FREQUÊNCIA RELATIVA (fri) são os valores obtidos através do cálculo das razões entre as frequências simples e a frequência total. Fri = fi / ∑fi
FREQUÊNCIA ACUMULADA (Fi) é o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma dada classe. Fi = f1 + f2 + ... + fk
FREQUÊNCIA ACUMULADA RELATIVA (Fri) é a frequência acumulada da classe, dividida pela frequência total da distribuição. Fri = Fi / ∑ fi
REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO DE FREQUÊNCIAS
HISTOGRAMA: é formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe.
	As larguras dos retângulos são iguais às amplitudes dos intervalos de classe, sendo a amplitude dos intervalos iguais. Isso nos permite tomar as alturas numericamente iguais às frequências.
POLIGONO DE FREQUÊNCIAS: é um gráfico em linha, sendo as frequências marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios de cada classe.
EXERCÍCIOS
1) De acordo com o IBGE (1988), em 1986 ocorreram, em acidentes de trânsito, 27.306 casos de vítimas fatais, assim distribuídos: 11.712 pedestres, 7.116 passageiros e 8.478 condutores. Faça uma tabela para apresentar esses dados e após um gráfico de setores.
2. Os dados abaixo representam 50 leituras de temperatura (°C) de um pasteurizador de leite. Organize-os em uma distribuição de frequências.
74,8 74,0 74,7 74,4 75,9 76,8 74,2 74,9 77,0 75,1
73,8 74,4 74,8 76,8 73,6 72,9 72,9 74,6 75,0 75,1
75,3 73,4 74,7 73,4 74,2 74,9 74,5 77,1 74,6 74,8
76,4 73,2 76,5 75,6 73,5 76,2 74,7 76,0 75,8 77,3
76,3 74,1 75,0 76,0 74,7 75,2 77,5 74,7 73,3 74,3
Dado o rol de medidas das alturas (dadas em cm) de uma amostra de 100 indivíduos de uma faculdade
determine:
a amplitude amostral;
o número de classes;
a amplitude de classes;
os limites de classes;
as frequências absolutas da classes;
as frequências relativas;
os pontos médios da classes;
as frequências acumuladas;
o histograma;
o polígono de frequências acumuladas.
Os dados seguintes representam 20 observações relativas ao índice pluviométrico em determinado município do Estado:
Milímetros de chuva
Construir a tabela de frequências absolutas simples;
Determinar as frequências absolutas acumuladas.
Construa uma tabela para mostrar que, de acordo com a Pesquisa Nacional por Amostra de Domicílios, PNAD, em 1992 havia no Brasil 73,1 milhões de pessoas com renda familiar mensal até 330 reais (pobres e miseráveis), 45 milhões de pessoas com renda familiar mensal de 330 reais até 1300 reais (emergentes) e 13,6 milhões de pessoas comrenda familiar mensal acima de 1300 reais (classe média e ricos). Apresente, também, percentuais.
 REVISÃO
População ou universo é:
Um conjunto de pessoas;
Um conjunto de elementos quaisquer
Um conjunto de pessoas com uma característica comum;
Um conjunto de elementos com pelo menos uma característica em comum;
Um conjunto de indivíduo de um mesmo município, estado ou país.
Uma parte da população retirada para analisá-la denomina-se:
Universo;
Parte;
Pedaço;
Dados brutos;
Amostra.
A parte da estatística que se preocupa somente com a descrição de determinadas características de um grupo, sem tirar conclusões sobre um grupo maior denomina-se:
Estatística de População;
Estatística de Amostra;
Estatística Inferencial
Estatística Descritiva;
Estatística Grupal.
Uma série estatística é denominada Temporal quando?
O elemento variável é o tempo;
O elemento variável é o local;
O elemento variável é a espécie;
É o resultado da combinação de séries estatísticas de tipos diferentes;
Os dados são agrupados em subintervalos do intervalo observado.
Suponha que uma pesquisa de opinião pública deve ser realizada em um estado que tem duas grandes cidades e uma zona rural. Os elementos na população de interesse são todos os homens e mulheres do estado com idade acima de 21 anos. Que tipo de amostragem você sugeriria?. 
De acordo com as normas para representação tabular de dados, quando o valor de um dado é muito pequeno, para ser expresso com o número de casa decimais utilizadas ou com a unidade de medida utilizada, deve-se colocar na célula correspondente.
Zero (0);
Três pontos (...);
Um traço horizontal (-)
Um ponto de interrogação (?);
Um ponto de exclamação (!).
MEDIDAS DE POSIÇÃO OU MEDIDAS DE TENDÊNCIA CENTRAL
	As medidas de tendência central dão o valor do ponto em torno do qual os dados se distribuem. As mais usadas são:
Média aritmética: para dados não agrupados basta somar todos os dados e dividir o total pelo número deles.
 = ∑ xi / n onde: é a média
 xi são os valores da variável 
 n é o número de dados
Para dados agrupados deve-se levar em conta que as frequências são indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação; então a média aritmética ponderada é dada pela fórmula:
 = ∑ fi . x i / ∑fi onde fi é a frequência de cada classe
Mediana: é definida como o número que se encontra no centro de uma série de números ordenados. Ela divide a amostra em dois conjuntos com igual número de dados.
	A mediana pode ou não pertencer à série; pode ou não coincidir com a média. É muito importante, pois não se deixa influenciar por valores extremos.
	Para dados não agrupados, se a amostra é constituída por um número ímpar de dados, a mediana é o valor que fica no centro dos dados ordenados. Se a amostra é constituída por um número par de dados, a mediana é a média dos dois valores centrais, da série ordenada.
	Quando os dados encontram-se agrupados deve-se conhecer as freqüências acumuladas e determinar o valor que divide a distribuição em dois grupos com o mesmo número de elementos.
	A ordem do elemento mediano é dada por ∑ fi/2
 onde
 Md é a mediana
 Li é o limite da classe mediana
 Fant é a frequência acumulada da classe anterior a mediana
 fi é a freqüência absoluta da classe mediana
 h é a amplitude do intervalo da classe mediana
A mediana é empregada quando:
- deseja-se obter o ponto que divide a distribuição em partes iguais;
- há valores extremos que afetam a média;
- a variável em estudo é salário;
- nos casos de distribuição de frequências onde a primeira e a última classe tenham limites indefinidos;
- em toxicologia, na determinação da dose que é capaz de matar 50% dos indivíduos, isto é, dose mediana letal, DL50.
Moda: é o valor que ocorre com maior frequência em uma série de dados. Para dados não agrupados é o valor que mais se repete. Para dados agrupados sem intervalo de classe é o valor da variável com maior frequência. Para dados agrupados com intervalo de classe é o valor compreendido entre os valores limites da classe modal.
Moda bruta = Mo = li + Li
 2
Exercícios
Um biólogo está medindo o dano ambiental em uma reserva ecológica. em seis locais dessa reserva, determinou um escore de dano (em graus), obtendo os dados a seguir:
Local: L1 L2 L3 L4 L5 L6
Dano: 2 5 1 0 3 4
Calcule a média e a mediana e compare os valores.
Inclua o local L7, no qual foi observado um escore de dano igual a 4 e refaça os cálculos.
Os dados abaixo representam os salários pagos a 100 funcionários de uma cooperativa. Determine as frequências acumuladas e percentuais simples.
	Nº de salários Nº de operários
 
 0 |--- 2 40
 2 |--- 4 30
 4 |--- 6 15
 6 |--- 8 10
 8 |--- 10 5
	TOTAL
 
- Quantos funcionários ganham menos do que 4 salários mínimos?
- Que porcentagem representa os funcionários que ganham 6 ou mais salários mínimos?
- Quantos funcionários ganham 2 ou mais e menos do que 4 salários mínimos?
- Qual é a porcentagem de funcionários que ganham 6 ou mais e menos do que 8 salários mínimos?
- Determine a média salarial dos 100 funcionários.
- Qual o salário mediano do grupo acima apresentado?
- Calcule a moda de salários dos funcionários.
3. O salário de 40 funcionários de um escritório está distribuído segundo o quadro abaixo. Calcule o salário médio e o mediano destes funcionários. Compare.
	Salários R$
	N° de funcionários
	
	400,00 ((( 500,00
	12
	
	500,00 ((( 600,00
	15
	
	600,00 ((( 700,00
	8
	
	700,00 ((( 800,00
	3
	
	800,00 ((( 900,00
	1
	
	900,00 ((( 1000,00
	1
	
	Total
	
	
4. Uma empresa de âmbito nacional fez um levantamento do consumo de seu principal produto em várias agropecuárias, obtendo em determinado mês, a tabela abaixo. Calcule a média de consumo.
	Consumo(unidades)
	 N°de agropecuárias
	
	 0 ((( 1000
	10
	
	1000 ((( 2000
	50
	
	2000 ((( 3000
	200
	
	3000 ((( 4000
	320
	
	4000 ((( 5000
	150
	
	5000 ((( 6000
	30
	
5. Os números abaixo listados representam o comprimento, em centímetros, de determinado vegetal. Para cada série de dados calcule a média, a mediana e a moda.
11, 15, 16, 18, 22, 23, 26, 28, 13, 33, 37
23, 25, 25, 27, 29, 29, 31, 33, 33, 33, 35, 32
MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE
	Dispersão é a maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência central, normalmente a média, tomado como ponto de comparação. As mais usadas são:
Variância e Desvio Padrão: baseiam-se nos desvios em torno da média aritmética. Levam em consideração a totalidade dos valores da variável em estudo.
	Sendo a variância representada por s² temos:
S² = ∑(xi – x)² para amostras com dados isolados
 n 
s² = ∑(xi – x)² fi para amostras com dados agrupados
 n – 1
	O desvio padrão é numericamente igual a raiz quadrada da variância, assim:
S= √ ∑(xi – x)² ou s = √ ∑(xi – x)² fi
 n n -1
Zona de normalidade é definida por um conjuntode valores em torno da média, contidos num intervalo de amplitude “2s”, ou seja, -s (antes da média) e +s (depois da média). De acordo com estudos matemáticos, essa região engloba aproximadamente 68% dos valores da série.
Coeficiente de variação: é a razão entre o desvio padrão e a média. O resultado da divisão é multiplicado por 100, para que o coeficiente de variação seja dado em porcentagem.
 CV = s/x . 100
O coeficiente de variação permite a comparação de variáveis medidas em unidades diferentes.
EXERCÍCIOS
Foram anotadas as seguintes pulsações por minuto em três grupos de alunos 
	Grupo
	 Pulsações/min
	A
	70
	70
	72
	78
	80
	B
	70
	70
	75
	75
	80
	C
	70
	72
	72
	76
	80
Classifique a variável.
Calcule a média de cada grupo.
Calcule o desvio-padrão de cada grupo.
Determine o coeficiente de variação de cada grupo.
Qual dos grupos possui a pulsação mais homogênea? Justifique.
O quadro abaixo representa o consumo mensal de energia (kwh) em propriedades rurais. Para essas propriedades determine o consumo mensal médio de energia e a zona de normalidade.
	Consumo de energia
	 Fi
	 10 |--- 30 
	 8
	 30 |--- 50
	 19
	 50 |--- 70
	 17
	 70 |--- 90
	 15
	 90 |--- 110 
	 32
	 110 |--- 130
	 28
	 130 |--- 150 
	 26
	 150 |--- 170
	 18
	 170 |--- 190 
	 10
	 TOTAL
	
 
Calcule a média, o desvio padrão e o coeficiente de variação para os dados abaixo:
Peso (kg) e comprimento (cm) de cães
Peso Comprimento
23,0 104
22,7 107
21,2 103
21,5 105
17,0 100
28,4 104
19,0 108
14,5 91
Fonte: Araújo e Hossne (1977)
Os dados a seguir são leituras da pressão do homogeneizador de um laticínio.
	LEITE TIPO C
	LEITE UHT
	3,0 3,1 3,0 3,0 3,0 2,9 2,9 3,0
3,1 2,9 3,0 3,0 3,0 3,0 3,0 3,0
3,0 3,0 3,0 3,0 3,0 2,9 3,0 2,9
	2,2 2,2 2,3 2,2 2,2 2,2 2,4 2,4
2,2 2,4 2,6 2,6 2,4 2,2 2,2 2,2
2,8 2,6 2,2 2,6 2,4 2,0 2,2 2,4
Para cada conjunto de dados calcule as medidas descritivas que você conhece. Com base nas medidas calculadas, comente a diferença entre eles.
REVISÃO
Responda as questões abaixo:
Média, mediana e moda são medidas de :
a) ( ) dispersão	b) ( ) posição	
c) ( ) assimetria	d) ( ) curtose
Na série 10, 20, 40, 50, 70, 80 a mediana será:
a) ( ) 30		b) ( ) 35
c) ( ) 40		d) ( ) 45
50% dos dados da distribuição situa-se:
a) ( ) abaixo da média		c) ( ) abaixo da moda
b) ( ) acima da mediana		d) ( ) acima da média
Calcule para cada caso abaixo a respectiva média.
7, 8, 9, 12, 14
Calcule o valor da mediana.
82, 86, 88, 84, 91, 93 
 
 
Calcule a moda
3, 4, 7, 7, 7, 8, 9, 10 
Desvio padrão, variância e coeficiente de variação são medidas de :
a) ( ) Assimetria		c) ( ) Posição
b) ( ) Dispersão		d) ( ) Curtose
O desvio padrão de um conjunto de dados é 9. A variância é:
a) ( ) 3			c) ( ) 81
b) ( ) 36			d) ( ) 18
Na distribuição de valores iguais, o desvio padrão é:
a) ( ) negativo		 c) ( ) zero
b) ( ) a unidade		d) ( ) positivo
O calculo da variância supõe o conhecimento da:
a) ( ) frequência acumulada		c) ( ) mediana
b) ( ) média		 d) ( ) moda
A variância do conjunto de dados tabelados abaixo será:
			
a) ( ) 1,36			c) ( ) 4,54
b) ( ) 18,35		 d) ( ) 20,66
Numa empresa o salário médio dos homens é de R$ 4000,00 com um desvio padrão de R$1500,00, e o das mulheres é na média de R$3000,00 com desvio padrão de R$1200,00. Qual dos sexos apresenta maior dispersão. 
a) ( ) as mulheres		c) ( ) homens e mulheres
b) ( ) os homens		d) ( ) nenhuma das anteriores
		
CORRELAÇÃO E REGRESSÃO
- Muitas vezes há necessidade de estudar duas ou mais variáveis ao mesmo tempo. Por exemplo, pode se obter mais informações, de um grupo de crianças, estudando peso e estatura juntos do que separadamente.
- Frequentemente duas variáveis quantitativas são estudadas conjuntamente com o objetivo de determinar se há alguma relação entre elas e, se houver, qual o tipo dessa relação. Por exemplo, pode-se pesquisar uma relação entre idade e tempo de sobrevivência em casos de cirurgia, ou procurar saber o tipo de relação entre o tempo de internação e os custos do atendimento.
- Outras vezes, estudam-se conjuntamente duas variáveis na expectativa de com auxílio de uma delas poder prever o comportamento da outra. Por exemplo, depois de estudar a idade dos pacientes por ocasião de determinada cirurgia e o tempo de sobrevivência de pacientes após a operação, com base em sua idade, determinar a conveniência de tal procedimento cirúrgico.
Correlação Linear – existe correlação entre duas variáveis quando uma delas está, de alguma forma relacionada a outra.
	Quando duas variáveis crescem numa mesma proporção, diz-se que existe correlação positiva entre elas. Quando uma cresce e a outra decresce, diz-se que existe correlação negativa.
	A correlação entre duas variáveis é representada graficamente com auxílio do diagrama de dispersão
O coeficiente de correlação linear ( r ) mede o grau de relacionamento entre os pares de variáveis. Seu valor deve estar sempre entre -1 e +1, inclusive. Se o valor de r está próximo de 0, não há correlação entre as variáveis, mas se está próximo de -1 ou +1 há correlação negativa ou positiva.
 
Regressão refere-se aos casos em que se pretende estabelecer uma relação entre uma variável y dependente de uma variável x. Para poder avaliar melhor a correlação entre as variáveis, é interessante obter a equação da reta que as representa. Essa reta é chamada reta de regressão e pode ser determinada pela expressão: y = a + bx
x é a variável independente
y é a variável dependente, ou seja é a variável correlacionada com a variável x e sobre a qual se obtém um valor estimado.
	Os parâmetros a e b da equação da reta podem ser calculados com auxílio das fórmulas: 
 b = n. ∑xy - ∑x . ∑y 
 n.∑x² - (∑x)²
 a = y – b.x
EXERCÍCIOS
1) Doses crescentes de calcário foram adicionadas a um solo ácido e depois determinou-se a percentagem de anomalias encontradas em células germinativas de trigo plantadas nesse solo. Calcule o coeficiente de correlação e obtenha a reta de regressão da percentagem de anomalias sobre a quantidade de calcário no solo, partindo dos dados abaixo.
 Quantidade de calcário 0 1 2 3 4 5
% de anomalias celulares 30 27 22 23 18 16
2) Determine a equação da reta de regressão, que trata dos resultados de uma pesquisa entre o peso total do lixo descartado por dia, em um prédio com o peso do papel contido nesse lixo.
	Apartamento
	1
	2
	3
	4
	5
	6
	Peso total (kg)
	10,47
	19,85
	21,25
	24,36
	28,09
	33,61
	Peso do papel (kg)
	2,43
	5,12
	6,88
	6,22
	8,84
	8,76
Se o peso total do lixo fosse de 25kg, qual seria o peso de papel, em kg, esperado de estar contido nele?
3) O quadro abaixo apresenta o raio da colônia (emcm) de certo fungo observado em diferentes tempos de incubação:
	X (tempo em dias)
	Y (raio da colônia)
	3
	0,8
	4
	1,3
	5
	1,9
	6
	2,4
	7
	2,9
	8
	3,3
- Construa o diagrama de dispersão para as variáveis acima apresentadas.
- Qual seria o raio esperado da colônia no 9º dia?
4) Uma empresa de transporte forneceu os seguintes dados com relação a uma mostra de viagens feitas, dando a distância viajada e o tempo gasto. A empresa está interessada em desenvolver um modelo para prever o tempo gasto com uma viagem, se a distância a ser viajada for conhecida.
	Distancia (Km)
 X
	Tempo (horas)
 Y
	X.Y
	X2
	Y2
	200
	3,2
	
	
	
	120
	2,0
	
	
	
	175
	3,0
	
	
	
	150
	2,0
	
	
	
	300
	4,7
	
	
	
	320
	5,5
	
	
	
	240
	3,8
	
	
	
a) construa o diagrama de dispersão
b) determine o coeficiente de correlação(r) e o coeficiente de determinação (R2). Interprete-os.
c) ajuste uma reta de mínimos quadrados
d) para uma distancia de 220 Km, estime o tempo de viagem.
5) Os dados a seguir mostram as despesas com propaganda (expressas em porcentagem das despesas totais) e o lucro líquido operacional (expresso em porcentagem do total de vendas) em uma amostra de seis agropecuárias.
	Despesas com propagandas 
(x)
	Lucro operacional
(y)
	1,5
1,0
2,8
0,4
1,3
2,0
	3,6
2,8
5,4
1,9
2,9
4,3
Para esses dados: a) construa um diagrama de dispersão 
b) determine o coeficiente de correlação e de determinação. Interprete-os.
c) ajuste uma reta de mínimos quadrados com a qual possamos produzir a procura do produto em termos do seu preço.
d) faça uma aplicação utilizando a equação encontrada para uma despesa de 2,5.
 
PROBABILIDADE
	 A maioria dos fenômenos de que trata a estatística são de natureza aleatória ou probabilística. A probabilidade expressa por meio de valores numéricos as possibilidades da ocorrência dos resultados de um fenômeno.
Experimento: é qualquer processo que permite ao pesquisador fazer observações.
Experimento aleatório: ou fenômeno aleatório são aqueles que, mesmo repetidos várias vezes sob condições semelhantes, apresentam resultados imprevisíveis.
Espaço amostral: é a denominação dada ao conjunto de resultados possíveis para cada experimento.
	Ex: lançamento de uma moeda S = { K, C }
 lançamento de um dado S = {1, 2, 3, 4, 5, 6}
Eventos: chamamos de evento qualquer subconjunto do espaço amostral. Um evento é sempre definido por uma sentença.
	Ex: “obter um número par na face superior de um dado”
 “obter cara no lançamento de um dado.
	Se são possíveis “n” eventos mutuamente exclusivos e igualmente prováveis, e se “m” desses eventos tem uma determinada característica, a probabilidade de que ocorra um evento com essa característica é dada pela razão m/n. Ou seja, chama-se de probabilidade a razão entre o número de casos favoráveis a um evento e o número total de acontecimentos possíveis.
	Como qualquer proporção, uma probabilidade pode assumir qualquer valor entre zero e 1. Logo, se o evento não pode ocorrer a probabilidade será zero, e 1 se o evento com certeza vai ocorrer.
	A probabilidade também pode ser expressa como porcentual, tomando valores entre 0 e 100%, para obter esse valor basta multiplicar o resultado da proporção por 100.
	Por exemplo, se uma moeda for jogada várias vezes para o ar, na metade das vezes dá cara e na outra metade dá coroa, assim pode-se dizer que a probabilidade de dar coroa se a moeda for jogada uma vez é de 1/2; 0,5 ou 50%
Eventos complementares: são aqueles em que a soma de suas probabilidades de ocorrência é 1.
	Ex: a probabilidade de tirar 4 no lançamento de um dado é 1/6, logo a probabilidade de não tirar 4 é 5/6.
	p + q = 1	q = 1 – p
Eventos independentes: dois eventos são independentes quando a probabilidade de ocorrer um deles não é modificada pela ocorrência do outro.
Ex: “olhos claros” e “idade avançada” são eventos independentes, pois a probabilidade de pessoa ter olhos claros não aumenta ou diminui com a idade.
P (A/B) = P (A)
Probabilidade condicional: é a probabilidade de ocorrer determinado evento sob uma dada condição. Indica-se a probabilidade condicional de ocorrer o evento A sob a condição de ter ocorrido B por P (A/B), que se lê “probabilidade de A dado B”.
	Ex: no lançamento de um dado ocorreu uma face com um número ímpar. Qual a probabilidade de ter sido o 5?
Teorema do produto: se A e B são eventos independentes, a probabilidade de ocorrer A e B ao mesmo tempo é dada pela probabilidade de ocorrer A, multiplicada pela probabilidade de ocorrer B.
	P (A e B) = P (A) . P (B)
	Se A e B não são eventos independentes, a probabilidade de ocorrer A e B é dada pela probabilidade de ocorrer A, multiplicada pela probabilidade de ocorrer B, dado que A já ocorreu.
	P (A e B) = P (A) . P (B/A)
Teorema da soma: se os eventos A e B não podem ocorrer ao mesmo tempo, a probabilidade de ocorrer A ou B é dada pela soma das probabilidades de A + B.
	P (A ou B) = P (A) + P (B)
	Se A ou B podem ocorrer ao mesmo tempo, a probabilidade de ocorrer A ou B é dada pela soma das probabilidade de A + B menos a probabilidade de A e B.
EXERCÍCIOS
1. Os dados, a seguir, representam o sumário de um dia de observação em um posto de qualidade, em que se avalia o peso de pacotes de leite produzidos num laticínio. 
	Condições do peso
	Tipo B
	Tipo C
	 UHT
	 Total
	Dentro das especificações
Fora das especificações
	 500
 30
	 4.500
 270
	 1.500
 50
	 6.500
 350
	Total
	 530
	 4.770
	 1.550
	 6.850
Se um pacote de leite desse grupo é aleatoriamente escolhido, qual a probabilidade:
De estar dentro das especificações?
De ser UHT e estar dentro das especificações?
De ser do tipo C?
De ser do tipo B ou C?
Sabendo-se que o escolhido está fora das especificações, qual a probabilidade de ser UHT?
2. Depois de um período de testes, verificou-se que o procedimento A de recuperação de informações corre um risco de 2% de não oferecer resposta satisfatória. No procedimento B, o risco cai para 1%. O risco de ambos os procedimentos apresentarem resposta insatisfatória é de 0,5%. Qual a probabilidade de pelo menos um dos procedimentos apresentar resposta insatisfatória?
3. De um conjunto de 5 empresas, deseja-se selecionar, aleatoriamente, uma empresa, mas com a probabilidade proporcional ao número de funcionários. O número de funcionários da empresa A é 20, de B é 15, de C é 7, de D é 5 e de E é 3. Qual a probabilidade de cada uma das empresas ser a selecionada? 
- Qual é a probabilidade de a empresa A não ser selecionada?
4. A distribuição de cães num canil em Curitiba , registrados pelo período de 15 dias está abaixo representada:
	 Idade
	Sexo
	Total
	
	fêmea
	 macho
	
	 abaixo de 2 meses
	20
	 15
	 35
	 entre 2 e 4 meses
	65
	 150
	215
	 acima de 4 meses
	50
	 95
	145
	 Total
	135
	 260
	395
Se um cão desse grupo é aleatoriamente escolhido, qual a probabilidade:
- De ser fêmea?
- De ser fêmea e ter acima de 4 meses?
- De ser macho e ter menos de 2 meses?
- De ser fêmea e ter entre 2 e 4 meses?
- Ter entre 2 e 4 meses?
- Sabendo-se que é macho, qual a probabilidade de ter acima de 4 meses?
5. Suponha que a probabilidade de uma pessoa ser do tipo sanguíneo O é de 40%, ser A é 30% e ser B é 20%. Suponha ainda que a probabilidade de Rh+ é 90% e que o fator Rh independe do tipo sanguíneo. Nestas condições, qual é a probabilidade de uma pessoa tomada ao acaso da população ser:
- O e Rh+?
- AB e Rh-?
- A e Rh-?
- B ou AB?
6. Numa lote há 16 machos e 20 fêmeas, sendo que a metade dos machos e a metade das fêmeas são mochos . Ao escolher ao acaso um componente desse lote, qual é a probabilidade de que seja macho ou seja mocho?7. Num cruzamento de indivíduos cujos pares Aa e Bb determinam na F2 indivíduos AB, Ab, aB, ab na proporção de 9:3:3:1, determinar a probabilidade de num sorteio ao acaso encontrarmos um indivíduo de fenótipo aB ou ab.
8. Conhecendo-se a teoria genética de 1:1, em nascimentos de cobaias, observou-se em uma ninhada de 28 animais 17 machos. Num sorteio ao acaso, qual a probabilidade de, retirando-se um animal, obtermos um macho ou uma fêmea?
DISTRIBUIÇÃO DE PROBABILIDADES
	O conjunto de variáveis e das suas probabilidades correspondentes é denominado distribuição de probabilidades.
Exemplo: Consideremos a distribuição de frequências relativa ao número de acidentes diários em uma rodovia do estado, durante um mês.
Acidentes diários em uma rodovia, período de um mês
	Nº de acidentes
	0
	1
	2
	3
	4
	Freqüências
	17
	6
	4
	2
	1
A tabela que relaciona todas as probabilidades correspondentes às variáveis é denominada distribuição de probabilidades.
Distribuição de probabilidades relativa aos acidentes diários em uma rodovia durante um mês
	Nº de acidentes
	0
	1
	2
	3
	4
	Probabilidades
	0,57
	0,20
	0,13
	0,07
	0,03
DISTRIBUIÇÃO BINOMIAL
	É uma distribuição discreta resultante da soma de variáveis aleatórias binárias. Para ter uma distribuição binomial deve-se levar em conta experimentos que satisfaçam as seguintes condições:
- o experimento deve ser repetido, nas mesmas condições, um número finito de vezes (n);
- as provas repetidas devem ser independentes, isto é, o resultado de uma não deve afetar os resultados das outras;
- em cada prova deve aparecer um dos dois possíveis resultados: sucesso e insucesso;
- no decorrer do experimento, a probabilidade p do sucesso e q do insucesso manter-se-ão constantes;
- serão resolvidos problemas do tipo: determinar a probabilidade de se obterem x sucessos em n tentativas; com auxílio da função: 
Exercícios
1. Certa doença tem taxa de mortalidade de 30%. Num total de 15 pacientes acometidos dessa doença, qual a probabilidade de que:
5 sobrevivam?
8 ou mais sobrevivam?
Menos de 4 sobrevivam?
2. Em determinada população, foi aplicada uma vacina que costuma produzir imunização realmente efetiva em 90% dos casos. Qual a probabilidade de que, em um grupo de sete pessoas:
Todas se imunizem? 
Nenhuma se imunize?
2 não se imunizem?
5 ou mais se imunizem?
3. A espécie Drosophila willistoni é encontrada em frutos de Butia eriospatha, na rua X. Nessa população de moscas-das-frutas, 60% dos indivíduos apresentam a inversão cromossômica E no ccromossomo IIL (Valente e colaboradores, 1993). Um pesquisador vai a essa rua e coleta indivíduos dessa espécie de insetos. Calcule a probabilidade de que, em uma amostra de 15 indivíduos coletados, 12 ou mais sejam portadores da inversão cromossômica.
4. Um fabricante de plantadeiras suspeita que 2% de seu produto apresenta algum defeito. Se tal suspeita é correta, determine a probabilidade de que numa amostra de 9 plantadeiras:
a. não haja nenhuma defeituosa?
b. haja ao menos uma defeituosa?
DISTRIBUIÇÃO NORMAL
	É uma distribuição que envolve variáveis aleatórias contínuas. Obedece as seguintes propriedades:
- a variável aleatória x pode assumir qualquer valor real;
- a representação gráfica da distribuição normal é uma curva em forma de sino, simétrica em relação a média μ, que recebe o nome de curva normal ou de Gauss;
- o achatamento da curva está ligado ao valor do desvio-padrão:
 maior achatamento da curva – maior o desvio-padrão
 menor achatamento da curva – menor o desvio-padrão
- a área total compreendida entre a curva e o eixo das abcissas é igual à unidade (área = 1). A probabilidade de existência da variável no intervalo total é um. O valor da área coincide com o valor da probabilidade, uma vez que essa área tem como significado a probabilidade da variável aleatória x assumir qualquer valor real;
- a curva é simétrica em relação ao valor médio, os valores de probabilidades ocorridos à direita da média são iguais aos valores de probabilidades ocorridos à esquerda, ou seja, são simétricos em relação ao valor da média.
	Considere uma variável aleatória que tenha distribuição normal e pode-se obter a probabilidade dessa variável assumir um valor em determinado intervalo. O valor dessa probabilidade é:
 Z = x – μ
 δ 
Sendo: Z, o valor da probabilidade no intervalo considerado
 X, uma variável aleatória
 μ, o valor médio da distribuição
 δ, o desvio-padrão
	A variável Z tem distribuição normal reduzida, com μ = 0 e δ = 1. O valor de Z é obtido em uma tabela chamada tabela de distribuição normal reduzida.
Exercícios
1. Suponha que a absorção de água (%) em certo tipo de piso tenha distribuição normal com média 2,5 e desvio padrão 0,6. Selecionando, aleatoriamente, uma unidade desse piso, qual é a probabilidade de ele acusar absorção de água entre 2% e 3,5%?
2 A precipitação pluviométrica em certa cidade, no mês de setembro, foi de 18,9 mm, em média. Admitindo-se a distribuição normal com desvio-padrão de 2,5mm. Determinar a probabilidade de que, no mês de setembro próximo, a precipitação seja superior a 16mm?
3 Os prazos de substituição de aparelhos de medição têm distribuição normal com média de 8,2 anos e desvio-padrão de 1,5 anos. Determine a probabilidade de um aparelho de medição, selecionado aleatoriamente, acusar um tempo de substituição inferior a 7,0 anos.
4. Supondo que os pesos do papel descartado semanalmente pelas residências tenham distribuição normal com média 9,4 lb e desvio-padrão de 4,2 lb. Determine a probabilidade de escolher aleatoriamente uma residência que descarte entre 5,0 e 8,0 lb de papel por semana?
5. De acordo com o Opinion Research Corporation, os homens gastam em média 11,4 minutos no chuveiro. Suponha que esses tempos tenham distribuição normal com desvio-padrão de 1,8 minutos. Escolhido um homem aleatoriamente, determine a probabilidade de ele gastar ao menos 10,0 minutos no chuveiro?
DISTRIBUIÇÃO NORMAL PADRONIZADA
	Z
	0,00
	0,01
	0,02
	0,03
	0,04
	0,05
	0,06
	0,07
	0,08
	0,09
	0,0
	0,0000
	0,0040
	0,0080
	0,0120
	0,0160
	0,0199
	0,0239
	0,0279
	0,0319
	0,0359
	0,1
	0,0398
	0,0438
	0,0478
	0,0517
	0,0557
	0,0596
	0,0636
	0,0675
	0,0714
	0,0754
	0,2
	0,0793
	0,0832
	0,0871
	0,0910
	0,0948
	0,0987
	0,1026
	0,1064
	0,1103
	0,1141
	0,3
	0,1179
	0,1217
	0,1255
	0,1293
	0,1331
	0,1368
	0,1406
	0,1443
	0,1480
	0,1517
	0,4
	0,1554
	0,1591
	0,1628
	0,1664
	0,1700
	0,1736
	0,1772
	0,1808
	0,1844
	0,1879
	0,5
	0,1915
	0,1950
	0,1985
	0,2019
	0,2054
	0,2088
	0,2123
	0,2157
	0,2190
	0,2224
	0,6
	0,2258
	0,2291
	0,2324
	0,2357
	0,2389
	0,2422
	0,2454
	0,2486
	0,2518
	0,2549
	0,7
	0,2580
	0,2612
	0,2642
	0,2673
	0,2704
	0,2734
	0,2764
	0,2794
	0,2823
	0,2852
	0,8
	0,2881
	0,2910
	0,2939
	0,2967
	0,2996
	0,3023
	0,3051
	0,3078
	0,3106
	0,3133
	0,9
	0,3159
	0,3186
	0,3212
	0,3238
	0,3264
	0,3289
	0,3315
	0,3340
	0,3365
	0,3389
	1,0
	0,3413
	0,3438
	0,3461
	0,3485
	0,3508
	0,3531
	0,3554
	0,3577
	0,3599
	0,3621
	1,1
	0,3663
	0,3665
	0,3686
	0,3708
	0,3729
	0,3749
	0,3770
	0,3790
	0,3810
	0,3830
	1,2
	0,3849
	0,3869
	0,3888
	0,3907
	0,3925
	0,3944
	0,3962
	0,3980
	0,3997
	0,4015
	1,3
	0,4032
	0,4049
	0,4066
	0,4082
	0,4099
	0,4115
	0,4131
	0,4147
	0,4162
	0,4177
	1,4
	0,4192
	0,4207
	0,4222
	0,4236
	0,4251
	0,4265
	0,4279
	0,4292
	0,4306
	0,4319
	1,5
	0,4332
	0,4345
	0,4357
	0,4370
	0,4382
	0,4394
	0,4406
	0,4418
	0,4429
	0,4441
	1,6
	0,4452
	0,4463
	0,4474
	0,4484
	0,4495
	0,4505
	0,4515
	0,4525
	0,4535
	0,45451,7
	0,4554
	0,4564
	0,4573
	0,4582
	0,4591
	0,4599
	0,4608
	0,4616
	0,4625
	0,4633
	1,8
	0,4641
	0,4649
	0,4656
	0,4664
	0,4671
	0,4678
	0,4686
	0,4693
	0,4699
	0,4706
	1,9
	0,4713
	0,4719
	0,4726
	0,4732
	0,4738
	0,4744
	0,4750
	0,4756
	0,4761
	0,4767
	2,0
	0,4772
	0,4778
	0,4783
	0,4788
	0,4793
	0,4798
	0,4803
	0,4808
	0,4812
	0,4817
	2,1
	0,4821
	0,4826
	0,4830
	0,4834
	0,4838
	0,4842
	0,4846
	0,4850
	0,4854
	0,4857
	2,2
	0,4861
	0,4864
	0,4868
	0,4871
	0,4875
	0,4878
	0,4881
	0,4884
	0,4887
	0,4890
	2,3
	0,4893
	0,4896
	0,4898
	0,4901
	0,4904
	0,4906
	0,4909
	0,4911
	0,4913
	0,4916
	2,4
	0,4918
	0,4920
	0,4922
	0,4925
	0,4927
	0,4929
	0,4931
	0,4932
	0,4934
	0,4936
	2,5
	0,4938
	0,4940
	0,4941
	0,4943
	0,4945
	0,4946
	0,4948
	0,4949
	0,4951
	0,4952
	2,6
	0,4953
	0,4955
	0,4956
	0,4957
	0,4959
	0,4960
	0,4961
	0,4962
	0,4963
	0,4964
	2,7
	0,4965
	0,4966
	0,4967
	0,4968
	0,4969
	0,4970
	0,4971
	0,4972
	0,4973
	0,4974
	2,8
	0,4974
	0,4975
	0,4976
	0,4977
	0,4977
	0,4978
	0,4979
	0,4979
	0,4980
	0,4981
	2,9
	0,4981
	0,4982
	0,4982
	0,4983
	0,4984
	0,4984
	0,4985
	0,4985
	0,4986
	0,4986
	3,0
	0,4987
	0,4987
	0,4987
	0,4988
	0,4988
	0,4989
	0,4989
	0,4989
	0,4990
	0,4990
	3,1
	0,4990
	0,4991
	0,4991
	0,4991
	0,4992
	0,4992
	0,4992
	0,4992
	0,4993
	0,4993
	3,2
	0,4993
	0,4993
	0,4994
	0,4994
	0,4994
	0,4994
	0,4994
	0,4995
	0,4995
	0,4995
	3,3
	0,4995
	0,4995
	0,4995
	0,4996
	0,4996
	0,4996
	0,4996
	0,4996
	0,4996
	0,4997
	3,4
	0,4997
	0,4997
	0,4997
	0,4997
	0,4997
	0,4997
	0,4997
	0,4997
	0,4997
	0,4998
	3,5
	0,4998
	0,4998
	0,4998
	0,4998
	0,4998
	0,4998
	0,4998
	0,4998
	0,4998
	0,4998
	3,6
	0,4998
	0,4998
	0,4999
	0,4999
	0,4999
	0,4999
	0,4999
	0,4999
	0,4999
	0,4999
	3,7
	0,4999
	0,4999
	0,4999
	0,4999
	0,4999
	0,4999
	0,4999
	0,4999
	0,4999
	0,4999
	3,8
	0,4999
	0,4999
	0,4999
	0,4999
	0,4999
	0,4999
	0,4999
	0,4999
	0,4999
	0,4999
UNICRUZ
2017
(BIO)ESTATÍSTICA
Profª M Christina Schettert Moraes
�PAGE �
�PAGE �4�
_1388086017.unknown

Mais conteúdos dessa disciplina