Buscar

Outlook.com (1)

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

aula 1 - Unidade 01.ppt
Introdução a Estatística
*
Luís G.G. Silveira, Vladimir C. Pinto, Thiago M. Costa
*
Introdução a Estatística
Marcus Sergio
Introdução a Estatística
*
Luís G.G. Silveira, Vladimir C. Pinto, Thiago M. Costa
*
Dados – Informação e Conhecimento
Introdução a Estatística
Dados
Dado é qualquer elemento identificado em sua forma bruta que, por si só, não conduz a uma compreensão de determinado fato ou situação. (Oliveira, 2005)
Dados são códigos que constituem a matéria prima da informação, ou seja, é a informação não tratada. Os dados representam um ou mais significados que isoladamente não podem transmitir uma mensagem ou representar algum conhecimento.
Em uma pesquisa eleitoral por exemplo, são coletados dados, isto é, cada participante da pesquisa fornece suas opiniões e escolhas sobre determinados candidatos, mas essas opiniões não significa muita coisa no âmbito da eleição. Só depois de ser integrada com as demais opiniões é que teremos algo significativo.
Introdução a Estatística
Informação
Informação é o dado trabalhado que permite ao executivo tomar decisões. (Oliveira, 2005)
Dados são códigos que constituem a matéria prima da informação, ou seja, é a informação não tratada. Os dados representam um ou mais significados que isoladamente não podem transmitir uma mensagem ou representar algum conhecimento.
Em uma pesquisa eleitoral por exemplo, são coletados dados, isto é, cada participante da pesquisa fornece suas opiniões e escolhas sobre determinados candidatos, mas essas opiniões não significa muita coisa no âmbito da eleição. Só depois de ser integrada com as demais opiniões é que teremos algo significativo.
Introdução a Estatística
Conhecimento
Conhecimento é o conjunto de ferramentas conceituais e categorias usadas pelos seres humanos para criar, colecionar, armazenar e compartilhar a informação(LAUDON e LAUDON,1999).
Introdução a Estatística
Introdução a Estatística
Introdução a Estatística
Definição de Estatística
Introdução a Estatística
Introdução a Estatística
É uma parte da matemática fornece métodos para coleta, organizações, descrições, análise e interpretação de dados e a sua utilização na tomada de decisões
A coleta, a organização, a descrição, o cálculo, a análise e interpretação dos coeficientes pertencem à ESTATÍSTICA DESCRITIVA, enquanto que a análise e a interpretação dos dados amostrais, associado a uma margem de incerteza, ficam a cargo da ESTATÍSTICA INDUTIVA ou INFERENCIAL, que se fundamenta na teoria da probabilidade e é muito útil na análise de jogos, entre outros.
Definição de Estatística
Introdução a Estatística
ESTATÍSTICA DESCRITIVA :
COLETA, ORGANIZAÇÃO E DESCRIÇÃO DOS DADOS.
ESTATÍSTICA INFERENCIAL :
INFERÊNCIA, ANÁLISE E INTERPRETAÇÃO.
Definição de Estatística (Resumindo)
Introdução a Estatística
MÉTODO: é um meio mais eficaz para atingir determinada meta.
Método Experimental: consiste em manter constante todas as causas, menos uma, que sofre variação para se observar seus efeitos, caso existam. Ex: Estudos da Química, Física, etc. Em laboratório é fácil mantermos constantes, por exemplo, a pressão e variarmos a temperatura para estudar o efeito dessa variação.
Método Estatístico: diante da impossibilidade de manter as causas constantes(nas ciências sociais), admitem todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. Ex: Quais as causas que definem o preço de uma mercadoria quando a sua oferta diminui?
Método Estatístico
Introdução a Estatística
ORGANIZAÇÃO DE DADOS ESTATÍSTICOS 
FASES DO MÉTODO ESTATÍSTICO
1º - DEFINIÇÃO DO PROBLEMA : 	Saber exatamente aquilo que se pretende pesquisar é o mesmo que definir corretamente o problema.
Exemplo: Qual o tipo de veículo é mais vendido os clientes residentes no município?
Introdução a Estatística
2º - PLANEJAMENTO :	
Como levantar informações ?
Onde irei buscar?
Que dados deverão ser obtidos ?
Uma lista com todos os pedidos do mês anterior? Ou
Uma lista com os usados mais vendidos no ANO anterior? Ou
A opinião dos vendedores sobre a preferência de seus clientes...
E o cronograma de atividades ? 
Quanto tempo? Por onde começar – os passos – o relatório final
Os custos envolvidos ? etc.
Quem será alocado para a função, o que irá precisar?
Introdução a Estatística
3º - COLETA DE DADOS: 	
Fase operacional. É o registro sistemático de dados, com um objetivo determinado.
Dados primários: 	quando são publicados pela própria pessoa ou organização que os haja recolhido. Ex: tabelas do censo demográfico do IBGE.
Dados secundários: 	quando são publicados por outra organização. Ex: quando determinado jornal publica estatísticas referentes ao censo demográfico extraídas do IBGE.
OBS: 	É mais seguro trabalhar com fontes primárias. O uso da fonte secundária traz o grande risco de erros de transcrição.
Introdução a Estatística
Coleta Direta:
quando é obtida diretamente da fonte.
Ex: Empresa que realiza uma pesquisa para saber a preferência dos consumidores pela sua marca. 
coleta contínua:	registros de nascimento, óbitos, casamentos; 
coleta periódica:	recenseamento demográfico, censo industrial;
coleta ocasional:	registro de casos de dengue.
coleta Indireta:	É feita por deduções a partir dos elementos conseguidos pela coleta direta, por analogia, por avaliação, indícios ou proporcionalização.
 Quando é feita com base em elementos já pesquisados (revista, jornal, livros, etc.)
Introdução a Estatística
4º - CRÍTICA DOS DADOS: nesta fase os dados são contados e recontados, em busca de possíveis falhas (omissões, repetições, etc). 
5º - APURAÇÃO DOS DADOS: 		Resumo dos dados através de sua contagem e agrupamento. É a condensação e tabulação de dados.
6º - APRESENTAÇÃO DOS DADOS: 	Há duas formas de apresentação, que não se excluem mutuamente. 
A apresentação tabular, ou seja é uma apresentação numérica dos dados em linhas e colunas distribuídas de modo ordenado, segundo regras práticas fixadas pelo Conselho Nacional de Estatística. 
A apresentação gráfica dos dados numéricos constitui uma apresentação geométrica permitindo uma visão rápida e clara do fenômeno.
Introdução a Estatística
7º - ANÁLISE E INTERPRETAÇÃO DOS DADOS: 	A última fase do trabalho estatístico é a mais importante e delicada. 
Está ligada essencialmente ao cálculo de medidas e coeficientes, cuja finalidade principal é descrever o fenômeno (estatística descritiva).
é tirar conclusões sobre o todo a partir de informações fornecidas por uma parte deste representativa, através de técnicas apropriadas 
Nesta etapa obteremos conclusões sobre o todo (população), a partir das informações fornecidas pela parte que representa o todo (amostra).
Introdução a Estatística
População, amostra, variável
Variável
Introdução a Estatística
População: qualquer conjunto de informação que tenha entre si uma característica comum que delimite os elementos pertencentes a ela. 
Amostra: é um subconjunto de elementos pertencentes a uma população. 
Considerando a impossibilidade, na maioria das vezes do tratamento de todos os elementos da população, necessitaremos de uma parte representativa da mesma
Conceitos básicos
Introdução a Estatística
Em um restaurante, não precisamos comer todos os tipos de saladas, de sobremesas e de carnes disponíveis, para conseguirmos chegar a conclusão de que a comida é de boa qualidade. Basta que seja provado um tipo de cada opção para concluirmos se a comida está dentro dos padrões.
População
Amostra
Introdução a Estatística
CENSO: É o exame completo de toda população.
AMOSTRAGEM: é uma técnica especial para recolher amostras que garante, tanto quanto possível, o acaso na escolha, de modo a garantir à amostra o caráter de representatividade.
Variável: Dados referentes a uma característica de interesse, coletados a partir de uma amostra.
É o conjunto de resultados possíveis de um fenômeno. Ex.: sexo, cor da pele, idade...
Conceitos básicos
Introdução a Estatística
Variável
Variável é o conjunto de resultados possíveis de um fenômeno. Ex.: sexo,cor da pele, idade...
Para os fenômenos:
- sexo - dois resultados possíveis: masculino e feminino; (não pode ser medida: é um atributo)
- número de filhos tidos de um grupo de casais - resultados possíveis: 0, 1, 2, 3, 4, 5, ..., n;
- peso de pessoas adultas - resultados possíveis: 60 kg, 59,3 kg, 75,3 kg, 65,3 kg, ...; pode tomar um infinito número de valores num certo intervalo.
Introdução a Estatística
Tipos de Variáveis
As variáveis podem ser categóricas (Qualitativas) ou numéricas (Quantitativas)
Introdução a Estatística
Tipos de Variáveis
VARIÁVEIS QUALITATIVAS : São características de uma população que não pode ser medidas.
Ordinais (quando existe alguma ordem nos possíveis resultados)
 Ex: Escolaridade, Classe Social
 Nominais (quando não existe qualquer possibilidade de ordenação nas possíveis realizações) 
 Ex: sexo, estado civil
Introdução a Estatística
Tipos de Variáveis
VARIÁVEIS QUANTITATIVAS : São características de uma população que pode ser quantificadas.
medidas.
 Discretas(Enumeráveis, obtidas por contagem)
 Ex: Nº de Filhos
 Contínua (Não numeráveis, obtidas por medições) 
 Ex: altura, idade, salário
Introdução a Estatística
TRUNCAMENTO/ ARREDONDAMENTO
TRUNCAMENTO: Truncar um número é “quebrá-lo” de acordo com o número de dígitos que queremos representar.
Representar os números abaixo com apenas dois dígitos.
27,283 27
27,575 27
27,897 27
Introdução a Estatística
TRUNCAMENTO/ ARREDONDAMENTO
ARREDONDAMENTO: Considerando a impossibilidade, na maioria das vezes do tratamento de todos os elementos da população, necessitaremos de uma parte representativa da mesma. A esta porção da população chamaremos de amostra.
Introdução a Estatística
TRUNCAMENTO/ ARREDONDAMENTO
Para arredondar um número, devemos seguir as seguintes regras:
Introdução a Estatística
Faça o arredondamento dos números a seguir conforme a precisão indicada:
a)  47,8 para a unidade mais próxima => 
b) 37,257 para o décimo mais próximo => 
c) 37,257 para o centésimo mais próximo => 
d) 7,314 para o centésimo mais próximo  => 
e) 2,484 para o décimo mais próximo => 
f) 136,5 para a unidade mais próxima => 
g) 0,0435 para o milésimo mais próximo => 
h) 4,50001 para a unidade mais próxima => 
i) 5,56500 para o centésimo mais próximo => 
j) 5,56501 para o centésimo mais próximo => 
K) 78,85 para o décimo mais próximo => 
a)  47,8 para a unidade mais próxima => 48 
b) 37,257 para o décimo mais próximo => 37,3
c) 37,257 para o centésimo mais próximo => 37,26 
d) 7,314 para o centésimo mais próximo  => 7,31 
e) 2,484 para o décimo mais próximo => 2,5 
f) 136,5 para a unidade mais próxima => 136 
g) 0,0435 para o milésimo mais próximo => 0,044 
h) 4,50001 para a unidade mais próxima => 5 
i) 5,56500 para o centésimo mais próximo => 5,56 
j) 5,56501 para o centésimo mais próximo => 5,57 
K) 78,85 para o décimo mais próximo => 78,8
Introdução a Estatística
Faça o arredondamento dos números a seguir conforme a precisão indicada:
l)  3,456 para a centésimo mais próxima => 
m) 23,471 para o décimo mais próximo => 
n) 23,471para o centésimo mais próximo => 
o) 7,545 para o centésimo mais próximo  => 
p) 7,545 para o décimo mais próximo => 
q) 12,450 para a décimo mais próxima => 
r) 13, 350 para o décimo mais próximo => 
s) 3,456 para a décimo mais próxima => 
l)  3,456 para a centésimo mais próxima => 3,46 
m) 23,471 para o décimo mais próximo => 23,5
n) 23,471para o centésimo mais próximo => 23,47
o) 7,545 para o centésimo mais próximo  => 7,54
p) 7,545 para o décimo mais próximo => 7,5
q) 12,450 para a décimo mais próxima => 12,4
r) 13, 350 para o décimo mais próximo => 13,4
s) 3,456 para a décimo mais próxima => 3,5
*
*
*
Duas definições:
A primeira etimológica
A segunda mais completa. Na segunda definição eu volto explicando cada um dos termos apresentados, dando ênfase que essa definição é bem completa.
A segunda definição serve ainda como uma introdução aos objetivos da estatística ... Como segue no próximo slide.
*
Duas definições:
A primeira etimológica
A segunda mais completa. Na segunda definição eu volto explicando cada um dos termos apresentados, dando ênfase que essa definição é bem completa.
A segunda definição serve ainda como uma introdução aos objetivos da estatística ... Como segue no próximo slide.
*
Duas definições:
A primeira etimológica
A segunda mais completa. Na segunda definição eu volto explicando cada um dos termos apresentados, dando ênfase que essa definição é bem completa.
A segunda definição serve ainda como uma introdução aos objetivos da estatística ... Como segue no próximo slide.
*
Duas definições:
A primeira etimológica
A segunda mais completa. Na segunda definição eu volto explicando cada um dos termos apresentados, dando ênfase que essa definição é bem completa.
A segunda definição serve ainda como uma introdução aos objetivos da estatística ... Como segue no próximo slide.
*
Duas definições:
A primeira etimológica
A segunda mais completa. Na segunda definição eu volto explicando cada um dos termos apresentados, dando ênfase que essa definição é bem completa.
A segunda definição serve ainda como uma introdução aos objetivos da estatística ... Como segue no próximo slide.
*
E qual é a variável que estamos quantificando?
Um exemplo de variável é a altura das pessoas
*
Esses são os conceitos básicos, exemplos deles vêm nos próximos dois slides
*
População é o universo de pessoas
Porém, quando deseja-se fazer alguma medida, realizar essa medida na população toda pode ser inviável
A Estatística permite que se pegue algumas pessoas e infere-se que o aquilo que acontece com esse subconjunto da população possivelmente aconteceria com a população também
A esse subconjunto chamamos de amostra
*
Esses são os conceitos básicos, exemplos deles vêm nos próximos dois slides
Aula 2.1 - Unidade 01 - Tabelas - Série Estatistica.ppt
*
*
ANÁLISE DE DADOS
Tabela
Prof: Marcus Sergio
*
*
TABELAS
Um dos objetivos da estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da variação das mesmas.
Tabela - é uma maneira de apresentar de forma resumida um conjunto de dados.
*
*
ELEMENTOS DA TABELAS
Toda tabela deve ser simples, clara, objetiva e auto-explicativa. Conforme a figura abaixo:
*
*
ELEMENTOS DA TABELAS
O título – aponta o fenômeno, época e local de ocorrência; 
Corpo – conjunto de linhas e colunas que contém informações sobre a variável em estudo;
Cabeçalho – parte superior da tabela que especifica o conteúdo das colunas;
Coluna Indicadora – parte da tabela que especifica o conteúdo das linhas;
Linhas – retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as colunas;
Casa ou Célula – espaço destinado a um só número;
Rodapé – A fonte cita o informante (caracterizando a confiabilidade dos dados); 
*
*
ELEMENTOS DA TABELAS
De acordo com a Resolução 886
da Fundação IBGE, nas casas ou células devemos colocar:
 
 um traço horizontal ( ) quando o valor é zero, não só quanto à natureza das coisas, como quanto ao resultado do inquérito;
 três pontos (...) quando não temos os dados;
 um ponto de interrogação (?) quando temos dúvida quanto à exatidão de determinado valor;
 zero (0) quando o valor é muito pequeno para ser expresso pela unidade utilizada. Se os valores são impressos em números decimais, precisamos acrescentar à parte decimal um número correspondente de zeros (0,0; 0,00; 0,000; ...).
*
*
ANÁLISE DE DADOS
SÉRIE ESTATÍSTICA
*
*
SÉRIE ESTATÍSTICA
SÉRIE ESTATÍSTICA: É qualquer tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie
São classificadas como:
 Série temporal, histórica ou cronológica;
 Série geográfica, territorial espacial ou de localidade;
 Série específica ou categórica;
 Séries mistas.
*
*
SÉRIE TEMPORAL
É a série cujos dados estão em correspondência com o tempo, ou seja, variam com o tempo.
*
*
SÉRIE GEOGRÁFICA
É a série cujos dados estão em correspondência com a região geográfica, ou seja, o elemento variável é o fator geográfico (a região).
*
*
SÉRIE ESPECÍFICA
É a série cujos dados estão em correspondência com a espécie, ou seja, variam com o fenômeno.
*
*
SÉRIES MISTAS
As combinações entre as séries anteriores constituem novas séries que são denominadas séries compostas ou mistas e são apresentadas em tabelas de dupla entrada.
Aula 2.2 - Unidade 01 - Distribuição de Frequencia.ppt
*
*
ANÁLISE DE DADOS
Distribuição de Frequência
Prof: Marcus Sergio
*
*
DEFINIÇÕES BÁSICAS
Frequência: é a quantidade de vezes que um mesmo valor de um dado é repetido;
Dados Brutos: são os dados originais que ainda não foram numericamente organizados após a coleta. São os dados coletados sem nenhuma arrumação;
EX.: 25, 21, 22, 21, 22, 23, 24, 21 ,30, 26, 30, 26, 40, 34, 32, 38, 37, 38, 40, 31
 
*
*
ROL
É a ordenação dos valores obtidos em ordem crescente ou decresnte de grandeza numérica ou qualitativa.
 É a relação obtida após a ordenação dos dados (crescente ou decrescente).
 
 É a ordenação dos valores obtidos em ordem crescente ou descrente de grandeza numérica ou qualitativa.
EX.: 21, 21, 21, 22, 22, 23, 24, 25, 26, 26, 30, 30, 31, 32, 34, 37, 38, 38, 40, 40
*
*
DADOS BRUTOS
Faixa etária de crianças de um acampamento X
Dificulta estabelecer em torno de qual valor tendem a se concentrar as idades das crianças, ou ainda que se encontram acima ou abaixo de determinada idade.
*
*
ROL
Dados organizados
*
*
DISTRIBUIÇÃO DE FREQUÊNCIA SEM INTERVALOS DE CLASSES
*
*
DISTRIBUIÇÃO DE FREQUÊNCIA COM INTERVALOS DE CLASSES
*
*
ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA
Classes: caso as colunas da tabela de distribuição de frequência contenham muitos valores elencados, podemos reduzir a quantidade desses valores elencados agrupando-os em intervalos.
Esses agrupamentos de valores num intervalo de abragência são chamados de classes
Classes - são os intervalos de variação da variável.
*
*
ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA
Limites de Classes - são os extremos de cada classe. O menor número é o limite inferior de classe ( li ) e o maior número, limite superior de classe ( Li ).
Limite inferior (li): o número menor é o limite inferior da classe (4 l- 6) em que l1 = 4.
Limite superior (Li): o número maior é o limite superior da classe (4 l- 6) em que L1 = 6.
l- : este simbolo estabelece inclusão e exclusão para os valores limites de um dado intervalo de classe. Ex: 
4 l- 6 = indica inclusão do limite inferior (4) e exclusão do limite superior (6).
*
*
ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA
Amplitude de classes (hi) - A amplitude de um intervalo de classe (hi) é a diferença entre o limite superior e inferior de uma classe:
hi = Li – li
h1= 6 – 4 = 2 anos;
h2= 8 – 6 = 2 anos;
h3= 10 – 8 = 2 anos;
h4= 12 – 10 = 2 anos;
h5= 14 – 12 = 2 anos;
h6= 16 – 14 = 2 anos;
*
*
ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA
Amplitude Amostral (AA) - (AA = Xmáx - Xmin)
Trata-se da diferença entre o valor máximo e o valor mínimo da amostra (ROL).
 AA= 15 - 4 = 11.
Amplitude Total da Distribuição (AT) - (AT = L(max) - l(min))
É a diferença entre o limite superior da última classe e o limite inferior da primeira classe.
 AT = 16 – 4 = 12.
*
*
ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA
Ponto Médio de uma Classe (xi)
É o ponto que , por situar-se numa posição média da distribuição de valores do intervalo de classe, divide o intervalo em duas partes iguais.
Xi = (li + Li) / 2
Ponto médio da primeira classe: x1 = (4 + 6) / 2 = 5
*
*
*
*
MODA
MODA - Mo
 
	É o valor que ocorre com maior freqüência em uma série de valores.
 
Desse modo, o salário modal dos empregados de uma fábrica é o salário mais comum, isto é, o salário recebido pelo maior número de empregados dessa fábrica.
*
*
MODA
MODA - Mo
 
	É o valor que ocorre com maior freqüência em uma série de valores.
 
Desse modo, o salário modal dos empregados de uma fábrica é o salário mais comum, isto é, o salário recebido pelo maior número de empregados dessa fábrica.
*
*
*
*
Aula 3 - Unidade 01 -Tipos de Frequencia.ppt
*
*
ANÁLISE DE DADOS
Tipos de Frequência
Prof: Marcus Sergio
*
*
ROL
Dados organizados
*
*
DISTRIBUIÇÃO DE FREQUÊNCIA SEM INTERVALOS DE CLASSES
*
*
DISTRIBUIÇÃO DE FREQUÊNCIA COM INTERVALOS DE CLASSES
*
*
TIPOS DE FREQUÊNCIA
Frequência simples ou absoluta (fi): é o número de observações de um valor individual (ou de uma classe).
 
Frequência Simples ou Absoluta
*
*
TIPOS DE FREQUÊNCIA
Frequência relativa (fr): representa a proporção de observações de um valor (ou de uma classe) em relação ao número total de observações, o que facilita a observação.
*
*
TIPOS DE FREQUÊNCIA
Frequência acumulada (Fi): é a soma de todas as frequências abaixo do limite superior de uma classe considerada.
*
*
ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA
Ponto Médio de uma Classe (xi)
É o ponto que , por situar-se numa posição média da distribuição de valores do intervalo de classe, divide o intervalo em duas partes iguais.
Xi = (li + Li) / 2
Ponto médio da primeira classe: x1 = (4 + 6) / 2 = 5
*
*
TIPOS DE FREQUÊNCIA
*
*
TIPOS DE FREQUÊNCIA
correlação.ppt
*
*
ANÁLISE DE DADOS
CORRELAÇÃO
*
*
CORRELAÇÃO 
Frequentemente procura-se verificara se existe relação entre duas ou mais variáveis. 
O peso pode estar relacionado com a idade das pessoas; o consumo das famílias pode estar relacionado com sua renda; as vendas de uma empresa
e os gastos promocionais...
A verificação da existência e do grau de relação entre variáveis é o objeto de estudo da Correlação.
 
*
*
CORRELAÇÃO 
Correlação, também chamada de coeficiente de correlação,indica a força e a direção do relacionamento linear entre duas variáveis aleatórias
 
*
*
CORRELAÇÃO 
Mede a força, ou grau de relacionamento entre duas variáveis.
Quanto maior a correlação, maior a intensidade de relacionamento
 
*
*
CORRELAÇÃO 
Exemplo:
 
*
*
CORRELAÇÃO 
Para entendermos a correlação existente, precisamos calcular o Coeficiente de Correlação de Pearson (r).
 
*
*
Coeficiente de Correlação 
O valor de r varia de –1,00 a +1,00; 
Um relacionamento positivo (r é +) indica uma correlação positiva entre duas variáveis. Os valores altos (baixos) de uma das variáveis, correspondem valores altos (baixos) da outra; 
Um relacionamento negativo (r é -) indica uma correlação negativa entre duas variáveis. Os valores altos (baixos) de uma das variáveis, correspondem valores baixos (altos) da outra. 
 
*
*
Coeficiente de Correlação 
Assim:
r > 0 – Existe forte relação positiva
r < 0 – Fraca relação negativa
r = 0 – Ausência de relação
r = 1 – Relação Linear Perfeita
 
*
*
Coeficiente de Correlação 
Exemplo 01: Calcular o coeficiente de Correlação Linear entre as variáveis X e Y, usando os dados da tabela abaixo.
 
*
*
Coeficiente de Correlação 
Exemplo 01: Calcular o coeficiente de Correlação Linear entre as variáveis X e Y, usando os dados da tabela abaixo.
 
*
*
Coeficiente de Correlação 
Exemplo 01: Calcular o coeficiente de Correlação Linear entre as variáveis X e Y, usando os dados da tabela abaixo.
Coeficiente de correlação r = 0,416
Conclusão: O resultado mostra que o coeficiente de correlação linear entre X e Y é positiva (quando X cresce linearmente, Y também cresce linearmente), porém é baixa.
 
*
*
Coeficiente de Correlação 
Exemplo 02: Em uma clínica de Endocrinologia foi feita uma pesquisa com 5 mulheres de 50 anos de idade. Os resultados estão descritos na tabela a seguir.
 
Tabela 1. HDL (em mg/dl) e número de horas de prática de exercícios físicos.
 
*
*
Coeficiente de Correlação 
Observação: No exame de colesterol estão incluídas a fração HDL (bom colesterol) e a fração LDL (mau colesterol). Estudos apontam que, nas pessoas com HDL aumentado ou nas faixas superiores do que é considerado normal (>50 mg/dL), a ocorrência de doenças cardiovasculares é menor.
 
*
*
Coeficiente de Correlação 
Determine o Coeficiente de Correlação entre Quantidade de HDL (em mg/dl) e número de horas de prática de exercícios físicos.
 
*
*
Coeficiente de Correlação 
Determine o Coeficiente de Correlação entre Quantidade de HDL (em mg/dl) e número de horas de prática de exercícios físicos.
 
*
*
Coeficiente de Correlação 
Determine o Coeficiente de Correlação entre Quantidade de HDL (em mg/dl) e número de horas de prática de exercícios físicos.
A correlação é positiva r = 0,988.
 
*
*
Coeficiente de Correlação 
Exemplo 03: Foi feito um levantamento com 10 jovens atletas para verificar se existe relação entre o consumo de proteínas e a perda de peso, no período de 1 semana. Os dados revelados são:
 
*
*
Coeficiente de Correlação 
Exemplo 02: Foi feito um levantamento com 10 jovens atletas para verificar se existe relação entre o consumo de proteínas e a perda de peso, no período de 1 semana. Os dados revelados são:
 
*
*
Coeficiente de Correlação 
Exemplo 02: Foi feito um levantamento com 10 jovens atletas para verificar se existe relação entre o consumo de proteínas e a perda de peso, no período de 1 semana. Os dados revelados são:
Coeficiente de correlação r = 0,097
Conclusão: se o atleta fizer uma dieta à base somente de proteínas, com o r calculado podemos verificar que o grau de correlação é quase nula, ou seja, r é muito próximo de zero.
 
Desvio Padrão.ppt
*
*
ANÁLISE DE DADOS
Medida de Variabilidade ou Dispersão
Variância / Desvio padrão / CVP
Prof: Marcus Sergio
*
*
 MEDIDAS DE VARIABILIDADE OU DISPERSÃO 
 As medidas de variabilidade ou dispersão nos dão uma descrição de como os dados estão espalhados no todo. Existem diversas medidas de dispersão. Entre elas:
Variância;
Desvio padrão;
Coeficiente de variação.
 
 
*
*
 MEDIDAS DE VARIABILIDADE OU DISPERSÃO 
Observe os seguintes conjuntos de valores referentes à mesma variável:
X = {20, 20, 20, 20, 20}
Y = {05, 15, 20, 30 ,30}
Z = {01, 01, 03, 05, 90}
 Os três conjuntos apresentam a mesma média aritmética (20).
*
*
 MEDIDAS DE VARIABILIDADE OU DISPERSÃO 
X = {20, 20, 20, 20, 20}
Y = {05, 15, 20, 30 ,30}
Z = {01, 01, 03, 05, 90}
 O primeiro conjunto de valores é mais homogêneo que os outros dois, pois todos os valores são iguais. 
Já o segundo é mais homogêneo que o terceiro, pois este é o mais disperso de todos. 
 
 
*
*
VARIÂNCIA (S²)
Na teoria da probabilidade e na estatística, a variância de uma variável aleatória é uma medida da sua dispersão estatística, indicando quão longe em geral os seus valores se encontram do valor esperado.
Ela baseia-se nos desvios em torno da média.
 
 
*
*
VARIÂNCIA AMOSTRAL (S²)
Para dados isolados:
 
 
*
*
VARIÂNCIA AMOSTRAL (S²)
Atividade:
Dado o conjunto de valores 3, 4, 4, 6, 8. Calcule a Variância.
Dado o conjunto de Valores 1, 1, 6, 6, 11. Calcule a Variância.
 
 
 
*
*
VARIÂNCIA AMOSTRAL (S²)
Para dados agrupados:
 
 
*
*
VARIÂNCIA (S²)
Calcule a Variância
 
*
*
VARIÂNCIA AMOSTRAL (S²)
 Ao analisarmos as idades dos pacientes atendidos num dia em duas clínicas de saúde A e B, temos:
Calcule a Variância, Desvio Padrão e CVP nas duas Clínicas.
 
 
*
*
VARIÂNCIA (S²)
 
*
*
VARIÂNCIA (S²)
 
*
*
VARIÂNCIA (S²)
Podemos observar que a variância da Clínica A é bem menor do que a variância da Clínica B, apesar de as médias aritméticas serem iguais. 
Isso significa que os dados referentes às idades dos pacientes atendidos na primeira clínica são mais homogêneos, ou seja, mais concentrados em torno da média que os da segunda clínica, que são mais dispersos.
 
*
*
DESVIO PADRÃO (S)
É um parâmetro muito usado em estatística que indica o grau de variação de um conjunto de elementos. 
Ex.: Se medirmos a temperatura máxima durantes três dias em uma cidade e obtivermos os seguintes valores, 28°, 29° e 30°, podemos dizer que a média desses três dias foi 29°. 
Em outra cidade, as temperaturas máximas nesses mesmos dias podem ter sido 22°, 29° e 35°. No segundo caso, a média dos três dias também foi de 29°.
 
*
*
DESVIO PADRÃO (S)
As médias têm o mesmo valor, mas os moradores da primeira cidade viveram três dias de calor, enquanto os da segunda tiveram dois dias de calor e um de frio. 
Para diferenciar uma média da outra, foi criada a noção de desvio padrão, que serve para dizer o quanto os valores dos quais se extraiu a média são próximos ou distantes da própria média. 
No exemplo dado, o desvio padrão da segunda cidade é muito maior que o da primeira.
 
*
*
DESVIO PADRÃO (S)
Quanto maior o desvio padrão mais heterogêneos são os dados. 
O desvio é um indicador de variabilidade bastante estável. 
Ele baseia-se nos desvios em torno da média aritmética.
É a média quadrática dos desvios, isto é, a raiz quadrada da variância.
 
*
*
ATIVIDADE
1. Uma determinada editora pesquisou o número de páginas das revistas mais vendidas de uma cidade. Sendo fornecida a distribuição de freqüência de número de páginas, o valor do desvio padrão é aproximadamente:
 
*
*
ATIVIDADE
2. A tabela abaixo mostra a relação de idade dos funcionários e o salário que recebem na empresa em que trabalham:
Calcule o desvio padrão das variáveis salário e idade.
 
*
*
ATIVIDADE
2. A tabela abaixo mostra a relação de idade dos funcionários e o salário que recebem na empresa em que trabalham:
Calcule o desvio padrão das variáveis salário e idade.
 
*
*
Coeficiente de Variação de Pearson - CVP
O fato do desvio padrão ser expresso na mesma unidade dos dados não nos permite comparar duas ou mais séries de valores expressas em unidades diferentes.
O coeficiente de variação é uma medida de dispersão relativa, ou seja, é admensional, é a relação entre o desvio padrão e uma medida de tendência central.
 
*
*
Coeficiente de Variação de Pearson - CVP
Ex.: Consideremos os pesos e as alturas de um grupo de jovens atletas de uma escola de ensino fundamental da baixada fluminense: qual das medidas (Estatura ou Peso) possui maior homogeneidade?
 
*
*
Coeficiente de Variação de Pearson - CVP
 
intervalo de classes - Amplitude.ppt
*
*
ANÁLISE DE DADOS
Cálculo
Intervalo de classes / Amplitude
Prof: Marcus Sergio
*
*
Cálculo do número de intervalos de classe (i)
Podemos calcular o número de intervalos de classe de duas formas: 
 pela Regra de Sturges 
 pela raiz quadrada de n.
 
*
*
Regra da Raiz Quadrada de n - Número de Classes
Para determinar o número de classes ideal de uma distribuição, utiliza-se a regra da Raiz Quadrada de n, de acordo com o tamanho da amostra.
i =~ √n
Onde n é o número de elementos da relação de dados brutos.
 
*
*
Cálculo da amplitude das classes
Calcule a amplitude dos intervalos de classe (amplitude amostral dividida pelo número de intervalos de classe).
hi = AA
 i
OBS.: No caso de termos que arredondar o valor de hi, este deve ser arredondado sempre para mais para que haja folga na última classe, no contrário corre-se o risco de a tabela montada não incluir o último valor, e nenhum valor pode ser descartado.
 
*
*
Exemplo 1
Vinte e quatro alunos foram submetidos a um teste de aproveitamento cujos resultados foram os que se seguem no Rol abaixo.
 
*
*
Exemplo 2
A tabela abaixo apresenta as vendas abaixo de um determinado aparelho elétrico, durante um semestre, por uma firma comercial:
 
26   12   11   13   26   13 19 20 22
12   14   23   14   11   12 18 20 22
12   19   10   13   15   11 20 18 23
15   13   16   17   14   14 15 19 10
ROL
*
*
Trinta e seis alunos foram submetidos a um teste de aproveitamento cujos resultados foram os que se seguem no Rol abaixo.
Média, Moda, Mediana.ppt
*
*
ANÁLISE DE DADOS
Média / Moda / Mediana
Prof: Marcus Sergio
*
*
MÉDIA ARITMÉTICA (X) 
É igual ao quociente entre a soma dos valores do conjunto e o número total dos valores.
X = ∑ Xi / n 
onde Xi são os valores da variável e n o número de valores.
 
*
*
MÉDIA ARITMÉTICA (X) 
(dados agrupados)
Sem intervalos de classe
Com intervalos de classe
X = ∑ Xi . fi
 ∑ fi
 
*
*
MÉDIA ARITMÉTICA (X) 
(dados agrupados)
Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino. Calcularemos a quantidade média de meninos por família
 
*
*
MÉDIA ARITMÉTICA (X) 
(dados agrupados)
 
*
*
MODA(Mo) 
É o valor que ocorre com maior freqüência em uma série de valores.
Ex.: o número de calçado mais vendido em uma sapataria é a moda. Até os vendedores ambulantes, mesmo sem saber, utilizam-se da moda. De uma maneira grosseira, podemos nos lembrar daquilo que está na moda, ou seja, daquilo que mais aparece.
 
*
*
MODA PARA DADOS NÃO AGRUPADOS
 A moda de uma distribuição para dados não agrupados é fácil de ser vista, é só procurarmos o valor que mais aparece. 
 Uma distribuição pode ter nenhuma (amodal), uma (unimodal), duas (bimodal) ou mais modas.
 
*
*
MODA PARA DADOS NÃO AGRUPADOS
Na série {6, 7, 9, 11, 11, 11, 12, 12} a moda é igual a 11. A
distribuição é unimodal;
A série {2, 5, 7, 11,12} não possui um número que apareça
mais que os outros. A série é amodal;
A série {2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9} apresenta duas ou mais modas: 4 e 7. A série é bimodal;
 
*
*
MODA PARA DADOS AGRUPADOS SEM INTERVALOS DE CLASSE 
a) Sem intervalos de classe: Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de maior freqüência.
Ex: Qual a temperatura mais comum medida no mês abaixo:
Resp: 2º C é a temperatura modal, pois é a de maior freqüência.
 
*
*
MODA(Mo) 
b) Com intervalos de classe:	A classe que apresenta a maior freqüência é denominada classe modal. 
fórmula de CZUBER: Mo = l Mo + d1 X h
 (d1 +d2)
l* = limite inferior da classe modal..... e..... L* = limite superior da classe modal
d1 = freqüência da classe modal - freqüência da classe 
 anterior à da classe modal
d2 = freqüência da classe modal - freqüência da classe 
 posterior à da classe modal
h* = amplitude da classe modal
 
*
*
MEDIANA (Md)
A mediana de um conjunto de valores, dispostos segundo uma ordem ( crescente ou decrescente), é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos.
A mediana em dados não-agrupados 
Dada a série: { 5, 2, 6, 13, 9, 15, 10 }
Ordenando-a: { 2, 5, 6, 9, 10, 13, 15 }
O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9.
 
*
*
Método prático para o cálculo da Mediana:
Se a série dada tiver número ímpar de termos: 	O valor mediano será o termo de ordem dado pela fórmula:
(n+1) / 2
Ex: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 2, 5 }
 
1º - ordenar a série { 0, 0, 1, 1, 2, 2, 3, 4, 5 }
n = 9 logo (n + 1)/2 é dado por (9+1) / 2 = 5, ou seja, o 5º elemento da série ordenada será a mediana
A mediana será o 5º elemento = 2
 
*
*
Método prático para o cálculo da Mediana:
Quando o número de valores for par:
Ex.: 
Calcular a mediana da série {1, 2, 0, 0, 2, 4, 4, 3, 6, 4, 5, 6}
Rol - {0, 0, 1, 2, 2, 3, 4, 4, 4, 5, 6, 6} Md = 3 + 4 = 3,5
   2
Quando o número de elementos da série for par, a mediana nunca coincidirá com um dos elementos da série. Neste caso, a mediana será sempre a média aritmética dos 2 elementos centrais da série
 
*
*
Mediana
para dados agrupados sem intervalos de classe
Será dada pela fórmula: ∑ fi
 2 
Neste caso, basta identificarmos a freqüência acumulada (Fi) igual ou imediatamente superior ao seu resultado. 
 
*
*
Mediana para dados agrupados sem intervalos de classe
Veja a tabela a seguir: 
∑ fi = 39 = 19,5. Logo a Mediana será Md = 3
 2 2 
 
*
*
Mediana para dados agrupados em classes
Primeiro será necessário definir a classe da mediana
 
*
*
Mediana para dados agrupados em classes
Primeiro será necessário definir a classe da mediana
 
*
*
Mediana para dados agrupados em classes
A Mediana é dada pela fórmula:
 
Onde:
 li é o limite inferior da classe mediana.
 F(ant) é a freqüência acumulada anterior à classe mediana.
 f* é a freqüência simples da classe mediana.
 h* é a amplitude do intervalo da classe mediana.
 
*
*
Mediana para dados agrupados em classes
No caso da tabela dada anteriormente
 
*
*
Mediana para dados agrupados em classes
No caso da tabela dada anteriormente
Teremos:
 
*
*
Mediana para dados agrupados em classes
Calcule:
Média Aritmética, Moda e a Mediana
 
*
*
ATIVIDADE
As alturas, em centímetros, dos alunos de uma turma do 10º ano são as seguintes:
Calcule o nº de Classes (i)
Calcule a amplitude (h)
Calcule o valor da Mediana
*
*
ATIVIDADE
Vinte alunos foram submetidos a um teste de aproveitamento cujos resultados foram os que se seguem.
Calcule o nº de Classes (i)
Calcule a amplitude (h)
Calcule o valor da Mediana
*
*
ATIVIDADE
Quarenta e dois funcionários foram submetidos a um teste de aproveitamento cujos resultados foram os que se seguem no Rol abaixo.
Calcule o nº de Classes (i)
Calcule a amplitude (h)
Calcule o valor da Mediana
Probabilidade - binomial.ppt
*
*
ANÁLISE DE DADOS
PROBABILIDADE BINOMIAL
Prof: Marcus Sergio
*
*
DISTRIBUIÇÃO BINOMIAL DE PROBABILIDADE
As variáveis numéricas podem ser Discretas (contagem) e Contínua (medição)
Para a variável discreta a principal distribuição de probabilidade é a Distribuição Binomial.
 
Variável Discreta – É a variável que assume valor inteiro. Os dados discretos são resultados de contagem, por exemplo: número de carros que passam na ponte Rio de Janeiro – Niterói; atletas que cruzam a linha de chegada da maratona de São Silvestre, etc.
 
*
*
DISTRIBUIÇÃO BINOMIAL DE PROBABILIDADE
De cada 5 clientes que entram numa certa loja, 2 realizam uma compra.
P(compra) = P(C) = 0,40
Qual a probabilidade dos dois primeiros clientes realizarem compras?
S = {(CC), (CC’), (C’C), (C’C’)}
 
*
*
DISTRIBUIÇÃO BINOMIAL DE PROBABILIDADE
E se quisermos saber as probabilidades de X compras dos 10 primeiros clientes? Ou dos 100 primeiros?
P(x) = Cn, k pk q(n-k)
Onde:
 Cn,x = n! / (k!(n-k)!)
 
*
*
DISTRIBUIÇÃO BINOMIAL DE PROBABILIDADE
Utiliza-se os seguintes parâmetros para a Distribuição Binomial de probabilidade:
p – Probabilidade de sucesso;
q – Probabilidade de insucesso (1-p);
n – tamanho da amostra ou número de vezes que se faz um experimento;
K – Variável aleatória.
 
*
*
DISTRIBUIÇÃO BINOMIAL DE PROBABILIDADE
Onde, Fatorial de um número significa o produto do número natural n pelos seus antecedentes até chegar à unidade.
Exemplo:
5! = 5*4*3*2*1
3! = 3*2*1
0! = 1
1! = 1
 
*
*
DISTRIBUIÇÃO BINOMIAL DE PROBABILIDADE
Exemplo: 
Determine a probabilidade de não aparecer a face 2 ao lançar o dado 3 vezes.
p = 1/6
q = (1-1/6) = 5/6
n = 3
k = 0
Pr = Cn,k * pk * q(n-k) 
Pr{k=0}= C3,0 * 1/60 * 5/6(3-0) 
Pr{k=0}= C3,0 * 1/60 * 5/6(3-0) 
Pr{k=0}= 1 * 1 * 125/216 
 
*
*
DISTRIBUIÇÃO BINOMIAL DE PROBABILIDADE
Exemplo: 
O setor de saúde do trabalhador, ao acompanhar por um longo períodoa aplicação de um produto químico domiciliar, verificou que este produto causa lesões na pele de 40% dos funcionários que trabalham com ele. Ao examinar uma amostra de 15 destes profissionais, pede-se determinar a probabilidade de causar lesões na pele em mais de 3 e no máximo em 6 deles.
Temos uma distribuição binomial: 
P(3< X <6) = Pr(X=4) + Pr(X=5) + Pr(X=6)
 
*
*
DISTRIBUIÇÃO BINOMIAL DE PROBABILIDADE
Exemplo: 
Temos uma distribuição binomial: 
P(3< X <6) = Pr(X=4) + Pr(X=5) + Pr(X=6)
 
*
*
DISTRIBUIÇÃO BINOMIAL DE PROBABILIDADE
Exemplo: 
No bairro de Buriti, a probabilidade de um carro furtado ser recuperado é de 0,40. Dentre 10 carros furtados, qual a probabilidade de até 3 carros serem recuperados?
 
*
*
DISTRIBUIÇÃO BINOMIAL DE PROBABILIDADE
Exemplo: 
No
bairro de Buriti, a probabilidade de um carro furtado ser recuperado é de 0,40. Dentre 10 carros furtados, qual a probabilidade de até 3 carros serem recuperados?
p = 0,4
q = (1-0,4) = 0,6
n = 10
k = 0
k= 1
k= 2
k= 3
 
*
*
DISTRIBUIÇÃO BINOMIAL DE PROBABILIDADE
Exemplo: 
No bairro de Buriti, a probabilidade de um carro furtado ser recuperado é de 0,40. Dentre 10 carros furtados, qual a probabilidade de até 3 carros serem recuperados?
Pr{k≤3} = Pr{k=0} + Pr{k=1} + Pr{k=2} + Pr{k=3};
Pr = Cn,k * pk * q(n-k) 
Pr{k=0}= C10,0 * 0,40 * 0,6(10-0) 
Pr{k=1}= C10,1 * 0,41 * 0,6(10-1) 
Pr{k=2}= C10,2 * 0,42 * 0,6(10-2) 
Pr{k=3}= C10,3 * 0,43 * 0,6(10-3) 
 
 
*
*
DISTRIBUIÇÃO BINOMIAL DE PROBABILIDADE
Atividade: 
Em um tratamento para alergia em crianças, é ministrado um remédio. Observou-se que 20% das crianças que tomam tal medicamento ficam sonolentas em 5 minutos. Determine a probabilidade de que, dentre 20 crianças que tomam o remédio, no máximo duas ficarem sonolentas dentro de 5 minutos. 
 
*
*

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Continue navegando