Buscar

Estatistica_I_Capitulo_2_Estatistica_Descritiva_Apres_Dados_Office_2007

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

Estatística Aplicada à Administração I
ADM 1276 Profa. Léa Benatti
Capítulo 2 – ESTATÍSTICA DESCRITIVA:
 Métodos Tabulares e Gráficos (Apresentação dos Dados).
 Introdução
1 - Sintetizando Dados Qualitativos
2 - Sintetizando Dados Quantitativos
3 – Análise Exploratória dos Dados: Apresentação de Ramo-e-Folha
4 – Tabulação Cruzada e Diagrama de Dispersão
PUC-Rio
1
Esta apresentação tem o propósito de cumprir a Tarefa 4 do Curso de Treinamento do Moodle (Sistema de Gerenciamento de Curso), realizado no Departamento de Administração da PUC-Rio.
Serão mostrados:
- Um breve resumo de um artigo sobre Educação à Distancia (referente à tarefa 1);
E considerações Finais do debate realizado no Fórum (referente à tarefa 3).
Artigo: ....
Estudo sobre a importância da introdução de estratégias motivacionais de suporte ao aluno de programa de educação à distância. 
Estatística Aplicada à Administração I
ADM 1276 Profa. Léa Benatti
Capítulo 2 – ESTATÍSTICA DESCRITIVA:
 Métodos Tabulares e Gráficos (Apresentação dos Dados).
Introdução
 Métodos Tabulares
 Métodos Gráficos
 Exemplos:
Distribuição de Freqüência;
Gráficos em Barras;
Histogramas;
Apresentação Ramo-e-Folha;
Tabulações Cruzadas (sintetiza dados quando a relação entre 2 variáveis é necessária).
Sintetizam dados Qualitativos e Quantitativos
- Sintetizam dados referentes a uma variável;
- Sintetizam dados quando a relação entre duas variáveis é de interesse.
2
Esta apresentação tem o propósito de cumprir a Tarefa 4 do Curso de Treinamento do Moodle (Sistema de Gerenciamento de Curso), realizado no Departamento de Administração da PUC-Rio.
Serão mostrados:
- Um breve resumo de um artigo sobre Educação à Distancia (referente à tarefa 1);
E considerações Finais do debate realizado no Fórum (referente à tarefa 3).
Artigo: ....
Estudo sobre a importância da introdução de estratégias motivacionais de suporte ao aluno de programa de educação à distância. 
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
Objetivo dos Métodos  Sintetizar dados de forma que possam ser facilmente entendidos e interpretados.
Dados Qualitativos  utilizam rótulos ou nomes para identificar categorias de itens semelhantes.
Dados Quantitativos  usam valores numéricos que indicam quantidade.
1 - Sintetizando Dados Qualitativos
Sumário Tabular de Dados
i) Distribuição de Freqüência → Sumário Tabular de dados
 Mostra o número de itens (freqüência) em cada uma das classe não sobrepostas.
3
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
Ex.: Amostra de 50 compras de refrigerantes
Dados Qualitativos  Coca-cola, Coca-cola Light, Guaraná, Sprite, Pepsi-cola, 
Freqüência de compras de refrigerantes.
Número de vezes que foi comprado cada refrigerante.
Sintetiza dados de compra de refrigerantes em uma amostra de 50 compras (n = 50).
Coca-cola (lider); Sprite / Guaraná (empatados em quarto lugar.
Conclusão: a distribuição de freqüência sintetiza informações sobre a popularidade dos cinco refrigerantes mais vendidos.
Distribuição de Freqüência das compras de refrigerantes.
4
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
ii) Distribuição de Freqüência Relativa e de Freqüência Percentual → Sumário Tabular de dados
Para alguns casos, há interesse na proporção (FR) ou na porcentagem (FP) dos itens de cada classe.
FR: equivale à fração ou proporção dos itens pertencentes a uma classe.
FP: é a freqüência relativa multiplicada por 100.
 FP = FR x 100
5
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
Ex.: Amostra de 50 compras de refrigerantes
Dados Qualitativos  Coca-cola, Coca-cola Light, Guaraná, Sprite, Pepsi-cola, 
Três primeiros refrigerantes mais comprados:
Coca-cola: 38%
Pepsi-cola: 26%
Coca-cola Light: 16%
 TOTAL: 80%
Distribuição de Freqüência Relativa e de Freqüência Percentual das compras de refrigerantes
– Coca-cola;
- Coca-cola Light;
- Guaraná;
- Pepsi-cola;
Sprite
6
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
iii) Gráficos em Barras → Sumário Gráfico de dados
Para alguns casos, há interesse na proporção (FR) ou na porcentagem (FP) dos itens de cada classe.
Descrevem dados qualitativos, sintetizados em uma distribuição de Freqüência, em uma distribuição de Freqüência Relativa (FR) ou em uma distribuição de Freqüência Percentual (FP).
Eixo Horizontal: especifica os rótulos usados para cada classe (categoria);
Eixo Vertical: escala de freqüência, freqüência relativa ou freqüência percentual (valores).
5
20
15
10
5
19
8
5
13
Refrigerante
Freqüência
0
Gráfico em Barras das comprar de Refrigerantes.
 n = 50
(a)
(b)
(c)
(d)
(e)
Classes com freq. ≤ 5% podem ser agrupadas em uma classe determinada de “outros”.
7
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
iv) Gráfico em Setores (“Pizza”) → Sumário Gráfico de dados
Circulo: representa todos os dados.
Usa-se Freqüências Relativas (FR) para subdividir o circulo em setores (ou partes) → correspondem à Freqüência Relativa de cada classe.
Circulo: 360 graus.
Coca-cola: FR = 19/50 = 0,38
 0,38 x 360 = 136,80
Coca-cola Light: FR = 0,16
 0,16 x 360 = 57,60
8
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
2 - Sintetizando Dados Quantitativos
Sumário Tabular de Dados
i) Distribuição de Freqüência → Sumário Tabular de dados.
Dados Quantitativos: deve-se ter mais cuidado ao definir as classes não sobrepostas a serem usadas na distribuição de freqüência.
Três etapas são definidas:
 1 - Determinar o número de classes não sobrepostas;
 2 - Determinar a amplitude de cada classe;
 3 - Determinar os limites da classe.
9
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
Etapas 1: Número de classes não sobrepostas
Especificar intervalos para agrupar os dados.
 Recomendável → usar entre 5 a 20 classes.
 - Número pequeno de itens: 5 a 6 classes é recomendado;
 - Número grande de itens: necessário maior número de classes.
Etapas 2: Amplitude de classes
 Recomendável → amplitude igual para cada uma das classes.
 - Número maior de classes: menor amplitude;
 - Número menor de classes: maior amplitude.
Arredondar para valor conveniente.
* Número classes e Amplitude classes: inversamente proporcionais.
10
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
Etapas 3: Limites de Classe
São escolhidos de forma que cada uma das observações pertença a uma e somente uma classe.
- Limite inferior: menor valor de dados atribuídos à classe;
- Limite superior: maior valor de dados atribuídos à classe.
obs.: Dados Qualitativos → não é preciso especificar limites de classe (cada item de dados situa-se em uma classe distinta)
11
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
Exemplo: dados → 12, 15, 20, 22, 14 / 14, 15, 27, 21,18 / 19, 18, 22, 33, 16 / 18, 17, 23, 28, 13.
Tempo (dias) para a conclusão das auditorias de fim de ano.
 (n = 20 clientes)
- Etapa 1: usar 5 classes (no relativamente pequeno de amostra);
- Etapa 2: Amplitude de classe:
- Etapa 3: Limites de classe:
 no classes = 5; 1ª classe → Limite inferior = 10 dias;
 Limite superior = 14 dias; Amplitude 5
Classe 1: 10 – 14; Classe 2: 15 – 19; Classe 3: 20 – 24; Classe 4: 25 – 29; Classe 5: 30 – 34.
12
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
Exemplo (continuação):
Distribuição de Freqüência para os dados de tempo para a conclusão das auditorias. (n = 20 clientes)
Conclusão: Tempos mais freqüentes para conclusão das auditorias: 15 – 19 dias maior valor de freqüência - 8).
Apenas 1(uma) auditoria necessitou mais de 30 dias para ser concluída.
Ponto Médio da Classe: valor intermediário entre os limites inferiores
e superiores da classe → 5 pontos médios para o modelo: 12 (10+(14-10)/2 = 12); 17; 22; 27 (25+(29-25)/2 = 27) ; 32. (Usados em dados Quantitativos)
13
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
ii) Distribuição de Freqüência Relativa e de Freqüência Percentual → Sumário Tabular de dados.
Mesma definição usada para dados qualitativos.
FR – proporção das observações pertencentes a uma classe.
Exemplo: Distribuição de Freqüência para os dados de tempo para a conclusão das auditorias. (n = 20 clientes → tamanho da amostra)
Conclusão:
40% das auditorias necessitam de 15 a 19 dias;
5% das auditorias necessitam de 30 ou mais dias.
14
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
iii) Gráficos de Dispersão Unidimensional → Sumário Gráfico de dados.
Úteis para comparar a distribuição dos dados de 2 ou mais variáveis.
iv) Histograma → Sumário Gráfico de dados.
Úteis para dados quantitativos.
Usados para distribuição de freqüência, distribuição de freqüência relativa e distribuição de freqüência percentual.
 - Usados para caso de dados quantitativos contínuos (não fracionários);
 - Não há separação entre os retângulos como ocorre no gráfico de barras;
 - Não há separação entre classes adjacentes;
 - Todos os valores entre o limite inferior da primeira classe e o superior da última classe são possíveis (portanto, não há separação das classes).
Vantagens: fornece informações sobre a forma, ou formato, de uma distribuição.
15
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
v) Distribuições Cumulativas → Sumário Tabular de dados.
Distribuição Freqüência Cumulativa: é uma variação da distribuição de freqüência que produz outro tipo de sumário tabular → usa número de classe, amplitudes de classes e limites de classe.
16
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
vi) Ogiva → Sumário Gráfico de dados.
Usados para apresentar dados de Distribuição Cumulativa.
 Eixo Horizontal: Valores de dados;
 Eixo Vertical: freqüência cumulativa (FC), freqüências relativas cumulativas (FRC) ou freqüências percentuais cumulativas (FPC).
Ogiva: construída assinalando um ponto correspondente à freqüência cumulativa de cada classe → assinalar pontos intermediários entre os limites de classe.
Importante:
 Ler Bibliografia Principal (Anderson – pgs. 31, 32 – 2ª edição):
 Histograma, Níveis de Assimetria em Histogramas.
 Ler Bibliografia Principal (Anderson – pg 32 – 2ª edição):
 Exemplos de Ogivas.
17
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
Informações Gerais Importantes:
- Histograma: gráfico em barras, sem separação entre as barras.
- Para dados quantitativos discretos pode-se usar separação entre barras.
- Dados quantitativos contínuos, separação entre as barras não é apropriada.
- Limites de classe com dados quantitativos dependem do nível de precisão dos dados:
 Dados com valores inteiros: limites de classe com valores inteiros;
 Dados com uma casa decimal: limites de classe com uma casa decimal;
 Dados com duas casas decimais: limites de classe com duas casas decimais;
 Classe aberta: requer um limite inferior de classe ou um limite superior de classe:
 Ex.: Auditorias → Supondo que duas auditorias tenham tomado 58 e 65 dias, respectivamente.
 Em vez de usar classes de 5 em 5 dias, simplificar a distribuição de freqüência e mostrar uma classe (a ultima delas) como “35 ou mais”, e neste caso, a freqüência é 2 (dois valores são acima de 35).
18
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
3 – Análise Exploratória dos Dados: Apresentação de Ramo-e-Folha
Técnicas de Análise Exploratória dos Dados:
	- Cálculos aritméticos simples;
	- Gráficos.
Uma Técnica de Análise Exploratória dos Dados é denominada Apresentação de Ramo-e-Folha → mostra simultaneamente a ordem de classificação e a forma dos dados.
19
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
Apresentação de Ramo-e-Folha
a) Organizar os dígitos à esquerda de cada valor de dados à esquerda da linha vertical;
b) Registrar o último dígito de cada valor de dados à direita da linha vertical;
c) Definir a unidade da folha usada.
	
Dígitos à esquerda de cada valor de dados
Último dígito de cada valor de dados
Linha vertical
20
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
Exemplo: Teste de aptidão, 150 questões, aplicado a 50 pessoas que concorrem a um cargo.
Dados → Número de questões respondidas corretamente em um teste de aptidão: 
112, 73, 126, 82, 92, 115, 95, 84, 68, 100 / 72, 92, 128, 104, 108, 76, 141, 119, 98, 85 / 69, 76, 118, 132, 96, 91, 81, 113, 115, 94 / 97, 86, 127, 134, 100, 102, 80, 98, 106, 106 / 107, 73, 124, 83, 92, 81, 106, 75, 95, 119.
 n = 50, Menor Dado: 68, Maior Dado: 141.
Unidade de folha: 1
a) Organizar dígitos à esquerda do valor de dado:
 Menor dado: 68 (6 à esquerda da linha vertical e 8 à direita;
 Maior dado: 141 (14 à esquerda de linha vertical e 1 à direita.
21
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
b) Registrar último dígito do valor de dado;
22
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
c) Classificar Dados (lado direito, em ordem crescente cada linha).
23
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
d) Dados Classificados (similar ao Histograma).
Classe de maior freqüência:
90 – 99: 11 itens;
Dado de maior freqüência da classe: 92 (aparece 3 vezes). 
24
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
i) Vantagens de Apresentação Ramo-e-Folha sobre Histograma:
 1) Apresentação Ramo-e-Folha → mais fácil de construir manualmente;
 2) Dentro de um intervalo de classe, a apresentação Ramo-e-Folha mostra os dados reais (o que não ocorre se usar um Histograma).
ii) Distribuição de Freqüência ou Histograma, e Apresentação Ramo-e-Folha:
 Não possuem número absoluto de classes.
Se apresentação Ramo-e-Folha condensar muito os dados, estender a apresentação usando 2 ou mais Ramos para cada dígito à esquerda da linha vertical.
 Considerar 2 ramos para cada dígito:
 1º ramo do dígito → valores terminados em 0, 1, 2, 3 e 4 (folhas de 0 a 4);
 2º ramo do dígito → valores terminados em 5, 6, 7, 8 e 9 (folhas de 5 a 9).
25
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
Ex.: Apresentação Ramo-e-Folha - apresentação estendida:
Unidade de Folha não indicada: entende-se unidade de Folha igual a 1 (um).
26
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
Ex.: Apresentação Ramo-e-Folha (unidade de folha especificada  1)
27
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
4 – Tabulação Cruzada e Diagrama de Dispersão
Até este item: falou-se de métodos tabulares e gráficos usados para sintetizar dados de uma variável a cada vez.
Tabulação Cruzada e Diagrama de Dispersão → métodos usados para compreender a relação entre duas variáveis.
Tabulação Cruzada → Sumario tabular para 2 variáveis.
Ex.: Avaliação da qualidade e preço das refeições de 300 restaurantes.
28
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
Tabulação Cruzada da qualidade e preço de refeições de 300 restaurantes.
29
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
Porcentagens de linha para cada categoria de avaliação.
30
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
i) Tabulação Cruzada
Usada quando é necessário examinar relação entre 2 variáveis;
Amplamente usada na prática;
Podem ser desenvolvida para variáveis qualitativas e para variáveis quantitativas;
Para variáveis quantitativas, deve sempre ser criada classes para os valores das variáveis.
ii) Paradoxo de Simpson
Precisa-se ter cuidado ao tirar conclusões utilizando dados agregados. Variáveis ocultas devem sempre ser investigadas antes de tirar conclusões em caso de tabulação cruzada. (Ver bibliografia principal
– pg. 45).
31
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
iii) Diagrama de Dispersão e Linha de Tendência
Diagrama de Dispersão: apresentação gráfica da relação entre 2 variáveis.
Linha de Tendência: linha que fornece uma aproximação da relação entre 2 variáveis.
32
Capítulo 2 – Estatística Descritiva
Apresentação de Dados
iii) Diagrama de Dispersão e linha de Tendência (continuação)
Diagrama de Dispersão.
Linha de Tendência.











Y
X
Relação global positiva











Y
X
Relação global negativa











Y
X
Sem relação aparente

33

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Outros materiais