Buscar

1 Aula Conceitos b sicos de Estat stica (1)

Prévia do material em texto

DIRETORIA ACADÊMICA
CURSO DE ENGENHARIA
PERÍODO LETIVO 2017.1
Conceitos Básicos em Estatística
O que é estatística?
A estatística tem aplicações nos mais importantes ramos da ciência e torna-se a cada dia uma importante ferramenta de apoio à tomada de decisão. O objetivo deste capítulo é introduzir importantes conceitos em estatística, trabalhando a intuição do leitor para que este raciocine em cima de problemas cujas soluções requerem o uso de técnicas estatísticas.
Para iniciar toda a discussão, primeiramente é necessário conhecer melhor o conceito de estatística. As pessoas comumente escutam falar de estatísticas na mídia. Diariamente são divulgadas informações tais como: índice de inflação, taxa de mortalidade, índice de desenvolvimento humano, proporção de eleitores, dentre outras.
O primeiro cuidado que devemos tomar é distinguir as estatísticas (valores numéricos que resumem informações) da Estatística que ganhou status de ciência. Nesta introdução, esta distinção será feita da seguinte forma, a Estatística, enquanto ciência, terá sempre a primeira letra maiúscula.
No dicionário Aurélio, podemos encontrar como primeira definição para Estatística:
[Do fr. statistique.] S.f.1.Parte da matemática em que se investigam os processos de obtenção, organização e análise de dados sobre uma população ou sobre uma coleção de seres quaisquer, e os métodos de tirar conclusões e fazer ilações ou predições com base nesses dados.
Como não poderia deixar de ser, a definição de Estatística no dicionário é bem abrangente e procura mostrar vários campos de ação. Entretanto, a definição para Estatística que mais se aproxima da abordagem que será feita durante este curso é dada abaixo.
A Estatística é um conjunto de métodos e técnicas que auxiliam a tomada de decisão sob a presença de incerteza
A incerteza permea várias áreas do conhecimento: física, ciências sociais, comportamento humano, economia e ciências naturais. A incerteza é consequência da variabilidade de um fenômeno e dificulta a tomada de decisões. O tamanho de uma peça de automóvel a ser produzida é uma quantidade incerta, assim como o número de alunos que se matricularão na disciplina de Estatística no próximo período letivo do curso de graduação. Outros inúmeros exemplos podem ser citados e a forma adequada de lidar com a incerteza é feita por meio do uso de idéias e métodos desenvolvidos na Estatística. Estes métodos basicamente extraem informações de dados coletados e utilizam o cálculo de probabilidades para balizar as decisões.
Estatística Descritiva x Estatística Inferencial
A Estatística é conhecida, por muitas pessoas, como uma ferramenta meramente descritiva, ou seja, descreve dados por meio de percentagens, taxas, proporções, gráficos e tabelas. Apesar da Estatística cumprir, também, este papel de resumir as informações, seu potencial de uso é muito mais amplo. Para entender o uso da Estatística como ferramenta de apoio à tomada de decisões, temos que entender o conceito de Estatística Inferencial e sua diferença para a Estatística Descritiva. Abaixo são apresentadas as funções destas duas abordagens.
Estatística Descritiva (Dedutiva) 
O objetivo da Estatística Descritiva é resumir as principais características em um conjunto de dados fazendo uso de tabelas, gráficos e resumos numéricos. Descrever os dados pode ser comparado ao ato de tirar uma fotografia da realidade. Caso a câmera fotográfica utilizada não seja adequada, ou esteja sem foco, o resultado, no caso a foto, pode sair distorcido. Portanto, quem faz uso da estatística deve ter extremo cuidado em escolher os métodos e técnicas corretas para resumir os dados.
	Tabela 1.1:
	Técnicas de Estatística Descritiva
	
	
	
	
	Tabelas de frequência
	Ao dispor de uma lista volumosa de dados, as tabelas de frequência servem para agrupar informações de modo que estas possam ser analisadas. As tabelas podem ser de frequência simples ou de frequência em intervalos de classe
	
	
	Gráficos
	O objetivo da representação gráfica é dirigir a atenção do analista para alguns aspectos2 de um conjunto de dados.
”Um gráfico vale mais que mil palavras”.
Alguns exemplos de gráficos: diagrama de barras, diagrama em setores, histograma, box-plot, ramo-e-folhas, diagrama de dispersão e gráfico sequencial.
	
	
	Resumos numéricos
	Através de medidas ou resumos numéricos podemos levantar importantes informações sobre o conjunto de dados tais como: a tendência central, variabilidade, simetria, valores extremos, valores discrepantes, etc...
As competências de um analista quantitativo durante a realização de uma análise descritiva podem ser comparadas às de um detetive que procura evidências que o leve a formular hipóteses e embase suas ações.
Estatística Inferencial (Indutiva)
A Estatística Inferencial utiliza informações incompletas para tomar decisões e tirar conclusões satisfatórias. O alicerce das técnicas de estatística inferencial está no cálculo de probabilidades. As duas técnicas de estatística inferencial são: estimação e teste de hipóteses.
	Tabela 1.2:
	Técnicas de estatística inferencial
	
	
	
	
	Estimação
	A estimação consiste em utilizar um conjunto de dados incompletos, ao qual iremos chamar de amostra, e com ele obter estimativas de quantidades de interesse. Estas estimativas podem ser pontuais (representadas por um único valor) ou intervalares.
	
	
	Teste de Hipóteses
	O fundamento do teste estatístico de hipóteses é levantar suposições (hipóteses) acerca de uma quantidade não conhecida e, também utilizar dados incompletos para criar uma regra que permita escolher a hipótese mais adequada.
Um exemplo clássico do uso da Estatística Inferencial ao qual estamos acostumados é apresentado a seguir.
Exemplo 1: Um instituto de pesquisa deseja estimar a proporção de eleitores do partido de situação no primeiro turno das eleições presidenciais. Ao coletar uma amostra de 1200 eleitores, a proporção foi estimada em 54%.
No Exemplo 1, a quantidade a ser estimada é a proporção de eleitores que votarão no partido de situação nas eleições para presidente. Somente a realização das eleições revelará o verdadeiro valor desta quantidade. Entretanto, estimá-la, com base em uma amostra, auxilia a tomada de decisões tais como a alteração de uma estratégia de campanha política.
Uma outra aplicação da estatística inferencial aparece no Exemplo 2 onde duas hipóteses são colocadas em questão. Será que uma nova droga, a ser lançada, aumenta a produção de um hormônio?
Exemplo 2 Um laboratório deseja verificar se uma nova droga aumenta a produção de testosterona em homens com idade acima de 35 anos. Ao aplicá-la em um grupo de 40 indivíduos, constatou-se que após um período de tempo a droga aumentou significativamente a quantidade do referido hormônio.
Exemplo 3 Em uma fábrica de parafusos, a peça é considerada dentro da especificação caso seu comprimento esteja no intervalo entre 4,8cm e 5,2cm. Os técnicos do Controle Estatístico de Qualidade selecionam diariamente 100 parafusos fabricados e calculam o comprimento médio. Já existe conhecimento prévio sobre a variabilidade nos tamanhos dos parafusos fabricados, caso o comprimento médio esteja abaixo de 4,99 cm ou acima de 5,01 cm, o processo será interrompido.
No Exemplo 3, espera-se que o comprimento médio de um conjunto de parafusos amostrados esteja dentro de um intervalo. Caso isto não ocorra, o processo de produção sofre uma interrupção. Neste caso, a Estatística Inferencial é utilizada para criar uma regra de decisão com base na observação dos comprimentos de um subconjunto de 100 peças.
População e Amostra
O uso da estatística inferencial oferece suporte à tomada de decisão com base em apenas uma parte das informações que interessam no problema estudado. A partir de agora, vamos utilizar os conceitos de população e amostra para representar, respectivamente, o conjunto total e o conjunto parcial (incompleto) destas informações.
População
É a conjunto de todasas unidades que possuem pelo menos uma característica em comum que desejamos medir . Estas unidades podem ser pessoas, domicílios, bancos, universidades, etc. Em muitas ocasiões o termo Universo é utilizado no lugar de População. Repare que na definição de população não há nada que estabeleça que esta deve ser formada por uma grande quantidade de unidades, mas por todas as que estamos interessados em investigar.
Amostra
É um conjunto menor de unidades retiradas da população, ou seja, um subconjunto da população. O desejável é que amostra represente bem a população pois, a partir dela a estatística inferencial tira conclusões sobre como deve ser a população. Entretanto, nem sempre é fácil garantir esta representatividade por uma série de fatores. O ideal é que a amostra seja casual (aleatória) para garantir que as unidades tenham igual chance de serem selecionadas e evitar possíveis vícios nas inferências que serão feitas, mas em muitas situações não é possível encontrar uma amostra casual.
A caracterização da população está vinculada ao problema a ser estudado. Se um vendedor deseja fazer um levantamento dos potenciais clientes para o seu produto, a população será formada por todos os indivíduos com possibilidade de consumir aquele produto. Se este produto for, por exemplo, um iate, a população deve ser constituída apenas por indivíduos que possuem renda suficiente para comprá-lo.
Para tornar clara a definição das unidades que fazem parte da população em um levantamento de dados é importante identificar 3 elementos: uma característica em comum, a localização temporal e geográfica.
Exemplo 4
Suponha que por um levantamento amostral desejamos estudar a taxa de inadimplência dos clientes de um banco na cidade de Niterói.
	Característica
	correntista do banco a ser investigado
	
	
	Tempo
	clientes com cadastro em março de 2009
	
	
	Região
	agências do município de Niterói
Exemplo 5
A secretaria de saúde de Niterói tem interesse em previnir a obesidade em adolescente que é considerada uma das novas epidemias.
		
	
	Característica
	alunos de 2o. grau da rede pública das escolas de Níterói
	
	
	Tempo
	matriculados em janeiro de 2009
	
	
	Região
	município de Niterói
Sem a clara definição dos 3 elementos, conforme fora feito nos exemplos acima, torna-se difícil proceder a coleta de dados. Quando um estudo estatístico é feito levantando-se informações de todas as unidades da população este chama-se Censo. Há casos em que o levantamento censitário é inviável, como por exemplo em testes destrutivos. Ao estudar apenas parte da população para inferir sobre o todo, o levantamento é dito ser por amostragem.
Um elemento importante para a retirada de uma amostra é a existência de um cadastro com a relação de todas as unidades que compõe a população. Quando este cadastro não existe, não poderemos selecionar diretamente as unidades e uma possibilidade é selecionar um grupo de unidades. Para aqueles que desejam estudar este assunto a fundo, maiores detalhes sobre técnicas de amostragem podem ser vistas em Bussab (2001).
Amostragem
Existe uma técnica especial – amostragem – para recolher amostras, que garante, tanto quanto possível, o acaso na escolha.
Dessa forma, cada elemento da população passa a ter a mesma chance de ser escolhido, o que garante à amostra o caráter de representatividade, e isto é muito importante, pois, como vimos, nossas conclusões relativas à população vão estar baseadas nos resultados obtidos nas amostras dessa população.
Daremos, a seguir, três das principais técnicas de amostragem.
Amostragem Casual ou Aleatória Simples
Este tipo de amostragem é equivalente a um sorteio lotérico. 
Na prática, a amostragem casual ou aleatória simples pode ser realizada numerando-se a população de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, k números dessa sequência, os quais corresponderão aos elementos pertencentes à amostra.
Exemplo:
Vamos obter uma amostra representativa para a pesquisa da estatura de noventa alunos de uma escola.
Numeramos os alunos de 1 a 90.
Escrevemos os números, de 1 a 90, em pedaços iguais de um mesmo papel, colocando-os dentro de uma caixa. Agitamos sempre a caixa para misturar bem os pedaços de papel e retiramos, um a um, nove números que formarão a amostra. Neste caso, 10% da população.
Na prática:
Excel: =aleatórioentre(inferior;superior)
		 Tabela de Números Aleatórios
Amostragem Proporcional Estratificada
Muitas vezes a população se divide em subpopulações – estratos.
Como é provável que a variável em estudo apresente, de estrato em estrato, um comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio dos elementos da amostra leve em consideração tais estratos.
É exatamente isso que fazemos quando empregamos a amostragem proporcional estratificada, que, além de considerar a existência dos estratos, obtém os elementos da amostra proporcional ao número de elementos dos mesmos.
Exemplo:
Supondo, no exemplo anterior, que, dos noventa alunos, 54 sejam meninos e 36 sejam meninas, vamos obter a amostra proporcional estratificada.
São, portanto, dois estratos (sexo masculino e sexo feminino) e queremos uma amostra de 10% da população. Logo, temos:
	SEXO
	POPULAÇÃO
	10%
	AMOSTRA
	Masculino
	54
	10 x 54 / 100 = 5,4
	5
	Feminino
	36
	10 x 36 / 100 = 3,6
	4
	Total
	90
	10 x 90 / 100 = 9
	9
Numeramos os alunos de 01 a 90, sendo que de 01 a 54 correspondem meninos e de 55 a 90, meninas. Tomando na Tabela de Números Aleatórios a primeira e a segunda colunas da esquerda, de cima para baixo, obtemos os seguintes números:
57 28 92 90 80 22 56 79 53 18 53 03 27 05 40
Temos, então:
28 22 53 18 03 – para os meninos;
57 90 80 56 – para as meninas.
Amostragem Sistemática
Quando os elementos da população já se acham ordenados, não há necessidade de construir o sistema de referência. São exemplos os prontuários médicos de um hospital, os prédios de uma rua, as linhas de produção etc. Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos sistemática.
Assim, no caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar um para pertencer a uma amostra da produção diária. Neste caso, estaríamos fixando o tamanho da amostra em 10% da população.
Exemplo:
Suponhamos uma rua contendo novecentos prédios, dos quais desejamos obter uma amostra formada de cinquenta prédios. Podemos, nesse caso, usar o seguinte procedimento: como 900/50 = 18, escolhemos por sorteio casual um número de 1 a 18 (inclusive), o qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente considerados de 18 em 18. Assim, se o número sorteado fosse o 4, tomaríamos, pelo lado direito da rua, o 4ª prédio, o 22ª, o 40ª etc., ate voltarmos ao inicio da rua, pelo lado esquerdo.
Variáveis e suas classificações
Em um levantamento de dados, censitário ou amostral, investiga-se em cada unidade de interesse uma ou mais características que supostamente variam de uma unidade para outra. Estas características são chamadas de variáveis. A variável pode ser uma quantidade que permite a realização operações aritméticas; soma, subtração, divisão, multiplicação, ou pode apenas ser um atributo como cor de pele, zona de moradia ou classe social. No primeiro caso, a variável é classificada como quantitativa e na outra situação ela é dita ser qualitativa.
A classificação da variável vai ser determinante para o tipo de análise estatística a ser realizada. Sobre uma variável qualitativa, não podemos calcular resumos numéricos tais como a média aritmética e desvio-padrão. Por outro lado, o diagrama em setores (ou gráfico de pizza), não é adequado para representar as frequências das temperaturas observadas durante um ano, pois serão muitos valores diferentese a consequente formação de muitas fatias.
As variáveis quantitativas possuem uma subclassificação, elas podem ser discretas ou contínuas. O primeiro caso ocorre quando os possíveis valores da variável podem ser enumerados. Esta situação é típica de dados oriundos de contagens, como por exemplo o número diário de assaltos em um quarteirão que pode assumir valores no conjunto {0, 1, 2, 3,…}. A segunda subclassificação ocorre nos casos em que a variável pode assumir valores em um intervalo contínuo, por consequência os possíveis valores são infinitos e não-enumeráveis. A variável idade, por exemplo, é uma variável contínua pois se for medida com bastante precisão pode gerar como resultado 32,1023 anos de idade e, quanto maior for a precisão, dificilmente dois indivíduos apresentarão idades iguais. Apresentamos a seguir alguns exemplos de variáveis quantitativas.
Variáveis quantitativas
  - Discretas: número de filhos, número de plantas, quantidade de peças.
  - Contínuas: índice de preços, salário, peso, altura.
Toda variável que não é quantitativa, será classificada como qualitativa. A variável qualitativa é não-numérica, portanto é expressa em classes, níveis ou categorias. Caso estes níveis sejam ordenáveis, a variável é dita ser ordinal, caso contrário ela é classificada como nominal. É importante ressaltar que esta ordenação nos níveis (categorias) da variável é natural tal como ocorre com a variável classe social. Nesta situação, Classe A > Classe B > Classe C > Classe D. Como já foi comentado, o tipo de variável determina o tipo de análise e, para variáveis qualitativas ordinais, um resumo numérico, uma técnica gráfica ou até uma tabela de frequência deve incorporar a idéia de ordenação.
Variáveis qualitativas (atributos)
  - Ordinais: classe social, cargo na empresa, classificação de um filme.
  - Nominais: sexo, bairro, cor de pele, canal de TV preferido.
Além das classificações acima, vamos destacar uma outra situação em que a característica de interesse é investigada ao longo do tempo (espaço) constituindo o que chamamos de uma série temporal. A análise de uma variável que é medida ao longo do tempo deve considerar aspectos específicos como tendência e sazonalidade. Ao resumir estas variáveis, quando há presença de tendência o valor médio modifica-se ao longo do tempo, enquanto a sazonalidade pode explicar variações periódicas, como o aumento de venda de televisores nos meses de novembro e dezembro.
Exercícios
Uma escola de 1º grau abriga 124 alunos. Obtenha uma amostra representativa correspondendo a 15% da população.
Sugestão: use a 8ª, 9ª e 10ª colunas da 1ª linha, da Tabela de Números Aleatórios (de cima para baixo).
Solução: amostra aproximadamente igual a 19 alunos.
Segue na tabela de Números Aleatórios pela sugestão acima:
 
76 39 99 56 62 123 82 66 54 34 02 105 118 96 53 16 94 14 110
Em uma escola há oitenta alunos. Obtenha uma amostra de doze alunos.
Uma população é formada por 140 notas resultantes da aplicação de um teste de inteligência:
Obtenha uma amostra formada de 26 elementos, tomando, incialmente, a 1ª linha da esquerda para a direita.
O diretor de uma escola, na qual estão matriculados 280 meninos e 320 meninas, desejoso de conhecer as condições de vida extra escolar de seus alunos e não dispondo de tempo para entrevistar todas as famílias, resolveu fazer um levantamento, por amostragem, em 10% dessa clientela. Obtenha, para esse diretor, os elementos componentes da amostra.
Uma cidade X apresenta o seguinte quadro relativo às suas escolas de 1ª grau:
	ESCOLAS
	Nº DE ESTUDANTES
	
	MASCULINO
	FEMININO
	A
	80
	95
	B
	102
	120
	C
	110
	92
	D
	134
	228
	E
	150
	130
	F
	300
	290
	TOTAL
	876
	955
Obtenha uma amostra proporcional estratificada de 120 estudantes.
Uma população encontra-se dividida em três estratos, com tamanhos, respectivamente, n1 = 40, n2 = 100, n3 = 60. Sabendo que, ao ser realizada uma amostragem estratificada proporcional, nove elementos da amostra foram retirados do 3º estrato, determine o número total de elementos da amostra.
Resposta: 30
Mostre como seria possível retirar uma amostra de 32 elementos de uma população ordenada formada por 2.432 elementos. 
Na ordenação geral, qual dos elementos abaixo seria escolhido para pertencer à amostra, sabendo-se que o elemento de ordem 1.420 a ela pertence?
a) 1.648º
b) 290º
c) 725º
d) 2.025º
e) 1.120º
Em uma escola existem 250 alunos, sendo 35 na 1ª série, 32 na 2ª, 30 na 3ª, 28 na 4ª, 35 na 5ª, 32 na 6ª, 31 na 7ª e 27 na 8ª. Obtenha uma amostra de 40 alunos e preencha o quadro abaixo.
	SÉRIES
	POPULAÇÃO
	CÁLCULO PROPORCIONAL
	AMOSTRA
	1ª
	35
	35 x 40 / 250 = 5,6
	6
	2ª
	
	
	
	3ª
	
	
	
	4ª
	28
	
	
	5ª
	
	
	6
	6ª
	
	
	
	7ª
	
	31 x 40 / 250 = 
	
	8ª
	
	
	
	Total
	250
	
	40
O objetivo de uma pesquisa era o de se obter, relativamente aos moradores de um bairro, informações sobre duas variáveis: nível educacional e renda familiar. Para cumprir tal objetivo, todos os moradores foram entrevistados e arguídos quanto ao nível educacional, e, dentre todos os domicílios do bairro, foram selecionados aleatoriamente 300 moradores para informar a renda familiar. As abordagens utilizadas para as variáveis nível educacional e renda familiar foram, respectivamente:
Censo e amostragem por conglomerados.
Amostragem aleatória e amostragem sistemática.
Censo e amostragem casual simples.
Amostragem estratificada e amostragem sistemática.
Amostragem sistemática e amostragem em dois estágios.

Continue navegando