Prévia do material em texto
18/02/2014 1 ESTATÍSTICA PARA ADMINISTRAÇÃO 1º Semestre de 2014 Profª. Luciana B Nucci Por que utilizar a Estatística? � Formulação de suposições construtivas sobre eventos futuros de nossa vida => planos para novas situações ou experiências � Explicar e predizer o comportamento humano � Examinando características (variáveis) que diferem ou variam de um indivíduo para outro (idade, classe social, comportamento) ou de um instante para outro no decorrer do tempo (desemprego, taxa de criminalidade, população) Métodos de Pesquisa � Experimento � Pesquisa Tipo Survey � Análise de conteúdo � Observação participativa � Análise secundária Experimento � Controle do pesquisador � Grupo experimental vs grupo controle � Pesquisador divide aleatoriamente os grupos � ‘Aplica’ o experimento � Analisa o resultado � Exemplo: frustração x agressividade Pesquisa tipo Survey � Retrospectiva – registro após ocorrência � Investiga-se um número maior de variáveis � Melhor generalização � Amostra da população Análise de Conteúdo � Pesquisador descreve o conteúdo de mensagens previamente elaboradas � Não se observa diretamente, estuda-se conteúdo de livros, revistas, jornais, filmes, programas de rádio, fotografias, desenhos, cartas, propaganda política ou música � Exemplo: estudo sobre capa da revista People de 1974 a 1998 � 1974 (1º ano) < 3% - razões negativas � 1988 – quase metade enfocava características desfavoráveis 18/02/2014 2 Observação Participativa � Pesquisador “participa da vida cotidiana das pessoas sujeitas ao estudo, seja abertamente, no papel de pesquisador, ou de maneira velada, sob algum disfarce, observando o que ocorre, ouvindo o que é dito ou interrogando pessoas durante certo período de tempo” (Becker & Geer, 1970) � Exemplo: músicas heavy-metal início (anos 80/90) Análise Secundária � Pesquisador utiliza informações já coletadas � Informações provém de fontes do governo, agências particulares ou mesmo faculdades e universidades � Mais rápida e fácil, portanto limita-se ao que foi coletado � Exemplos de fontes de dados: IBGE, Fundação SEADE Estatística = Números? � Plano nacional contra a obesidade quer avançar na publicidade de alimento (Fonte: Folha online de 07/08/2012) � A obesidade infantil está no centro de um debate que coloca, de um lado, a indústria de alimentos e suas guloseimas e, do outro, as organizações de direito do consumidor e sociedades médicas. � A causa da discórdia é a publicidade de alimentos para crianças no Brasil, se seria ou não um dos fatores responsáveis pelo crescimento assustador dos índices de obesidade infantil no país. � O IBGE mostrou aumento de mais de 200% na incidência de sobrepeso entre crianças de cinco a nove anos nas últimas três décadas. Para especialistas, é uma tendência comparável à epidemia de obesidade nos EUA. Estatística = Números? � Plano nacional contra a obesidade quer avançar na publicidade de alimento (Fonte: Folha online de 07/08/2012) � ... Segundo Rafael Sampaio, vice-presidente da Associação Brasileira de Anunciantes, não há evidências precisas sobre o papel da publicidade na obesidade infantil. � "Um estudo encomendado pelo governo britânico mostrou que há dezenas de fatores que contribuem para o aumento da obesidade e a propaganda é só um deles, e nem é o mais influente", diz. � Outro dado que ele cita é da província de Québec, no Canadá, onde a publicidade para crianças é proibida há 30 anos. "Um estudo de 2004 demonstrou que o índice de obesidade das crianças nessa província era de 7%, contra 8% do restante do país." � ... estudo de 2004 obesidade ... de 7%, contra 8% do restante do país." � Fatos numéricos contidos nas informações dadas denominam-se estatísticas Estatística � “Estatística é um conjunto de métodos e processos quantitativos que serve para estudar e medir os fenômenos coletivos” DUGÉ DE BERNONVILLE � A palavra estatística provém do latim status (estado) e é comumente associada a censos, pesquisas de opinião pública, aos vários índices governamentais, aos gráficos e médias publicadas diariamente na imprensa. Na realidade, como veremos adiante, a estatística engloba muitos outros aspectos. Estatística � Ciência que se preocupa com a organização, descrição, análise e interpretação dos dados experimentais � Plural (estatísticas) => coleção consistente de dados numéricos, reunidos com a finalidade de fornecer informações sobre uma atividade qualquer � Singular � Atividade humana especializada � Conjunto de técnicas 18/02/2014 3 Estágios de uma Pesquisa 1. O problema a ser estudado é reduzido a uma hipótese passível de teste (por exemplo, ‘famílias com apenas um pai geram maior delinquência do que famílias com pai+mãe’) 2. Elabora-se um conjunto apropriado de instrumentos (questionário ou esquema de entrevistas) 3. Coletam-se os dados (pesquisador sai a campo e faz a pesquisa) 4. Os dados são analisados quanto a sua influência sobre a hipótese inicial 5. Os resultados da análise são interpretados e comunicados a um público (conferência ou imprensa) Estatística � Metodologia desenvolvida para: � Coleta � Classificação � Apresentação � Análise � Interpretação de dados quantitativos � Utilização desses dados na tomada de decisões Resumindo... � No uso diário o termo estatística(s) refere-se a fatos numéricos � Sentido amplo: Estatística é a arte e a ciência de coletar, analisar apresentar e interpretar dados � Transformar dados em informação Exemplo � Uma pesquisa com assinantes norte-americanos indicou que 90% dos assinantes as Bussiness Week têm computadores em casa e que 64% articulam a compra de um computador no trabalho � Artigos relacionados à informática � Apresentação à potenciais assinantes � Apresentação à potenciais anunciantes Estatística � A estatística divide-se em: � Descritiva: preocupa-se com a organização e descrição dos dados experimentais � Indutiva (Estatística Inferencial ou Inferência Estatística): cuida da análise e interpretação dos dados População � População ou universo, é um conjunto de elementos com pelo menos uma característica comum � Essa característica deve delimitar inequivocamente quais os elementos que pertencem à população e quais os que não pertencem (Costa Neto, 1977) � É o conjunto constituído por todos os indivíduos que apresentem pelo menos uma característica comum cujo comportamento interessa analisar (Toledo & Ovalle, 1985) 18/02/2014 4 Amostra � É um subconjunto de uma população, necessariamente finita, pois todos os seus elementos serão examinados para efeito da realização do estudo estatístico desejado (Costa Neto, 1977) � Pode ser definida como um subconjunto, uma parte selecionada da totalidade de observações abrangidas pela população, através da qual se faz um juízo, ou inferência sobre as características da população População vs Amostra X X X X X X X X X População vs Amostra X X X X X X X X X X Amostra enviesada da população TÉCNICAS DE AMOSTRAGEM Amostragem Probabilística (Aleatória) Amostragem Não Probabilística (Não Aleatória) 1. Aleatória (casual) Simples 2. Sistemática 3. Estratificada 4. Por Conglomerados 1. A esmo 2. Intencional (por julgamento) 3. Por Cotas 4. Bola de Neve Fonte: http://www.inf.ufsc.br/~marcelo/Cap7.pdf Amostragem Probabilística � A amostragem probabilística também é chamada de aleatória ou casual. � A sua importância decorre do fato de que apenas os resultados provenientes de uma amostra probabilística podem ser generalizados estatisticamente para a população da pesquisa � O que significa estatisticamente? Significaque podemos associar aos resultados uma probabilidade de que estejam corretos, ou seja uma medida da confiabilidade das conclusões obtidas. Se a amostra não for probabilística não há como saber se há 95% ou 0% de probabilidade de que os resultados sejam corretos, e as técnicas de inferência estatística porventura utilizadas terão validade questionável Amostragem Probabilística � Condição primordial para uso da amostragem probabilística: "todos os elementos da população tenham uma probabilidade maior do que zero de pertencerem à amostra". Tal condição é materializada se: � Há acesso a toda a população. Ou seja, não há teoricamente problema em selecionar nenhum dos elementos, todos poderiam ser pesquisados � Há possibilidade de obter uma listagem dos elementos da população. Se pensarmos em uma pesquisa de opinião, seria uma listagem com todos os possíveis respondentes � Os elementos da amostra são selecionados através de alguma forma de sorteio não viciado: tabelas de números aleatórios, números pseudo- aleatórios gerados por computador. Com a utilização de sorteio elimina-se a ingerência do pesquisador na obtenção da amostra, e garante-se que todos os integrantes da população tem probabilidade de pertencer à amostra 18/02/2014 5 1. Amostragem Aleatória (casual) Simples 1. Casual ou Aleatória Simples: equivalente a um sorteio, é utilizada quando a população encontra-se desordenada, sendo que por essa técnica, qualquer elemento tem a mesma chance de ser sorteado - Quando a população é relativamente pequena (até 30, por exemplo), pode-se numerar os elementos e em seguida, realizar o sorteio. - Tratando-se de uma quantidade grande, o processo de numeração torna-se trabalhoso. Deve-se usar um processo com números aleatórios. Geração de Números Aleatórios 2. Amostragem Sistemática � Novamente é feito o sorteio, sendo que nessa amostragem os elementos da população já se encontram ordenados e, nesses casos, não é necessário se construir um sistema de referência (números aleatórios). � Exemplos de populações ordenadas: fichas individuais de empregados (alfabética), casas de uma rua (número), notas fiscais (data), etc. Exemplo 1 (Amostragem Sistemática) � Suponhamos que uma empresa tenha 720 colaboradores em determinado setor, dentre os quais deseja-se uma amostra formada por 30 destes empregados � Procedimento: � 1. Determinar o intervalo de amostragem. � Intervalo = População / Amostra = 720 / 30 = 24 � 2.Escolhemos, por sorteio, um número de 01 a 24 (inclusive). � Este número indicará o primeiro elemento da amostra. � Os demais elementos serão escolhidos em intervalos de 24 em 24. � 3. Se o primeiro número sorteado for o 16, escolhemos os demais colaboradores relacionado com o primeiro elemento da amostra: � 2º -> 16 + 24 = 40 3º->40 + 24 = 64 4º->64 + 24 = 88 .... Exemplo 2 (Amostragem Sistemática) � Uma operadora telefônica pretende saber a opinião de seus assinantes comerciais sobre seus serviços na cidade de Florianópolis. Supondo que há 25.037 assinantes comerciais, e a amostra precisa ter no mínimo 800 elementos, mostre como seria organizada uma amostragem sistemática para selecionar os respondentes. � A operadora dispõe de uma lista ordenada alfabeticamente com todos os seus assinantes, o intervalo de retirada será: � k = N/n = 25.037/800 = 31,2965 � Como o valor de k é fracionário algo precisa ser feito. Aumentar o tamanho da amostra não resolverá o problema, porque 25.037 é um número primo. Como não podemos reduzir o tamanho de amostra, devendo permanecer igual a 800, se excluirmos por sorteio 237 elementos da população, e refizermos a lista teremos: � k = N/n = 24800/800 = 31 � A cada 31 assinantes um é retirado para fazer parte da amostra. Devemos sortear o ponto de partida: um número de 1 a 31 (do 1o ao 31o assinante). Imagine que o sorteio resultasse em 5, então amostra seria (número de assinantes): � {5, 36, 67, 98, ...., 24774} 3. Amostragem Estratificada � Utilizada quando a população encontra-se dividida em estratos (ou camadas, faixas, intervalos, etc). Ex: sexo; idade (criança, adolescente, adulto e idoso); setores de uma empresa (adm., vendas, tesouraria, serviços gerais, etc); Cursos de uma faculdade (C. Contábeis, Adm., Direito, Enfermagem, etc); Faixa salarial (até 1 SM, de 1 a 2 SM, de 2 a 4 SM, acima de 4 salários- mínimos) � Ex.: pesquisa eleitoral para governador - opinião difere dependendo da idade, classe social e mesmo profissão dos entrevistados. Contudo podemos supor que haja certa homogeneidade de opinião dentro de cada grupo. Então se supõe que haja heterogeneidade entre os estratos, mas homogeneidade dentro dos estratos, e que eles sejam mutuamente exclusivos (cada elemento da população pode pertencer a apenas um estrato). Para garantir que a amostra seja representativa da população precisamos garantir que os diferentes estratos sejam nela representados. � A seleção dos elementos de cada estrato pode ser feita usando amostragem aleatória simples ou sistemática � A amostragem estratificada pode ser: � proporcional, quando o número de elementos selecionados de cada estrato é proporcional ao seu tamanho na população (por exemplo, se o estrato representa 15% da população, 15% da amostra deverá ser retirada dele); � uniforme, quando o mesmo número de elementos são selecionados de cada estrato. � A amostragem estratificada proporcional possibilita resultados melhores, mas exige um grande conhecimento da população (para saber quantos são e quais são os tamanhos dos estratos). A amostragem estratificada uniforme é mais usada em estudos comparativos 18/02/2014 6 Estrato (Nacionalidade) População Cálculo Proporcional Valor Amostra Argentina 45 45 x 12,766% 5,745 6 Boliviana 18 18 x 12,766% 2,298 3 Colombiana 31 31 x 12,766% 3,957 4 Total 94 - - 13 Exemplo 1: (Amostragem Estratificada proporcional) � Será realizada uma pesquisa, a partir de uma amostra, de 12 pessoas. Essa pessoas compõem um grupo de 94 que farão parte de uma expedição na Amazônia, sendo: 45 argentinos, 18 bolivianos e 31 colombianos. Determinar a quantidade de pessoas de cada nacionalidade que responderá a pesquisa � Calcula-se primeiramente percentual da amostra: � % amostra = amostra / população x 100 = 12/94 x 100 = 12,766% 4. Amostragem por conglomerados � Os conglomerados também são grupos mutuamente exclusivos de elementos da população, mas são definidos de forma mais arbitrária do que os estratos: é bastante comum definir os conglomerados geograficamente. Por exemplo, os bairros de uma cidade, que constituiriam conglomerados de domicílios. � O procedimento para a amostragem por conglomerados: � divide-se a população em conglomerados; � sorteiam-se os conglomerados (usando tabela de números aleatórios ou qualquer outro método não viciado); � pesquisam-se todos os elementos dos conglomerados sorteados, ou sorteiam-se elementos deles. 4. Amostragem por conglomerados � Exemplo: Pesquisa Nacional por Amostra de Domicílios (PNAD) do IBGE. Coleta informações demográficas e sócio-econômicas sobre a população brasileira. Utiliza amostragem por conglomerados. � Primeiro estágio: amostras de municípios (conglomerados) para cada uma das regiões geográficas do Brasil; � Segundo estágio: setores censitários sorteados em cada município (conglomerado sorteado); � Terceiro estágio: domicílios sorteados em cada setor censitário. � A utilização de amostragem por conglomerados permite uma redução substancial nos custos de obtenção da amostra, sem comprometer em demasia a precisão, e em alguns casos é a única alternativa possível. Técnicas de Amostragem Não Probabilística � A obtenção de uma amostra probabilística exige que se obtenha uma listagem com os elementosda população. Em suma, exige acesso a todos os elementos da população, que a população acessível seja igual à população alvo. Nem sempre é possível obter tal listagem na prática, o que teoricamente inviabilizaria a retirada de uma amostra aleatória. Então deve- se recorrer à amostragem não probabilística. � Ao usar a amostragem não probabilística o pesquisador não sabe qual é a probabilidade de um elemento da população tem de pertencer à amostra. Portanto, os resultados da amostra não podem ser estatisticamente generalizados para a população, porque não se pode estimar o erro amostral. Se as características da população acessível forem semelhantes às da população alvo os resultados podem ser equivalentes aos de uma amostragem probabilística, mas não podemos garantir a sua confiabilidade. Técnicas de Amostragem Não Probabilística � Alguns dos usos habituais da amostragem não probabilística são os seguintes: � Como etapa preliminar em projetos de pesquisa; � em projetos de pesquisa qualitativa; � em casos onde a população de trabalho não pode ser enumerada. 1. Amostragem a esmo. Neste caso o pesquisador procura ser o mais aleatório possível, mas sem fazer um sorteio formal. Imagine um lote de 10000 parafusos, do qual queremos tirar uma amostra de 100, se fôssemos realizar uma amostragem aleatória simples o processo seria muito trabalhoso. Então simplesmente retiramos os elementos a esmo. 2. Amostragem por julgamento (intencional). O pesquisador deliberadamente escolhe alguns elementos para fazer parte da amostra, com base no seu julgamento de aqueles seriam representativos da população. Este tipo de amostragem é bastante usado em estudos qualitativos. Obviamente o risco de obter uma amostra viciada é grande, pois se baseia totalmente nas preferências do pesquisador, que pode se enganar (involuntária ou "voluntariamente") Técnicas de Amostragem Não Probabilística � Amostragem por cotas. Parece semelhante a uma amostragem estratificada proporcional, da qual se diferencia por não empregar sorteio na seleção dos elementos. A população é dividida em vários subgrupos, na realidade é comum dividir em um grande número para compensar a falta de aleatoriedade, e seleciona-se uma cota de cada subgrupo, proporcional ao seu tamanho. � Por exemplo, em uma pesquisa de opinião eleitoral poderíamos dividir a população de eleitores por sexo, nível de instrução, faixas de renda entre outros aspectos, e obter cotas proporcionais ao tamanho dos grupos (que poderia ser obtido através das informações do IBGE). Na amostragem por cotas os elementos da amostra são escolhidos pelos entrevistadores (de acordo com os critérios...), geralmente em pontos de grande movimento, o que sempre acarreta certa subjetividade (e impede que qualquer um que não esteja passando pelo local no exato momento da pesquisa possa ser selecionado). Na prática muitas pesquisas são realizadas utilizando amostragem por cotas. 18/02/2014 7 Técnicas de Amostragem Não Probabilística � Amostragem "bola de neve". "Particularmente importante quando é difícil identificar respondentes em potencial. A cada novo respondente que é identificado e entrevistado, pede-se que identifique outros que possam ser qualificados como respondentes". � Há ainda a amostragem por conveniência (selecionam-se elementos supostos semelhantes à população, e que estão disponíveis) e a de passantes eventuais (selecionam-se aqueles que estejam passando pelos pesquisadores no momento; é comum conjugar este tipo com a amostragem por cotas). Conceitos Fundamentais ELEMENTO, VARIÁVEL, OBSERVAÇÃO, CASO � Elemento é cada uma das unidades consideradas no estudo � Um conjunto de dados é composto por informações sobre as características de interesse de cada elemento � Variável é uma característica de interesse que se pode medir � O nome Variável está relacionado ao fato desta característica apresentar distintos valores dependendo do elemento. Ex: idade, sexo, margem de lucro bruto, ... Conceitos Fundamentais ELEMENTO, VARIÁVEL, OBSERVAÇÃO, CASO � Observação é a informação sobre a variável para um elemento específico � Caso é o conjunto de observações de um elemento determinado Tabela: Conhecimento da Margem de Lucro Bruto da Empresa Nome Idade Sexo Margem de Lucro Bruto da Empresa (%) José 26 M 36,7 Maria 37 F 59,3 Mário 28 M 44,8 Sheila 36 F 23,8 Josué 38 M 53,3 Carlos 38 M 4,1 Mariana 39 F 35,9 Variáveis Elemento Observação Caso Dados Qualitativos nominais � São aqueles nos quais os valores são classificados em categorias ou classes não-ordenadas � Exemplos: sexo, cor da pele � Quando podem assumir um entre dois valores distintos – tal como Homem e Mulher – são chamados dicotômicos ou binários Dados Qualitativos ordinais � Quando a ordem entre as categorias se torna importante, as observações são referenciadas como dados ordenados � Não há preocupação com a magnitude dos números � Classificação de satisfação: 1 = Muito satisfeito 2 = Satisfeito 3 = Indiferente 4 = Insatisfeito 18/02/2014 8 Dados Quantitativos discretos � Ordenação e magnitude são importantes � Os números representam quantidades mensuráveis reais � Dados estão restritos a ter somente valores específicos – freqüentemente inteiros ou contagens. Neste caso, nenhum valor intermadiário é possível � Exemplos 1. Número de vezes que o cliente foi atendido no call center 2. Número de pedidos com mais de 5 dias de atraso Dados Quantitativos Discretos � Para os dados discretos existe uma ordem natural entre os valores possíveis � Se estamos interessados no número de vezes que o cliente foi atendido no call center, podemos começar a analisar os clientes que mais ligam Dados Quantitativos contínuos � Dados que representam quantidades mensuráveis, mas que não são restritos a assumir certos valores especificados, são conhecidos como dados contínuos � Exemplos � Tempo � Temperatura � PIB Tipos de Dados vs Variáveis � Variável Qualitativa (ou Categórica) � Nominal � Ordinal � Variáveis Quantitativa (ou Numérica) � Discreta � Contínua Dados de Seção Transversal e de Série Histórica � Dados de Seção Transversal � São dados coletados no mesmo intervalo de tempo (aproximadamente) � Dados de Série Histórica � São dados coletados ao longo de diversos períodos. Ex. cotação do dólar nos últimos 6 anos. Exemplo de Série de dados R$0 R$100 R$200 R$300 R$400 R$500 R$600 R$700 R$800 Evolução do Salário Mínimo (em R$) de 1994 a 2014