Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA Juliane Silveira Freire da Silva Fundamentos, tipos e aplicação de variáveis estatísticas Objetivos de aprendizagem Ao final deste texto, você deve apresentar os seguintes aprendizados: � Definir variável estatística. � Identificar os tipos de variáveis. � Utilizar os diferentes tipos de variáveis em situações aplicadas. Introdução Neste capítulo, você vai aprender o que significa uma variável em esta- tística e irá verificar a importância delas para a estatística. Você também estará apto a classificar os diferentes tipos de variáveis e quais as aplicações que cada tipo de variável pode ter. Variáveis estatísticas Uma variável em estatística é a observação de uma característica em uma amostra ou em uma população. É uma informação que pode variar de elemento para elemento. Essa observação pode ser um atributo, uma contagem, uma classificação ou uma medição. São essas características que definem os diferentes tipos de variáveis. Essa é a primeira coisa a se observar quando estamos classificando os tipos de variáveis. Verificar se a resposta a essa variável é um atributo ou um número. Quando fazemos um questionário para uma pesquisa, cada uma das per- guntas realizadas do questionário será uma variável da pesquisa. Cada uma delas será uma característica diferente da amostra ou da população; cada uma delas pode variar para cada um dos elementos da minha amostra ou da minha população. Não obtemos variáveis de um questionário formal obrigatoriamente, po- demos ter bancos de dados de empresas, de acompanhamentos financeiros, dados que são levantados independentemente de questionários, como, por exemplo: valores mensais de entrada e saída, controle de estoque, valor de mercadorias, tipos de produtos em estoque, entre outros. Para definir uma população não precisamos necessariamente de pessoas. Uma população pode ser composta por pessoas, seres ou objetos, desde que todos os elementos dela tenham pelo menos uma característica comum a todos os elementos dessa população, e como consequência, a amostra que também será composta por pessoas, por seres ou por objetos com a mesma característica comum da população da qual ela foi retirada. Para fins de análise, precisamos organizar os dados das variáveis em bancos de dados. Esses bancos nos darão a oportunidade de realizar as estatísticas descritivas dos dados e, em alguns casos, as inferências estatísticas. Sempre que obtemos dados, sejam eles numéricos ou não, independentemente da clas- sificação das variáveis, precisamos organizar esses dados para que possamos, posteriormente, fazer resumos numéricos que facilitem a compreensão dos resultados das variáveis estudadas. Por exemplo, uma operadora de telefonia celular decide fazer uma pes- quisa para investigar a satisfação dos consumidores desse tipo de serviço e analisar a sua concorrência. Para isso, foi realizada uma pesquisa para descobrir com que frequência as pessoas trocam de celular, qual é o tipo de plano de telefonia móvel mais frequente entre elas, qual é o valor médio gasto com esse tipo de serviço e a satisfação com a atual operadora de telefonia móvel. Veja o Quadro 1. Fundamentos, tipos e aplicação de variáveis estatísticas2 Nome Número de aparelhos adquiridos nos últimos 5 anos Tipo de conta Valor gasto no último mês (em R$) Ope- radora atual Satisfa- ção com a ope- radora atual Mauro 1 Pré-pago 25,00 Cliente feliz Satisfeito Paula 3 Pós-pago 123,00 Telefonia ótima Indiferente Carlos 5 Pré-pago 15,00 Telefonia nova Insatisfeito Maicon 3 Pré-pago 10,00 Telefonia ótima Indiferente Juliana 2 Pré-pago 20,00 Cliente feliz Muito satisfeito Ricardo 4 Pós-pago 99,00 Cliente feliz Satisfeito Marluza 1 Pós-pago 42,00 Cliente feliz Satisfeito Caio 6 Pós-pago 199,00 Cliente feliz Satisfeito Patrícia 4 Pós-pago 149,00 Telefonia nova Satisfeito Renata 3 Pós-pago 153,00 Telefonia ótima Satisfeito Claudete 1 Pré-pago 40,00 Telefonia ótima Indiferente Vitória 5 Pós-pago 178,00 Cliente feliz Muito satisfeito Rui 4 Pós-pago 100,00 Telefonia nova Satisfeito Paulo 1 Pré-pago 60,00 Telefonia ótima Indiferente Raquel 1 Pré-pago 5,00 Telefonia ótima Insatisfeito Quadro 1. Banco de dados de uma pesquisa sobre uso do celular (Continua) 3Fundamentos, tipos e aplicação de variáveis estatísticas Quadro 1. Banco de dados de uma pesquisa sobre uso do celular Nome Número de aparelhos adquiridos nos últimos 5 anos Tipo de conta Valor gasto no último mês (em R$) Ope- radora atual Satisfa- ção com a ope- radora atual Ana 2 Pré-pago 14,00 Telefonia ótima Indiferente Antônio 4 Pós-pago 120,00 Cliente feliz Satisfeito Marcos 3 Pós-pago 79,00 Cliente feliz Satisfeito Marcelo 5 Pós-pago 66,00 Telefonia nova Satisfeito Mirian 3 Pré-pago 30,00 Telefonia nova Satisfeito (Continuação) Com esses dados no banco de dados não conseguimos tirar muitas conclu- sões dos resultados dessa pesquisa. Imagine que, em vez de 20 entrevistados, tivéssemos 200. Não conseguiríamos ter ideia do perfil pesquisado. Com base nessas variáveis, podemos obter resultados das estatísticas descritivas. Cada uma dessas variáveis pode gerar tabelas e gráficos e também é possível calcular algumas medidas de posição ou de variabilidade nas que forem numéricas. No exemplo, temos seis variáveis: nome, quantidade de celulares adquiridos nos últimos 5 anos, tipo de conta, valor pago (em R$) no último mês, operadora atual e o nível de satisfação com ela. A partir do banco de dados, podemos fazer a análise inicial estatística, a qual chamamos de estatística descritiva. Como o próprio nome sugere, esse tipo de estatística descreve os dados, resume as variáveis estudadas. Poderíamos obter tabelas e gráficos para todas as variáveis do exemplo do banco de dados sobre telefonia celular, como, por exemplo, a tabela e o gráfico da variável “tipo de plano de telefonia”, demonstrados na Figura 1 e no Quadro 2. Fundamentos, tipos e aplicação de variáveis estatísticas4 Figura 1. Tabela oriunda do banco de dados para a variável “tipo de plano de telefonia móvel”. TIPO DE PLANO pré-pago 45% pós-pago 55% Tipo de plano fi % Pós-pago 11 55 Pré-pago 9 45 Total geral 20 100 Quadro 2. Quadro oriundo do bando de dados para a variável tipo de plano de telefonia móvel Poderíamos, também, obter a média do valor gasto no último mês e a sua variabilidade. Para esses dados, o valor médio de gasto com telefonia móvel foi de R$ 76,35 com uma variabilidade em torno da média de R$ 60,55. Então, para as variáveis numéricas, podemos fazer tanto gráficos e tabelas quanto calcular algumas estatísticas que sejam interessantes para a análise. Segundo Doane e Seward (2015), um conjunto de dados pode ser constituído por muitas variáveis. As questões que podem ser exploradas e as técnicas analíticas usadas dependerão do tipo e do número de variáveis. 5Fundamentos, tipos e aplicação de variáveis estatísticas Estatística descritiva — análise que resume as variáveis, por meio de resumos ta- bulares, gráficos e numéricos. Esse tipo de estatística permite organizar tabelas de distribuição de frequências, elaborar gráficos e calcular algumas medidas numéricas como médias e desvios padrão. Estatística inferencial — quando temos as variáveis provenientes de amostras representativas e, a partir dessa amostra, fazemos inferências para a população. Tipos de variáveis As variáveis se dividem em dois grandes grupos: as variáveis qualitativas (também chamadas de variáveis categóricas ou variáveis por atributos), que são atributos observados, e as variáveis quantitativas, que são valores numéricos. Variáveis qualitativas Dentro das variáveis qualitativas há mais uma divisão: nominais ou ordinais. As variáveis qualitativas têm como resposta à variável os atributos. As variáveis qualitativas nominais são as de nível de mensuração mais simples. Elas são apenas um atributo associado a cada um dos resultadosda variável. Ou seja, a resposta dessa variável é apenas um nome associado. Nesse tipo de variável não existe nenhum tipo de ordenação. São exemplos de variáveis qualitativas nominais: sexo, raça de cachorros, nomes de empresas, marcas de carros, entre outras. Qual é seu sexo? ( ) Masculino ( ) Feminino Qual é a raça de seu cachorro? ( ) Maltês ( ) Yorkshire ( ) Labrador ( ) Buldogue ( ) Outra. Qual? Qual é a montadora do seu veículo? ( ) Ford ( ) Chevrolet ( ) Fiat ( ) Volkswagen ( ) Outra. Qual? Fundamentos, tipos e aplicação de variáveis estatísticas6 Quando temos um banco de dados, podemos codificar essas palavras para facilitar a digitação dos dados obtidos. No nosso exemplo do Quadro 1, as variáveis qualitativas nominais, são “nome” e “tipo de conta”. Poderíamos codificar a variável do banco de dados: “tipo de conta”, por exemplo, colocando o “0” para pré-pago e “1” para pós-pago. Isso serve apenas para facilitar a digitação dos dados, na posterior análise é necessário que os números sejam substituídos pelas palavras correspondentes. Não é porque os dados foram codificados que podemos permitir que uma média seja calculada, por exemplo, não podemos calcular média de sexo, por mais que usemos “0” e “1” para os sexos masculino e feminino, respectivamente. As variáveis qualitativas nominais, quando possuírem apenas duas opções de resposta, serão chamadas de variáveis qualitativas nominais dicotômicas, ou simplesmente dicotômicas ou binárias. São exemplos: sexo (masculino/ feminino); respostas a um questionamento (sim/não), entre tantas outras. Qual é seu sexo? ( ) Masculino ( ) Feminino Você votou nas últimas eleições? ( ) Sim ( ) Não As variáveis qualitativas ordinais, como o próprio nome sugere, têm uma ordem nas respostas. Elas têm um atributo, assim como as qualitativas, mas esse atributo possui uma ordem associada. Por exemplo, se a variável estudada for porte de empresas (pequena, média ou grande), existe uma ordem de grandeza. O nível de escolaridade também possui uma ordem que vai do analfabeto ao pós-doutorado. Qual é o porte da empresa em que você trabalha? ( ) Microempresa ( ) Pequena ( ) Média ( ) Grande Qual é o seu nível de escolaridade? ( ) Analfabeto ( ) Ensino Fundamental incompleto ( ) Ensino Fundamental completo ( ) Ensino Médio incompleto ( ) Ensino Médio completo ( ) Ensino Superior incompleto ( ) Ensino Superior completo 7Fundamentos, tipos e aplicação de variáveis estatísticas ( ) Pós-graduação incompleta ( ) Pós-graduação completa ( ) Mestrado incompleto ( ) Mestrado completo ( ) Doutorado incompleto ( ) Doutorado completo Nas variáveis qualitativas ordinais, enquadramos as escalas do tipo Likert. Esse tipo de variável precisa ter sempre uma quantidade ímpar de opções de resposta, pois sempre teremos o ponto neutro, o mesmo número de pontos favoráveis e desfavoráveis. Então podemos ter escalas Likert de 3, 5, 7, 9, 11 pontos. Podemos ter escalas Likert de satisfação, de concordância, de avaliação, de frequência, de importância, entre outras. Veja alguns exemplos: Escala de satisfação: ( ) Muito satisfeito ( ) Satisfeito ( ) Indiferente ( ) Insatisfeito ( ) Muito insatisfeito Escala de concordância: ( ) Concordo plenamente ( ) Concordo ( ) Não concordo nem discordo ( ) Discordo ( ) Discordo plenamente Escala de avaliação: ( ) Excelente ( ) Bom ( ) Regular ( ) Ruim ( ) Péssimo Escala de frequência: ( ) Sempre ( ) Muitas vezes ( ) Às vezes Fundamentos, tipos e aplicação de variáveis estatísticas8 ( ) Raramente ( ) Nunca Escala de importância: ( ) Muito importante ( ) Importante ( ) Indiferente ( ) Pouco importante ( ) Nada importante Observe que também podemos codificar os dados para fins de tabulação. Porém, temos que tomar cuidado que, por mais que possamos calcular médias — isso é feito em larga escala em pesquisas —, não temos exatamente uma média, pois se perguntarmos ao entrevistado um nível de satisfação categó- rico, como podemos analisá-lo como um número? Podemos, nesse caso, estar subestimando ou superestimando as respostas. Se codificássemos a escala Likert dessa forma: 5 - Muito satisfeito 4 - Satisfeito 3 - Indiferente 2 - Insatisfeito 1 - Muito insatisfeito Podemos calcular uma média com esses códigos, já que eles seguem uma escala ordinal; porém, na hora de analisar, precisamos ter bastante cuidado pois não estamos calculando uma média, uma variável em que coletamos dados numéricos. Houve, na verdade, uma “transformação” nos dados, então, na hora de mostrarmos essa resposta, precisamos encará-la como um índice médio. Supondo que a média de satisfação resultasse em 3,8; afirmaríamos que o índice médio de satisfação de 3,8 concentra os dados em média entre o “indiferente” e o “satisfeito”. Nas variáveis qualitativas ordinais, também podemos classificar as variáveis intervalares. Por exemplo, se, em uma pesquisa, em vez de perguntarmos a idade perguntarmos a faixa etária, não saberemos quantas pessoas há cada uma das idades, mas saberemos o intervalo em que cada um dos entrevistados está. Assim sendo, não poderemos calcular a média de idade, nem o desvio padrão dessas variáveis, podemos apenas ter uma aproximação desses valores considerando o ponto médio de cada um dos intervalos. 9Fundamentos, tipos e aplicação de variáveis estatísticas Qual é a sua faixa etária? ( ) 15|25 ( ) 25|35 ( ) 35|45 ( ) 45|55 Qual é a sua faixa salarial? ( ) De R$ 0,00 a R$ 1.000,00 ( ) De R$ 1.000,01 a R$ 2.000,00 ( ) De R$ 2.000,01 a R$ 4.000,00 ( ) De R$ 4.000,01 a R$ 5.000,00 ( ) Mais de R$ 5.000,01 Sempre que pudermos investigar os valores de forma quantitativa devemos contar ou medir os valores correspondentes, pois perdemos muita informação quando perguntamos variáveis que seriam quantitativas de forma intervalar. Variáveis quantitativas As variáveis quantitativas, a exemplo das variáveis qualitativas, também se dividem em dois grupos: discretas ou contínuas. Ambas são representadas por números. As variáveis quantitativas discretas são variáveis que resultam de uma contagem, portanto, podem assumir apenas valores inteiros. Segundo Doane e Seward (2015) uma variável que assume um número contável de possíveis valores que podem ser representados por um número inteiro é denominada discreta. Como exemplo, podemos usar a variável “número de aparelhos adquiridos nos últimos 5 anos” (apresentada no Quadro 1), ela tem valores numéricos que resultam em uma contagem de números inteiros. Para esse tipo de variável podemos fazer cálculos matemáticos. Já as variáveis quantitativas contínuas são resultantes de medição ou de operações matemáticas. Nesse tipo de variável, podemos ter valores fracio- Fundamentos, tipos e aplicação de variáveis estatísticas10 nados, a variável pode assumir qualquer valor em um intervalo numérico. O número de casas decimais dependerá no instrumento de medida utilizado para a mensuração da variável. Mesmo que os dados da variável sejam apresentados em forma de um número inteiro, precisamos analisar se a variável resultaria em uma medição, independentemente de o número ser apresentado inteiro, ele será considerado contínuo. Segundo Doane e Seward (2015), em geral, tratamos dados financeiros (dólares, euros, pesos) como contínuos, ainda que os preços no varejo variem de 0,01 (por exemplo, vamos de US$1,25 para US$1,26). Temos como exemplo, então, a variável “valor gasto no último mês (em R$)”. Outros exemplos de variáveis quantitativas contínuas são: tempo de abertura de uma empresa, velocidade de um veículo, peso de sacas de arroz, etc. Utilização das variáveis Todas as análises estatísticas partem das variáveis, elas são o instrumento necessário para toda análise, seja descritiva ou inferencial. Como existem diferentes tipos de variáveis, há também aplicações diferentes para cada tipo de variável. As variáveis qualitativas nominais, muitas vezes, servem para as estatísticas descritivas. Com elas podemos montar tabelas de dados categóricos (tabelasde frequência), podemos aplicar esses dados em gráficos que tornam a visu- alização mais rápida e prática e podemos utilizá-las como modo de separar outras variáveis por grupos. Já com as variáveis qualitativas ordinais, podemos realizar alguns outros procedimentos estatísticos além de tabelas e gráficos. Nesse caso também existem análises numéricas, desde que observemos que não coletamos um número e que o valor dessas operações deve ser considerado como um índice. Para as variáveis ordinais também temos algumas técnicas inferenciais como os testes não paramétricos. As variáveis quantitativas nos permitem um maior número de análises. Nas quantitativas discretas, podemos utilizar todas as técnicas descritivas, podemos calcular as medidas numéricas, montar tabelas e gráficos, também podemos utilizar da maioria das técnicas estatísticas inferenciais. Nas quantitativas contínuas, nos utilizamos também de todas as análises de estatística descritiva, além de poder fazer uso de quase todas as técnicas de estatística inferencial disponíveis. 11Fundamentos, tipos e aplicação de variáveis estatísticas Vamos, então, de um atributo a uma mensuração e a quantidade de informa- ções e análises cresce conforme a complexidade de informação das variáveis cresce. Assim sendo, é nas variáveis que a magia da estatística acontece, são elas que nos fornecem os argumentos necessários para as análises. Utilizamos as variáveis para levantamentos de pesquisas de marketing, por exemplo, quando elaboramos um questionário e investigamos um produto; ou quando levantamos os dados contábeis de uma empresa e analisamos a sua situação, além de podermos realizar correlações e análise de séries temporais. Utilizamos as variáveis quando fazemos observações qualitativas em campo ou quando coletamos dados ao longo do tempo. É com as variáveis que tudo acontece. É de suma importância saber classificar cada um dos tipos de variáveis para que não sejam feitas análises estatísticas erradas. Muitas vezes, pesquisadores perdem coletas inteiras pois não conseguem definir os tipos de variáveis que sejam compatíveis com os objetivos de análises que eles desejam. Por exemplo, um pesquisador deseja investigar a correlação entre valor investido em previdência privada e o valor do salário. Essa correlação só será passível de solução, caso essas duas variáveis sejam coletadas de forma quantitativa. Como o objetivo é uma correlação, precisamos dos dados referentes a cada um dos elementos das amostras, precisamos do valor exato. Não podemos, em hipótese alguma, perguntar a renda e o valor investido em previdência em uma escala intervalar, pois dessa maneira não conseguiremos utilizar a análise de correlação e regressão que é feita com dados numéricos e não intervalares. Muitos pesquisadores cometem esse erro, dispendem tempo e dinheiro sem conseguir cumprir os objetivos delineados antes da coleta de dados. Então, antes de iniciar qualquer levantamento ou amostra ,é preciso definir as variáveis a serem estudadas e a maneira com que elas serão medidas. Uma má escolha nesse momento pode arruinar todos os objetivos traçados. Acesse o link ou o código a seguir para conhecer mais sobre os tipos de variáveis estatísticas. https://goo.gl/FshvEK Fundamentos, tipos e aplicação de variáveis estatísticas12 DOANE, D. P.; SEWARD, L. E. Estatística aplicada à administração e economia. 4. ed. Porto Alegre: AMGH, 2015. Referência 13Fundamentos, tipos e aplicação de variáveis estatísticas Conteúdo:
Compartilhar