A Natureza e os Conceitos Fundamentais

Estatística I

•

UFRJ

0

Jessica Faria

16.03.2018

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Estatística I

56.216 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Aula 1
ANatureza e os Conceitos Fundamentais
da Estatística
Objetivo: Compreender a natureza da Estatística, as fases de um trabalho es-
tatístico, e seus conceitos fundamentais a uma interpretação conscienciosa dos re-
sultados de um trabalho estatístico.
1 A Natureza da Estatística
Vivemos num mundo imerso em incertezas. A todo tempo somos bombardeados
por informações sobre pesquisas cientícas comprovando (estatisticamente) que tal
substância induz uma certa patologia, ou sobre pesquisas eleitorais, índices de rou-
bos, e outros conteúdos de forte caracterização probabilística. Num mundo assim,
é de fundamental importância possuir um espírito crítico para informações sujeitas
à incerteza a m de poder dar inteligibilidade a elas e até mesmo poder distinguir
informações falsas de verdadeiras. Nessa medida, a Estatística é uma disciplina
crucial para todos os estudantes, e talvez aquela que mais atua na formação crítica
do cidadão, pois ela abarca diferentes áreas de atuação como: Medicina, Econo-
mia, Política, Psicologia, Tecnologia, Indústria (Controle de Qualidade), Demograa
(Censo), dentre outras.
A raiz etimológica da palavra Estatística vem da palavra latina status
que signica estado e signicava a contagem e gestão de dados do estado. Ao
longo da história da Estatística, essa vinculação ao estado foi se enfraquecendo e
hoje a estatística tem um caráter abrangente o bastante para lidar com sistemas do
conhecimento bem dissociados da noção de Estado.
No entanto, cabe ressaltar que hoje temos dois signicados para Estatística,
a saber: "Estatística" como Ciência e "estatística" como uma operação de dados
coletados em pesquisas. Por exemplo, uma média aritmética (que iremos mais tarde
estudar) é uma estatística também. O contexto nos auxiliará a distinguir o signi-
cado veiculado pelo termo estatística.
Mas como ciência, o que é a Estatística, anal?
Estatística é a arte e a ciência de coletar, analisar, apresentar,
e interpretar dados, para que se tomem decisões sob incerteza.
1
Você deve estar surpreso com o uso da palavra "arte" na denição acima,
não? Mas a verdade é que sem julgamento, experiência e até mesmo uma forte
intuição é impossível analisar estatisticamente fenômenos incertos.
E o que entendemos por "fenômenos incertos"?
Fenômenos aleatórios (ou incertos) são aqueles cujos resultados
de interesse não podem ser aferidos com 100% de certeza.
Assim, onde há incerteza (e por conseguinte, variabilidade de resultados
mesmo sob mesmas condições iniciais) aí deverá estar a Estatística para nos auxiliar
a dar ordem simbólica ao fenômeno.
Vamos agora entender como se dão as quatro fases descritas acima da Es-
tatística. Para isso, vejamos um caso concreto na pesquisa cientíca:
Um pesquisador deseja estudar o efeito de histórias infantis na prontidão
para a alfabetização de crianças, através de um teste de prontidão de leitura chamado
ABC. Para isso, ele seleciona sete crianças aleatoriamente para responderem ao teste
ABC sem o treinamento (pré-teste). Em seguida elas são estimuladas usando-se a
leitura e o comentário de histórias. Após o treinamento, as crianças respondem
novamente ao teste ABC (pós-teste). Ele deseja saber se o treinamento de fato
induz a prontidão na alfabetização.
Observe que esse estudo demanda a ferramenta Estatística, já que cada
amostra de sete alunos retirada trará resultados variáveis e desejamos concluir algo
sob incerteza. Com esse objetivo, como conduzir as fases da Estatística?
Fase 1 (Coletar Dados): o pesquisador selecionará as sete crianças, que par-
ticiparão do estudo e mensurará os testes antes e depois do treinamento.
Fase 2 (Explorar os Dados): o pesquisador fará uma análise exploratória dos
dados coletados para comparar os valores obtidos antes e depois do teste a m de
ter poder concluir, com um certo nível de conabilidade, se houve uma melhora na
alfabetização. Para isso selecionará os métodos estatísticos adequados para testar
a hipótese de que o treinamento de fato induziu ou não à prontidão na leitura. Ele
deverá portanto analisar dados, conforme tabela e grácos abaixo, criados após a
coleta dos dados.
Escores no Teste ABC do Grupo Experimental
Indivíduos Pré-Teste Pós-Teste
1 6 20
2 9 11
3 13 12
4 10 14
5 8 10
6 4 7
7 6 6
2
PRE_TEST
POS_TEST
Bar/Column Plot (testeABC.STA 10v*7c)
0
4
8
12
16
20
24
Case 1 Case 2 Case 3 Case 4 Case 5 Case 6 Case 7
Pré-Teste x Pós-Teste
Fase 3 (Apresentar os Dados): o pesquisador apresentará seus resultados
de maneira adequada para que possas ser veiculados em conferências, mídias ou
periódicos cientícos.
Fase 4 (Interpretar os Dados): o pesquisador fará interpretações claras e
compreensíveis até para não-estatísticos, quanticando o nível de incerteza de suas
armações e propondo medidas gerenciais, quando necessárias, à luz de suas con-
clusões obtidas no estudo.
Claro que o exemplo acima é posto apenas para que possamos entender panorami-
camente como iremos construir um raciocínio estatístico para o tratamento de dados
coletados, daqui para frente.
2 Conceitos Fundamentais da Estatística
Em todas as áreas da ciência, conceitos são fundamentais para a contrução de
uma teoria. É o que se costuma chamar na losoa da linguagem uma taxonomia. Na
Estatística, isso não é diferente. Como a Estatística é um ramo da Matemática, ela
traz as marcas da concisão matemática e estabelece de forma unívoca os seus objetos
e seus conceitos. Neste capítulo, discutiremos os conceitos-chave do nosso curso, para
que possamos caminhar de forma concisa na construção teórica da Estatística.
Antes, porém, gostaria de discutir com vocês a ideia mais emblemática da
funcionalidade da Estatística nas ciências em geral:
A concepção mais emblemática da Estatística seria aquela em que temos
uma população de interesse em estudo e, por motivos quaisquer, não podemos acessá-
la integralmente para medir uma certa propriedade da mesma. O que fazer então?
A ideia central da Estatística é obter de maneira conscienciosa uma amostra que
traga potencialmente a informação da população e, através da amostra, inferir os
resultados para a população. Como a amostra não é a população, há portanto
3
variabilidade nos resultados amostrais (cada amostra gerará resultados diversos), e,
portanto, tais resultados são aleatórios e devem ser modelados probabilisticamente.
Na presença portanto de variabilidade de resultados, temos então legitimado aí o uso
da Estatística, pois devemos tomar nossas decisões e armar determinadas coisas
sob incerteza agora. Observe que se pudéssemos rastrear toda a população, então
a mensuração da propriedade em estudo deixaria de ser variável e incerta, pois
acederíamos ao valor exato, e assim não haveria necessidade do uso da Estatística...
É claro que este exemplo supõe uma população nita. Se a população fosse innita,
então por mais razão a Estatística seria a ferramenta teórica por excelência para o
tratamento do problema! Mas estamos nos adiantando e precisamos denir ainda o
que se entende por população, amostra, parâmetro e estatística (ou estimador) dentro
das chamadas Estatística Descritiva e Estatística Inferencial. Vamos lá então!
Estatística Descritiva é parte da Estatística que se ocupa em
resumir (sintetizar) e organizar a informação de um conjunto de dados.
Estatística Inferencial é parte da Estatística que se ocupa em estimar
e tirar conclusões sobre características de uma população à luz da amostra.
População é a coleção de todos os elementos (pessoas, objetos, ou dados)
de interesse num particular estudo.
Amostra é um suconjunto da população da qual a informação é coletada.
Parâmetro é a descrição numérica de uma característica da população.
Estatística (ou Estimador) é a descrição numérica de uma característica
da amostra.
Assim, suponha que estejamos interessados emestudar a renda bruta média
mensal de todos os brasileiros assalariados no ano de 2010.
Qual é a nossa população nesse estudo? Acertou se tiver dito que são todos
os brasileiros com carteira assinada em 2010.
Qual seria uma possível amostra? Por exemplo, os brasileiros assalariados
de 2010 do estado do Rio de Janeiro.
Qual é o nosso parâmetro de interesse? A média de todos os salários brutos
mensais de todos os brasileiros assalariados de 2010.
Qual é a nossa estatística? A média de todos os salários brutos mensais de
todos os brasileiros assalariados do estado do Rio de Janeiro de 2010.
A essa altura você já deve ter intuído que nossa ideia é usar a estatística
(ou estimador) para armar com um certo nível de conabilidade qual o valor do
parâmetro em jogo, certo? Pois é isto mesmo e é assim que iremos coroar o nosso
curso ao nal deste.
Como dissemos anteriormente, para que a informação fornecida pela amostra
seja valiosa para a estimação de parâmetros, é necessário que amostra tenha sido
4
coletada de maneira conscienciosa da população. Embora haja toda uma teoria para
uma tecnologia de obtenção da amostra, gostaríamos de caracterizar alguns tipos
aqui, embora o tratamento dessa teoria esteja fora dos objetivos desse curso:
� Amostra aleatória: Cada membro da população tem a mesma chance de ser
selecionado.
� Amostra aleatória simples: Todas as amostras de mesmo tamanho são
igualmente prováveis.
� Amostra aleatória estraticada: A população é dividida em grupos (es-
tratos) e uma amostra aleatória é selecionada de cada grupo. Os estratos
podem ser faixas etárias, gêneros ou graus de escolaridade, por exemplo.
� Amostra aleatória por conglomerados: A população é dividida em grupos
distintos (como se fossem subpopulações), chamados conglomerados. Usamos
a amostra aleatória simples para escolher uma amostra de conglomerados e
em seguida todos os indivíduos dos conglomerados escolhidos são analisados.
� Amostra sistemática: A partir de uma população caracterizada numa listagem,
selecionamos aleatoriamente um elemento inicial, e em seguida, escolhemos
os membros da amostra a intervalos regulares. Por exemplo, se desejamos
selecionar um membro da população a cada 20 elementos da lista, então se-
lecionamos aleatoriamente um número de 1 a 20, digamos 7, e tomamos os
membros 27, 47, 67, e assim sucessivamente da lista.
Mas nossa taxonomia ainda não chegou ao m... Temos ainda alguns con-
ceitos a discutir. Então vamos lá.
Um elemento é cada uma das unidades observadas no estudo.
Uma variável é uma característica de um elemento que se possa medir.
Uma observação é um conjunto de valores de variáveis de um dado elemento.
Por exemplo, se desejamos testar a inuência de um determinado medica-
mento na pressão arterial de idosos acima de 65 anos, a partir da mensuração da
pressão arterial antes e depois da medicação, então, temos que cada idoso no estudo
é um elemento (ou unidade experimental); a pressão arterial é a nossa variável de
mensuração; e as medidas da pressão arterial antes e depois da medicação de cada
idoso compõem a observação do estudo.
Finalmente, para fechar agora os nossos conceitos fundamentais da Estatís-
tica, precisamos classicar os tipos de variáveis presentes num determinado estudo.
Por que isso é tão importante? Porque é pela natureza dos nossos dados, ou, como
dizemos em Estatística, pelo nosso nível de mensuração dos dados, que saberemos
que métodos estatísticos serão apropriados em cada caso. Assim, a natureza de
nossos dados já nos direciona para o tipo de tratamento estatístico de que faremos
uso.
5
Uma variável qualitativa é uma variável que não assume valor numérico,
mas é classicada em categorias (qualidades).
Uma variável quantitativa é uma variável que assume valores numéricos.
Variáveis qualitativas são também chamadas de variáveis categóricas, pois
podem ser agrupadas em categorias. Alguns exemplos são: sexo, etnia, estado civil,
etc. Já exemplos de variáveis quantitativas temos: altura, peso, idade, número de
lhos, etc.
As variáveis qualitativas podem ser classicadas como nominais ou ordi-
nais.
Uma variável é dita nominal se assume categorias não-ordenadas, sem
característico numérico intrínseco. Por exemplo, sexo e etnia.
Uma variável é dita ordinal se assume categorias ordenadas, sem característico
numérico intrínseco. Por exemplo, classe social e grau de instrução.
Além disso, as variáveis quantitativas podem ser classicadas como discre-
tas ou contínuas.
Uma variável discreta pode assumir um número nito ou contável de valores.
Cada valor pode ser grafado como um ponto na reta, com espaço entre os pontos.
Uma variável contínua assume um número innito de valores, formando
um intervalo da reta real, sem espaço entre os pontos.
Exemplos de variáveis quantitativas discretas são: número de habitantes por
domicílio, número de anos cursados com aprovação em séries escolares, etc. Já para
as quantitativas contínuas podemos citar: altura, peso, tempo de vida útil de um
componente eletrônico.
Assim temos o seguinte esquema resumido:
Variável
8>>>><>>>>:
Qualitativa
�
Nominal
Ordinal
Quantitativa
�
Discreta
Contínua
Associados aos tipos de variáveis, temos também, não menos importante, os
níveis de mensuração.
6
Níveis de Mensuração: Um conjunto de dados pode ser classicado de acordo
com o nível de medida mais alto que ele aplica. Os quatro níveis de medida, do mais
baixo para o mais alto, são:
1. Escala Nominal: formada por categorias que descrevem atributos ou qual-
idades dos dados (variáveis qualitativas). Não há nenhuma ordem natural nessas
categorias e tampouco característicos numéricos intrínsecos. Exemplos: sexo, estado
civil, cor dos olhos, etnia, etc.
2. Escala Ordinal: formada por categorias que descrevem atributos ou quali-
dades dos dados (variáveis qualitativas), mas que podem ser ordenadas, embora não
tenham característicos numéricos intrínsecos. Exemplos: grau de hipertensão (leve,
moderada e grave), escolaridade (sem instrução, ensino fundamental, ensino médio,
ensino superior, pós-graduação), etc.
3. Escala Intervalar: é similar à escala ordinal, exceto pelo fato de as men-
surações serem numéricas e distâncias entre dois dados podem ser medidas. Entre-
tanto, o zero (0) não é natural, isto é, não indica a ausência do atributo mensurado.
Exemplo: temperatura em graus Celsius (0�C não indica a ausência de temper-
atura).
4. Escala Racional (ou das Razões): é a escala mais rica de mensuração, com
característicos numéricos intrínsecos e zero natural (indicando a ausência do atributo
medido). Exemplo: todas as mensurações físicas (peso, altura, massa corporal).
De posse desses conceitos fundamentais, podemos no próximo capítulo começar
nalmente a operar matematicamente nossos dados. Antes, porém, gostaríamos
de propor as seguintes atividades de sedimentação do conteúdo tratado em nossa
primeira aula.
Exercício 1 Qual o objetivo da Estatística?
Exercício 2 Como se estrutura a Estatística?
Exercício 3 Dê um exemplo de fenômeno aleatório e um exemplo de fenômeno
não-aleatório (determinístico).
Exercício 4 Suponha que você tivesse que validar a informação de que a geladeira
da fábrica A consome menos energia ao mês que a geladeira da fábrica B. Como
você intuitivamente estruturaria as fases do método estatístico para validar (ou não)
essa armação?
Exercício 5 Retire de mídias (jornal, revista, internet, etc) uma matéria que você
utilizaria em sala de aula para ilustrar a presença da Estatística no dia a dia aos
seus alunos.
7
Exercício 6 Estabeleça se as seguintes situações ilustram o uso da Estatística De-
scritiva ou Estatística Inferencial, justicando as respostas.
(a) Em São Paulo, a média de gasto semanal de consumo de gasolina numa
amostra de 700 proprietários de carros foi de R$ 150; 00. O governo inferea média
semanal de gasto em gasolina no estado de São Paulo é R$ 150; 00.
(b) Uma amostra de 150 residentes de Copacabana mostra que 27 destes são
funcionários públicos. Assim 18% desses 150 residentes trabalham para o governo.
(c) A média de idade de uma amostra de 250 habitantes de Santa Cruz foi de 34
anos.
(d) Numa pesquisa feita com 1000 habitantes de Campos (Rio de Janeiro), 456
disseram que já fazem suas compras com sacola ecológica pessoal. A prefeitura con-
clui que 45; 6% dos habitantes de Campo já aderiram à bolsa ecológica.
Exercício 7 Deseja-se conhecer o comportamento de idosos do bairro do Flamengo,
com idade acima de 65 anos. Para isso, você como pesquisador decide selecionar
200 idosos moradores do Flamengo e, através de mensurações, obter as seguintes
informações por idoso:
(1) Ativo (A) ou Sedentário (S).
(2) Idade (em anos).
(3) Peso (em kg).
(4) Altura (em cm).
(5) Índice de Massa Corporal (IMC), que é a razão entre peso e altura em metros
elevada ao quadrado.
(6) Classe segundo o IMC (Normal (N) ou Sobrepeso (P))
(7) Circunferência da cintura (em cm).
(8) Circunferência do quadril (em cm).
(9) Relação Cintura/Quadril (RCQ) (adimensional).
(10) Classe segundo a RCQ, sendo PR (pequeno risco), MR (médio risco) e GR
(grande risco).
Com base no estudo acima, pede-se:
(a) Identicar a população em estudo.
(b) Identicar a amostra em estudo.
(c) Identicar os parâmetros do estudo.
(d) Identicar as estatísticas do estudo.
(e) Identicar os elementos do estudo.
(f) Identicar as variáveis do estudo.
(g) Identicar as observações do estudo.
(h) Classicar as variáveis do estudo como qualitativas ou quantitativas.
(i) Classicar as variáveis qualitativas do estudo como nominais ou ordinais.
(j) Classicar as variáveis quantitativas do estudo como discretas ou contínuas.
(k) Avaliar o nível de mensuração de cada variável do estudo.
8