Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística Básica SIRLEI ALVES CHAVES 19 Edição Brasília/DF - 2020 C512e Chaves, Sirlei Alves Estatística básica / Sirlei Alves Chaves. – Brasília : Alumnus, 2020. 71 p. Recurso online: e-book Modo de acesso: world wide web ISBN 978-65-89227-10-6 1. Estatística. 2. Estatística matemática. I. e-book. II. Título. CDU 311.1 Ficha catalográfica elaborada pela Bibliotecária Marjorie Gonçalves Andersen Trindade, CRB-1/2704 Autores Sirlei Alves Chaves Produção Equipe Técnica de Avaliação, Revisão Linguística e Editoração Sumário Organização do Livro Didático ............................................................................ 4 Introdução ................................................................................................... 6 Capítulo 1 Conceitos fundamentais ................................................................................ 7 Capítulo 2 Distribuição de frequências .......................................................................... 16 Capítulo 3 Medidas estatísticas ................................................................................... 27 Capítulo 4 Probabilidade .......................................................................................... 36 Capítulo 5 Distribuição de probabilidade de variáveis aleatórias discretas ................................ 52 Capítulo 6 Distribuição de probabilidade de variáveis aleatórias contínuas ................................ 59 Organização do Livro Didático Para facilitar seu estudo, os conteúdos são organizados em capítulos, de forma didática, objetiva e coerente. Eles serão abordados por meio de textos básicos, com questões para reflexão, entre outros recursos editoriais que visam tornar sua leitura mais agradável. Ao final, serão indicadas, também, fontes de consulta para aprofundar seus estudos com leituras e pesquisas complementares. A seguir, apresentamos uma breve descrição dos ícones utilizados na organização do Livro Didático. Atenção Chamadas para alertar detalhes/tópicos importantes que contribuam para a síntese/conclusão do assunto abordado. Cuidado Importante para diferenciar ideias e/ou conceitos, assim como ressaltar para o aluno noções que usualmente são objeto de dúvida ou entendimento equivocado. Importante Indicado para ressaltar trechos importantes do texto. Observe a Lei Conjunto de normas que dispõem sobre determinada matéria, ou seja, ela é origem, a fonte primária sobre um determinado assunto. Para refletir Questões inseridas no decorrer do estudo a fim de que o aluno faça uma pausa e reflita sobre o conteúdo estudado ou temas que o ajudem em seu raciocínio. É importante que ele verifique seus conhecimentos, suas experiências e seus sentimentos. As reflexões são o ponto de partida para a construção de suas conclusões. 4 ORGANIZAÇÃO DO LIVRO DIDÁTICO Provocação Textos que buscam instigar o aluno a refletir sobre determinado assunto antes mesmo de iniciar sua leitura ou após algum trecho pertinente para o autor conteudista. Saiba mais Informações complementares para elucidar a construção das sínteses/conclusões sobre o assunto abordado. Sintetizando Trecho que busca resumir informações relevantes do conteúdo, facilitando o entendimento pelo aluno sobre trechos mais complexos. Sugestão de estudo complementar Sugestões de leituras adicionais, filmes e sites para aprofundamento do estudo, discussões em fóruns ou encontros presenciais quando for o caso. Posicionamento do autor Importante para diferenciar ideias e/ou conceitos, assim como ressaltar para o aluno noções que usualmente são objeto de dúvida ou entendimento equivocado. 5 Introdução Este livro didático destina-se aos alunos do curso de graduação a distância da Faculdade Unyleya e apresenta uma introdução conceitual do campo da estatística e algumas aplicações. As aplicações correspondem a problemas contextualizados que exigem a análise de certos dados apresentados e a escolha de um método conveniente para tratá-los estatisticamente. Sendo assim, ao longo de cada capítulo, serão discutidas, desenvolvidas e ampliadas algumas técnicas estatísticas, a fim de, posteriormente, serem aplicadas em situações-problema. Vale ressaltar que as questões apresentadas irão, constantemente, exigir que o estudante se posicione criticamente em relação a elas, isto é, a partir de resultados estatísticos, o estudante deverá fornecer critérios para a tomada de decisão na solução de problemas. Apesar do forte caráter das aplicações, é importante lembrar que, em todos os momentos, o rigor característico da linguagem matemática está presente, uma vez que um dos objetivos deste livro é articular teoria e prática. Vale observar, ainda, que não existe preocupação de esgotar por completo os conceitos abordados, embora estejam incluídas referências bibliográficas para aqueles que assim desejarem. Objetivos Este livro didático tem como objetivos: » Servir de instrumento de reflexão, discussão e problematização em torno de temas e questões fundamentais presentes na prática de uma empresa e/ou organização. » Entender e usar de forma eficiente e eficaz informações estatísticas extraídas de um banco de dados. » Analisar relatórios estatísticos visando avaliar e tomar decisões acertadas; enfatizar o desenvolvimento do pensamento estatístico e avaliar a credibilidade do valor das inferências feitas a partir de dados, não só para aqueles que consomem, mas também para aqueles que produzem. 6 CAPÍTULO CONCEITOS FUNDAMENTAIS Introdução do capítulo Este capítulo apresenta algumas definições básicas de conceitos fundamentais relacionados à estatística. Além disso, busca demonstrar o papel-chave que a estatística desempenha no raciocínio crítico, seja ele elaborado no decorrer deste curso, no trabalho ou na vida diária. Objetivos Esperamos que, após o estudo do conteúdo deste capítulo, você seja capaz de: » Identificar os objetivos da ciência estatística. » Identificar tipos de aplicações estatísticas na empresa. » Reconhecer os elementos fundamentais da estatística. » Identificar e escolher adequadamente um método estatístico para análise de populações. » Classificar dados estatísticos. » Estabelecer um critério para coleta de dados. » Entender o papel da estatística no gerenciamento da tomada de decisão. A estatística e sua importância Durante muito tempo a estatística foi vista apenas como gráficos e tabelas. Atualmente, no mundo globalizado em que vivemos, a informação é de fundamental importância nas mais variadas atividades profissionais como economia, agronomia, administração, biologia etc. 7 1 A principal ferramenta para transformar uma massa de números (dados) em informações é exatamente a estatística. As técnicas estatísticas são utilizadas para organizar, apresentar, analisar e interpretar dados. Embora a análise e a interpretação de dados escape à noção de estatística, estas seriam, na verdade, o seu principal uso. Importante CAPÍTULO 1 • CONCEITOS FUNDAMENTAIS Como a estatística é uma ciência relativamente nova, muitos ainda não se deram conta da sua importância para a vida moderna. Com os recentes avanços computacionais, a estatística tem sido cada vez mais utilizada, pois muitas de suas técnicas envolvem cálculos cansativos que hoje podem ser facilmente resolvidos por pacotes estatísticos (programas de computadores específicos para estatística) disponíveis no mercado. A estatística como ciência é uma área da matemáticaque, com base na teoria das probabilidades, estuda métodos para a modelagem de fenômenos. A estatística básica usa os aleatórios, aqueles fenômenos que produzem dados de observação, tais como temperatura média diária em uma determinada região ou o índice de inflação mensal de certo país. Como os fenômenos aleatórios permeiam as mais variadas áreas do conhecimento, esses métodos usam a estatística como ferramenta na solução de problemas nessas áreas. Por isso, observa-se que são raros os cursos de graduação que não incluem em sua grade curricular pelo menos uma disciplina da área de estatística. A estatística está dividida em duas grandes áreas: a sstatística descritiva e a inferência estatística. A estatística descritiva é de extrema importância principalmente em pesquisa de levantamento de dados, pois, diante de uma grande massa de dados (observações), coletados de um determinado fenômeno (por exemplo, o preço de um produto em todos os supermercados da cidade), precisa-se de procedimentos estatísticos para organizá-los de forma que este fenômeno possa ser interpretado de maneira bastante clara. Os métodos de inferência estatística são utilizados principalmente para tomar decisões diante de incertezas que são inerentes aos fenômenos aleatórios. Embora já se disponha de métodos estatísticos bem sofisticados, muitos problemas do nosso dia a dia podem ser resolvidos com a estatística descritiva. A estatística descritiva deve ser aplicada na coleta, organização e descrição dos dados, enquanto que a inferência estatística auxilia na análise e interpretação dos dados. Sendo assim, em qualquer área do conhecimento, em vários cursos de graduação, é fundamental que se tenha a matéria estatística, iniciando com uma disciplina cujo conteúdo trate de estatística descritiva. 8 É possível distinguir duas concepções para a palavra ‘estatística’: no plural (estatísticas), indica qualquer coleção de dados numéricos, reunidos com a finalidade de fornecer informações acerca de uma atividade qualquer. No singular (estatística), indica a atividade humana especializada ou um corpo de técnicas, ou ainda uma metodologia desenvolvida para coleta, classificação, apresentação, análise e interpretação de dados quantitativos e utilização desses dados para a tomada de decisões. A Éstatística é uma parte da matemática que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados, viabilizando a utilização deles na tomada de decisões Importante Amostra CONCEITOS FUNDAMENTAIS • CAPÍTULO 1 População e amostra População é o conjunto de todos os elementos (pessoas, animais, domicílios ou objetos) que têm em comum a característica ou o atributo de interesse do fenômeno em estudo. Como exemplo, suponha que queremos estudar o perfil sócio-econômico dos estudantes universitários da cidade de Manaus. Então, o fenômeno em estudo é o perfil sócio-econômico dos universitários da cidade de Manaus e a população é formada por todos os estudantes universitários da cidade de Manaus, ou seja, estudantes matriculados nas universidades e faculdades localizadas na cidade de Manaus. Amostra é uma parte da população, selecionada de maneira criteriosa, para efetivamente fornecer os dados para o estudo. Figura 1. População e amostra. População Fonte: https://www.shutterstock.com/g/Bakhtiar+Zein?searchterm=Popula%C3%A7%C3%A3o%20e%20amostra. Uma amostra representativa de uma população pode ser obtida escolhendo-se aleatoriamente os elementos que irão compor a amostra e isso nos permite fazer inferências sobre a população. 9 https://www.shutterstock.com/g/Bakhtiar%2BZein?searchterm=Popula%C3%A7%C3%A3o%20e%20amostra Se o nosso interesse está voltado para certa variável de determinado grupo de elementos, ela pode ser classificada em: Qualitativa, isto é, quando resulta de uma classificação por tipos ou atributos. Sendo assim, pode ser: » nominal - como, por exemplo, sexo ou cor dos olhos; » ordinal - como, por exemplo, classe social ou grau de instrução. Quantitativa, isto é, quando os seus valores indicam quantidades. Dessa forma, a variável pode ser: » discreta - quando seus possíveis valores formam um conjunto enumerável, finito ou infinito, como, por exemplo, número de peças defeituosas, número de filhos ou número de carros; » contínua - quando assume qualquer valor dentro de um intervalo de variação, como, por exemplo, peso, altura, tempo ou renda. Atenção CAPÍTULO 1 • CONCEITOS FUNDAMENTAIS No exemplo acima, a amostra é formada por parte dos estudantes universitários da cidade de Manaus. Censo e amostragem: quando consideramos todos os elementos da população em um estudo, realizamos um censo e quando tomamos parte da população estatística básica usando o para o estudo, realizamos uma amostragem. Em geral a realização de um censo demanda muito tempo e alto custo, daí o Brasil fazer o censo a cada dez anos. O censo se torna viável quando a população é pequena e é fácil o acesso aos seus elementos. Definição e classificação de variáveis Quando falamos no estudo do perfil sócio-econômico dos universitários da cidade de Manaus, fica subentendido que estamos tratando com algumas variáveis, tais como, idade, renda familiar, número de filhos na família, escolaridade dos pais etc. É importante diferenciar os tipos de variáveis para que se possa dar o tratamento estatístico adequado a cada uma delas. As variáveis são classificadas como qualitativas ou quantitativas. Uma variável qualitativa representa uma qualidade e seus valores são categorias. 10 Duas observações: A primeira é que devemos usar procedimentos estatísticos para determinar o tamanho da amostra, ou seja, quantos elementos devem ser selecionados para fazer parte da amostra. A segunda é utilizar o método de amostragem (amostragem aleatória simples, amostragem estratificada, amostragem por conglomerado etc...) mais adequado para os objetivos do levantamento. Atenção CONCEITOS FUNDAMENTAIS • CAPÍTULO 1 De acordo com as categorias, a variável pode ser subdividida em qualitativa nominal, se as categorias não impõem uma ordem natural ou qualitativa ordinal, se as categorias impõem uma ordem natural. Por outro lado, uma variável quantitativa representa uma quantidade e seus valores são numéricos. Podem ser subdivididas em quantitativa discreta, quando seus valores são pontos sobre a reta, geralmente resultado de uma contagem, ou quantitativa contínua, quando seus valores estão em um intervalo da reta, geralmente resultado de uma medida. Figura 2. Variáveis estatíscas. Fonte: https://marketinganalitico.com.br/marketing-e-estatistica-variaveis/ Exemplos: Variáveis qualitativas nominais - nacionalidade (brasileira, francesa, portuguesa, ...); religião (católica, evangélica); sexo: (masculino, feminino). Observa-se nessas variáveis que não existe uma relação de ordem entre as categorias. Variáveis qualitativas ordinais - escolaridade (ensino fundamental; ensino médio; ensino superior); classe social (A, B, C, ...). Nesse caso as categorias apresentam uma relação de ordem natural. Variáveis quantitativas discretas - número de filhos por família (0, 1, 2, ...); pontos na Carteira Nacional de Habilitação (0, 7, ..., 20). Variáveis quantitativas contínuas - peso de indivíduo (em quilograma), altura de indivíduos (em centímetro), idade, temperatura, etc. As variáveis são medidas registradas de um dado objeto de estudo, realizadas em diferentes unidades de observação. Por exemplo, no estudo do perfil dos universitários da cidade de Manaus, o pesquisador tem “estudante universitário” como objeto ou unidade amostral. Como variáveis, “idade do estudante”, “renda familiar do estudante” e “curso em que está matriculado”; o valor da variável depende do estudante avaliado, sendo a medida expressapela escala escolhida, por exemplo, idade em anos e renda em salários mínimos. 11 https://marketinganalitico.com.br/marketing-e-estatistica-variaveis/ Na realização de estudos dessa natureza é quase impossível observar todos os elementos da população em estudo, principalmente devido ao tempo e custo operacional. Portanto, tendo que trabalhar com uma amostra, deve-se escolher a estatística básica usando uma amostra que seja representativa da população, ou seja, uma cópia o mais fiel possível da população. Assim, escolhendo-se criteriosamente as unidades amostrais, teremos segurança para usar a inferência estatística e generalizar os resultados obtidos na amostra para a população. Atenção CAPÍTULO 1 • CONCEITOS FUNDAMENTAIS Tipos de dados Todos os dados (e, por conseguinte, as variáveis que medimos) podem ser classificados como um dos dois tipos gerais: quantitativo ou qualitativo. Dados quantitativos são medidas registradas em uma escala numérica de ocorrência natural. Exemplo 1: a temperatura (em graus Celsius) em que cada unidade em uma amostra de 25 peças plásticas resistentes ao calor começa a derreter; a atual taxa de desemprego de cada um dos estados brasileiros da região Sudeste; o salário dos administradores empregados em multinacionais; o número de mulheres executivas empregadas em cada uma das amostras de 75 empresas de manufatura. Quanto aos dados qualitativos, são mensurações que não podem ser medidas em uma escala numérica natural. Eles só podem ser classificados em grupo de categorias, ou seja, podem apenas ser classificados em categorias. Exemplo 2: a afiliação a um partido político, a condição de defeito (defeito ou não) de cada uma das 100 peças de um microcomputador, a nacionalidade de cem turistas em visita à cidade do Rio de Janeiro. Coleta de dados Em toda pesquisa de levantamento em que queremos fazer afirmações sobre características de uma população, surgem dois problemas que devem ser tratados com bastante atenção para a confiabilidade dos resultados do estudo. O primeiro diz a respeito ao número de unidades a serem observadas, ou seja, o tamanho da amostra. O segundo refere-se ao plano amostral, isto é, como operacionalizar a coleta dos dados. Fontes de dados Os dados a serem coletados podem estar previamente armazenados em algum lugar ou podem ser gerados pelo próprio pesquisador. As fontes de dados podem ser secundárias e primárias. 12 Para o êxito do instrumento de pesquisa devemos: » fazer questões tão simples quanto possível; » acilitar as respostas dos entrevistados; » elaborar com clareza as perguntas; » facilitar a memória do sujeito entrevistado; » evitar realização de cálculos; » evitar palavras técnicas no instrumento; » evitar perguntas com respostas dúbias; » evitar perguntas sugestivas; » evitar um grande número de questões; » evitar questões com respostas abertas; » permitir uma resposta adicional. Atenção CONCEITOS FUNDAMENTAIS • CAPÍTULO 1 Fontes secundárias: são bancos de dados ou arquivos previamente existentes, onde estão armazenadas as informações que serão utilizadas no levantamento, ou seja, os dados já existem e o pesquisador irá lançar mão deles para desenvolver seu estudo. As fichas de cadastro de estudantes ou de clientes de uma loja de departamentos são exemplos de fonte de dados secundária. Fontes primárias: dizemos que a fonte é primária quando o próprio pesquisador gera a informação. As fontes primárias mais utilizadas são a observação direta do fenômeno, que é um método clássico na pesquisa científica, e o questionário que é o instrumento de pesquisa do levantamento de dados. Construção do instrumento de pesquisa O instrumento de pesquisa é o objeto que reúne um conjunto de questões para gerar um documento padrão onde serão coletados e registrados os dados da pesquisa. O instrumento precisa ser bem adequado e direcionado aos objetivos da pesquisa. O papel da estatística no gerenciamento das tomadas de decisão O crescimento na coleta de dados, associado ao fenômeno científico, às operações de negócios e às atividades governamentais (controle de qualidade, auditoria estatística, previsões) tem sido marcante nas últimas décadas. Todo dia a mídia apresenta resultados e pesquisas políticas, econômicas e sociais. Na ênfase cada vez maior do governo a respeito das drogas e dos testes de produtos, por exemplo, testemunha-se a clara evidência da necessidade de ser capaz de avaliar os 13 O pensamento estatístico envolve a aplicação do pensamento racional e da ciência da estatística para avaliar criticamente dados e inferências. É fundamental para o processo que exista variação na população e no processamento de dados. Para refletir CAPÍTULO 1 • CONCEITOS FUNDAMENTAIS dados inteligentemente. Como consequência, cada um de nós tem desenvolvido um discernimento – uma habilidade de raciocínio para interpretar e entender o significado dos dados. Essa habilidade pode ajudar a fazer escolhas inteligentes, inferências e generalizações, isto é, ajudar a pensar criticamente, usando a estatística. Gestores de sucesso confiam muito no uso do pensamento estatístico para ajudá-los a tomar decisões. O fluxograma da figura 3, mostra o papel da estatística na tomada de decisão. Figura 3. O papel da estatística na tomada de decisão gerencial. Fonte: Criação do autor. Cada problema de tomada de decisão inicia-se no mundo real. Esse problema é, então, formulado em termos gerenciais e estruturado como uma questão gerencial. Os próximos passos (seguindo o fluxograma no sentido anti-horário) identificam os papéis que a estatística pode representar nesse processo. Os problemas gerenciais são traduzidos para problemas estatísticos, os dados da amostra são coletados e analisados, e a questão estatística é respondida. O próximo passo 14 Vimos até agora: » O conceito de estatística. » Os tipos de aplicações da estatística: descritiva e inferencial. » Os quatro elementos dos problemas estatísticos descritivos: identificar a população ou amostra, identificar as variáveis, coletar dados e descrever os dados. » A caracterização dos tipos de dados: quantitativos (de natureza numérica) e qualitativos (de natureza categórica). » Os métodos de coleta de dados: observacional, fontes publicadas, pesquisa e plano experimental. » O papel da estatística no gerenciamento da tomada de decisão. Sintetizando CONCEITOS FUNDAMENTAIS • CAPÍTULO 1 é usar a resposta para resolver o problema gerencial. A resposta para o problema gerencial pode sugerir uma reformulação do problema original, uma nova questão ou levar à solução do problema gerencial. 15 CAPÍTULO DISTRIBUIÇÃO DE FREQUÊNCIAS Introdução do Capítulo Caro discente, agora que você já aprendeu como coletar os dados, no capítulo 2 estudará algumas técnicas estatísticas para organizar esses dados em tabelas. Você verá que para cada tipo de variável, qualitativa ou quantitativa, existe uma tabela adequada para apresentar os dados. Objetivos Esperamos que, após o estudo do conteúdo deste capítulo, você seja capaz de: » Descrever dados qualitativos de uma pesquisa estatística. » Estabelecer métodos gráficos para descrever dados quantitativos. » Interpretar e utilizar dados apresentados graficamente. » Selecionar a maneira mais adequada para representar um conjunto de dados graficamente. Variáveis qualitativas Uma vez coletados os dados, precisamos ter familiaridade com eles e, portanto, é necessário organizá-los de maneira que essa massa de dados se transforme em informações a respeito do fenômeno que está sendo estudado. Ou seja, nosso objetivo neste capítulo é organizar e apresentar os dadosem tabelas, de modo a facilitar o seu manuseio e entendimento do fenômeno. Classificação simples Para organizar as observações (dados) de uma variável qualitativa, construímos uma tabela a partir do conjunto de valores observados. Em uma coluna registramos as categorias da variável 16 2 DISTRIBUIÇÃO DE FREQUÊNCIAS • CAPÍTULO 2 e em outra coluna a frequência de cada categoria. Por exemplo, suponha que 50 candidatos ao vestibular de 2019, tenham respondido a um questionário com a pergunta, qual o grau de instrução do seu pai? As respostas codificadas são: 1 – Nenhum, 2 – Fundamental, 3 – Médio e 4 – Superior. Vamos admitir que o conjunto de resposta fosse o seguinte: 3 3 2 2 3 1 3 4 4 2 2 1 4 2 3 2 3 3 3 3 3 2 2 3 1 3 3 3 3 1 1 2 3 2 3 3 2 3 2 3 2 2 2 3 3 3 3 3 3 3 Os dados estão organizados na tabela 1. Uma tabela deve ter os seguintes elementos: Título - o título explica o que contém a tabela. Compõe-se da referência (tipo de elemento e número), da descrição do conteúdo e da data de referência. Corpo - o corpo é formado pelas linhas e colunas de dados da tabela. É a parte da tabela que contém os dados e informações. Cabeçalho - o cabeçalho da tabela é a primeira linha. É a parte superior da tabela que especifica o conteúdo das colunas. Pode ser constituído de um ou vários níveis. Coluna indicadora - a coluna indicadora é primeira coluna, especifica o conteúdo das linhas. Fonte - consiste na indicação da entidade (ou entidades) responsável pelo fornecimento ou elaboração dos dados e/ou informações constantes da tabela. Tabela 1. Grau de instrução do pai do candidato, Vestibular 2019. Grau de Instrução Frequência Nenhum 5 Fundamental 15 Médio 27 Superior 3 Total 50 Fonte: Criação do autor. Classificação dupla As informações contidas na tabela 1 podem ser mais detalhadas. Por exemplo, a informação sobre o grau de instrução dos pais, pode ser informada por sexo ou pelo curso que o candidato escolheu. Ou seja, podemos construir uma tabela com duas entradas ou dupla classificação. 17 CAPÍTULO 2 • DISTRIBUIÇÃO DE FREQUÊNCIAS Utilizando o exemplo anterior, suponha que no conjunto dos 50 candidatos acima, 30 são do sexo masculino e 20 do sexo feminino, além disso, 10 candidatos escolheram a área de ciências exatas, 25 escolheram ciências humanas e 15 escolheram ciências biológicas. Esses dados agora podem ser apresentados como nas tabelas a seguir: Tabela 2. Grau de instrução do pai por sexo do candidato, Vestibular 2019. Grau de Instrução Frequência Masculino Feminino Total Nenhum 3 2 5 Fundamental 5 10 15 Médio 14 13 27 Superior 2 1 3 Total 24 26 50 Fonte: Criação do autor. Note que a coluna da direita contém o total das frequências relativas à variável grau de instrução. Tais frequências são distribuídas no corpo da tabela conforme as categorias da outra variável de classificação. Na tabela 2 a variável sexo e na tabela 3 a variável área escolhida. Vejamos: Tabela 3. Grau de instrução do pai do candidato pela área escolhida, Vestibular 2019. Grau de Instrução Frequência Biológicas Exatas Humanas Total Nenhum 1 1 3 5 Fundamental 3 4 8 15 Médio 5 8 14 27 Superior 2 0 1 3 Total 11 13 26 50 Fonte: Criação do autor. Variáveis quantitativas No caso de variável quantitativa discreta, quando existem poucos valores diferentes da variável, construímos uma tabela semelhante à tabela 1, apenas colocando na coluna indicadora os diferentes valores da variável. Por exemplo, se fosse perguntado aos candidatos, qual o número de filhos na sua família, poderíamos ter o resultado apresentado na tabela 4. 18 DISTRIBUIÇÃO DE FREQUÊNCIAS • CAPÍTULO 2 Tabela 4. Número de filhos na família do candidato, Vestibular 2019. Número de filhos Frequência 0 5 1 26 2 9 3 5 4 3 5 2 Total 50 Fonte: Criação do autor. Quando existe um grande número de valores diferentes para a variável discreta, ou se a variável quantitativa é contínua, construímos uma tabela de distribuição em classes de frequências. Dados brutos Os dados, na forma como são coletados, são chamados de dados brutos. Depois de ordenados, em ordem crescente ou decrescente, são chamados de rol. Por exemplo, suponha que coletamos a idade de cinquenta estudantes do curso de administração, cujos valores são apresentados a seguir: Dados Brutos 19 22 19 21 25 26 24 23 28 19 17 20 18 23 29 18 18 20 20 22 26 18 20 27 24 19 20 19 24 17 20 19 17 28 22 19 25 20 22 20 18 18 27 23 19 25 19 24 23 20 Dessa forma (dados brutos), temos dificuldade, por exemplo, de verificar qual a maior idade no grupo ou qual a idade do estudante mais jovem. Essas questões são facilmente respondidas quando dispomos os dados, por exemplo, em ordem crescente como segue: Rol 17 17 17 18 18 18 18 18 18 19 19 19 19 19 19 19 19 19 20 20 20 20 20 20 20 20 20 21 22 22 19 Para construir as classes de frequências devemos observar as seguintes regras: » as classes devem conter todas as observações; » a primeira classe deve conter o menor valor e a última classe o maior valor; » cada valor deve ser colocado em uma única classe; » dDeve-se usar entre 5 e 15 classes, se possível, de mesmo tamanho. Importante CAPÍTULO 2 • DISTRIBUIÇÃO DE FREQUÊNCIAS 22 22 23 23 23 23 24 24 24 24 25 25 25 26 26 27 27 28 28 29 Agora é simples verificar que o estudante mais jovem no grupo tem 17 anos, assim como o mais velho tem 29 anos. Distribuição em classes de frequências Esses dados podem ser organizados numa tabela de distribuição em classes de frequências. Com os dados do exemplo anterior, vamos construir uma tabela de distribuição em classes de frequências para a variável idade dos estudantes. Inicialmente observamos que a menor idade é 17 anos e a maior idade é 29 anos, portanto, estes dados têm uma amplitude de 13 anos, vejamos: Amplitude total = At = maior valor – menor valor = 29 – 17 = 13. Escolhendo k = 6 classes (e é uma escolha), cada classe deve ter o comprimento aproximado de h At 13 2,16 . k 6 Para facilitar os cálculos e respeitar a segunda regra, podemos usar h = 2 e como limite inferior da primeira classe o valor 16. Logo as seis classes de idade são: 16 a 18, 18 a 20, 20 a 22, 22 a 24, 24 a 26 e 26 a 28. Como o maior valor é 29, devemos aumentar mais uma classe para respeitar a segunda regra, a última classe será 28 a 30. Tabela 5. Distribuição em classes de frequências para a variável idade. Número de filhos Frequência 16 18 3 18 20 15 20 22 10 22 24 8 24 26 7 26 28 4 28 30 3 Total 50 Fonte: Criação do autor. 20 A soma de todas as frequências relativas de uma amostra totaliza 100% ou 1. Atenção Fonte: Criação do autor. Notação para intervalos de classe. Considere os extremos a e b de um intervalo, então: a b: intervalo fechado à esquerda e aberto à direita. Inclui o limite inferior a e exclui o limite superior b; a b: intervalo aberto à esquerda e fechado à direita. Exclui o limite inferior a e inclui o limite superior b; a b: intervalo fechado à esquerda e à direita. Inclui os dois extremos; a b:: intervalo aberto à esquerda e à direita. Exclui os dois limites a e b. Saiba mais DISTRIBUIÇÃO DE FREQUÊNCIAS • CAPÍTULO 2 As classes são fechadas à esquerda e abertas à direita, isto significa que a idade 18 anos pertence à segunda classe e não à primeira. Por fim, contamos a frequência de cada classe. Observe que na classe de 16 a 18, encontra-se três vezes a idade 17 anos. Portanto, a primeira classe tem frequência igual a 3. Para a segunda classe verificamos que aparecem seis vezes a idade de 18 anos e nove vezes a idade 19 anos, logo, a segunda classe tem frequência igual a 15. E assim por diante, até a última classeque tem frequência 3, pois os valores correspondentes à classe 28 a 30 são as idades 28, 28 e 29 anos. Ao organizamos os dados em uma tabela de distribuição em classes de frequências, não sabemos mais quais as idades que estão na terceira classe, por exemplo. Sabemos apenas que existem 10 estudantes com 20 anos ou mais e menos de 22 anos. Elementos de uma distribuição de frequência Os elementos em uma tabela de distribuição em classes de frequências trazem informações tais como, a proporção de estudantes com menos de 26 anos, quantos estudantes têm 24 anos ou mais. Esses elementos estão na tabela 6 e são definidos da seguinte forma, vejamos: Tabela 6. Distribuição em Classes de Frequências para a variável idade. Número de filhos Xi fi Fi fri Fri 16 18 17 3 3 0,06 0,06 18 20 19 15 18 0,30 0,36 20 22 21 10 28 0,20 0,56 22 24 23 8 36 0,16 0,72 24 26 25 7 43 0,14 0,86 26 28 27 4 47 0,08 0,94 28 30 29 3 50 0,06 1,00 Total 50 21 CAPÍTULO 2 • DISTRIBUIÇÃO DE FREQUÊNCIAS Ponto médio da classe (Xi): É o valor que representa todas as observações da classe. É calculado como sendo a média dos limites da classe. Sendo assim, para a quarta classe temos: X 22 24 23 4 2 Frequência simples ou absoluta (fi): É o número de observações na classe. Na quarta classe existem oito observações, conforme se verifica no rol, sendo quatro vezes a idade 23 anos e quantro vezes a idade 24 anos, portanto: F 4 = 8 Frequência acumulada (Fi): É a soma das frequências absolutas até a i-ésima classe. Para a quarta classe, temos: F 4 = F 1 + F 2 + F 3 + F 4 = 3 + 15 + 10 + 8 = 36 Frequência relativa (fri): É a proporção de observações na i-ésima classe e é calculada como o quociente entre a frequência absoluta e o total de observações, ou seja, fri = fi/n. Para a quarta classe, temos: fr4 f4 8 n 50 0,16 Frequência relativa acumulada (Fri): É a proporção de observações acumuladas até a i-ésima classe, ou seja, Fri = Fi/n. Ou ainda, a soma das frequências relativas até a i-ésima classe. Para a quarta classe temos: Fr F4 36 0, 72 4 n 50 Também pode ser calculada da seguinte forma: Fr 4 = Fr 1 + Fr 2 + Fr 3 + Fr 4 = 0,06 + 0,30 + 0,20 + 0,16 = 0,72 Apresentação gráfica O gráfico constitui um importante instrumento de representação de dados, fornecendo uma comunicação rápida, clara e efetiva, poupando, sobretudo, tempo e esforço na visualização de dados sumarizados, sendo uma forma de representar uma distribuição de frequências. Um gráfico deve levar a uma rápida compreensão do fenômeno apresentado e possibilitar uma correta interpretação dos seus valores. Ele auxilia bastante a apresentação de dados estatísticos facilitando a sua compreensão. 22 Um gráfico deve apresentar título e escala. O título deve ser colocado acima do gráfico e descrito como figura. As escalas devem crescer da esquerda para a direita e de baixo para cima. As legendas explicativas, quando houver necessidade, devem ser colocadas, de preferência, à direita do gráfico. Importante DISTRIBUIÇÃO DE FREQUÊNCIAS • CAPÍTULO 2 Gráfico de pontos No gráfico de pontos, o valor numérico de cada medição quantitativa do conjunto de dados é representado por um ponto em uma escala horizontal. Quando os valores se repetem, os pontos são posicionados um sobre o outro, verticalmente. Gráfico 1. Número de filhos na família do candidato, Vestibular 2019. Fonte: Criação do autor. Gráficos de colunas e barras Gráficos de colunas são empregados para representar a distribuição de frequências de variáveis qualitativas e quantitativas discretas. Cada categoria ou valor é representado por uma coluna cuja altura é a sua frequência absoluta ou frequência relativa. Por exemplo: a distribuição de frequências do gráfico abaixo: 23 CAPÍTULO 2 • DISTRIBUIÇÃO DE FREQUÊNCIAS Gráfico 2. Número de filhos na família do candidato, Vestibular 2019. Fonte: Criação do autor. Alternativamente, podemos apresentar as categorias no eixo vertical e a frequências no eixo horizontal. Os gráficos construídos desta forma são chamados de gráficos de barras. Como exemplo, a distribuição de frequências está representada no gráfico 3: Gráfico 3. Grau de instrução do pai do candidato, Vestibular 2019. Fonte: Criação do autor. Gráfico de setores O gráfico de setores é utilizado em geral para variáveis qualitativas. Ele é construído dividindo- se o círculo em setores, cada um correspondendo, de forma proporcional, à frequência simples 24 Ao interpretar um histograma, devem-se considerar dois importantes fatores: O primeiro é a porção da área total abaixo do histograma que fica sobre um intervalo particular do eixo horizontal, que é igual à frequência relativa de medidas no intervalo. O segundo é que se pode imaginar a aparência do histograma da frequência relativa para um conjunto de dados muito grande (uma população). Importante DISTRIBUIÇÃO DE FREQUÊNCIAS • CAPÍTULO 2 ou relativa de uma das categorias da variável. O grau de instrução do pai do candidato está representado no gráfico de setores, que também pode ser chamado de pictórico, da figura abaixo: Gráfico 4 . Grau de instrução do pai do candidato, Vestibular 2019. Fonte: Criação do autor. Histogramas Os histogramas podem ser usados para mostrar tanto a frequência absoluta quanto a frequência relativa das medidas em cada intervalo de classes. No histograma, os valores numéricos da variável quantitativa estão divididos em intervalos de classe de mesma largura. Esses intervalos formam a escala do eixo horizontal. A frequência absoluta ou relativa das observações em cada intervalo de classe é determinada por uma barra vertical posicionada sobre cada intervalo de classe, cuja altura corresponde à frequência absoluta ou relativa do intervalo de classe em questão. O histograma que representa a distribuição em classes de frequências da tabela 5 está apresentado no gráfico 5: 25 Vimos até agora: 1. Como descrever dados qualitativos, isto é, identificar classes de categorias, determinar as frequências absolutas e relativas das classes e representar tais frequências em gráficos de barras e gráficos de pizza. 2. Como descrever dados quantitativos, ou seja, identificar classes de categorias, determinar as frequências absoluta e relativa das classes e representar tais frequências em gráficos de pontos, de ramos e folhas e em histogramas. Sintetizando CAPÍTULO 2 • DISTRIBUIÇÃO DE FREQUÊNCIAS Gráfico 5. Histograma da idade de 50 estudantes de Administração. Fonte: Criação do autor. Enquanto os histogramas proporcionam uma melhor descrição visual dos grupos de dados (particularmente grupos muito grandes), eles não permitem identificar medidas individuais. Mas cada uma das medidas originais é visível de alguma forma em um gráfico de pontos e claramente visíveis em um gráfico de ramo e folhas. 26 CAPÍTULO MEDIDAS ESTATÍSTICAS Introdução do capítulo Este capítulo apresenta conceitos e métodos para obter medidas de tendência central e medidas de variabilidade, bem como critérios para interpretar o significado dessas medidas. Objetivos Esperamos que, após o estudo do conteúdo deste capítulo, você seja capaz de: » Calcular e interpretar medidas de tendência central. » Calcular e interpretar medidas numéricas de variabilidade. » Calcular e interpretar medidas numéricas de posicionamento relativo. Medidas numéricas de tendência central Nesta seção, o objetivo é apresentar medidas numéricas descritivas da amostra a fim de fazer inferências sobre medições correspondentes da população. Existem muitos métodos numéricos para descreverconjuntos de dados quantitativos. A maior parte deles mede uma de duas características: » a tendência central do conjunto de medições, ou melhor, a tendência dos dados observados se agruparem em torno de valores centrais; » a variabilidade do conjunto de medições, ou seja, a dispersão dos dados. Média aritmética A média aritmética de um conjunto de dados quantitativos é a soma das medições dividida pelo número de medições contadas no conjunto de dados. A média aritmética é a mais importante medida de posição. Certamente você já calculou várias vezes a média 27 3 i1 n O símbolo 1 xi significa o somatório dos números xi, com i variando de 1 a n. Atenção CAPÍTULO 3 • MEDIDAS ESTATÍSTICAS aritmética, afinal, para ser aprovado numa disciplina você precisa obter média maior ou igual a cinco. Notação: x. Ou seja: n x X i1 i n Exemplo: digamos que o professor Sirlei tenha realizado cinco testes e você tenha tirado as seguintes notas: 10, 2, 9, 6 e 8, respectivamente. Neste caso temos n = 5 observações e a sua média igual a: X 10 2 9 6 8 7 5 Como calcular a média de dados agrupados Quando agrupamos os dados, calculamos a média ponderada onde cada valor x¬ tem peso igual a sua frequência fi¬, ou seja, 1 k f X f X f X X f X 1 1 2 2 k k i i i1 k i1 Exemplo: Para a distribuição de frequências da tabela 4, a média é calculada como segue: X 0 . 5 1 . 26 2 . 9 3 . 5 4 . 3 5 . 2 81 1, 6 50 50 Observe que a média pode não ser um dos valores encontrados na amostra, como também não temos 1,6 filhos. Este valor, que chamamos de média, representa o centro da distribuição do número de filhos por família, é como o centro de massa de um corpo na física, é o ponto de equilíbrio. Quando os dados estão agrupados em classes de frequências, calculamos a média ponderada usando Xi como sendo o ponto médio da classe. Exemplo: para a distribuição de frequências da tabela 5, a média é calculada como segue: X 17 . 3 19 . 15 21 . 10 23 . 8 25 . 7 27 . 4 29 . 3 1100 22 50 50 Sendo assim, conclui-se que os estudantes do curso de administração apresentam uma média de 22 anos de idade. 28 n n fi 2 Mediana (M d ) MEDIDAS ESTATÍSTICAS • CAPÍTULO 3 A mediana é o valor que ocupa a posição central de uma série de n observações ordenadas. A mediana divide um conjunto de dados no meio, deixando 50% dos dados abaixo dela e 50% dos dados acima. O cálculo da mediana depende do número n de observações. Mediana para dados agrupados Se os dados estão agrupados, o procedimento de cálculo da mediana não se altera. Logo, basta conferir que os valores já estão ordenados e a posição da mediana é encontrada pela frequência acumulada. Tabela 7. Número de filhos na família do candidato, Vestibular 2019. Número de filhos Frequência (Fi) Fi 0 5 5 1 26 31 2 9 40 3 5 45 4 3 48 5 2 50 Total 50 Fonte: Criação do autor. Neste caso, sendo n = 50 um número par, a mediana será a média entre os valores que ocupam as posições n o n 1 o e , isto é, o 25º e 26º elementos. Observe pela frequência acumulada que, 2 2 do 1º ao 5º elemento, todos são iguais a zero, do 6º ao 31º, todos são iguais a 1 e portanto, o 25º e 26º elementos são iguais a 1 e assim a mediana será dada por Md 11 1. Assim, a mediana é 1 filho por família. 29 2 Portanto a mediana é dada por Md = 6 8 7 notas, se as notas ordenadas são 2 2 , 5 , 6, 2 8, 9 , 10, então a mediana será a média entre o 3º e o 5º termos, cujos valores são 6 e 8, respectivamente. valores que ocupam as posições n e n 1 . Sendo assim, voltando ao caso das notas de estatística e considerando seis Se n é par, a mediana será a média dos termos centrais dos dados ordenados. Ou seja, a mediana será a média entre os 2 posição central é a 39 observação cujo valor é 8, logo, 8. . Vejamos: no caso das notas de estatística, os valores ordenados são 2, 6, 8, 9, 10. Neste caso, n = 5, a n 1 a posição Se n é ímpar, a mediana é o valor que ocupa a posição central dos dados ordenados. Ou seja, é aquele valor que ocupa Importante 2 Md li Pos Md Fi i xh , onde, fi li: é o limite inferior da classe mediana; Fi - 1 é a frequência acumulada da classe anterior à classe mediana; fi é a frequência simples da classe mediana; h é o intervalo de classe. 2 classe mediana, que é a classe que contém a mediana. E por fim calculamos a mediana como segue: Quando os dados estão distribuídos em classes de frequências, como na tabela 8, o procedimento muda totalmente. Primeiro calculamos a posição da mediana, Pos Md n . Em seguida, pela frequência acumulada, determinamos a Importante CAPÍTULO 3 • MEDIDAS ESTATÍSTICAS Tabela 8. Distribuição em Classes de Frequências para a variável idade. Número de filhos Xi fi Fi 16 18 17 3 3 18 20 19 15 18 20 22 21 10 28 22 24 23 8 36 24 26 25 7 43 26 28 27 4 47 28 30 29 3 50 Total 50 Fonte: Criação do autor. Como exemplo, vamos calcular a mediana para a variável idade com os dados da tabela 8. Neste caso, Pos Md 50 25 . Pela coluna de frequência acumulada, verificamos que o 25º elemento está na classe 20 a 22 anos, ou seja, a terceira classe é a classe mediana. Portanto a mediana é dada por: Pos Md Fi i 25 18 Md li xh 20 fi 10 x 2 21, 4 Portanto, para este conjunto de idades de estudantes do curso de administração, a idade mediana é 21,4 anos. Moda M o A moda é o valor que ocorre com maior frequência em um conjunto de dados. Por exemplo, considere que dez alunos realizaram um teste de estatística obtendo as seguintes notas: 5, 4, 4, 6, 3, 6, 3, 1, 7 e 2. Neste caso, a nota que aparece mais vezes é a nota 3, portanto, para esse conjunto de notas a moda é 4. Mo = 4 Observação: 30 MEDIDAS ESTATÍSTICAS • CAPÍTULO 3 • Existem conjuntos com duas modas, 5, 6, 6, 8, 9, 10, 10. Conjunto bimodal. Mo = 6 e Mo = 10 • Existem conjuntos sem moda, 1, 6, 11, 17, 21. Conjunto amodal. • Existem conjuntos com várias modas. Conjunto polimodal. Moda para dados agrupados A moda para dados agrupados como na tabela 7 é simplesmente o valor de maior frequência simples. Neste caso, a moda vale M o = 1, pois o valor 1 tem a maior frequência simples que é igual a 26. Quando os dados estão agrupados em classes de frequências, a moda pode ser calculada pelo seguinte método: primeiro determinamos a classe modal, aquela que apresenta a maior frequência simples; depois, empregamos a fórmula, li = limite inferior da classe modal; Mo li 1 xh , onde: 1 2 = é a diferença entre a frequência simples da classe modal e a frequência simples da classe imediatamente anterior à da classe modal; = é a diferença entre a frequência simples da classe modal e a frequência simples da classe imediatamente posterior à da classe modal; hi = amplitude da classe modal. Por exemplo, para calcular a moda para os dados da tabela 8, observamos inicialmente que a classe modal é a segunda classe, cujas idades vão de 18 a 20 anos. Neste caso, 1 f 2 f 1 15 3 12 2 f 2 f 3 15 10 5 e Portanto, a moda é calculada como segue: Mo li 1 xh 18 12 x 2 18 1, 4 19, 4 1 2 12 5 Medidas de dispersão ou de variabilidade Para descrição adequada de um fenômeno, não basta saber o valor em torno do qual os dados estão variando, é necessário saber o grau de variabilidade dos dados. Isto é conhecido por meio das medidas de dispersão. As medidas de variabilidade ou medidas de dispersão que vamos calcularsão: amplitude, variância, desvio padrão e coeficiente de variação. 31 S 2 n X 5 CAPÍTULO 3 • MEDIDAS ESTATÍSTICAS Amplitude Chama-se amplitude de um conjunto de dados quantitativos a diferença entre a maior e a menor medição. Vale lembrar que a amplitude é de fácil cálculo e compreensão, mas é uma medida não muito apropriada de variação de dados quando os conjuntos de dados são muito grandes. Isso porque dois conjuntos de dados podem ter a mesma amplitude, mas serem diferentes no que diz respeito à variação dos dados. Variância e desvio padrão A variância, assim como o desvio padrão, são medidas que complementam a informação das medidas de posição. Para calcular essas medidas de variabilidade, consideramos os desvios de cada observação em relação à média aritmética, ou seja, Xi – X. Em seguida calculamos a média dos quadrados dos desvios. Assim, para um conjunto de valores X 1 , X 2 , X 3 , ..., X n, a variância, denotada por S2, é calculada como segue: S 2 n i1 i X 2 n 1 Como a variância é uma medida quadrática, sua unidade de medida é o quadrado da unidade de medida dos dados. Portanto, devemos trabalhar com a raiz quadrada positiva da variância, que está na mesma unidade de medida dos dados. Esta medida é o desvio padrão, que é denotado por S, dado por: S Exemplo: voltamos ao exemplo do professor de estatística que realizou cinco testes nos quais você tirou as seguintes notas: 10, 2, 9, 6 e 8, respectivamente. Neste caso a sua média foi: 1 n 10 2 9 6 8 X X i 7 i1 Logo, a variância é calculada da seguinte forma: 32 n i1 X X i 2 n 1 S 2 10 S 2 S 2 1, 51 X X S 2 n i1 i X 2 MEDIDAS ESTATÍSTICAS • CAPÍTULO 3 10 7 2 2 7 2 9 7 2 6 7 2 8 7 2 n 1 5 1 32 5 2 22 1 2 12 9 25 4 11 40 10 4 4 4 E o desvio padrão é calculado assim: S 3, 2 Variância e desvio padrão para dados agrupados Quando os dados estão agrupados, cada valor Xi¬ tem sua frequência correspondente. Neste caso a variância e o desvio padrão são dados, respectivamente, por: S 2 n i1 i X 2 S n 1 Por exemplo, para os dados da tabela 9, vamos determinar a variância e o desvio padrão do número de filhos por família. Já vimos que para estes dados a média foi X = 1,7. Tabela 9. No de filhos na família do candidato, Vestibular 2019. Número de filhos Frequência (fi) Xifi Fi(Xi – X)2 0 5 0 5(0 - 1,7)2 = 14,45 1 26 26 26(1 - 1,7)2 = 12,74 2 9 18 9(0 - 1,7)2 = 0,81 3 5 15 5(3 - 1,7)2 = 8,45 4 3 12 3(4 - 1,7)2 = 15,87 5 2 10 2(5 - 1,7)2 = 21,78 Total 50 81 74,10 Fonte: Criação do autor. Usando as informações da última coluna da tabela 9 para calcular a variância e desvio padrão temos: S 2 n i1 fi Xi X 2 74,10 1, 51 S 1, 2 n 1 49 Quando os dados estão agrupados em classes de frequências, cada valor Xi¬ será o ponto médio da classe. Para os dados da tabela 10, já calculamos a média de idade X = 22 anos. 33 n i1 X X 2 i n 1 S 2 10, 98 CAPÍTULO 3 • MEDIDAS ESTATÍSTICAS Tabela 10. Distribuição em Classes de Frequências para a variável idade. Número de filhos Xi fi Xifi Fi(Xi – X)2 16 18 17 3 51 3(17 - 22)2 = 75 18 20 19 15 285 15(19 - 22)2 = 10 20 22 21 10 210 10(21 - 22) 2 = 10 22 24 23 8 184 8(23 - 22) 2 = 8 24 26 25 7 175 7(25 - 22) 2 = 63 26 28 27 4 108 4(27 - 22) 2 = 100 28 30 29 3 87 3(29 - 22) 2 = 147 Total 50 1100 538 Fonte: Criação do autor. Sendo assim, temos: S 2 n i1 fi Xi X 2 538 10, 98anos2 S 3, 31anos n 1 49 Coeficiente de variação O desvio padrão, quando analisado individualmente, tem limitações. Por exemplo, um desvio padrão S = 2, pode ser considerado pequeno, ou insignificante para uma série de valores cuja média é X = 200, mas se a média for X = 20, esse desvio padrão já é bastante significativo. Por isso, muitas vezes é conveniente usar uma medida de dispersão relativa para expressar a variabilidade de um conjunto de dados. Nesses casos, usamos o coeficiente de variação (CV) comparando o desvio padrão com a média, ou seja, calculamos CV S . X Como o desvio padrão e a média são expressos na mesma unidade de medida dos dados, o coeficiente de variação é uma medida de dispersão relativa adimensional e, portanto, o S resultado desta divisão deve ser multiplicado por 100 e expresso em porcentagem, isto é, CV X .100 . Exemplo: suponha que para os cinquenta estudantes do curso de administração, foram também determinadas as alturas de cada um. A média e o desvio padrão das alturas de homens e mulheres estão na tabela 11. Tabela 11. Resumo das alturas de 50 estudantes de administração. Variável Méida ( X ) Desvio Padrão (S) Altura – homens 183 cm 8 cm Altura – mulheres 166 cm 5 cm Fonte: Criação do autor. 34 Vimos até agora: » Como calcular medidas de tendência central como a média, a mediana e a moda. » Como calcular medidas de variabilidade como a amplitude, a variância e o desvio padrão. » Como determinar o coeficiente de variação de uma distribuição e a medida de assimetria dela. Sintetizando MEDIDAS ESTATÍSTICAS • CAPÍTULO 3 A grande utilidade do coeficiente de correlação é comparar diferentes conjuntos de dados. Vamos calcular o coeficiente de variação para a variável altura de homens e mulheres. Homens: CV S X .100 8 133 .100 0, 0437 .100 4, 37% Mulheres: CV S .100 8 .100 0, 0437 .100 4, 37% X 133 No exemplo acima, para esses conjuntos de dados de altura de estudantes, as mulheres apresentam menor dispersão relativa. Concluímos, portanto, que, embora as mulheres sejam mais baixas que os homens, as alturas das mulheres são mais homogêneas. 35 CAPÍTULO PROBABILIDADE Introdução do capítulo Este capítulo apresenta métodos e conceitos combinatórios, que consistem no estudo de situações em que a contagem se reduz, a saber, a quantas maneiras determinado grupo de objetos pode ser escolhido, sem e com repetições em relação à ordem em que são selecionados. Tais situações envolvem o desenvolvimento de competências como o planejamento de estratégias na resolução de problemas, a divisão de problemas em casos, a análise envolvendo números pequenos levando à generalização, e a crítica dos resultados obtidos. Essas técnicas, muitas vezes, serão aplicadas em outros tipos de situações-problema, cujo objetivo é investigar qual é a chance de um evento ocorrer, isto é, obter um número que indica a frequência relativa de ocorrência de um evento. Obter as chances de determinado evento ocorrer permite, racionalmente, tomar decisões prevendo eventos futuros. Objetivos Esperamos que, após o estudo do conteúdo deste capítulo, você seja capaz de: » Resolver problemas de contagem utilizando listagens, diagrama de árvores e/ou princípio multiplicativo. » Resolver problemas que envolvam o cálculo do número de elementos da união de conjuntos. » Identificar em situações-problema agrupamentos associados a conjuntos e sequências. » Reconhecer situações em que os agrupamentos são distinguíveis pela ordem de seus elementos, ou não, e resolver problemas que envolvam arranjos, combinações e/ou permutações simples, com elementos repetidos e circulares. » Reconhecer o caráter aleatório de variáveis em situações-problema e identificar o espaço amostral nessas situações-problema; » Resolver problemas que envolvam o cálculo de probabilidades de eventos equiprováveis.36 4 125 Respondendo à questão inicial, a quarta aposta seria de 1296 do dinheiro total. 6 6 1 isso daria do total do dinheiro, e assim por diante. 1 6 sua chance de tirar um seis ainda é de 6 , e o apostador deve apostar 1 do dinheiro que lhe sobrou da primeira aposta, 6 apostador apostaria 1 do dinheiro disponível para as apostas. Se ele falhar e tiver que jogar o dado uma segunda vez, O problema foi resolvido por Fermat da seguinte forma: a chance de se tirar um seis em um dado é de 1 portanto o A probabilidade teve sua origem por volta do século XVII, devido à curiosidade de um cavaleiro, o Chevalier de Méré, que era muito apaixonado por jogos e, um dia, discutiu com um matemático chamado Blaise Pascal (1654) sobre as possibilidades de ganhar em jogos com cartas, despertando no matemático um imenso interesse pelo assunto. Então, Pascal escreveu uma carta para um amigo, também matemático, chamado Pierre de Fermat expondo o problema do Chavalier de Méré. Para Fermat, o assunto era algo novo e desconhecido. Após a carta do amigo, ele começou a estudar formas de descrever matematicamente as leis do acaso com maior precisão. Os amigos continuaram se comunicando por meio de cartas, compartilhando cada nova descoberta. Fermat não tinha um real comprometimento em aprimorar probabilidade, ele respondia às cartas de Pascal, e resolvia os problemas que o amigo enviava, o que era apenas uma curiosidade relacionada com jogatinas e apostas. A prova disso pode ser vista em um problema proposto a ele por Pascal. O problema dizia o seguinte: “uma pessoa quer tirar seis no dado em oito jogadas, suponhamos que ela tenha feito três tentativas e falhado, quanto de dinheiro ela poderia apostar em seu sucesso, ou seja, tirar um seis, na quarta jogada?” Para refletir » Utilizar o princípio multiplicativo no cálculo de probabilidades. PROBABILIDADE • CAPÍTULO 4 » Resolver problemas que envolvam o cálculo da probabilidade de eventos. » Identificar eventos independentes e não independentes em situações-problema. » Resolver problemas que envolvam o conceito de probabilidade condicional e binomial. » Utilizar probabilidades para fazer previsões aplicadas em diferentes áreas do conhecimento. Probabilidades Todas as vezes que se estudam fenômenos de observação, cumpre-se distinguir o próprio fenômeno e o modelo matemático (determinístico ou probabilístico) que melhor o explique. Os fenômenos estudados pela estatística são aqueles cujo resultado, mesmo em condições normais de experimentação, varia de uma observação para outra, dificultando dessa maneira a previsão de um resultado. A observação de um fenômeno casual é recurso poderoso para se entender a sua variabilidade. Entretanto, com suposições adequadas e sem observar diretamente o fenômeno, podemos criar um modelo teórico que reproduza de forma bastante satisfatória a distribuição das frequüências quando o fenômeno é observado diretamente. Tais modelos são os chamados modelos de probabilidades. 37 Consideram-se os experimentos aleatórios como fenômenos produzidos pelo homem: » lançamento de uma moeda honesta; » lançamento de um dado; » lançamento de duas moedas; » retirada de uma carta de um baralho completo, de 52 cartas; » determinação da vida útil de um componente eletrônico. A análise desses experimentos revela que: » cada experimento poderá ser repetido indefinidamente sob as mesmas condições; » não se conhece em particular o valor do experimento a priori, porém, pode-se descrever todos os possíveis resultados – as possibilidades; » quando o experimento for repetido um grande número de vezes, surgirá uma regularidade. Importante CAPÍTULO 4 • PROBABILIDADE Os fenômenos determinísticos conduzem sempre a um mesmo resultado quando as condições iniciais são as mesmas. Ex: tempo de queda livre de um corpo. Mantidas as mesmas condições, as variações obtidas para o valor do tempo de queda livre de um corpo são extremamente pequenas (em alguns casos, desprezíveis). Os fenômenos aleatórios podem conduzir a diferentes resultados e mesmo quando as condições iniciais são as mesmas, existe a imprevisibilidade do resultado. Ex: lançamento de um dado. Para a explicação desses fenômenos (fenômenos aleatórios), adota-se um modelo matemático probabilístico. Para melhor entendimento desta unidade, é interessante relembrar alguns conceitos básicos no estudo das probabilidades tais como: Espaço amostral Um dos conceitos matemáticos fundamentais utilizados no estudo das probabilidades é o de conjunto. Um conjunto é uma coleção de objetos ou itens que possuem características comuns. É importante definir cuidadosamente o que constitui o conjunto em que estamos interessados, a fim de podermos decidir se determinado elemento é ou não membro do conjunto. Conjunto é uma coleção bem definida de objetos ou itens. A probabilidade só tem sentido no contexto de um espaço amostral, que é o conjunto de todos os resultados possíveis de um experimento. O termo “experimento” sugere a incerteza do resultado 38 O complemento de um evento é constituído de todos os resultados no espaço amostral que não façam parte do evento. Os eventos são mutuamente excludentes, quando não têm elemento em comum, ou se não podem ocorrer simultaneamente. Importante PROBABILIDADE • CAPÍTULO 4 antes de fazermos as observações. Os resultados de um experimento (ex: a ocorrência de um raio, uma viagem etc.) chamam-se eventos. Evento aleatório (E) É qualquer subconjunto de um espaço amostral. É também o resultado obtido de cada experimento aleatório, que não é previsível. Espaço Amostral (S) Espaço amostral de um experimento aleatório é o conjunto de todos os possíveis resultados desse experimento. Exemplos de espaços amostrais: S = { c, r } (é composto de dois eventos) S = { 1, 2, 3, 4, 5, 6 } (é composto de seis eventos) S = { (c, r), (c, c), (r, c), (r, r)} (é composto de oito eventos) Genericamente, se o número de pontos (elementos do espaço amostral) amostrais de um espaço amostral finito é n, então o número de eventos é dado por 2n. Exemplo: no lançamento de seis moedas, o número de pontos amostrais (resultados possíveis) é 26 = 64. Portanto, S = 64. Exemplo: na extração de uma só carta, os eventos “a carta é de copas” e a “carta é de ouros” são mutuamente excludentes, porque uma carta não pode ser ao mesmo tempo de copas e de ouros. Já os eventos “a carta é de copas” e “a carta é uma figura” não são mutuamente excludentes, porque algumas cartas de copas são também figuras. Muitas vezes, é útil representar graficamente um espaço amostral, porque isso torna mais fácil visualizar os elementos. Os eventos A e A’ são complementares: 39 CAPÍTULO 4 • PROBABILIDADE Figura 4. Elementos A e A’ são complementares. Fonte: Criação do autor. Os eventos A e B são mutuamente excludentes porque não se interceptam. Figura 5. Elementos A e A’ são excludentes. Fonte: Criação do autor. Os eventos A e B não são mutuamente excludentes, pois têm alguns elementos em comum. Figura 6. Elementos A e B são mutuamente excludentes. Fonte: Criação do autor. Operações com eventos aleatórios 40 PROBABILIDADE • CAPÍTULO 4 Consideremos um espaço amostral finito: s e1,e2 ,e3,en Sejam A e B dois eventos de S, as seguintes operações são definidas: I) Reunião – A 𝖴 B – O evento reunião é formado pelos pontos amostrais que pertencem a pelo menos um dos eventos. A B {e1 S|,e1 Aou e1 B} Figura 7. Reunião de dois eventos. Fonte: Criação do autor. É o evento que ocorre se A ocorre ou B ocorre, ou ambos ocorrem. II) Interseção – A ∩ B – O evento interseção é formado pelos pontos amostraisque pertencem simultaneamente aos eventos A e B. A B {e1 S|,e1 Aou e1 B} Figura 8. Interseção de dois eventos. Fonte: Criação do autor É o evento que ocorre se A e B ocorrem. Obs: Se A ∩ B = ∅, A e B são eventos mutuamente exclusivos. 41 CAPÍTULO 4 • PROBABILIDADE Definição de Laplace para probabilidade A probabilidade de um acontecimento associado a uma certa experiência aleatória é dada pelo quociente entre o número de casos favoráveis ao acontecimento e o número de casos possíveis. Podemos representar isso da seguinte forma : Seja A um acontecimento associado a certa experiência aleatória cujo espaço amostral é , tendo-se A . Seja p(A) a sua probabilidade, então: P A Número de casos favoráveis a A Número de casos possíveis Sendo assim, suponha que os experimentos aleatórios têm as seguintes características: » há um número finito n de eventos elementares (casos possíveis). A união de todos os eventos elementares é o espaço amostral; » os eventos elementares são igualmente prováveis; » todo evento A é uma união de m eventos elementares em m n Portanto, probabilidade de A: P A Número de casos favoráveis a A # A m que Número de casos possíveis # n De acordo com a definição acima temos como consequências imediatas: Para todo evento A, 0 P A 1 ; P(Ω) = 1; P(∅) = 0; Se A ∩ B = ∅ então P A∪ B P A P A P B. Exemplo 1: Uma urna contém dez bolas numeradas de 1 a 10. Retira-se, ao acaso, uma bola dessa urna. Qual a probabilidade de se obter uma bola cujo número inscrito é múltiplo de 3? Solução: Espaço amostral: = {1, 2, 3, 4, 5, 6, 7, 8, 9,1 0} Evento: A = {3, 6, 9} 42 Logo: P A P A # A 3 PROBABILIDADE • CAPÍTULO 4 Exemplo 2: # 10 Uma moeda é lançada três vezes, sucessivamente. Qual é a probabilidade de observarmos: a. Exatamente uma cara? b. No máximo duas caras? Solução: podemos construir uma árvore de possibilidades, em que as três colunas representem os possíveis resultados dos três lançamentos. Isto é: Figura 8. Árvore de possibilidades. O espaço amostral é dado por: Fonte: Criação do autor. = {(K,K,K), (K,K,C), (K,C,K), (K,C,C), (C,K,K), (C,K,C), (C,C,K), (C,C,C)} Logo, # = 8. a. O evento “exatamente uma cara” corresponde ao conjunto: A = {(K,C,C), (C,K,C), (C,C,K)} Daí: #A = 3 43 CAPÍTULO 4 • PROBABILIDADE Portanto: P A # A 3 37, 5% # 8 b. O evento “no máximo duas caras” corresponde ao conjunto: B = {(K,K,C), (K,C,K), (K,C,C), (C,K,K), (C,K,C), (C,C,K), (C,C,C)} Daí: #B = 7 Portanto: P B # B 7 87, 5% # 8 Espaços de probabilidade A partir de agora, será introduzida a noção geral de probabilidade. Seja espaço amostral. Uma função P definida para todos os subconjuntos de W (chamados eventos) é chamada uma probabilidade se: 1. 0 P A 1 , para todo evento A ; 2. P(∅) = 0, P() = 1; 3. Se A e B são eventos disjuntos, então P(A𝖴B) = P(A) + P(B). Considerando as consequências do espaço amostral, temos: P( A ) = 1 – P(A). Se A ⊂ B, então P(A) = P(B) – P(B – A). Se A ⊂ B, então P(A) ≤ P(B). P(A𝖴B) = P(A) + P(B) – P(A ∩ B). Exemplo 3: Retira-se uma carta de um baralho completo de 52 cartas. Qual a probabilidade de sair um rei? ou uma carta de espadas? Solução: 44 Considere: A: saída de um rei B: saída de uma carta de copas Então: PROBABILIDADE • CAPÍTULO 4 P A 4 eP B 13 52 52 Mas, temos ainda: A ∩ B: saída de um rei de copas, daí: P A B 1 52 Portanto: P A B P A P B P A B 4 13 1 16 0, 3769% 52 82 52 82 Probabilidade condicional A probabilidade de um evento A ocorrer, dado que um outro evento B ocorreu, é chamada probabilidade condicional do evento A dado B. Por exemplo, a probabilidade de que uma pessoa venha a contrair HIV dado que ele/ela é um usuário de drogas injetáveis é uma probabilidade condicional. Um outro exemplo é um estudo sobre panfletos de fármacia, em que se deseja calcular a probabilidade de que um panfleto de propaganda seja jogado no lixo dado que contém uma mensagem sobre o cuidado de depositar lixo no local apropriado, ou seja, na lixeira. Um terceiro exemplo, é uma frase que ocorrerá repetidamente neste material: ‘’Se a hipótese nula for verdadeira, a probabilidade de se obter um resultado como este é ...’’. Aqui a palavra se substitui à expressão ‘dado que’, mas o sentido é o mesmo. Com dois eventos, A e B, a probabilidade condicional de A dado B é denotada por P A B , por exemplo, P HIV ou Lixo . Usuário de drogas P Mensagem Exemplo: frequentemente assumimos, com alguma justificativa, que a paternidade leva a responsabilidade. Pessoas que passam anos atuando de maneira descuidadosa e irracional de alguma forma parecem se tornar pessoas diferentes uma vez que elas se tornam pais, mudando muitos dos seus antigos padrões habituais. Suponha que uma estação de 45 P P. . CAPÍTULO 4 • PROBABILIDADE rádio tenha amostrado 100 pessoas, 20 das quais tinham filhos. Eles observaram que 30 dessas pessoas usavam cinto de segurança, e que 15 daquelas pessoas tinham filhos. Os resultaddos são mostrados na tabela abaixo: Tabela 12: Distribuição de dados. Paternidade Usam cinto Não usam cinto Total Com filho 15 5 20 Sem filho 15 65 80 Total 30 70 100 Fonte: Criação do autor. A partir da informação na tabela podemos calcular probabilidades simples (ou marginais ou incondicionais), conjuntas e condicionais. » A probabilidade de uma pessoa amostrada aleatoriamente usar cinto de segurança é 30 100 0, 30 ou 30% . 15 0,15 ou15% » A probabilidade de uma pessoa ter filho e usar cinto de segurança é 100 . » A probabilidade de uma pessoa usar cinto de segurança dado que tem filho é 15 0, 75 ou 75% . 20 15 0, 50 ou 50% » A probabilidade de uma pessoa ter filho dado que usa cinto de segurança é 30 . Teorema da probabilidade total Sejam A1, A2, ..., An eventos que formam uma partição do espaço amostral. Seja B um evento desse espaço. Então: n B P B P Ai . P A Exercício resolvido i1 i Uma urna contém três bolas brancas e duas amarelas. Uma segunda urna contém quatro bolas brancas e duas amarelas. Escolhe-se, ao acaso, uma urna e dela retira-se, também ao acaso, uma bola. Qual a probabilidade de que seja branca? Probabilidade da urna escolhida ser a primeira (três bolas brancas e duas amarelas): P 1 2 Probabilidade de uma bola dessa urna ser branca: 3 1 3 3 5 2 5 10 46 6 2 6 i1 i i PROBABILIDADE • CAPÍTULO 4 Probabilidade da urna escolhida ser a segunda: P '' 1 2 Probabilidade de uma bola esoclhida da segunda urna ser branca: P P . 4 1 . 4 2 1 6 3 Logo, probabilidade total: P P 1 3 19 3 10 30 Teorema Bayes Sejam A1, A2, ..., An eventos que formam uma partição do espaço amostral W. Seja B ⊂ W. Sejam conhecidas e , i = 1, 2, ..., n. Então: P A∣B P Ai . P B∣Ai , j 1, 2, ..., n i n P A . P B∣A Exercício resolvido A urna A contém três bolas vermelhas e duas azuis, e a urna B contém duas bolas vermelhas e oito azuis. Joga-se uma moeda honesta. Se a moeda der cara, extrai-se uma bola da urna A; se der coroa, extrai-se uma bola da urna B. Uma bola vermelha é extraída. Qual a probabilidade de ter saído cara no lançamento? Figura 10. Probabilidade. Fonte: Criação do autor.47 O Teorema de Bayes é também conhecido como Teorema da Probabilidade a Posteriori. Ele relaciona uma das parcelas da probabilidade total com a própria probabilidade total. Atenção i1 1 1 CAPÍTULO 4 • PROBABILIDADE P A / X P X Ai i P X Pelo Teorema de Bayes temos: P A B P X Ai P X | Ai P Ai i P X P X | A P A P X | A P A P X | A P A 1 1 2 2 n n P X Ai n P X∣A P A Sendo assim: 3 x 1 3 3 P Ca / V 5 2 10 10 3 x 20 60 3 0, 75 ou 75% 3 x 1 2 x 1 3 2 6 2 10 8 80 4 5 2 10 2 10 20 20 Probabilidade binomial Considere um experimento com apenas dois resultados possíveis, chamados de sucesso e fracasso. Vejamos: » No lançamento de uma moeda não viciada, tome sucesso = cara e fracasso = coroa. » No lançamento de um dado não viciado, tome sucesso = o resultado é 4 ou 6 e fracasso = o resultado é 1, 2, 3 ou 5. Seja p a probabilidade de sucesso e q = 1 – p a probabilidade de fracasso. Vejamos o exemplo abaixo: Considere o experimento aleatório: jogue um dado e observe o número mostrado na face de cima. Nesse caso, o conjunto formado por todos os resultados possíveis do experimento é dado por: = {1, 2, 3, 4, 5, 6} (Espaço amostral). Qualquer subconjunto do espaço amostral caracteriza um evento, por exemplo, o subconjunto A = {2, 4, 6} é o evento que acontece se o número mostrado na face de cima é par. Assim, A = 3. Uma das perguntas que pode ser feita é: qual a chance (probabilidade) do evento A ocorrer? 48 k PROBABILIDADE • CAPÍTULO 4 Intuitivamente, se esse experimento for repetido em um grande número de vezes, obtém- se um número par em aproximadamente metade dos casos. Isto é: » os eventos elementares são todos igualmente prováveis; » o número de elementos de A é justamente a metade dos elementos de . Logo, pode-se afirmar que: Probabilidade de A A A 3 1 6 2 1 3 No exemplo acima, segue que os valores de p são, respectivamente, 2 e 6 A partir de cada experimento apresentado no exemplo 4.9, pode-se estar interessado em repeti- los um número fixo n de vezes. Supondo que a probabilidade p de sucesso se mantém constante ao longo das provas e que as provas sejam independentes, surge a seguinte questão: Qual é a probabilidade de obtermos k sucessos nessas n provas? Para resolver essa questão, utiliza-se o teorema binomial, isto é: Teorema binomial A probabilidade de ocorrerem exatamente k sucessos em uma sequência de n provas independentes, na qual a probabilidade de sucesso em cada prova é p, é igual a: n pk 1 p nk Exercício resolvido Joga-se uma moeda não viciada dez vezes. Qual a probabilidade de se obter exatamente cinco caras? Solução: Tome: sucesso = cara. Assim, p 1 2 em cada prova e as provas são independentes. Deve-se obter a probabilidade de k = 5 sucessos em n = 10 provas. Portanto, pelo teorema binomial, segue que: 10 1 5 1 105 252 63 5 2 1 2 1024 256 49 . CAPÍTULO 4 • PROBABILIDADE A Estatística e o recurso tecnológico Cálculo da média, variância e desvio padrão No capítulo 2, vimos como calcular a média, a variância e o desvio padrão de uma amostra. Agora,vejamos como isso pode ser feito com o auxílio do Excel. Considere o seguinte conjunto de dados da figura abaixo contidos em uma planilha do Excel: Figura 11. Salários da empresa XYZ. Fonte: Criação do autor Para obter a média salarial dos funcionários, escolha a última célula pertencente à coluna Salário mensal (R$) e, no menu principal, escolha o ícone fórmulas, isto é: 50 Vimos até agora: » Como resolver problemas de contagem utilizando listagens, diagrama de árvores e/ou o princípio multiplicativo. » Como reconhecer a diferença entre conjuntos e sequências e identificar em situações-problema agrupamentos associados a conjuntos e sequências. » Como reconhecer o caráter aleatório de variáveis em situações-problema e identificar o espaço amostral nessas situações-problema. » Como resolver problemas que envolvam o cálculo de probabilidades de eventos equiprováveis. » Como resolver problemas que envolvem o cálculo da probabilidade de eventos. » Como identificar eventos independentes e não independentes em situações-problema. » Como resolver problemas que envolvam o conceito de probabilidade condicional e binomial. » Como utilizar probabilidades para fazer previsões aplicadas em diferentes áreas do conhecimento. Sintetizando PROBABILIDADE • CAPÍTULO 4 Figura 11. Média dos salários da empresa XYZ. Fonte: Criação do autor. Agora basta escolher a função desejada, isto é, no caso da média, escolha MÉDIA. Assim, a média salarial aparecerá calculada na célula selecionada. Analogamente, obtêm-se outros tipos de médias, a mediana, a moda, a variância e o desvio padrão. 51 CAPÍTULO DISTRIBUIÇÃO DE PROBABILIDADE DE VARIÁVEIS ALEATÓRIAS DISCRETAS Introdução do capítulo Este capítulo apresenta o conceito de variável aleatória discreta e exemplos de distribuições e probabilidades que servem como modelos para o estudo de experimentos estatísticos. Objetivos Esperamos que, após o estudo do conteúdo deste capítulo, você seja capaz de: » Identificar variáveis aleatórias discretas. » Entender como ocorre a distribuição de probabilidades para variáveis aleatórias discretas. » Utilizar adequadamente o modelo de distribuição de probabilidade discreta binomial na resolução de problemas estatísticos. Preliminares A seguir, será apresentado o conceito de variável aleatória a fim de associá-lo aos resultados de um experimento aleatório. Esse conceito estará relacionado a um número real que, juntamente com a definição de função, permitirá calcular a probabilidade de ocorrência de vários eventos correspondentes a esse experimento de forma mais simples e fácil. Definição: uma variável aleatória é aquela que assume valores associados com resultados aleatórios de um experimento, em que um (e apenas um) valor numérico é marcado para cada ponto da amostra. As variáveis aleatórias são classificadas em variáveis aleatórias discretas e variáveis aleatórias contínuas (esta última a ser tratada na capítulo 6). Chama-se variável aleatória discreta toda variável aleatória que pode assumir um número de valores. 52 5 Distribuição de probabilidades para variáveis aleatórias discretas DISTRIBUIÇÃO DE PROBABILIDADE DE VARIÁVEIS ALEATÓRIAS DISCRETAS • CAPÍTULO 5 Exemplo de variáveis aleatórias discretas: o número de vendas feitas por um vendedor em uma semana de trabalho: x = 0, 1, 2, 3, ... » O número de consumidores de uma amostra de seiscentas pessoas que preferem o produto da marca A em relação ao produto da marca B: x = 0, 1, 2, 3, ..., 600. » O número de clientes esperando serem servidos em um restaurante em um horário específico: x = 1, 2, 3, ... Uma descrição completa de uma variável aleatória discreta requer as seguintes especificações: » os possíveis valores que ela pode assumir; » a probabilidade associada a cada valor. A distribuição de probabilidade de uma variável aleatória discreta é um gráfico, tabela ou fórmula que especifica a probabilidade associada em cada valor possível que a variável aleatória pode assumir. Vale lembrar que são necessários dois requisitos para uma distribuição de probabilidades de uma variável aleatória discreta X: P x 0 x P x 1 Média ou valor esperado de uma variável aleatória discreta A média de uma variável
Compartilhar