Baixe o app para aproveitar ainda mais
Prévia do material em texto
LÓGICA E ESTATÍSTICA Me. Claudio Ferreira de Carvalho GUIA DA DISCIPLINA 1 Lógica e Estatística Universidade Santa Cecília - Educação a Distância 1. EVOLUÇÃO DOS CONCEITOS DE LÓGICA Objetivo: Apresentar um breve resumo de como evoluíram ao longo dos tempos os conceitos de princípios que nortearam o desenvolvimento da lógica, assim como apresentar exemplos de aplicações da lógica no ambiente computacional. Introdução: Segundo Parmênides e Platão lógica estuda as condições em que podemos afirmar que um dado raciocínio é correto. Aristóteles (384-322 a. C.), sistematizou e definiu a lógica como a conhecemos, constituindo-a como uma ciência autônoma, portanto apesar dos grandes avanços, sobretudo a partir do século XIX, conforme será discutido neste item, a matriz aristotélica persiste até os nossos dias. 1.1. Lógica e métodoos dedutivos e indutivos A lógica aristotélica baseada em métodos dedutivos que utilizam o raciocínio lógico para chegar a conclusões mais particulares começou a ser questionada a partir do século XVI pelo pensamento de “a partir do particular atingir o universal”. Rompeu-se assim com os estudos seculares da lógica dedutiva e procurou-se fundamentar as regras do raciocínio indutivo quando, definimos uma lei geral a partir de observações de determinado fenômeno observado em diversos eventos. Em resumo, métodos dedutivos do geral para o particular, enquanto que, métodos indutivos do particular para o geral. Figura 1 Platão Figura 2 Aristóteles 2 Lógica e Estatística Universidade Santa Cecília - Educação a Distância 1.2. Lógica como um cálculo Em meados do século XIX, diversos investigadores de formação matemática, conceberam não apenas uma nova linguagem simbólica, mas também uma forma de transformar a lógica em uma álgebra. Com isso, operou-se uma verdadeira revolução, passando a lógica a ser vista como um cálculo tal como a álgebra, fazendo com que, os enunciados passarem a ser atemporais à semelhança das proposições matemáticas. 1.3. Lógica Booleana Ainda no século XIX, George Boole (1815-1864), apresentou os princípios da lógica matemática, e da álgebra booleana que posteriormente foi fundamental para o desenho dos circuitos de computadores eletrônicos utilizados até os dias atuais. Estas são também as bases da teoria dos conjuntos. Dentro destas conceituações foram grandes as contribuições para acabar com restrições impostas à lógica desde Aristóteles, afirmando que,podiam existir uma infinidade de raciocínios válidos e uma infinidade de raciocínios não válidos. Ainda no Século XIX, Ernest Schroder (1890-1895), nas suas "Lições sobre a álgebra lógica" deu a forma acabada à lógica Booleana. Com isso os estudos de lógica matemática deram passos gigantescos no sentido de formalizar conceitos e processos. 1.4. Cálculo Proposicional Com a evolução dos conceitos da Lógica Booleana, foram apresentados os sistemas lógicos de cálculo proposicional e o cálculo de predicados. Frege (1848-1925), foi o primeiro a apresentar o cálculo proposicional na sua forma moderna, introduzindo a função proposicional, o uso de quantificadores e a formação de regras de inferência primitivas. Frege procurou, em síntese, criar todo um sistema capaz de transformar em raciocínios dedutivos todas as demonstrações matemáticas. Figura 3 George Boole 3 Lógica e Estatística Universidade Santa Cecília - Educação a Distância 1.5. Aplicações da Lógica entre os séculos XVII e XIX Ainda sem todos os conceitos lógicos desenvolvidos por George Boole, máquinas começaram a ser concebidas dando início à evolução tecnológica que vivemos atualmente. Em 1642, (Século XVII) Blaise Pascal inventou a primeira máquina de somar. Leibniz, em 1694, (Final do Século XVII) inventou uma calculadora que além de somar, subtrair, podia multiplicar, dividir e extrair raízes quadradas. Charles Babbage, em meados do século XIX (1847 a 1849) concebeu a máquina analítica, cujas características antecipam os atuais computadores. Com uma máquina chamada de “Eletronic Tabulating” Herman Hollerith em 1890 (Século XIX) foi capaz de separar, contar e catalogar dados recolhidos no censo Norte Americano e os apresentou em tempo recorde, utilizando cartões perfurados que já eram conhecidos desde 1801, em teares mecânicos. Esta máquina de Hollerith, possuía cinco características comuns aos atuais computadores: Um mecanismo de entrada de dados (input), para fornecer à máquina a informação necessária para equacionar e resolver os problemas. Uma memória para armazenar as informações (Memória). Uma unidade matemática para efetuar cálculos (ULA – Unidade lógica Aritmética). Figura 4 - Blaise Pascal Figura 5 Máquina Analítica 4 Lógica e Estatística Universidade Santa Cecília - Educação a Distância Uma unidade de controle (UC) para indicar à máquina quando devia utilizar a informação armazenada. Uma unidade de saída de dados (output), para fornecer a resposta impressa. 1.5. Aplicações da Lógica a partir do século XX Já no século XX, os inventores de máquinas inteligentes tinham ao seu dispor como ferramenta fundamental uma lógica amplamente formalizada, as quais foram amplamente aplicadas e a partir de meados deste século começaram a ser também auxiliadas pelas evoluções tecnológicas de eletrônica. O primeiro computador totalmente automático IBM- Havard Mark 1 concretizado em 1944 ainda não era eletrônico e sim uma máquina eletromecânica e não utilizava sistemas binários. Ainda durante a segunda guerra para executar cálculos balísticos foi apresentado por Eckert e Mauchly o ENIAC (Electronic Numerical Integrator and Calculator – Computador e Integrador eletrônico numérico) como o primeiro computador totalmente eletrônico, mas não trabalhando na base binária como são nossos computadores atuais. O protótipo seguinte foi o EDVAC (Electronic Discrete Variable Automatic Computer – Computador Eletrônico de variável discreta) concebido por Von Neumann que tinha um amplo conhecimento de matemática aplicada, não tão difundida na época. Diferentemente do ENIAC o EDVAC trabalhava na base binária com ampla utilização de lógica Booleana. Figura 6 ENIAC Figura 7 EDVAC 5 Lógica e Estatística Universidade Santa Cecília - Educação a Distância 2. PROPOSIÇÕES E CONECTIVOS Objetivo: Apresentar os conceitos básicos de lógica com proposições, argumentos, valor lógico verdadeiro e falso, diferenciar proposições lógicas verdadeiras e falsas. Apresentar os conectivos utilizados na lógica matemática. Introdução: Para que seja possível entender os fundamentos da lógica é necessário entender os conceitos de proposições e suas interpretações, neste item serão apresentadas as definições acompanhadas de exemplos simples para melhorar esta conceituação. 2.1. Princípios fundamentais A lógica está fundamentada em diversos princípios. Neste item são apresentados os que serão utilizados neste curso. 2.1.1. Proposição É chamado de proposição, todo o conjunto de palavras ou símbolos que exprimem um pensamento de sentido completo. As proposições transmitem pensamentos, isto é, afirmam fatos ou exprimem juízos que são formados a respeito de determinados entes, eventos ou mesmo operações. 2.1.2. Valor lógico de uma proposição O valor lógico de uma proposição pode ser: A verdade se a proposição é verdadeira, cujo valor lógico é V (Verdadeiro) que também pode ser representado pelo valor numérico 1. A falsidade, se a proposição é falsa, cujo valor lógico é F (Falso) que também pode ser representado pelo valor numérico 0. 6 Lógica e Estatística Universidade Santa Cecília - Educação a Distância Não são proposições lógicasaquelas às quais não se pode associar a um valor lógico definido (Verdadeiro ou Falso). Tais como: "O dia está bonito" "x é um número real" "x + 2 = 7" 2.1.3. Lógica matemática A lógica matemática é bivalente, ou seja, baseada em dois princípios: Princípio do terceiro excluído: uma proposição só pode ser verdadeira ou falsa, não havendo outra alternativa. Princípio da não contradição: uma proposição não pode ser ao mesmo tempo verdadeira e falsa. 2.1.4. Proposição lógica simples É aquela que não contêm outra proposição como parte integrante de si mesma. Uma proposição lógica simples é representada pelas letras minúsculas p, q, r, s, t, u... que são chamadas de letras proposicionais. Exemplos de proposições lógicas simples: p: "A soma dos ângulos internos de um triângulo é igual a 180º". Proposição Verdadeira (V) q: 5 + 4 = 9 Proposição Verdadeira (V) r: 5 + 3 = 9 Proposição Falsa (F) s: “O sol é um planeta” Proposição Falsa (F) t: “Um quadrado possui 5 lados” Proposição Falsa (F) 2.1.5. Proposição lógica composta É aquela formada pela combinação de duas ou mais proposições. Uma proposição lógica composta é representada pelas letras maiúsculas P, Q, R, S, T, U... que são também chamadas de letras proposicionais. 7 Lógica e Estatística Universidade Santa Cecília - Educação a Distância 2.1.6. Conectivos As proposições compostas, formadas por proposições simples, são unidas através de conectivos que são símbolos utilizados para conectar proposições. Dentre os conectivos utilizados com mais frequência estão: e: indica a conexão das duas proposições uma e a outra, também chamada de conjunção ou: indica uma ou outra, também chamado de disjunção não: indica a negação de uma proposição se.... então: indica uma consequência que surgirá se a conexão for verdadeira se e somente se: indica uma consequência que surgirá somente se a conexão for verdadeira. Em expressões os conectores lógicos são representados por símbolos. A tabela a seguir apresenta alguns destes símbolos Obs: Neste curso não serão utilizados todos os conectivos apresentados na tabela acima. 8 Lógica e Estatística Universidade Santa Cecília - Educação a Distância Exemplos de proposições lógicas compostas com conectivos P: A cadeira é verde e a mesa é azul Q: A cadeira é verde ou a cadeira é azul R: Se a cadeira é verde então a mesa deve ser verde. S: O prêmio será pago se e somente se o apostador apresentar o bilhete. Obs: Cada uma das proposições simples pode ser Verdadeira ou Falsa. A interpretação de proposições com conectores será discutida na próxima aula. 9 Lógica e Estatística Universidade Santa Cecília - Educação a Distância 3. TABELA VERDADE Objetivo: Discutir valor lógico de proposições e a utilização de tabela verdade. Introdução: O valor lógico de qualquer proposição composta depende unicamente dos valores lógicos das proposições simples componentes e dos conectores utilizados, ficando por estes univocamente determinado. Admitido este princípio, para aplicá-lo na prática à determinação do valor lógico de uma proposição composta fornecida, recorre-se quase sempre a um dispositivo denominado “Tabela Verdade”, na qual figuram todos os valores lógicos possíveis da proposição composta correspondente a todas as possíveis atribuições de valores lógicos às proposições simples componentes. 3.1. Obtenção de uma tabela verdade Conforme apresentado no item anterior, para determinar a tabela verdade de uma proposição composta, deve-se observar os valores possíveis das proposições simples que formam a proposição composta. Para tanto, vamos supor duas proposições p e q que podem assumir os dois resultados (Verdadeiro / Falso), indicados em verde na figura. No esquema abaixo pode-se notar que para o valor de p Verdadleiro existem dois valores possíveis valores de q (Verdadeiro e Falso) e quando p for Falso existem também os mesmos dois valores possíveis (Verdadeiro e Falso) para q. A setas em vermelho apresentam a formação da tabela verdade. 10 Lógica e Estatística Universidade Santa Cecília - Educação a Distância Observe que os valores lógicos V e F se alternam de dois em dois para a primeira proposição p, (VV,FF) e de um em um para a segunda proposição q, (VF,FV), portanto, VV, VF, FV e FF, são os arranjos binários possíveis dos dois resultados V e F. 3.2. Operações lógicas sobre proposições As operações lógicas sobre proposições obedecem a regras de um cálculo, denominado cálculo proposicional, semelhante ao da aritmética sobre os números. 3.2.1. Negação (~) Chama-se negação de uma proposição a proposição representada por “não p” ou ~p. Se o valor de p for Verdadeiro (V), o valor de ~p é Falso (F). Se o valor de p for Falso (F), o valor de ~p é Verdadeiro (V). A tabela verdade da negação é fornecida ao lado Exemplos de negação: p: 2 + 4 = 6 → V ~p: 2 + 4 ≠ 6 → F q: Buenos Aires é a capital do Brasil → F ~q: Buenos Aires não é a capital do Brasil → V 3.2.2. Conjunção (e) ( ) Chama-se conjunção de duas proposições p e q à proposição representada por 𝒑 ∧ 𝒒, cujo valor lógico é verdadeiro (V), quando as proposições p e q são ambas verdadeiras e a Falso (F) nos demais casos. A tabela verdade resultante da conjunção de duas proposições é fornecida na figura: 11 Lógica e Estatística Universidade Santa Cecília - Educação a Distância Interpretações da tabela verdade 𝑠𝑒 𝑝 = 𝑉 𝑒 𝑞 = 𝑉 → 𝑉 ∧ 𝑉 = 𝑉 𝑠𝑒 𝑝 = 𝑉 𝑒 𝑞 = 𝐹 → 𝑉 ∧ 𝐹 = 𝐹 𝑠𝑒 𝑝 = 𝐹 𝑒 𝑞 = 𝑉 → 𝐹 ∧ 𝑉 = 𝐹 𝑠𝑒 𝑝 = 𝐹 𝑒 𝑞 = 𝐹 → 𝐹 ∧ 𝐹 = 𝐹 Exemplos de conjunção: p: A neve é branca → V q: 3 < 6 → V 𝒑 ∧ 𝒒 = 𝑽 ∧ 𝑽 → 𝑽 p: A grama é verde → V q: 3 > 6 → F 𝒑 ∧ 𝒒 = 𝑽 ∧ 𝑭 → 𝑭 p: o gelo é líquido → F q: 7 é número primo →V 𝒑 ∧ 𝒒 = 𝑭 ∧ 𝑽 → 𝑭 p: a água do mar é doce → F q: π é número inteiro → F 𝒑 ∧ 𝒒 = 𝑭 ∧ 𝑭 → 𝑭 Observação: Uma maneira fácil de memorizar a tabela verdade da conjunção é lembrar que a proposição resultante é obtida pela letra e então, resultará em verdadeiro somente se as duas proposições simples forem verdadeiras. 3.2.3. Disjunção (ou) ( ∨ ) Chama-se disjunção de duas proposições p e q à proposição representada por 𝑝 ∨ 𝑞, cujo valor lógico é verdadeiro (V) quando ao menos uma das proposições p ou q é Verdadeira e Falsa (F) quando as proposições p e q são ambas falsas. A tabela verdade resultante da disjunção de duas proposições é fornecida na figura: 12 Lógica e Estatística Universidade Santa Cecília - Educação a Distância Interpretação da tabela verdade 𝑠𝑒 𝑝 = 𝑉 𝑒 𝑞 = 𝑉 → 𝑉 ∨ 𝑉 = 𝑉 𝑠𝑒 𝑝 = 𝑉 𝑒 𝑞 = 𝐹 → 𝑉 ∨ 𝐹 = 𝑉 𝑠𝑒 𝑝 = 𝐹 𝑒 𝑞 = 𝑉 → 𝐹 ∨ 𝑉 = 𝑉 𝑠𝑒 𝑝 = 𝐹 𝑒 𝑞 = 𝐹 → 𝐹 ∨ 𝐹 = 𝐹 Exemplos de disjunção: p: A neve é branca → V q: 3 < 6 → V 𝒑 ∨ 𝒒 = 𝑽 ∨ 𝑽 → 𝑽 p: A grama é verde → V q: 3 > 6 → F 𝒑 ∨ 𝒒 = 𝑽 ∨ 𝑭 → 𝑽 p: o gelo é líquido → F q: 7 é número primo → V 𝒑 ∨ 𝒒 = 𝑭 ∨ 𝑽 → 𝑽 p: a água do mar é doce → F q: π é número inteiro → F 𝒑 ∨ 𝒒 = 𝑭 ∨ 𝑭 → 𝑭 Observação: Uma maneira fácil de memorizar a tabela verdade da disjunção é lembrar que a proposição resultante é obtida pela palavra ou, então resultará em verdadeiro se pelo menos uma das proposições simples for verdadeira. 3.3. Aplicações Como exemplo de aplicação dos conceitos de lógica apresentada nos itens anteriores, assim como das tabelas verdade, a seguir são mostrados circuitos eletrônicos chamados de portas lógicas que funcionam de acordo com os conceitos anteriormentediscutidos. Estes circuitos são largamente utilizados em diversos projetos de automação. Para a utilização em circuitos eletrônicos, com o objetivo de implementar as funções lógicas booleanas, os valores de Verdadeiro (V) e Falso (F), são representados por 1 (para 13 Lógica e Estatística Universidade Santa Cecília - Educação a Distância Verdadeiro) e 0 (para Falso), que muitas vezes é também chamado no linguajar eletrônico de ligado (1 ou V) ou desligado (0 ou F), ou mesmo, “com sinal” (1) ou “sem sinal” (0). 3.3.1. Porta lógica NOT É possível emular, através de componentes eletrônicos simples, uma porta lógica chamada NOT que recebe um sinal na entrada (normalmente chamado de A) e fornece na saída o valor contrário (normalmente chamado de S). A figura apresenta a representação gráfica de uma porta NOT A figura a seguir apresenta a porta lógica NOT e sua tabela verdade. Observe na figura se à entrada A for aplicado o valor 1 (Verdadeiro), ou seja, for aplicado um sinal elétrico, na saída S aparecerá o valor 0 (falso), ou seja, não aparecerá sinal elétrico. Exemplo: Suponha que esta porta seja utilizada para criar um dispositivo de iluminação noturna que permite que a “luz noturna” acenda (V = 1) quando a “luz solar” deixar de existir (F = 0), então, basta observar que, se a “luz solar”, aplicada na entrada, for Verdadeira (1), a saída será Falsa (0), então a “luz noturna” não acenderá. Por outro lado, quando a “luz do sol” for Falsa (0) na saída aparecerá o sinal Verdadeiro (1), então a “luz noturna” irá acender. Veja que esta porta lógica funciona exatamente com o conceito de negação. 14 Lógica e Estatística Universidade Santa Cecília - Educação a Distância As figuras a seguir representam graficamente as explicações fornecidas neste exemplo: 3.3.2. Porta lógica AND Assim como no item anterior, é também possível emular, através de componentes eletrônicos simples, uma porta lógica chamada AND que pode receber dois sinais de entrada chamados de A e B que podem ser Verdadeiros (1) ou Falsos (0) e fornecer na saída um valor Verdadeiro (1) ou Falso (0) obedecendo uma lógica como a implementada em uma Conjunção (e). A figura apresenta a representação de uma porta AND. A figura a seguir apresenta a porta lógica AND com as 4 alternativas possíveis e sua tabela verdade. Exemplo: Com uma porta AND seria possível acrescentar ao controle da “luz noturna” discutido no item anterior, uma chave que permitiria que a “luz noturna” fosse acesa ao entardecer 15 Lógica e Estatística Universidade Santa Cecília - Educação a Distância (quando a “luz do sol” ficasse fraca), mas, em determinado momento, quando por exemplo, o morador da casa fosse dormir fosse possível apagar a “luz noturna”. Então, a “luz noturna” seria controlada por uma porta lógica AND com as duas entradas A e B. Se estas entradas fossem Verdadeiras a “luz noturna” acenderia, mas quando uma das entradas ou as duas fossem Falsas, a “luz noturna” seria apagada. Para tanto, vamos inverter (por exemplo com uma porta NOT) o sinal de entrada da “luz solar” que será aplicada em A, assim, quando deixar de existir “luz solar”, na entrada A da porta lógica AND aparecerá o valor 1 (Verdadeiro). Vamos ligar à entrada B da porta lógica AND, uma chave que poderá estar ligada (1) ou desligada (0). Assim, para que a “luz noturna” seja acesa é necessário que as duas portas, A e B tenham valor Verdadeiro (1). Nos demais casos, quando uma das duas ou as duas forem falsas (0), a “luz noturna” ficará apagada. As figuras a seguir representam graficamente o as explicações fornecidas neste exemplo: 3.3.3. Porta lógica OR Como apresentado nos itens anteriores é também possível emular, através de componentes eletrônicos simples, uma porta lógica chamada OR que pode receber dois sinais de entrada chamados de A e B que podem ser Verdadeiros (1) ou falsos (0) e fornecer na saída um valor Verdadeiro (1) ou Falso (0), dependendo da lógica 16 Lógica e Estatística Universidade Santa Cecília - Educação a Distância implementada em uma Disjunção (ou). A figura apresenta a representação de uma porta OR. A figura a seguir apresenta a porta lógica OR com as 4 alternativas possíveis e sua tabela verdade. Exemplo: Utilizando o mesmo exemplo da “luz noturna”, vamos supor que agora, se deseja que a luz noturna seja acessa tanto pela falta de “luz solar” como através de uma chave. Então, às duas entradas A e B serão ligadas respectivamente a “luz solar” (invertida com uma porta NOT, conforme item anterior) e a uma chave. Então, a “luz noturna” será controlada por uma porta OR, conforme a seguir. Quando a “luz solar” passar a ser Falsa (0) ela será invertida (pela porta NOT) de maneira que à entrada A da porta OR será colocado o valor Verdadeiro (1). Independentemente do valor atribuído à entrada B, a saída da porta lógica OR fornecerá o valor Verdadeiro (1). Caso o usuário desejasse acender a “luz noturna” mesmo antes do escurecer, bastaria a ele acionar a chave que está ligada à entrada B fornecendo a esta entrada o valor Verdadeiro (1). Caso a “luz do sol” fique forte, cmo ela está invertida pela porta NOT à entrada A da porta OR será aplicado o valor Falso (0) e se neste mesmo momento à porta B onde está ligada a chave for aplicado o valor Falso (0), a “luz noturna” ficará apagada pois a saída da porta OR estará com Falso (0). 17 Lógica e Estatística Universidade Santa Cecília - Educação a Distância 18 Lógica e Estatística Universidade Santa Cecília - Educação a Distância 4. NOÇÕES DE ESTATÍSTICA – COLETA DE DADOS – VARIÁVEIS Objetivo: Apresentar os conceitos de Estatística Descritiva e Estatística Indutiva assim como as definições básicas necessárias para o desenvolvimento desta e das próximas aulas. Introdução: Sem dúvida, existem diversas definições para Estatística. Uma das que melhor se enquadra aos objetivos de nosso curso é a seguinte: Estatística é uma metodologia de análise de números dando a eles significados. Com a estatística, é possível dar sentido a conjuntos de dados, pois, muitas vezes diversos valores são observados, mas não se consegue estabelecer uma relação entre eles ou até, sem uma análise mais detalhada, pode-se vir a interpretar estes números erroneamente. Nos dias de hoje, existem diversos algoritmos computacionais que acabam sendo utilizados indiscriminadamente em técnicas de Ciências de Dados, sendo que, muitos acabam confiando cegamente nos resultados apresentados por estes algoritmos, sem, muitas vezes, uma perfeita compreensão do funcionamento e, o que pode ser mais grave, sem que os critérios para a obtenção dos dados tenham sido corretamente analisados e implementados. 4.1. Estatística Descritiva x Estatística Indutiva Dependendo dos elementos aos quais são aplicados os estudos, sendo eles amostras ou população, conceitos estes que serão apresentados a seguir, a estatística, pode ser classificada como: Estatística descritiva é empregada para caracterizar a amostra evidenciando suas principais características e propriedades. Estatística indutiva, também chamada de inferencial, são métodos e técnicas utilizados para estudar uma população baseando-se em amostras destas populações. 19 Lógica e Estatística Universidade Santa Cecília - Educação a Distância Em resumo, podemos dizer que a estatística descritiva descreve dados e a indutiva toma decisões sobre a população, a partir de estudos em amostras. 4.2. Dados São informações obtidas a partir de medições de grandezas, resultados de pesquisas, respostas a questionários, contagens em geral e outros métodos. 4.3. População estatística Sãotodos os elementos que possuem as características que desejamos estudar. 4.4. Amostra É um subconjunto finito de uma população estatística, em outras palavras, uma parte da população, escolhida através de uma técnica de amostragem. 4.5. Amostra significativa Uma amostra significativa, deve representar em escala reduzida, todas as características qualitativas e quantitativas do universo que se pretende reproduzir. 4.6. Amostragem Técnica utilizada para recolher amostras que garante, tanto quanto possível, o acaso na escolha. Para que uma amostragem seja correta, cada elemento da população deve ter a chance de ser escolhido, e com isto, a amostra assume o caráter de representatividade, de maneira que as conclusões sobre a amostra possam realmente representar a população. População estatística são todos os elementos que possuem a característica em estudo, enquanto, uma amostra é uma parte destes elementos da população, mas para que a amostra seja significativa, todos os elementos precisam ter as mesmas chances de serem sorteados, para isto, existem as técnicas de amostragem que garantem a representatividade da amostra. 20 Lógica e Estatística Universidade Santa Cecília - Educação a Distância 4.7. Técnicas de amostragem É sempre importante observar que durante uma amostragem deve-se tomar cuidados para evitar viés. Um viés pode ser ideológico como muitas vezes observamos por institutos de pesquisa tendenciosos, mas, pode ser também causado por descuidos ou falta de critérios no momento da amostragem (escolha da amostra). Uma amostragem pode ser basicamente: Aleatória, também chamada de probabilística e Não Aleatória (também chamada de não probabilística). Dentro destas duas categorias existem diversas subcategorias. Um estudo estatístico mais detalhado ficaria a cargo de profissionais da área, entretanto, para este estudo serão feitas, a seguir, algumas considerações importantes: 4.7.1. Amostragem Aleatória Neste tipo de amostragem, todos os elementos têm a mesma probabilidade de serem escolhidos. Exemplos típicos são sorteios entre os candidatos, tal como um bingo onde cada participante possui um número ou um conjunto de números 4.7.2. Amostragem não aleatória Neste tipo de amostragem a escolha dos participantes é feita de forma seletiva. Esta escolha pode ser feita devido a particularidades do grupo em estudo, atendendo aos interesses do investigador. Este tipo de amostragem pode ser útil em alguns casos. Existem diversas maneiras de utilizar amostragens não aleatórias, dentre elas: Amostragem não aleatória voluntária. Este tipo de amostragem é aquele em que se disponibiliza uma pesquisa (por exemplo com um link em Internet) e se solicita que os interessados acessem a pesquisa e a respondam. Neste caso corremos o risco de resultados com viés, visto que, pode acontecer de interessados em determinados tópicos da pesquisa se mobilizem e consigam muito mais participantes que outros. Este é o caso de muitas pesquisas em redes sociais onde um grupo disponibiliza o link para seus seguidores ou mesmo é facilitado o acesso a estes seguidores e com isto se tem uma amostra de pessoas que tem afinidade com as ideias de seus mentores. Pesquisas que aparecem constantemente no Facebook solicitando a concordância ou não com uma determinada lei ou com a opinião de algum político, são exemplos de pesquisa voluntária. 21 Lógica e Estatística Universidade Santa Cecília - Educação a Distância Amostragem não aleatória por conveniência. Este tipo de amostragem é aquele que o pesquisador disponibiliza a pesquisa somente para aqueles que ele deseja. Exemplos típicos são as pesquisas de satisfação criadas por lojas, atendimentos telefônicos etc. Nestas pesquisas somente os clientes ou alguns dos clientes são escolhidos. 4.8. Coleta de dados São maneiras escolhidas para adquirir informações, que pode ser feita através de registros como: nascimentos; casamentos; etc., ou através de questionários coletados pelo pesquisador. 4.9. Crítica de dados São considerações sobre os dados que devem ser feitas para evitar erros grosseiros. 4.10. Variáveis São conjuntos de resultados de uma possível ocorrência. Como exemplo podemos citar a cor de um objeto, que possui diversos resultados possíveis. 4.10.1. Variáveis qualitativas São informações não numéricas, normalmente atributos classificados em categorias: Exemplos: Tipos sanguíneos (A, B, AB ou O) Cor dos olhos (azuis, verdes, castanhos etc.) Variáveis qualitativas nominais Quando os valores são classificados em categorias ou classes, não ordenadas. Exemplo: Caso em uma pesquisa se deseje saber o tipo sanguíneo, ela será uma variável nominal, pois não pode ser ordenada, as respostas poderiam ser: A, B, AB ou O, e não existe uma ordem para afirmar que sangue tipo A é maior ou menor que B e assim sucessivamente. 22 Lógica e Estatística Universidade Santa Cecília - Educação a Distância Variáveis qualitativas ordinais Quando os valores são ou podem ser ordenados. Exemplo: Caso em uma pesquisa, se deseje saber a escolaridade dos participantes, as respostas poderiam ser: sem escolaridade, com ensino fundamental, com ensino médio, com ensino superior ou pós-graduado. É importante observar, que neste caso uma pessoa com ensino médio tem mais escolaridade que uma com ensino fundamental, uma pessoa com ensino superior tem mais escolaridade que uma com ensino médio e assim sucessivamente. 4.10.2. Variáveis quantitativas São informações que assumem valores numéricos, obtidos a partir de medições ou constatações. Variáveis quantitativas contínuas Podem assumir valores entre dois limites, normalmente são números fracionários, mas podem até ser números inteiros. Exemplos: Pesos, estaturas, renda, distância, comprimento etc. Variáveis quantitativas discretas Só podem assumir valores pertencentes a um conjunto específico de valores, não são números facionários. Exemplos: Alunos em uma sala, filhos de uma família, bolsas em um estoque etc. 23 Lógica e Estatística Universidade Santa Cecília - Educação a Distância 5. DISTRIBUIÇÃO DE FREQUÊNCIA Objetivo: Apresentar elementos básicos para cálculos estatísticos a partir de elementos obtidos com as técnicas discutidas nas aulas anteriores. Introdução: Esta aula apresenta inicialmente, classes, intervalo de classes, que são os primeiros elementos necessários para criar tabelas de distribuição de frequência, em seguida discute a montagem de tabelas de distribuição de frequência para variáveis contínuas com seus principais itens apresentando também a construção de Histograma. Em uma segunda parte, esta aula discute o tratamento de frequência em variáveis discretas 5.1. Organização de dados Quando dados são obtidos através das amostragens discutidas anteriormente, eles não veem organizados, estão misturados, não apresentam uma ordem ou sequência, motivo pelo qual, fica muito difícil a visualização assim como obter conclusões. Estes dados que são classificados como dados brutos, se forem fornecidos em tabelas estas são chamadas de tabelas primitivas. 5.1.1. Rol Normalmente para que dados possam ser analisados eles precisam ser ordenados, esta ordenação, colocando os dados em ordem (crescente, decrescente ou outra classificação), irá gerar uma tabela que recebe o nome de Rol. 5.2. Distribuição de Frequência Em variáveis contínuas, quando a diversificação dos valores é grande, e os valores são fornecidos entre dois limites, a análise é feita através de distribuição de frequência que utiliza os conceitos definidos a seguir neste item. Estes valores normalmente são fracionários, mas podem também ser inteiros 24 Lógica e Estatística Universidade Santa Cecília - Educação aDistância 5.2.1. Classe Dados organizados em um Rol podem ser analisados através de uma técnica chamada de “Distribuição de Frequência”, que consiste em organizar dados de maneira que eles possam ser agrupados em intervalos chamados de Classes. 5.5.2. Número de Classes Para determinar o número de classes em uma distribuição utiliza-se a equação: 𝑖 = √𝑛 2 Onde: 𝑖 é o número de classes em um Rol 𝑛 é a quantidade de dados da amostra 5.5.3. Amplitude do intervalo de classe É obtido pela equação: ℎ = 𝐿𝑚á𝑥 − 𝐿𝑚𝑖𝑛 𝑖 Onde: ℎ é a amplitude do intervalo de classe 𝐿𝑚á𝑥é o maior valor do Rol 𝐿𝑚𝑖𝑛 é o menor valor do Rol 𝑖 é o número de classes 5.5.4. Frequência de classe É o número de ocorrências de cada valor em um intervalo de classe. É representada por Fi 5.5.5. Ponto médio da classe É a média entre o valor máximo e o valor mínimo de um intervalo de classe 𝑥𝑖 = 𝐿𝑖 + 𝐿𝑠 2 Onde: 𝑥𝑖 é o ponto médio da classe 𝐿𝑖 é o limite inferior da classe 25 Lógica e Estatística Universidade Santa Cecília - Educação a Distância 𝐿𝑠 é o limite superior da classe 5.5.6. Frequência acumulada É a frequência total acumulada até determinada classe, na verdade a soma das frequências de todas as classes anteriores até a classe atual. É representada por Fa 5.5.7. Frequência relativa É o quociente entre a frequência absoluta da classe em estudo e a soma das frequências absolutas (frequência de todas as classes): 𝐹𝑟 = 𝐹𝑖 ∑ 𝐹𝑖 Onde: 𝐹𝑟 é a frequência acumulada 𝐹𝑖 é a frequência da classe em estudo ∑ 𝐹𝑖 é a somatória de todas as frequências 5.5.8. Frequência relativa acumulada É a soma da frequência relativa da classe em estudo com as frequências acumuladas das classes anteriores. Esta frequência pode também ser representada em percentagem, bastando para isto multiplicar o valor por 100. 5.3. Histograma Histograma, é um gráfico que tem o mesmo formato e modo de construção que um gráfico de colunas, a única diferença é que as colunas ficam justapostas. Histogramas são utilizados para representar diversos tipos de dados, inclusive dados estatísticos. Existem diversos tipos de histograma, tais como “histogramas de frequências”, “histogramas de frequências acumuladas” dentre outros. Nestes tipos de gráficos os valores do eixo vertical (eixo y) são as frequências, frequências acumuladas, frequências relativas etc. enquanto que no eixo horizontal (eixo 26 Lógica e Estatística Universidade Santa Cecília - Educação a Distância x), são os pontos médios das classes quando se utilizam variáveis quantitativas contínuas (possuem intervalo de classe) ou os valores das classes quando se utiliza variáveis quantitativas discretas (sem intervalo de classe). O gráfico a seguir representa um histograma de frequências de alturas de pessoas. 5.3. Exemplo com variáveis quantitativas contínuas Em um treino de maratona, o treinador registrou a velocidade média de 40 corredores e obteve os valores da tabela abaixo. Pede-se determinar a tabela de distribuição de frequências e elaborar o Histograma de frequência. Solução: A tabela fornecida é uma tabela primitiva, então, o primeiro passo será construir a Rol. 27 Lógica e Estatística Universidade Santa Cecília - Educação a Distância 10 12 14 17 19 20 24 26 29 32 10 13 15 18 19 21 24 26 30 32 10 14 15 18 20 21 25 27 31 32 12 14 15 18 20 23 25 28 31 33 Para a construção da tabela de distribuição de frequências deve ser calculado primeiramente o número de classes e o intervalo de classes Número de classes: Intervalo de classe: Cálculo de todos os pontos mínimos e máximos das classes. Classe Limite mínimo Limite máximo 1 Primeiro valor = 10 10 + 4 = 14 2 Valor máximo da classe anterior = 14 14 + 4 = 18 3 Valor máximo da classe anterior = 18 18 + 4 = 22 4 Valor máximo da classe anterior = 22 22 + 4 = 26 5 Valor máximo da classe anterior = 26 26 + 4 = 30 6 Valor máximo da classe anterior = 30 30 + 4 = 34 28 Lógica e Estatística Universidade Santa Cecília - Educação a Distância Distribuição de Frequências Utilizando a Rol, contar a quantidade de valores dentro de cada um dos intervalos. Lembrar que, em cada intervalo de classe, as ocorrências com o valor máximo não são contadas, pois ele é considerado como valor mínimo da classe seguinte. Preencher a coluna de Frequência, da classe que é nomeada de Fi. Colocar também a soma de Fi que que será útil futuramente. Cálculo do ponto médio de todas as classes: Primeira classe: Demais classes: Classe Ponto médio (xi) 2 = (14 +18)/2 = 16 3 = (18 + 22)/2 = 20 4 = (22 + 26)/2 = 24 5 = (26 + 30)/2 = 28 6 = (30 + 34)/2 = 32 29 Lógica e Estatística Universidade Santa Cecília - Educação a Distância Cálculo da frequência acumulada: Primeira classe: Segunda classe: Demais classes: Classe Frequência acumulada (Fa) 3 = 10 + 13 = 23 4 = 5 + 23 = 28 5 = 5 + 28 = 33 6 = 7 + 33 = 40 30 Lógica e Estatística Universidade Santa Cecília - Educação a Distância Cálculo da frequência relativa: Primeira classe: Demais classes: Classe Frequência relativa (Fr) 2 = 7/40 = 0,175 3 = 10/40 = 0,250 4 = 5/40 = 0,125 5 = 5/40 = 0,125 6 = 7/40 = 0,175 Cálculo da frequência relativa acumulada: Primeira classe: Segunda classe: 31 Lógica e Estatística Universidade Santa Cecília - Educação a Distância Demais classes: Classe Frequência relativa acumulada (Fra) 3 = 0,250 + 0,325 = 0,575 4 = 0,125 + 0,575 = 0,700 5 = 0,125 + 0,700 = 0,825 6 = 0,175 + 0,825 = 1,000 Cálculo da frequência relativa acumulada percentual: Primeira classe: Demais classes: Classe Frequência relativa acumulada percentual (Fra%) 2 = 100.0,175 = 17,5 3 = 100.0,250 = 25,0 4 = 100.0,125 = 12,5 5 = 100.0,125 = 12,5 6 = 100.0,175 = 17,5 32 Lógica e Estatística Universidade Santa Cecília - Educação a Distância Histograma de frequência: 5.4. Exemplo com variáveis quantitativas discretas Ao final do período letivo em uma escola foram levantados os dados a seguir sobre a performance dos alunos. Pede-se determinar a tabela de distribuição de frequências e elaborar o Histograma de frequência. 33 Lógica e Estatística Universidade Santa Cecília - Educação a Distância Solução Como a variável é discreta: Não existe também, a necessidade de ordenar os dados para criar a Rol. O número de classes é a própria quantidade de classes, no caso 5. Não existe intervalo de classe, sendo o valor médio da classe o próprio valor de cada uma das classes Com as considerações acima a tabela de distribuição de frequência ficará conforme a seguir: Histograma de frequência 34 Lógica e Estatística Universidade Santa Cecília - Educação a Distância 6. MÉDIA ARITMÉTICA, MODA E MEDIANA Objetivo Nesta aula serão apresentados os conceitos de média, moda e mediana. Introdução: Além dos cálculos apresentados no item anterior, é importante também obter valores como média, moda e mediana que apresentam dados sobre a amostragem que podem ser utilizados com diversos objetivos. 6.1. Média Aritmética de dados não agrupados Quando os dados não são agrupados, a média é o quociente da divisão entre a soma dos valores das variáreis de uma distribuição, pelo número de variáveisque compõe esta distribuição. A média aritmética é considerada uma medida de tendência central, visto que, focaliza valores centrais entre conjuntos de valores. A média aritmética é obtida pela equação: Onde: A média aritmética é a medida de posição que possui maior estabilidade, deve ser utilizada quando houver necessidade de um tratamento algébrico ulterior Exemplo Sabemos que as idades de 7 crianças que no momento estão em um parque são: 10, 14, 13, 15, 16, 18 e 12 anos. Qual a idade média destas crianças? �̅� = ∑ 𝑥𝑖 𝑛 �̅� = ∑ 𝑥 𝑖 𝑛 �̅� = 10+14+13+15+16+18+12 7 35 Lógica e Estatística Universidade Santa Cecília - Educação a Distância 6.2. Média aritmética de dados agrupados Quando os dados são agrupados, as frequências de classe são indicadores de intensidade, ou seja, elas indicam a quantidade de vezes que cada um dos valores da distribuição acontece, portanto, elas funcionam como fatores de ponderação, então, a média aritmética é obtida pela equação: Onde: Se os dados estiverem agrupados em intervalos de classe, para somatória dos valores, utiliza-se a somatória dos pontos médios das classes. Exemplo de dados agrupados sem intervalo de classe Um professor construiu a tabela abaixo com a distribuição de frequência dos meninos em grupos de alunos para um trabalho. Qual a média de meninos por grupo? �̅� = 98 7 �̅� = 14 Observando a tabela temos: A resposta é 2 meninos por grupo 36 Lógica e Estatística Universidade Santa Cecília - Educação a Distância Exemplo de dados agrupados com intervalo de classe Um treinador mediu a altura de seus jogadores e montou a tabela abaixo. Qual a estatura média dos jogadores? Para obter xi foi considerado o ponto médio de cada intervalo de classe dos valores das alturas dos alunos. 6.3. Moda de dados não agrupados Moda é o valor que ocorre com maior frequência em uma série de valores. Se tomarmos como exemplo notas de uma prova ou de uma disciplina, a moda será a nota obtida pela maioria dos alunos. Podem existir grupos de valores nos quais nenhum valor aparece mais de uma vez, então, podemos afirmar que esta série de valores é amodal, assim como, podem existir grupos com mais de um valor sendo repetido o mesmo número de vezes, estas distribuições são chamadas de bimodais (duas modas), trimodais (3 modas) e assim por diante. Exemplo Em um jogo de basquete, anotou o número de cestas que cada jogador acertou em três turmas. Quais as modas de acertos dos alunos em cada uma das turmas. Turma A: 7, 8, 9, 10, 10, 10, 11, 12, 12, 15. Turma B: 3, 5, 8, 10, 12, 13, 15. Turma C: 2, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9. Respostas: Turma A: 7, 8, 9, 10, 10, 10, 11, 12, 12, 15 => Moda da Turma A: 10. Observando a tabela temos: 37 Lógica e Estatística Universidade Santa Cecília - Educação a Distância Turma B: 3, 5, 8, 10, 12, 13, 15. => Turma B não tem moda é amodal. Turma C: 2, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9. => Turma C é Bimodal: 4 e 7. 6.4. Moda de dados agrupados Quando os dados estão agrupados a moda, corresponde ao valor de maior frequência. Caos os dados estejam agrupados com intervalo de classe, a moda será o ponto médio da classe de maior frequência. Exemplo: moda com dados agrupados sem intervalo de classe Utilizando o mesmo exemplo do professor que construiu uma tabela com a distribuição de frequência dos meninos em grupos de alunos para um trabalho. Qual a moda de meninos por grupo? Solução: Conforme definição, a moda é o valor da classe de maior frequência. Como a maior frequência é 12, a moda será 3. Exemplo: moda com dados agrupados com intervalo de classe No mesmo exemplo anterior, no qual o treinador montou a tabela com a estatura média dos jogadores, calcular a moda. Solução: Conforme definição, a moda será o ponto médio da classe com maior frequência. Como a classe com maior frequência é a classe 3 (frequência 11), podemos afirmar que a moda será o ponto central da classe 3 que é: 38 Lógica e Estatística Universidade Santa Cecília - Educação a Distância 6.5. Mediana de dados não agrupados Em um conjunto de valores ordenados, a mediana é o valor situado de tal forma que os subconjuntos antes e depois do valor da mediana são iguais. Caso a quantidade de valores do conjunto seja um número ímpar, a mediana será a média entre os dois valores centrais. Exemplo com número ímpar de valores Determine a mediana do seguinte conjunto de valores: 2, 5, 6, 9,10,13,15,16,18. Solução: Como existem 9 valores, portanto um número ímpar de valores, basta separar 4 valores de cada lado e a mediana será o valor central. A mediana será 10 Exemplo com número par de valores Determine a mediana do seguinte conjunto de valores: 2, 6, 7, 10, 12, 13, 18, 19. Solução: Como existem 8 valores, portanto um número par de valores, basta separar 3 valores de cada lado e a mediana será a média dos dois valores centrais. A mediana será a média entre 10 e 12, portanto 6.6. Mediana de dados agrupados sem intervalo de classe Quando os dados são agrupados sem intervalo de classe, o cálculo é feito da seguinte maneira: a) Calcula-se a frequência acumulada da distribuição: = ∑ 𝑓𝑖 b) Divide-se o número total de elementos da distribuição por 2: = ∑ 𝑓𝑖 2 39 Lógica e Estatística Universidade Santa Cecília - Educação a Distância c) Procura-se a menor frequência acumulada que supera o valor obtido anteriormente. d) A mediana será o valor desta classe: Exemplo: mediana com dados agrupados sem intervalo de classe Utilizando o mesmo exemplo do professor que construiu uma tabela com a distribuição de frequência dos meninos em grupos de alunos para um trabalho. Qual a mediana de meninos por grupo? Solução: Incluir na tabela a coluna de frequência acumulada. Dividir o número total de elementos por 2 Procurar o menor valor de frequência acumulada que supera 17, que é o valor 18 A mediana será o valor da classe de frequência acumulada 18 que é 2. 40 Lógica e Estatística Universidade Santa Cecília - Educação a Distância 6.7. Mediana de dados agrupados com intervalo de classe Quando os dados são agrupados com intervalo de classe, o cálculo é feito de maneira semelhante ao do item anterior, porém, o valor da mediana é obtido através de uma equação e não por simples observação de valor. O procedimento é o seguinte: a) Calcula-se a frequência acumulada da distribuição: = ∑ 𝑓𝑖 b) Divide-se o número total de elementos da distribuição por 2: = ∑ 𝑓𝑖 2 c) Procura-se a menor frequência acumulada que supera o valor obtido anteriormente. d) Calcular a mediana pela equação: Exemplo: mediana com dados agrupados com intervalo de classe No mesmo exemplo anterior, no qual o treinador montou a tabela com a estatura média dos jogadores, calcular a mediana. Solução: Incluir na tabela a coluna de frequência acumulada. 41 Lógica e Estatística Universidade Santa Cecília - Educação a Distância Dividir o número total de elementos por 2 Procurar o menor valor de frequência acumulada que supera 20, que é o valor 24 Calcular a mediana utilizando a equação Onde: Li = Limite inferior da classe mediana =158 Fi = Frequência da classe mediana =11 Fa(ant) = Frequência acumulada anterior à mediana =13 h= Intervalo de classe da classe mediana = 4 Somatória de Fi dividido por 2 (já calculado) = 20 42 Lógica e Estatística Universidade Santa Cecília - Educaçãoa Distância SOUZA, Jeferson Afonso Lopes. Lógica Matemática. ed. São Paulo: Pearson, 2018. ISBN: 9788543020310 GUEDES, S. (org.). Lógica de programação algorítmica. São Paulo: Prentice Hall, 2009. ISBN: 9788543005546 DACHI, Édson Pereira. HAUPT, Alexandre Hauptu, Eletrônica Digital – Blucher – São Paulo, 2016, ISBN: 9788521210092 FIMENEZ, P. Salvador. Microcontroladores 8051. São Paulo – Editora Pearson,2002, ISBN: 9788587918284 BONAFINI, Fernanda Cesar, Estatística, São Paulo – Editora Pearson, 2012, ISBN: 9788564574403 NETO, Pedro Luiz de Oliveira, Estatística, São Paulo – Editora Blucher, 2002, ISBN: 9788521215226 MORETTIN, Luiz Gonzaga, Estatística Básica: probabilidade e inferência, Editora Pearson, 2009, ISBN: 9788576053705 JUNIOR, Dorival Bonora, Estatística Básica, São Paulo, Ícone Editora, 2019, ISBN: 9788527413152
Compartilhar