Buscar

RESUMÃO AULA 1

Prévia do material em texto

PANDAS
BIBLIOTECA PERMITE MANIPULAÇAO RAPIDA DE DADOS EM FORMATO DE TABELAS DADOS TABULARES CONSTRUIDA EM CIMA DO NUBAY
BIBLIOTECA CONSTRUIDA SOBRE O NUMPY
TIPOS DE DADOS
 1 - DATA FRAME
FORMATO TABELA COM TABELAS BEM GRANDES COM CENTENAS E MILHARES DE COLUNAS
TUDO SÃO FUNÇÕES 
RESAMPLE
A PARTIR DE UMA COLUNA DATA, TENHO A PREVISÃO DO TEMPO HORA A HORA NA SUA CIDADE CONSIGO AGRUPAR ELAS POR SEMANAS POR MESES 
AGRUPA DADOS POR DIA, SEMANA, MESES, ANOS 
GROUPHY merge/ melt/ pivot_table TABELAS DINAMICAS 
HED/TAIL visualizar dados(ver uma pequena amostra) funções bem úteis para visualizar os dados HED visualisa as 5 primeiras linhas e o TAIL as 5 últimas linhas
LOC/ILOC visualizar dados por indice ou por linhas 
ver linha 500 a 520 Iloc loc por indice as 20 primeiras linhas 
TABELAS DINAMICAS NO EXEL .==JUNTAR DIFERENTES TABELAS 
Extração de Dados 
GET_DUMMIES EXEMPLOS sorvetes coluna tipo de sorvete transformar em 5 novas colunas por sabores , criando as novas colunas fica muito mais util no ponto de vista de ciencias de dados manipulação analise de dados 
Series.dt.week . week extrai a semana referente aquela data day extrai so os dias , month somente meses , weekday dia da semana 
IMAGINE DATA FRAME É UMA TABELA COM LINHAS COLUNAS CADA COLUNA SERIAM OS SERIES (CONJUNTOS DE DADOS)
2 -SERIES
IMPORTAÇAO DE DADOS 
LER INFORMAÇOES DE DIFERENTES ARQUIVOS COM O PANDAS
1- CSV / JSON
2- EXEL 
3-SQUL (CONECTAR UM BANCO DE DADOS SQUL ATRAVÉS DO PANDAS NO PYTHON )
PANDA TEM TMBM 
CORRELAÇÕES 
Person (relacionamento linear) nem sempre os relacionamentos são lineares no dia a dia podem existir curvas tmbm
Spearman ( relacionamentos monotônico não necessariamente linear )
Kendall ( relacionamento monotônidco mais robusto ue Spearmaan , mais lento )
RESOLVENDO PROBLEMAS COM UMA LINHA USO DE EXPRESSÕES REGULARES DO PYTHON 
 REGEX - receita de um padrão de busca suponhamos que eu esteja lendo um artigo cientifico e tenho que encontrar todas as ocorrencia de alguma coisa , uma lista de um diário oficial , que tem textos numeros etc todas a ocorrencias de uma placa de carro , como tenho diferentes valores seguindo um padrao REGEX ajuda a encontrar pelo padrão
aa0000 é uma placa ai vai procurar por padrão
[0-9] - tracinho representa até
[] um caracter que esteja dentro desse padrão
[0-9] vamos encontrar qualquer valor enter 0 e 9
[0-9a-z] encontrar valor o a 9 qualquer letra minuscula alfabeto ingles 
[0-9a-zA-Z] digito e letras maiuscula e minuscula 
[^0-9a-z] tudo que nao esta esta nesse padrao a seguir quando aparece o circunflexo 
[0-9]+ ( o + é o mais caracteres juntos conjuntos de digitos 
O símbolo "+" significa "um ou mais ocorrências". Isso indica que a classe de caracteres [0-9] deve ocorrer uma ou mais vezes consecutivas na string para que haja correspondência.
Portanto, "[0-9]+" corresponde a um ou mais dígitos numéricos consecutivos, 
Aqui estão alguns exemplos para ilustrar como essa expressão regular funciona:
"[0-9]*" corresponde a zero ou mais dígitos numéricos consecutivos.
A expressão regular "[0-9]*" em Python é semelhante à expressão regular "[0-9]+" que discutimos anteriormente, mas com uma diferença crucial. Vamos analisar essa expressão em detalhes:
Aqui estão alguns exemplos para ilustrar o funcionamento correto:
Na expressão regular "[0-9]+":
"12345" corresponde à expressão regular, pois contém uma sequência de um ou mais dígitos numéricos.
"abc123" não corresponde à expressão regular, pois não contém apenas dígitos numéricos.
"9876xyz" corresponde à expressão regular, pois contém uma sequência de um ou mais dígitos numéricos.
"x1y2z3" não corresponde à expressão regular, pois os dígitos não estão em uma sequência comsecutiva.
Na expressão regular "[0-9]*":
"12345" corresponde à expressão regular, pois contém uma sequência de zero ou mais dígitos numéricos.
"abc123" corresponde à expressão regular, pois contém uma sequência de zero ou mais dígitos numéricos (neste caso, zero ocorrências).
"9876xyz" corresponde à expressão regular, pois contém uma sequência de zero ou mais dígitos numéricos.
"x1y2z3" corresponde à expressão regular, pois contém uma sequência de zero ou mais dígitos numéricos (neste caso, zero ocorrências).
[0-9]?
A expressão regular "[0-9]?" em Python utiliza o ponto de interrogação "?" como um quantificador que indica "zero ou uma ocorrência" do elemento anterior. Vamos analisar essa expressão em detalhes:
Os colchetes [ ] ainda indicam uma classe de caracteres, que neste caso é a classe de dígitos numéricos de 0 a 9.
O ponto de interrogação "?" significa "zero ou uma ocorrência". Isso indica que a classe de caracteres [0-9] pode ocorrer zero vezes (ou seja, estar ausente na string) ou apenas uma vez.
Aqui estão alguns exemplos para ilustrar como essa expressão regular funciona:
"12345" não corresponde à expressão regular, pois contém uma sequência de vários dígitos numéricos.
"abc123" não corresponde à expressão regular, pois não contém apenas dígitos numéricos.
"9876xyz" não corresponde à expressão regular, pois contém uma sequência de vários dígitos numéricos.
"x1y2z3" corresponde à expressão regular, pois contém apenas um dígito numérico.
Em Python, você pode usar a biblioteca re para trabalhar com expressões regulares. Aqui está um exemplo de código que usa essa expressão regular para encontrar todas as ocorrências de zero ou um dígito numérico em uma string:
 validar_cep(cep):
 padrao = r'^\d{5}-[\d]{3}$' DESMONTANDO ACHAR SEQUENCIA DE 0 A 9 REPETINCO 5X
[/d] = [0-9]
{5} significa 5x
depois ifen 
depois mais {3} 3 digitos o que equivale ao CPE DE CADA LOCAL
EX 82220-120
CODIGO 
import re
def validar_cep(cep):
 padrao = r'^\d{5}-\d{3}$'
 resultado = re.match(padrao, cep)
 return resultado is not None
# Exemplo de uso:
cep1 = "12345-678"
cep2 = "987654"
cep3 = "ABCDE-FGH"
cep4 = "1234-5678"
print(validar_cep(cep1)) # Saída: True
print(validar_cep(cep2)) # Saída: False
print(validar_cep(cep3)) # Saída: False
print(validar_cep(cep4)) # Saída: False
Neste exemplo, a função validar_cep recebe uma string cep como argumento. A expressão regular ^\d{5}-\d{3}$ é utilizada para verificar se o CEP está no formato correto. Vamos analisar essa expressão regular:
^ indica o início da string.
\d{5} corresponde a exatamente cinco dígitos numéricos.
- corresponde ao caractere de hífen.
\d{3} corresponde a exatamente três dígitos numéricos.
$ indica o final da string.
O método re.match é utilizado para verificar se a string cep corresponde ao padrão definido pela expressão regular. Se houver correspondência, o resultado será diferente de None, indicando que o CEP é válido.
No exemplo de uso, você pode testar diferentes valores de CEP, como cep1, cep2, cep3 e cep4, e verificar a saída que indica se o CEP é válido ou não.
Lembrando que esse exemplo é específico para o formato brasileiro de CEP de 8 dígitos, e se você estiver trabalhando com CEPs de outros países, pode ser necessário ajustar o padrão da expressão regular de acordo com o formato esperado.

Continue navegando