Prévia do material em texto
Vamos continuar nossa jornada aqui para falar um pouco mais sobre algumas áreas ali do mundo da inteligência artificial e hoje nós vamos embarcar em uma jornada muito fascinante pela área da inteligência artificial que é conhecida como visão computacional. Então se prepara aí para gente desvendar o segredo das máquinas que enxergam o mundo ao seu redor. A visão computacional é uma das áreas mais impressionantes quando a gente fala de inteligência artificial, pois ela permite que os computadores entendam e interpretem o conteúdo visual das imagens e vídeos, tá? É como se você desse olhos e um cérebro digital para uma máquina para que elas possam perceber o ambiente à sua volta e tomar decisões mais inteligentes. Para que essas máquinas possam ver como eu e você enxergamos o mundo, nós utilizamos algoritmos poderosos, com redes neurais convolacionais. Essas redes foram inspiradas no funcionamento do cérebro humano e elas têm capacidade de aprender padrões visuais complexos. É como se eu ensinasse para o meu computador, se eu ensinasse para o meu algoritmo, por exemplo, a reconhecer um formato de controle. Sempre que ele identificar esse tipo de formato e ele identificar relevos, que são botões, ele vai identificar isso como controle. Então eu ensino para a máquina enxergar os padrões complexos para reconhecer um controle por exemplo, e poderia ir além, poderia pedir para ele reconhecer somente controles de ar-condicionado. Seja detectando alguma marca específica ou um formato específico. Então eu estou ensinando para o meu algoritmo tudo o que significa um controle, identificando e mostrando uma base de dados enorme para ele de imagens vídeos e outras coisas de controle para que toda vez que ele se deparar com um objeto novo diante dele, ele entenda que aquilo é um controle. Então, é assim que nós fazemos com que eles enxerguem a grosso modo. E com esses algoritmos nós podemos fazer eles identificarem coisas impressionantes, desde objetos e imagens classificar diferentes cenas, detectar movimentos e até mesmo compreender sentimentos e expressões faciais humanas. E um dos grandes desafios da visão computacional é a segmentação de objetos. Isso significa que separar diferentes objetos em uma imagem, como se fossem peças de um quebra-cabeça, está se tornando uma tarefa possível. Uma compreensão do ambiente está se tornando muito mais comum, que era uma coisa que era muito difícil para algoritmos antigamente. Mas com o poder computacional que a gente tem hoje, está ficando muito mais poderoso a força desses algoritmos aí, para que a gente consiga imputar uma massa de dados maior e para que eles consigam identificar um objeto mesmo numa sala totalmente bagunçada, devido à quantidade e o poder de processamento que as máquinas têm hoje em dia. E essa técnica é amplamente utilizada em carros autônomos por exemplo para que eles possam identificar e acompanhar pedestres, veículos e outros objetos na estrada garantindo uma condução muito mais segura e eficiente. Outra aplicação impressionante da visão computacional é a de detecção e reconhecimento facial. Através de algoritmos avançados, as máquinas são capazes de identificar características únicas em um rosto e associá-los a uma pessoa específica, por exemplo. E essa tecnologia já é utilizada hoje em diversos aplicativos. Desde desbloqueio de smartphones até mesmo em investigações criminais e até mesmo na criação de sistemas de vigilância eficiente. Então a gente já tem câmeras hoje que estão validando ali todo mundo que está passando em real time ali, com base de dados de pessoas procuradas pelo mundo todo. Então é realmente incrível o que a visão computacional pode fazer. E nós estamos cada vez mais próximos de permitir que as máquinas vejam e compreendam o mundo de uma maneira muito mais incrível do que a gente poderia imaginar antigamente. Primeiro por conta do avanço do poder computacional e por avanço desses algoritmos, né? Já que uma vez que um algoritmo é treinado, ele dá base para que você treine outros algoritmos. Eu espero que vocês tenham gostado de desvendar esses conteúdos aqui da visão computacional e as suas aplicações surpreendentes. E eu sei, pode parecer ainda uma coisa muito mística, mas é só você parar para pensar que quando você aprendeu o que era uma cadeira, você basicamente ouviu outras pessoas dizendo que aquela é uma cadeira, você depois de um tempo começou a se sentar naquela cadeira e ter comportamentos ao redor daquela cadeira. Então, assim como você entendeu que é um objeto cadeira, toda vez que você entra numa sala agora, você sabe identificar o que é uma cadeira ou não, onde elas estão, se elas estão posicionadas de frente ou não. Então é justamente educar a máquina para que ela faça isso, o algoritmo detectar ali num cenário bagunçado diferentes cadeiras quantas cadeiras tem, quais são as cores, se elas estão de frente ou de costas, que é a missão desse profissional. Ajudar o algoritmo a identificar padrões em imagens e vídeos, ou até mesmo trabalhar com base de imagens e base de vídeos para reconhecer um certo padrão. E como você pode ver, o poder dessa visão computacional de fato é uma coisa que muda e muito vários mercados.