Marta Quaresma Ferreira em 2023-7-17

A FUNDO

Em Foco

A inteligência artificial de mãos dadas com computer vision

A visão computacional é já uma realidade que vai para além da videovigilância e do controlo de acessos. A aceleração do desenvolvimento de tecnologias de IA mostrou-se essencial quando falamos em análise de grandes quantidades de dados e aplicação de algoritmos de machine learning

A inteligência artificial de mãos dadas com computer vision

Analisar dados, diferenciar objetos, identificar elementos visuais. São simples tarefas humanas que são cada vez mais replicadas pela tecnologia. Com o objetivo principal de compreender o conteúdo de vídeos e imagens, o computer vision não é um termo novo nas sociedades. Pelo contrário. A visão computacional e o processamento de imagens têm sido um recurso utilizado ao longo de vários anos, nos mais diversos contextos, ganhando uma particular dimensão e posição com o desenvolvimento cada vez mais acele - rado da inteligência artificial e com a necessi - dade de gerir e analisar grandes quantidades de dados.

A crescente popularidade de tecnologias com base em inteligência artificial tem permitido um maior desenvolvimento desta tecnologia em particular, à base de deep learning e de redes neuronais, com uma automação e precisão cada vez maiores e adaptadas às crescentes necessidades e desafios.

Desenvolvimento de mãos dadas com a inteligência artificial

Com origem na década de 60 do século XX, e a par da inteligência artificial, “a visão compu - tacional tem sido uma área de grande foco de desenvolvimento e investigação, tendo tido a sua grande explosão no início do século XXI com a aplicação de redes neuronais a imagens, contribuindo fortemente para a evolução do chamado deep learning”, começa por explicar Susana Silva, Data Scientist da IBM Consulting Portugal.

 

Susana Silva, Data Scientist da IBM Consulting Portugal

Os computadores, que aprenderam represen - tações hierárquicas de dados, permitiram “o reconhecimento e rastreamento automático de objetos, com uma exatidão nunca antes vista”, reitera Susana Silva. Tal realidade despertou – e continua a despertar – o interesse de empresas como a IBM, a Microsoft, a Google e o Facebook.

Em Portugal, a aplicação de técnicas de visão computacional que visam ajudar ou executar determinadas atividades são já uma realidade. Alberto Alonso, Solutions Engineer Southern Europe da Axis Communications, defende que “a tecnologia de análise digital da imagem sempre foi uma força motriz na indústria das câmaras de vídeo, tanto para vigilância, como para aplicação em processos de produção”.

O computer vision ocupou sempre uma posição dominante na empresa de câmaras em rede que, atualmente, progrediu de uma análise básica de vídeo para a possibilidade de extrair dados das imagens. Aos dias de hoje, garante Alberto Alonso, é já possível utilizar estas técnicas de análise digital baseadas na inteligência artifi - cial para “extrair dados valiosos das imagens, o que constitui uma ajuda essencial para a análise forense, utilizando vídeo gravado, reduzindo os tempos de pesquisa para uma pequena fração do tempo anteriormente necessário”. Estes dados podem, posteriormente, “ser utilizados para análises estatísticas da atividade, melho - rias de processos e otimização de operações de produção”.

No campo do vídeo e da videovigilância, o Solutions Engineer da Axis defende que a análise com base em tecnologias de IA, em especial deep learning, está a tornar-se num “fator determinante, sobretudo para aplicações de deteção de intrusão e situações potencialmente perigosas”.

Alberto Alonso, Solutions Engineer Southern Europe da Axis Communications 

 

“Não há dúvida de que a automatização da vigilância reduz a dependência do fator humano e aumenta o valor dos sistemas, tornando-os preditivos em vez de tradicionalmente reativos. Isto tem um impacto particular em tarefas como o controlo de acessos, em que a identificação de pessoas e veículos pode ser automatizada e, por conseguinte, permite otimizar todos os processos relacionados”, frisa. Em linha com esta ideia, Susana Silva enfatiza que a inteligência artificial “tem contribuído significativamente para este tipo de mercado através, por exemplo, da aplicação de algoritmos de machine learning à análise de grandes quantidades de dados provenientes de sistemas de vigilância, ajudando na identificação e deteção de anomalias e comportamentos fora da norma”.

O computer vision pode também ser posto, por exemplo, ao serviço do setor bancário, num trabalho de “deteção precoce de fraude bancária com recurso a algoritmos de machine learning e analítica avançada”, que resulta numa ação proativa “no combate à corrupção e fraude fiscal”.

“O desenvolvimento de modelos preditivos também tem ajudado a impulsionar este tipo de mercado [de computer vision], a sua aplicação pode ajudar na identificação de potenciais riscos, ajudando os profissionais de segurança a agir sobre as vulnerabilidades preventivamente e a tomar ações ainda antes de um ataque acontecer”, refere a Data Scientist da IBM.

Computer Vision em todo o lado

No dia-a-dia, é possível encontrar este tipo de tecnologia no nosso bolso, incorporada através dos nossos smartphones de gama média/alta, que oferecem uma garantia de segurança no acesso ao dispositivo e, acima de tudo, aos dados nele contidos.

As áreas da saúde, segurança e os transportes já tiram partido da visão computacional, com melhorias de eficiência em tarefas humanas que, em situações normais, consumiriam mais tempo e recursos.

Na saúde, explica Susana Silva, os “diversos algoritmos podem ser aplicados no sentido de extrair informação adicional essencial para complementar o diagnóstico de um médico”. Já no ramo da vigilância e da segurança de pessoas e espaços, “a capacidade de reconhecimento de pessoas e objetos automaticamente pode criar sistemas de alerta mais rápidos e eficientes ou a capacidade de extrair métricas automáticas sobre a evolução de alguns equipamentos que pode prevenir o controlo de acidentes e aumentar a qualidade da manutenção”.

No entanto, é na condução autónoma que a visão computacional encontra – e continuará a encontrar – uma das suas grandes áreas de exploração massiva, tendo como ponto de partida a extração do ambiente de estrada que possibilite a condução do veículo sem que para isso seja necessária a intervenção humana.

Das aplicações mais tradicionais – como a deteção de intrusões e o controlo de perímetro – até às aplicações mais específicas, como o controlo de equipamentos de proteção individual e de processos industriais, “o espetro de aplicações é enorme, quase ilimitado”, considera Alberto Alonso, que exemplifica: “na gestão das cidades, a análise da mobilidade das pessoas e dos veículos, do tráfego e do estacionamento, é um motor de desenvolvimento constante”. Também na logística “o controlo e a rastreabilidade das mercadorias e a automatização de processos ainda muito intensivos em termos de recursos humanos estão a sofrer uma grande mudança”. Para o Solutions Engineer, “qualquer atividade de controlo e de produção, seja na indústria, na agricultura ou na pesca, beneficia dos avanços da análise de vídeo digital baseada em IA”.

Desafios acrescidos

A existência de dados é fulcral para a aplicação da visão computacional. No entanto, a baixa qualidade de um conjunto de dados poder tornar-se numa das principais barreiras à implementação deste tipo de tecnologia. “O poder das soluções desenvolvidas é tão maior quanto melhor e maior for a qualidade e quantidade dos dados onde estas se baseiam”, reforça Susana Silva, que olha para a quantidade de imagens como um dos grandes desafios a superar: “para garantir bons resultados com este tipo de algoritmos, a dependência de uma grande quantidade de dados ainda é bastante significativa, tornando demorada a sua aplicação em determinados conceitos específicos, onde a recolha de imagens/vídeos e consequente anotação é ainda bastante demorada”. Para Alberto Alonso, alguns dos principais desafios trazidos por esta tecnologia prendem-se, sobretudo, com a capacidade de processamento das câmaras, com a arquitetura híbrida de sistemas e com a evolução de modelos de análise com base em deep learning, que utilizam as bases de dados de imagens já existentes.

A sustentabilidade e a pegada de carbono gerada por este tipo de soluções com base em inteligência artificial é outro dos pontos quentes da visão computacional, que obriga a repensar como pode ser feito o desenvolvimento do algoritmo, com recurso a técnicas que permitam a redução dos custos energéticos.

Ao serviço dos Parceiros

Esta área é uma oportunidade de investimento para os Parceiros de Canal, à boleia daquilo que a inteligência artificial é já capaz de fazer. “Convidamos os Parceiros a aprofundar a análise das necessidades dos seus clientes e a criar sistemas para automatizar processos e melhorar atividades. É isto que acrescenta valor, que cria um fator de diferenciação nas ofertas e que permite aos prestadores de serviços manterem as suas margens de rentabilidade comercial”, garante Alberto Alonso.

Susana Silva acredita que “nunca foi tão fácil” implementar este tipo de tecnologia: “o uso de visão computacional, aliada ao poder computacional providenciado por computação na cloud, permite aos Parceiros o acesso rápido e fácil a diversas aplicações deste tipo de tecnologia, que trazem elencado enorme poder de aumento de eficiência e transformação dos seus processos de negócio”. 

As soluções – desde produtos a serviços – das empresas que atuam nesta área são cada vez mais diversificadas e dirigidas aos diferentes casos. “As ferramentas disponíveis atualmente permitem a criação e desenvolvimento de um sem-número de casos de uso com apenas alguns meses de desenvolvimento, estando garantida a rápida integração e estabilidade em sistemas de cloud já sobejamente conhecidos dos Parceiros”, remata.

O futuro já chegou

De acordo com o estudo “Global Computer Vision Market – Opportunities and Forecast 2020-2030”, o mercado mundial de computer vision estava avaliado em 9,45 mil milhões de dólares em 2020. Até 2030, a perspetiva é a de que atinja os 41,11 mil milhões de dólares.

A garantia de processos mais rápidos, simples, os custos reduzidos e a apresentação de melhores produtos e serviços são algumas das mais-valias mais ‘apetecíveis’ que levam à aposta em computer vision nos mais diversos cenários do quotidiano.

Alberto Alonso considera que as grandes tecnológicas, como é o caso da Amazon, da Apple, do Facebook e da Microsoft “têm e terão muito a dizer no que toca ao desenvolvimento e disponibilidade das ferramentas de visão artificial”. Porém, só será possível evoluir nas análises “se as imagens existentes forem de alta qualidade”. O valor ético também não deve ser esquecido, alerta, uma vez que estão em causa os limites da aplicação destas tecnologias e a transformação dos mesmos em regulamentos e normas que devem ser tidos e adotados de forma consensual.

A massificação da inteligência artificial nos últimos meses, refere Susana Silva, pode levar à conclusão errada de que não existe espaço para tecnologias como a visão computacional. No entanto, recorda que “o desenvolvimento dos tão famosos modelos fundacionais não ocorre sem a presença da visão computacional”. Assim, “a ‘visão computacional generativa’ é já hoje uma realidade com diversas aplicações online para gerar imagens totalmente artificiais, contruídas por algoritmos treinados em cima de milhões de dados de imagens capturadas ao longo dos anos”.

Áreas como Visual Foundation Models, SelfSupervised Learning e Vídeo Recognition and Action Recognition vão levar as aplicações ao nível de IA. Na perspetiva da Data Scientist, “a capacidade de conjugar informação obtida via visão computacional com as capacidades de compreensão e geração de conteúdo de outras áreas de inteligência artificial já estão e irão, ainda mais, modificar a maneira como trabalhamos e vemos o mundo”.

IT CHANNEL Nº 113 DEZEMBRO 2024

IT CHANNEL Nº 113 DEZEMBRO 2024

VER EDIÇÕES ANTERIORES

O nosso website usa cookies para garantir uma melhor experiência de utilização.