2018-11-19
A inteligência artificial está a assumir um papel fulcral em problemas de identificação de formas e imagens: treine-se um sistema baseado em IA e este poderá fazer uma reportagem automatizada de uma corrida de automóveis, narrando a evolução dos participantes ao longo do tempo
Mas não se espere que o desenho de carros de corrida seja feito exclusivamente por AI nos anos mais próximos: o desafio maior para os sistemas de IA, o santo Graal, tem sido a criação e não o reconhecimento de padrões. Contudo, um desenvolvimento recente está a ser determinante para pôr as máquinas a criar. Numa espécie de evolução natural digital, sistemas de IA estão a ser colocados a treinar uns com os outros, para criar imagens ou sons originais com elevado realismo, algo que nunca foi possível obter antes. A solução deve-se a Ian Goodfellow, enquanto estudante de doutoramento na Universidade de Montreal, em 2014, e a abordagem, conhecida como “generative adversarial network”, ou GAN, utiliza duas redes neuronais colocando- as uma contra a outra, num “debate”. Ambas são treinadas com o mesmo conjunto de dados. Uma delas, conhecida como “generator”, tem a tarefa de criar variações nas imagens que já são vistas. A segunda, conhecida como “discriminator”, é convidada a identificar se o exemplo é como as imagens em que tem sido treinado, ou se é “falsa”. Com o tempo, o “generator” pode tornar-se tão bom na produção de imagens que o “discriminator” não consegue detetar falsificações. Esta tecnologia tornou-se num dos avanços mais promissores da IA , sendo capaz de ajudar as máquinas a produzir resultados que baralham, ou enganam mesmo, os seres humanos.
As GAN têm sido usadas para criar quadros que já foram vendidos em leilão, sintetizar fala com som realista, e imagens impressionantemente reais. Em exemplos convincentes, a NVidia treinou GAN com fotografias de celebridades para criar centenas de rostos de pessoas que não existem; investigadores produziram pinturas falsas que se parecem com as obras de van Gogh ou Manet; adicionalmente, as GAN podem refazer as imagens de diferentes maneiras, transformando cavalos em zebras, por exemplo, ou imagens de verão em inverno. Os resultados nem sempre são perfeitos. As GAN podem criar faces com sobrancelhas no lugar errado, por exemplo. Mas uma vez que as imagens e os sons são surpreendentemente coerentes, fazem “sentido”, alguns especialistas acreditam que as GAN estão a começar a entender a estrutura subjacente do mundo de que se “alimentam”. E isso significa que a IA pode dar às máquinas, paralelamente com um sentido de imaginação, uma capacidade independente de perceber o mundo.
Henrique Carreiro | Docente de Cloud Computing e Mobilidade Empresarial na Nova Information Management School |