LISBOA, Portugal (AP) – Os gigantes tecnológicos estão a investir cada vez mais no desenvolvimento dos chamados modelos de inteligência artificial “soberanos” para aumentar a competitividade através de um maior foco nas infra-estruturas locais.
A soberania dos dados é a ideia de que os dados das pessoas devem ser armazenados na infraestrutura do país ou continente em que vivem.
“IA soberana é um termo relativamente novo que surgiu no último ano”, disse à CNBC Chris Gow, decisor político da UE na gigante de redes de TI Cisco, com sede em Bruxelas.
Atualmente, muitos dos maiores modelos de linguagem de grande porte (LLMs), como ChatGPT da OpenAI e Claude da Anthropic, usam data centers nos EUA para armazenar dados e processar solicitações por meio da nuvem.
Isto suscitou preocupações entre os políticos e reguladores na Europa, que consideram que a dependência da tecnologia dos EUA é prejudicial para a competitividade do continente – e, o que é mais preocupante, para a resiliência tecnológica.
De onde vem a “soberania da IA”?
O conceito de soberania de dados e tecnologia já estava na agenda europeia. Isso se deveu em parte à resposta das empresas às novas regulamentações.
O Regulamento Geral de Proteção de Dados da União Europeia, por ex. B. exige que as empresas tratem os dados dos usuários de forma segura e compatível, respeitando seu direito à privacidade. Casos de grande repercussão na UE também levantaram dúvidas sobre se os dados dos cidadãos europeus podem ser transferidos com segurança através das fronteiras.
O Tribunal de Justiça Europeu em 2020 invalidou uma estrutura de partilha de dados entre a UE e os EUA, dizendo que o pacto não fornecia o mesmo nível de proteção garantido na UE pelo Regulamento Geral de Proteção de Dados (GDPR). No ano passado, o quadro de proteção de dados UE-EUA foi criado para garantir que os dados possam fluir com segurança entre a UE e os EUA
Estes desenvolvimentos políticos levaram, em última análise, a um impulso para localizar a infraestrutura em nuvem onde os dados são armazenados e processados para muitos serviços online.
Filippo Sanesi, chefe global de marketing e operações de startups da OVHCloud, disse que a empresa francesa de nuvem está a registar uma grande procura pela sua infraestrutura baseada na Europa, pois “compreende o valor dos seus dados na Europa, que está sujeita à legislação europeia”. “
“À medida que este conceito de soberania de dados se torna mais maduro e as pessoas compreendem o que isso significa, vemos cada vez mais empresas compreenderem a importância de ter os seus dados locais e sob jurisdição e governação específicas”, disse Sanesi à CNBC. “Hospedamos muitos dados”, acrescentou. “Esses dados são soberanos em certos países sob certas regulamentações.”
“Com esses dados agora você pode realmente criar produtos e serviços para IA, e esses serviços deverão então ser soberanos, controlados, entregues e desenvolvidos localmente por talentos locais para a população ou empresas locais.”
A pressão pela soberania da IA não foi impulsionada pelos reguladores – pelo menos não ainda, de acordo com Gow da Cisco. Em vez disso, vem de empresas privadas que abrem mais centros de dados na Europa – instalações com grandes quantidades de equipamento informático para permitir ferramentas de IA baseadas na nuvem, disse ele.
A IA soberana é “impulsionada mais pela indústria que lhe dá esse nome do que pelos formuladores de políticas”, disse Gow. “Você ainda não vê a terminologia ‘soberania da IA’ usada no lado regulatório.”
Os países estão promovendo a ideia da soberania da IA porque reconhecem que a IA é “o futuro” e uma “tecnologia tremendamente estratégica”, disse Gow.
Os governos estão concentrados em apoiar as suas empresas e ecossistemas tecnológicos nacionais, bem como a importantíssima infraestrutura de back-end que permite os serviços de IA.
“A carga de trabalho de IA consome 20 vezes mais largura de banda de uma carga de trabalho tradicional”, disse Gow. Segundo Gow, trata-se também de capacitar a força de trabalho, uma vez que as empresas precisam de trabalhadores qualificados para terem sucesso.
Mas o mais importante são os dados. “O que você está vendo são algumas tentativas deste lado de pensar em treinar LLMs em dados localizados no idioma”, disse Gow.
“Refletir valores”
Na Itália, o primeiro treinamento LLM específico para dados de língua italiana, denominado Italia 9B, foi lançado neste verão.
O objetivo do projeto Itália é armazenar resultados numa jurisdição específica e basear-se em dados de cidadãos dessa região para que os resultados produzidos pelos sistemas de IA sejam melhor baseados nas línguas, cultura e história locais.
“A IA soberana reflete os valores de uma organização, ou igualmente do país em que você está, bem como os valores e a linguagem”, diz David Hogan, diretor de vendas EMEA da fabricante de chips Nvidiadisse CNBC.
“O maior desafio é que a maioria dos modelos de fronteira hoje foram treinados principalmente em dados ocidentais em geral”, acrescentou Hogan.
Na Dinamarca, por exemplo, onde a Nvidia tem uma grande presença, Hogan disse que as autoridades estão preocupadas com o facto de serviços vitais, como cuidados de saúde e telecomunicações, estarem a ser fornecidos por sistemas de IA que não “reflectem” a cultura e os valores locais dinamarqueses.
Na quarta-feira, a Dinamarca apresentou um livro branco histórico descrevendo como as empresas podem usar a IA em linha com a próxima lei da UE sobre IA – a primeira grande lei de IA do mundo. O documento pretende servir como um modelo a ser seguido e adotado por outros estados da UE.
“Se você estiver em um país europeu que não é um dos principais países linguísticos internacionais, provavelmente há menos de 2% dos dados treinados em seu idioma – e muito menos em sua cultura”, disse Hogan.
Como a regulamentação levou a um repensar
Isso não quer dizer que as regulamentações não tenham provado ser um factor importante para fazer com que os gigantes da tecnologia pensem mais na construção de infra-estruturas localizadas de IA na Europa.
Sanesi, da OVHCloud, disse que regulamentações como o GDPR da UE despertaram muito interesse na terceirização do processamento de dados em uma determinada região.
O conceito de soberania da IA também encontra apoio entre as empresas tecnológicas europeias locais.
No início desta semana, o motor de busca Ecosia, com sede em Berlim, e o seu concorrente Qwant, com sede em Paris, anunciaram uma joint venture para desenvolver um índice de busca europeu a partir do zero, com o objectivo de fornecer melhores resultados em francês e alemão.
Agora uma operadora francesa de telecomunicações Laranja disse que está em discussões com uma série de empresas principais de modelos de IA sobre a construção de um modelo de “IA soberana” baseado em smartphones para seus clientes que reflita com mais precisão seu próprio idioma e cultura.
“Não faria sentido construir seus próprios LLMs. “Portanto, há muita discussão agora sobre como podemos trabalhar com os provedores existentes para torná-lo mais local e mais seguro”, disse Bruno Zerbib, diretor de tecnologia da Orange, à CNBC.
“Existem muitos casos de uso em que [AI data] pode ser editado localmente [on a phone] em vez de serem processados na nuvem”, acrescentou Zerbib. A Orange ainda não selecionou um parceiro para essas ambições do modelo soberano de IA.