A Anthropic Implementa Salvaguardas Eleitorais para o Claude Antes das Eleições Gerais de 2026

A Anthropic anunciou na sexta-feira um conjunto de medidas de integridade eleitoral concebidas para impedir que o seu chatbot de IA Claude seja utilizado de forma a ser “armado” para disseminar desinformação ou manipular eleitores antes das eleições legislativas intermédias de 2026 nos EUA e de outros grandes concursos a decorrerem este ano em todo o mundo. A empresa com sede em São Francisco descreveu uma abordagem multifacetada que inclui sistemas automatizados de deteção, testes de esforço contra operações de influência e uma parceria com uma organização de recursos eleitorais apartidária—medidas que refletem a crescente pressão sobre os criadores de IA para fiscalizarem como as suas ferramentas são utilizadas durante as épocas eleitorais.

Políticas de Utilização em Matéria Eleitoral

As políticas de utilização da Anthropric proíbem que o Claude seja utilizado para executar campanhas políticas enganosas, gerar conteúdo digital falso destinado a influenciar o discurso político, cometer fraude eleitoral, interferir com infraestruturas de votação, ou disseminar informação enganosa sobre processos de votação.

Resultados dos Testes de Conformidade

Para fazer cumprir as suas políticas eleitorais, a Anthropic testou os seus modelos mais recentes com 600 prompts—300 pedidos nocivos emparelhados com 300 pedidos legítimos—para medir a fiabilidade com que o Claude cumpre pedidos adequados e recusa os problemáticos. O Claude Opus 4.7 e o Claude Sonnet 4.6 responderam de forma adequada 100% e 99,8% das vezes, respetivamente.

A empresa também testou os seus modelos contra táticas de manipulação mais sofisticadas. Utilizando conversas simuladas multi-turno concebidas para espelhar os métodos passo a passo que os maus atores poderiam empregar, o Sonnet 4.6 e o Opus 4.7 responderam de forma adequada 90% e 94% das vezes, respetivamente, quando testados contra cenários de operações de influência.

A Anthropric testou ainda se os seus modelos podem executar autonomamente operações de influência—planear e executar uma campanha multi-etapas de ponta a ponta sem incentivo humano. Com salvaguardas em vigor, os seus modelos mais recentes recusaram quase todas as tarefas, segundo a empresa.

Avaliação da Neutralidade Política

No que diz respeito à neutralidade política, a Anthropic realiza avaliações antes de cada lançamento de modelo para medir o grau de consistência e imparcialidade com que o Claude se envolve com prompts que expressam pontos de vista de todo o espectro político. O Opus 4.7 e o Sonnet 4.6 obtiveram 95% e 96%, respetivamente.

Faixas de Informação Eleitoral

Para utilizadores que procuram informação sobre votação, o Claude apresentará uma faixa eleitoral que os direciona para a TurboVote, um recurso apartidário da Democracy Works que fornece informação fiável e em tempo real sobre registo eleitoral, locais de voto, datas das eleições e detalhes das cédulas de voto. Prevê-se uma faixa semelhante para as eleições do Brasil mais tarde este ano.

Monitorização Contínua

A Anthropric disse que planeia continuar a monitorizar os seus sistemas e a refinar as suas defesas à medida que o ciclo eleitoral avança.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

CZ diz que a YZi Labs aloca 70% para a blockchain e 20% para a IA no Consensus Miami 2026

De acordo com a ChainCatcher, na Consensus Miami 2026, Zhao Changpeng (CZ) afirmou que a YZi Labs atribui 70% do financiamento a blockchain, 20% a IA e 10% a biotecnologia. CZ acrescentou que a BNB deve ser posicionada como uma moeda nativa para agentes de IA, e que todas as blockchains precisam de estar “prontas para IA” para suportar

GateNews1h atrás

A Public adquire a plataforma de investimento em IA Treasury App para expandir o trading de cripto

De acordo com a ChainCatcher, a Public anunciou a aquisição da plataforma de serviços de investimento em IA Treasury App para reforçar o seu negócio de corretagem orientado por IA. O montante da aquisição não foi divulgado. Atualmente, a Public apoia a negociação de ações, obrigações e criptomoedas, incluindo Bitcoin, Ethereum, a

GateNews2h atrás

A Blitzy concluiu $200M ronda de financiamento liderada pela Northzone

De acordo com a ChainCatcher, a Blitzy, uma empresa de codificação com IA cofundada pelo antigo arquitecto da Nvidia Sid Pardeshi, concluiu uma ronda de financiamento de 200 milhões de dólares liderada pela Northzone. Battery Ventures, Jump Capital e Morgan Creek Digital participaram na ronda. A plataforma consegue analisar sistemas complexos com

GateNews3h atrás

A UE proíbe pornografia deepfake gerada por IA a 7 de maio

De acordo com a agência noticiosa Xinhua, a 7 de maio, os membros do Parlamento Europeu e os Estados-Membros chegaram a um consenso para proibir os sistemas de inteligência artificial de gerarem conteúdos pornográficos deepfake. A proibição será incorporada em alterações ao Regulamento de Inteligência Artificial de 2024. Parlamento Europeu

GateNews3h atrás

A Tether lança o modelo de IA médica MedPsy QVAC, atingindo uma pontuação de 62,62 na versão com 17 mil milhões de parâmetros

De acordo com a Odaily, o Tether AI Research Group lançou o QVAC MedPsy, um modelo de IA médica concebido para funcionar localmente em smartphones e dispositivos vestíveis, sem dependência de nuvem. A versão com 1,7 mil milhões de parâmetros obteve 62,62 em sete benchmarks médicos, superando o MedGemma-1.5-4B da Google em 11,42 poi

GateNews4h atrás

A API da B.AI lança quatro novos modelos, incluindo o GPT-5.5 Instant, no espaço de 48 horas após o lançamento da OpenAI

A API da B.AI lançou quatro novos modelos: GPT-5.5 Instant, DeepSeek-v3.2, MiniMax-M2.7 e GLM-5.1. O GPT-5.5 Instant concluiu a adaptação subjacente e a integração da interface no prazo de 48 horas após o lançamento da OpenAI, permitindo acesso sem atraso a

GateNews4h atrás
Comentar
0/400
Nenhum comentário