Anthropic implementa salvaguardas electorales para Claude antes de las elecciones legislativas de mitad de mandato de 2026

Anthropic anunció el viernes un conjunto de medidas de integridad electoral diseñado para evitar que su chatbot de IA Claude se pueda utilizar como arma para difundir desinformación o manipular a los votantes de cara a las elecciones legislativas de mitad de mandato de EE. UU. de 2026 y otros grandes comicios a nivel mundial que tendrán lugar este año. La empresa con sede en San Francisco detalló un enfoque de múltiples frentes que incluye sistemas de detección automatizados, pruebas de resistencia frente a operaciones de influencia y una asociación con una organización de recursos electorales apartidista—medidas que reflejan la creciente presión sobre los desarrolladores de IA para que supervisen cómo se usan sus herramientas durante las temporadas electorales.

Políticas de uso en elecciones

Las políticas de uso de Anthropric prohíben que Claude se utilice para ejecutar campañas políticas engañosas, generar contenido digital falso destinado a influir en el discurso político, cometer fraude electoral, interferir con la infraestructura de votación o difundir información engañosa sobre los procesos de votación.

Resultados de pruebas de cumplimiento

Para hacer cumplir sus políticas electorales, Anthropic probó sus modelos más recientes usando 600 prompts—300 solicitudes dañinas emparejadas con otras 300 legítimas—para medir qué tan consistentemente Claude cumple con las solicitudes apropiadas y rechaza las problemáticas. Claude Opus 4.7 y Claude Sonnet 4.6 respondieron de manera adecuada el 100% y el 99,8% de las veces, respectivamente.

La compañía también probó sus modelos frente a tácticas de manipulación más sofisticadas. Al usar conversaciones simuladas de múltiples turnos diseñadas para reflejar los métodos paso a paso que podrían emplear actores malintencionados, Sonnet 4.6 y Opus 4.7 respondieron de manera adecuada el 90% y el 94% de las veces, respectivamente, cuando se probaron contra escenarios de operaciones de influencia.

Anthropric además probó si sus modelos podían llevar a cabo de forma autónoma operaciones de influencia—planificar y ejecutar una campaña de varios pasos de principio a fin sin indicaciones humanas. Con salvaguardas en su lugar, sus modelos más recientes rechazaron casi todas las tareas, según la empresa.

Evaluación de neutralidad política

Sobre la cuestión de la neutralidad política, Anthropic realiza evaluaciones antes de cada lanzamiento de modelo para medir qué tan consistentemente y de manera imparcial Claude participa con prompts que expresan puntos de vista de todo el espectro político. Opus 4.7 y Sonnet 4.6 obtuvieron 95% y 96%, respectivamente.

Banners de información electoral

Para los usuarios que buscan información de votación, Claude mostrará un banner electoral que los dirigirá a TurboVote, un recurso apartidista de Democracy Works que ofrece información fiable y en tiempo real sobre el registro de votantes, ubicaciones de centros de votación, fechas de elecciones y detalles de las papeletas. Se planea un banner similar para las elecciones de Brasil más adelante este año.

Monitoreo continuo

Anthropric dijo que planea seguir monitoreando sus sistemas y perfeccionando sus defensas a medida que avance el ciclo electoral.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Scale AI recibe $500M contrato del Pentágono para el procesamiento de datos de IA

Según ChainCatcher, el Departamento de Defensa de Estados Unidos otorgó a Scale AI, respaldada por Meta Platforms, un contrato de 500 millones de dólares para ayudar a procesar datos y apoyar la toma de decisiones militares. El premio es cinco veces mayor que el contrato de 100 millones de dólares que la empresa, con sede en San Francisco, recibió en

GateNewsHace17m

Elon Musk's xAI se renombrará como SpaceXAI cuando termine su estatus como compañía independiente

Según Odaily, Elon Musk anunció que xAI será renombrada como SpaceXAI, ya que la empresa dejará de operar como una entidad independiente.

GateNewsHace50m

IBM amplía su suite de IA empresarial con nuevas herramientas basadas en agentes en Think 2026

Según IBM, la compañía anunció una expansión de sus capacidades de IA empresarial en la conferencia Think 2026 en Boston, implementando nuevas herramientas basadas en agentes para ayudar a las organizaciones a integrar la inteligencia artificial en las operaciones diarias. Context Studio, ahora disponible de forma general, permite a las empresas a

GateNewsHace58m

Las acciones de Hut 8 suben 30% con un contrato de arrendamiento de centros de datos de IA por valor de 9,8 mil millones de dólares

Las acciones de Hut 8 se dispararon más de un 30% tras la noticia de un acuerdo de arrendamiento de centros de datos de IA por 9,8 mil millones de dólares. El minero de Bitcoin se está expandiendo hacia la infraestructura de IA con un contrato de hiperescalabilidad a largo plazo ubicado en Texas. Expansión de la infraestructura de IA El contrato incluye opciones que podrían aumentar el total

CryptoFrontierhace1h

Los sueños de Claude de Anthropic: el agente se organiza la memoria entre tareas, eliminando duplicados y contradicciones

Anthropic en la conferencia Code with Claude dio a conocer Dreams, con el que Claude Managed Agents puede ordenar automáticamente la memoria entre múltiples conversaciones, eliminar duplicados y contradicciones, y actualizar entradas desactualizadas, generando un repositorio de memoria posterior verificable. El límite de entrada es de 100 sesiones y 4.096 caracteres; se ejecuta de forma asíncrona y se completa en minutos a decenas de minutos, con soporte para observación en streaming. La vista previa para investigación requiere solicitud; por ahora solo admite claude-opus-4-7 y claude-sonnet-4-6, y la fecha de lanzamiento oficial aún no está definida.

ChainNewsAbmediahace4h
Comentar
0/400
Sin comentarios