DeepMind advierte: seis tipos de ciberataques pueden secuestrar agentes de IA; las empresas deben reforzar la protección

Noticias de Gate: el equipo de investigadores de Google DeepMind advierte que un entorno abierto de Internet podría aprovecharse para secuestrar agentes de inteligencia artificial autónomos y manipular su comportamiento. El informe, titulado 《La trampa de los agentes de IA》, señala que, cuando las empresas despliegan agentes de IA para ejecutar tareas reales, los atacantes también podrían realizar ataques dirigidos a través de la red. La investigación identifica seis riesgos principales, entre ellos trampas de inyección de contenido, trampas de manipulación semántica, trampas del estado cognitivo, trampas de control del comportamiento, trampas del sistema y trampas de interacción hombre-máquina.

La trampa de inyección de contenido es la más directa: el atacante puede colocar instrucciones en comentarios HTML, metadatos o elementos ocultos de una página; el agente las lee y, entonces, puede ejecutarlas. La trampa de manipulación semántica, en cambio, afecta de manera silenciosa la comprensión que el agente tiene de la tarea al cargar formulaciones autorizadas o al hacerse pasar por páginas que imitan un entorno de investigación, y a veces incluso elude los mecanismos de seguridad. La trampa del estado cognitivo consiste en implantarle fuentes de información al agente con datos falsos para que, durante mucho tiempo, crea erróneamente que esa información ya ha sido validada. La trampa de control del comportamiento se centra en las operaciones reales del agente: puede inducirlo a acceder a datos sensibles y a transmitirlos a un objetivo externo.

La trampa del sistema implica una manipulación coordinada entre múltiples sistemas de IA, lo que puede desencadenar reacciones en cadena, de forma similar a cómo los algoritmos de trading provocan un desplome repentino del mercado. La trampa de interacción hombre-máquina aprovecha el proceso de revisión humana: al elaborar contenidos de revisión que parecen creíbles, las conductas dañinas pueden eludir la regulación.

Para hacer frente a los riesgos, DeepMind recomienda combinar entrenamiento adversarial, filtrado de entrada, monitorización del comportamiento y un sistema de reputación del contenido de red, además de establecer un marco de responsabilidad legal más claro. Sin embargo, la investigación señala que en la industria todavía no existen estándares de defensa unificados; las medidas actuales están dispersas y se centran de manera desigual. La investigación hace un llamamiento a que desarrolladores y empresas presten atención a la seguridad del entorno operativo de los agentes de IA y prevengan los posibles riesgos de manipulación en red y de abuso.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

El mayor exchange de Polonia enfrenta acusaciones de estafa de $350M

Zondacrypto se enfrenta a acusaciones de malversación de fondos, ya que su CEO, Przemysław Kral, afirma que el exchange perdió el acceso a una wallet que contenía más de 4,500 BTC. Kral señaló que la wallet se vendió al exchange, pero su propietario anterior desapareció antes de entregar las claves privadas. Clave

CoinpediaHace16m

JPMorgan: Explotaciones de seguridad en DeFi y TVL estancado limitan la adopción institucional

Mensaje de Gate News, 23 de abril — Analistas de JPMorgan liderados por el director gerente Nikolaos Panigirtzoglou dijeron que los persistentes exploits de (DeFi) y el débil crecimiento continúan limitando el interés institucional en el sector. El reciente hack de Kelp DAO eliminó aproximadamente $20 billion de la valoración total bloqueada de DeFi, TVL en solo unos días, según el informe del miércoles.

GateNewshace6h

El Tesoro de EE. UU. sanciona a un senador camboyano por una red de estafas con cripto

## Descripción general El Departamento del Tesoro de EE. UU. sancionó al senador camboyano Kok An y a 28 entidades vinculadas con él el jueves, según la (Oficina de Control de Activos Extranjeros (OFAC)) del Tesoro. La medida se dirige a lo que los funcionarios describen como una operación masiva de estafa con criptomonedas en el Sudeste Asiático. ## El

CryptoFrontierhace6h

Aave congela reservas de rsETH en cinco redes tras el exploit de KelpDAO

Mensaje de Gate News, 23 de abril — Aave ha congelado las reservas de rsETH en Ethereum Core, Arbitrum, Base, Mantle y Linea a medida que se acelera el esfuerzo de recuperación tras el exploit de KelpDAO del 18 de abril que drenó 116,500 rsETH, valorados aproximadamente en $292 millones, del puente entre cadenas de Kelp. Múltiples D

GateNewshace8h

JPMorgan: los piratas informáticos DeFi son cada vez más frecuentes y el mecanismo de compresión de interés junto con la estabilización del TVL, con el capital que se traslada a USDT

El informe de JPMorgan considera que las vulnerabilidades en DeFi persisten, que los ataques contra puentes entre cadenas y oráculos se repiten con frecuencia, lo que provoca estancamiento del TVL y debilita el interés de las instituciones inversoras; los fondos se están desviando hacia USDT rastreable y que puede ser congelado. Los ataques a KelpDAO y Rhea Finance revelan riesgos en la gestión de riesgos; las stablecoins centralizadas y la custodia se favorecen más. A largo plazo, para mejorar es necesario ir más allá del seguro y del gobierno; DeFi difícilmente volverá a los altos niveles de TVL de 2021, y las stablecoins se concentrarán aún más.

ChainNewsAbmediahace8h

Economista Jefe de Circle Propone Elevar las Tasas de USDC en Aave Ante el Incumplimiento de KelpDAO

Mensaje de Gate News, 23 de abril — Gordon Liao, economista jefe de Circle, ha propuesto esta semana elevar los parámetros de préstamo de USDC en Aave v3 Ethereum Core tras un exploit de KelpDAO rsETH por valor de $292 millones que desencadenó una crisis de liquidez en todo el protocolo. La Solicitud de Comentarios de Liao sugiere aumentar "S

GateNewshace9h
Comentar
0/400
Sin comentarios