Siempre he utilizado GitHub Copilot para revisar PR, después de todo, GitHub lo ejecuta automáticamente y parece que no es de pago.
Pero en las últimas revisiones, empecé a cuestionar si realmente “entiende” lo que está viendo.
Por ejemplo, un problema muy básico: todavía considera que 1.82.0 es mayor que 1.91.1, lo cual es un error típico de los modelos antiguos en la comparación de versiones.
Si esto fuera un problema del modelo, también consideraría que rust 1.91.1 aún no ha sido lanzado, lo que revela que la capacidad de búsqueda y evaluación del estado real del agente tampoco es muy buena.
Otro problema mayor es: la revisión de Copilot claramente se realiza por archivo.
Revisar el estilo de código y las condiciones límite está bien, pero carece de una perspectiva global. Por ejemplo, en un PR, el agente calculó mal la ruta relativa y duplicó el mismo archivo varias veces, en realidad solo una versión era efectiva — ni siquiera detectó este problema, y ni siquiera se interesó en lo que la issue original del PR requería.
En mi opinión, un agente de revisión de código competente debería primero hacer una evaluación global:
¿El PR cumple con la issue?, ¿se ajusta a los objetivos del proyecto?, ¿la estructura y distribución de archivos son razonables?, y solo después revisar la sintaxis y los detalles.
Recientemente, estoy preparando para agregar un modo de revisión a holon. ¿Realmente están usando un agente de revisión ahora? ¿Qué usan generalmente?
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Siempre he utilizado GitHub Copilot para revisar PR, después de todo, GitHub lo ejecuta automáticamente y parece que no es de pago.
Pero en las últimas revisiones, empecé a cuestionar si realmente “entiende” lo que está viendo.
Por ejemplo, un problema muy básico: todavía considera que 1.82.0 es mayor que 1.91.1, lo cual es un error típico de los modelos antiguos en la comparación de versiones.
Si esto fuera un problema del modelo, también consideraría que rust 1.91.1 aún no ha sido lanzado, lo que revela que la capacidad de búsqueda y evaluación del estado real del agente tampoco es muy buena.
Otro problema mayor es: la revisión de Copilot claramente se realiza por archivo.
Revisar el estilo de código y las condiciones límite está bien, pero carece de una perspectiva global. Por ejemplo, en un PR, el agente calculó mal la ruta relativa y duplicó el mismo archivo varias veces, en realidad solo una versión era efectiva — ni siquiera detectó este problema, y ni siquiera se interesó en lo que la issue original del PR requería.
En mi opinión, un agente de revisión de código competente debería primero hacer una evaluación global:
¿El PR cumple con la issue?, ¿se ajusta a los objetivos del proyecto?, ¿la estructura y distribución de archivos son razonables?, y solo después revisar la sintaxis y los detalles.
Recientemente, estoy preparando para agregar un modo de revisión a holon.
¿Realmente están usando un agente de revisión ahora? ¿Qué usan generalmente?