¿Por qué el optimizador GCC 6 mejorado rompe el código C ++ práctico?

148
boot4life 2016-04-28 04:45.

GCC 6 tiene una nueva función de optimizador : asume que thisno siempre es nulo y optimiza en base a eso.

La propagación del rango de valores ahora asume que este puntero de las funciones miembro de C ++ no es nulo. Esto elimina las comprobaciones comunes de puntero nulo, pero también rompe algunas bases de código no conformes (como Qt-5, Chromium, KDevelop) . Como solución temporal, se puede utilizar -fno-delete-null-pointer-checks. Se puede identificar un código incorrecto usando -fsanitize = undefined.

El documento de cambios claramente dice que esto es peligroso porque rompe una cantidad sorprendente de código de uso frecuente.

¿Por qué esta nueva suposición rompería el código C ++ práctico? ¿Existen patrones particulares en los que programadores descuidados o desinformados se basan en este comportamiento indefinido en particular? No puedo imaginarme a nadie escribiendo if (this == NULL)porque eso es muy antinatural.

4 answers

87
jtlim 2016-04-28 05:03.

Supongo que la pregunta que debe responderse es por qué personas bien intencionadas escribirían los cheques en primer lugar.

El caso más común es probablemente si tiene una clase que es parte de una llamada recursiva que ocurre naturalmente.

Si tuvieras:

struct Node
{
    Node* left;
    Node* right;
};

en C, podrías escribir:

void traverse_in_order(Node* n) {
    if(!n) return;
    traverse_in_order(n->left);
    process(n);
    traverse_in_order(n->right);
}

En C ++, es bueno hacer de esto una función miembro:

void Node::traverse_in_order() {
    // <--- What check should be put here?
    left->traverse_in_order();
    process();
    right->traverse_in_order();
}

En los primeros días de C ++ (antes de la estandarización), se enfatizó que las funciones miembro eran azúcar sintáctico para una función donde el thisparámetro está implícito. El código fue escrito en C ++, convertido a C equivalente y compilado. Incluso hubo ejemplos explícitos de que comparar thiscon null era significativo y el compilador original de Cfront también aprovechó esto. Entonces, viniendo de un fondo C, la opción obvia para la verificación es:

if(this == nullptr) return;      

Nota: Bjarne Stroustrup incluso menciona que las reglas para thishan cambiado a lo largo de los años aquí.

Y esto funcionó en muchos compiladores durante muchos años. Cuando ocurrió la estandarización, esto cambió. Y más recientemente, los compiladores comenzaron a aprovechar la llamada a una función miembro donde thisbeing nullptres un comportamiento indefinido, lo que significa que esta condición es siempre false, y el compilador es libre de omitirla.

Eso significa que para hacer cualquier recorrido de este árbol, debe:

  • Haga todas las comprobaciones antes de llamar traverse_in_order

    void Node::traverse_in_order() {
        if(left) left->traverse_in_order();
        process();
        if(right) right->traverse_in_order();
    }
    

    Esto significa también verificar en CADA sitio de llamadas si puede tener una raíz nula.

  • No uses una función miembro

    Esto significa que está escribiendo el antiguo código de estilo C (tal vez como un método estático) y llamándolo con el objeto explícitamente como parámetro. p.ej. ha vuelto a escribir en Node::traverse_in_order(node);lugar de node->traverse_in_order();al sitio de la llamada.

  • Creo que la forma más fácil / ordenada de arreglar este ejemplo en particular de una manera que cumpla con los estándares es usar un nodo centinela en lugar de un nullptr.

    // static class, or global variable
    Node sentinel;
    
    void Node::traverse_in_order() {
        if(this == &sentinel) return;
        ...
    }
    

Ninguna de las dos primeras opciones parece tan atractiva, y aunque el código podría salirse con la suya, escribieron código incorrecto en this == nullptrlugar de usar una solución adecuada.

Supongo que así es como algunas de estas bases de código evolucionaron para tener this == nullptrverificaciones.

65
Unslander Monica 2016-04-28 04:58.

Lo hace porque el código "práctico" estaba roto e implicaba un comportamiento indefinido para empezar. No hay ninguna razón para usar un valor nulo this, salvo como microoptimización, generalmente una muy prematura.

Es una práctica peligrosa, ya que el ajuste de punteros debido al recorrido de la jerarquía de clases puede convertir un nulo thisen uno no nulo. Entonces, como mínimo, la clase cuyos métodos se supone que funcionan con un valor nulo thisdebe ser una clase final sin una clase base: no puede derivar de nada y no puede derivarse de. Estamos pasando rápidamente de lo práctico a lo feo .

En términos prácticos, el código no tiene por qué ser feo:

struct Node
{
  Node* left;
  Node* right;
  void process();
  void traverse_in_order() {
    traverse_in_order_impl(this);
  }
private:
  static void traverse_in_order_impl(Node * n)
    if (!n) return;
    traverse_in_order_impl(n->left);
    n->process();
    traverse_in_order_impl(n->right);
  }
};

Si tenía un árbol vacío (por ejemplo, root es nullptr), esta solución aún se basa en un comportamiento indefinido al llamar a traverse_in_order con un nullptr.

Si el árbol está vacío, también conocido como nulo Node* root, no se supone que debe llamar a ningún método no estático en él. Período. Está perfectamente bien tener un código de árbol similar a C que toma un puntero de instancia mediante un parámetro explícito.

El argumento aquí parece reducirse a la necesidad de escribir métodos no estáticos en objetos que podrían llamarse desde un puntero de instancia nula. No hay tal necesidad. La forma C-with-objects de escribir dicho código sigue siendo mucho más agradable en el mundo de C ++, porque al menos puede ser seguro para los tipos. Básicamente, el nulo thises una micro-optimización, con un campo de uso tan estrecho, que rechazarlo está perfectamente bien en mi humilde opinión. Ninguna API pública debería depender de un valor nulo this.

35
eerorika 2016-04-28 05:12.

El documento de cambios claramente dice que esto es peligroso porque rompe una cantidad sorprendente de código de uso frecuente.

El documento no lo llama peligroso. Tampoco afirma que rompa una cantidad sorprendente de código . Simplemente señala algunas bases de código populares que, según afirma, se basan en este comportamiento indefinido y se romperían debido al cambio a menos que se use la opción de solución alternativa.

¿Por qué esta nueva suposición rompería el código C ++ práctico?

Si el código práctico de C ++ se basa en un comportamiento indefinido, los cambios en ese comportamiento indefinido pueden romperlo. Esta es la razón por la que se debe evitar la UB, incluso cuando un programa que se basa en ella parece funcionar como se esperaba.

¿Existen patrones particulares en los que programadores descuidados o desinformados se basan en este comportamiento indefinido en particular?

No sé si es un anti- patrón generalizado, pero un programador desinformado podría pensar que pueden arreglar su programa para que no se bloquee haciendo:

if (this)
    member_variable = 42;

Cuando el error real es eliminar la referencia a un puntero nulo en otro lugar.

Estoy seguro de que si el programador está lo suficientemente desinformado, podrá crear patrones (anti) más avanzados que se basen en esta UB.

No puedo imaginarme a nadie escribiendo if (this == NULL)porque eso es muy antinatural.

Puedo.

25
Jonathan Wakely 2016-04-29 03:47.

Parte del código "práctico" (forma divertida de deletrear "buggy") que se rompió se veía así:

void foo(X* p) {
  p->bar()->baz();
}

y se olvidó de tener en cuenta el hecho de que a p->bar()veces devuelve un puntero nulo, lo que significa que desreferenciarlo para llamar baz()no está definido.

No todo el código que se rompió contenía explícita if (this == nullptr)o if (!p) return;cheques. Algunos casos eran simplemente funciones que no tenían acceso a ninguna variable miembro, por lo que parecían funcionar bien. Por ejemplo:

struct DummyImpl {
  bool valid() const { return false; }
  int m_data;
};
struct RealImpl {
  bool valid() const { return m_valid; }
  bool m_valid;
  int m_data;
};

template<typename T>
void do_something_else(T* p) {
  if (p) {
    use(p->m_data);
  }
}

template<typename T>
void func(T* p) {
  if (p->valid())
    do_something(p);
  else 
    do_something_else(p);
}

En este código, cuando llama func<DummyImpl*>(DummyImpl*)con un puntero nulo, hay una desreferencia "conceptual" del puntero a llamar p->DummyImpl::valid(), pero de hecho esa función miembro simplemente regresa falsesin acceder *this. Eso return falsepuede estar en línea y, por lo tanto, en la práctica, no es necesario acceder al puntero en absoluto. Entonces, con algunos compiladores parece funcionar bien: no hay una segfault para desreferenciar nulos, p->valid()es falso, por lo que el código llama do_something_else(p), que busca punteros nulos, por lo que no hace nada. No se observa ningún accidente o comportamiento inesperado.

Con GCC 6 todavía recibe la llamada a p->valid(), pero el compilador ahora infiere de esa expresión que pdebe ser no nula (de lo contrario p->valid(), sería un comportamiento indefinido) y toma nota de esa información. El optimizador usa esa información inferida de modo que si la llamada a do_something_else(p)se inserta, la if (p)verificación ahora se considera redundante, porque el compilador recuerda que no es nulo, por lo que inserta el código para:

template<typename T>
void func(T* p) {
  if (p->valid())
    do_something(p);
  else {
    // inlined body of do_something_else(p) with value propagation
    // optimization performed to remove null check.
    use(p->m_data);
  }
}

Esto ahora realmente elimina la referencia a un puntero nulo, por lo que el código que anteriormente parecía funcionar deja de funcionar.

En este ejemplo, el error está en func, que debería haber verificado nulo primero (o las personas que llaman nunca deberían haberlo llamado con nulo):

template<typename T>
void func(T* p) {
  if (p && p->valid())
    do_something(p);
  else 
    do_something_else(p);
}

Un punto importante para recordar es que la mayoría de las optimizaciones como esta no son un caso en el que el compilador diga "ah, el programador probó este puntero contra nulo, lo eliminaré solo por molestar". Lo que sucede es que varias optimizaciones corrientes, como la propagación del rango de valores y la alineación, se combinan para hacer que esas verificaciones sean redundantes, porque vienen después de una verificación anterior o una desreferencia. Si el compilador sabe que un puntero no es nulo en el punto A de una función, y el puntero no se cambia antes de un punto posterior B en la misma función, entonces sabe que también es no nulo en B. Cuando ocurre la inserción los puntos A y B pueden ser en realidad fragmentos de código que originalmente estaban en funciones separadas, pero ahora se combinan en un solo fragmento de código, y el compilador puede aplicar su conocimiento de que el puntero no es nulo en más lugares. Esta es una optimización básica, pero muy importante, y si los compiladores no lo hicieran, el código diario sería considerablemente más lento y la gente se quejaría de las ramas innecesarias para volver a probar las mismas condiciones repetidamente.

MORE COOL STUFF

La estrella de HGTV, Christina Hall, revela que tiene 'envenenamiento por mercurio y plomo' probablemente por voltear 'casas asquerosas'

La estrella de HGTV, Christina Hall, revela que tiene 'envenenamiento por mercurio y plomo' probablemente por voltear 'casas asquerosas'

La estrella de HGTV, Christina Hall, revela que le diagnosticaron envenenamiento por mercurio y plomo, probablemente debido a su trabajo como manipuladora de casas.

La estrella de 'Love Is Blind' Brennon Lemieux responde a los cargos de violencia doméstica

La estrella de 'Love Is Blind' Brennon Lemieux responde a los cargos de violencia doméstica

Recientemente salió a la luz un informe policial que acusa a la estrella de 'Love Is Blind', Brennon, de violencia doméstica. Ahora, Brennon ha respondido a los reclamos.

Wynonna Judd se dio cuenta de que ahora es la matriarca de la familia Judd en un momento festivo de pánico

Wynonna Judd se dio cuenta de que ahora es la matriarca de la familia Judd en un momento festivo de pánico

Conozca cómo Wynonna Judd se dio cuenta de que ahora es la matriarca de la familia mientras organizaba la primera celebración de Acción de Gracias desde que murió su madre, Naomi Judd.

Experto en lenguaje corporal explica los 'paralelos' entre Kate Middleton y la princesa Diana

Experto en lenguaje corporal explica los 'paralelos' entre Kate Middleton y la princesa Diana

Descubra por qué un destacado experto en lenguaje corporal cree que es fácil trazar "tales paralelismos" entre la princesa Kate Middleton y la princesa Diana.

Los láseres arrojan luz sobre por qué necesita cerrar la tapa antes de descargar

Los láseres arrojan luz sobre por qué necesita cerrar la tapa antes de descargar

Los inodoros arrojan columnas de aerosol invisibles con cada descarga. ¿Como sabemos? La prueba fue capturada por láseres de alta potencia.

The Secrets of Airline Travel Quiz

The Secrets of Airline Travel Quiz

Air travel is far more than getting from point A to point B safely. How much do you know about the million little details that go into flying on airplanes?

Where in the World Are You? Take our GeoGuesser Quiz

Where in the World Are You? Take our GeoGuesser Quiz

The world is a huge place, yet some GeoGuessr players know locations in mere seconds. Are you one of GeoGuessr's gifted elite? Take our quiz to find out!

¿Caduca el repelente de insectos?

¿Caduca el repelente de insectos?

¿Sigue siendo efectivo ese lote de repelente de insectos que te quedó del verano pasado? Si es así, ¿por cuánto tiempo?

Se revela la estatua de Godzilla más nueva de Tokio

Se revela la estatua de Godzilla más nueva de Tokio

Anteriormente, Kotaku informó que un hotel Godzilla se estaba abriendo en Tokio este abril. Junto al hotel, estaba programada la aparición de una enorme cabeza de 'Zilla, pero todo lo que hemos visto fueron imágenes conceptuales computarizadas.

El alcalde de Chicago realmente quiere que Elon Musk perfore un túnel debajo de la ciudad

El alcalde de Chicago realmente quiere que Elon Musk perfore un túnel debajo de la ciudad

Foto: Getty Desde que lanzó The Boring Company hace un año, Elon Musk ha mencionado varios sitios de construcción posibles para el negocio de perforación de túneles y ha descartado una vaga referencia a una aprobación gubernamental "verbal" para un túnel Hyperloop que conecta la ciudad de Nueva York y Washington. , CC. Pero ahora sabemos que al menos un alcalde quiere que Musk perfore un agujero debajo de su ciudad.

Ponle una tapa. En realidad, ponle una tapa a todo. Consigue 12 tapas de cocina elásticas de silicona por $14. [Exclusivo]

Ponle una tapa. En realidad, ponle una tapa a todo. Consigue 12 tapas de cocina elásticas de silicona por $14. [Exclusivo]

Tapas elásticas de silicona de Tomorrow's Kitchen, paquete de 12 | $14 | Amazonas | Código promocional 20OFFKINJALids son básicamente los calcetines de la cocina; siempre perdiéndose, dejando contenedores huérfanos que nunca podrán volver a cerrarse. Pero, ¿y si sus tapas pudieran estirarse y adaptarse a todos los recipientes, ollas, sartenes e incluso frutas en rodajas grandes que sobran? Nunca más tendrás que preocuparte por perder esa tapa tan específica.

Cuéntanos tus mejores trucos de Washington, DC

Cuéntanos tus mejores trucos de Washington, DC

Hemos pirateado algunas ciudades industriales en esta columna, como Los Ángeles y Las Vegas. Ahora es el momento de una ciudad militar-industrial-compleja.

Patinaje artístico de EE. UU. 'frustrado' por falta de decisión final en evento por equipos, pide una decisión justa

Patinaje artístico de EE. UU. 'frustrado' por falta de decisión final en evento por equipos, pide una decisión justa

El equipo está a la espera de las medallas que ganó en los Juegos Olímpicos de Invierno de 2022 en Beijing, ya que se está resolviendo un caso de dopaje que involucra a la patinadora artística rusa Kamila Valieva.

Los compradores de Amazon dicen que duermen 'como un bebé mimado' gracias a estas fundas de almohada de seda que cuestan tan solo $ 10

Los compradores de Amazon dicen que duermen 'como un bebé mimado' gracias a estas fundas de almohada de seda que cuestan tan solo $ 10

Miles de compradores de Amazon recomiendan la funda de almohada de seda Mulberry, y está a la venta en este momento. La funda de almohada de seda viene en varios colores y ayuda a mantener el cabello suave y la piel clara. Compre las fundas de almohada de seda mientras tienen hasta un 46 por ciento de descuento en Amazon

Se busca al corredor de los Bengals Joe Mixon por orden de arresto emitida por presuntamente apuntar con un arma de fuego a una mujer

Se busca al corredor de los Bengals Joe Mixon por orden de arresto emitida por presuntamente apuntar con un arma de fuego a una mujer

El jueves se presentó una denuncia de delito menor amenazante agravado contra Joe Mixon.

Profesor de la Universidad de Purdue arrestado por presuntamente traficar metanfetamina y proponer favores sexuales a mujeres

Profesor de la Universidad de Purdue arrestado por presuntamente traficar metanfetamina y proponer favores sexuales a mujeres

El Departamento de Policía de Lafayette comenzó a investigar a un profesor de la Universidad de Purdue en diciembre después de recibir varias denuncias de un "hombre sospechoso que se acercaba a una mujer".

Concept Drift: el mundo está cambiando demasiado rápido para la IA

Concept Drift: el mundo está cambiando demasiado rápido para la IA

Al igual que el mundo que nos rodea, el lenguaje siempre está cambiando. Mientras que en eras anteriores los cambios en el idioma ocurrían durante años o incluso décadas, ahora pueden ocurrir en cuestión de días o incluso horas.

India me está pateando el culo

India me está pateando el culo

Estoy de vuelta por primera vez en seis años. No puedo decirte cuánto tiempo he estado esperando esto.

ℝ

“And a river went out of Eden to water the garden, and from thence it was parted and became into four heads” Genesis 2:10. ? The heart is located in the middle of the thoracic cavity, pointing eastward.

¿Merrick Garland le ha fallado a Estados Unidos?

Es más de la mitad de la presidencia de Biden. ¿Qué está esperando Merrick Garland?

¿Merrick Garland le ha fallado a Estados Unidos?

Creo, un poco tarde en la vida, en dar oportunidades a la gente. Generosamente.

Language