Es una técnica que mejora la búsqueda por vectores. En lugar de convertir directamente una consulta de usuario en un embedding, primero se le pide a un LLM que genere un ""documento hipotético"" que sería la respuesta perfecta a esa consulta. Luego, se utiliza el embedding de este documento hipotético para realizar la búsqueda. Esto optimiza el equilibrio entre la creatividad generativa y la exactitud factual, ya que la búsqueda se realiza con un embedding mucho más rico y contextualizado que el de la consulta original.