lemelisk Oct 22 2014 at 15:33

Персистентная очередь

17 min

26K

Вдохновившись недавней публикацией «Персистентное декартово дерево по неявному ключу», решил написать про реализацию персистентной очереди. Те, кто подумал сейчас, что раз обычная очередь — структура тривиальная, то и её персистентный вариант должен быть очень простым, ошиблись, получающаяся реализация как минимум не проще, чем для вышеуказанного дерева.

Постановка задачи

Реализовывать мы будем, естественно, так называемую полную персистентность — это значит, что промежуточные версии доступны не только в режиме read-only и мы можем в любой момент времени добавлять и извлекать из них элементы. Кроме того, нам, конечно, хотелось бы иметь такую же асимптотику времени работы и дополнительной памяти, как и для неперсистентного варианта, а именно O(n), где n — суммарное количество операций, совершаемых с нашей очередью. К слову, если ослабить требования до O(n log n), то очередь тривиально эмулируется с помощью персистентного декартового дерева по неявному ключу.

Примем следующий простой интерфейс работы с нашей структурой данных: получающиеся в результате запросов версии очередей будем нумеровать целыми неотрицательными числами, изначально имеется лишь пустая очередь под номером 0. Пусть у нас есть N версий очередей (включая исходную пустую), тогда они занумерованы числами от 0 до N-1 и мы можем выполнить следующие четыре запроса:

empty(query_id) — проверяет пуста ли очередь c заданным номером;
front(query_id) — возвращает первый элемент очереди, сама же очередь при этом никак не изменяется и никаких новых очередей не создается. Операция допустима, если очередь не пуста;
push(query_id, new_element) — создает новую очередь под номером N, получающуюся дописыванием в конец к исходной нового элемента. Старая версия при этом по-прежнему доступна под номером query_id;
pop(query_id) — создает новую очередь под номером N, получающуюся извлечением из исходной первого элемента. Исходная очередь все также доступна под старым номером. В случае, если исходная очередь была пуста, новая также будет пустой.

Имитация очереди с помощью стеков

For every problem there is a solution which is simple, fast, and wrong.
— The First Law of Online Judges

Как известно, персистентный стек — очень простая структура данных и асимптотика у него та, что нам и нужна. Кроме того, мы знаем, что очередь можно имитировать с помощью двух стеков. Возникает очевидная идея: сделаем эти два стека персистентными и задача решена! К сожалению, такой простой подход не сработает. Все дело в том, что при данной имитации у нас не всякая операция имеет асимптотику O(1): если при pop’е стек, из которого мы достаем элементы, оказывается пустым, то мы перекладываем в него все элементы из другого стека. В случае с обычным очередью каждый элемент перекладывается только один раз, поэтому суммарная асимптотика остается O(n), но в персистентном случае каждый элемент может принадлежать многим очередям и соответственно быть переложен несколько раз. Пусть, например, q — номер очереди, у которой этот стек пустой, тогда после push(q, 1) и push(q, 2) у полученных очередей этот стек останется пустым и при pop’е из них каждый элемент очереди q будет переложен по два раза. Организовать же какое-либо совместное использование переложенных элементов невозможно в силу того, что самые нижние элементы у полученных перекладыванием стеков будут различны (1 и 2 соотвественно), а персистентный стек устроен таким образом, что каждый элемент хранит указатель на элемент, лежащий ниже его, поэтому в любом случае мы будем вынуждены иметь 2 копии предпоследнего элемента, которые будут указывать на соответствующий последний, а значит и 2 копии предпредпоследнего, чтобы указывать на нужный предпоследний и так далее по цепочке.

Тем не менее существует алгоритм, основанный на такой идее (имитации очереди с помощью двух стеков), гарантирующий, что стек, из которого мы достаем при pop’e, никогда не окажется пустым и использующий для обеспечения этого 6 стеков. Мой же алгоритм эту идею в явном виде не использует, хотя при общие моменты, конечно, найти можно.

Описание алгоритма

Попытаемся использовать ту же структуру, что и при реализации персистентного стека: будем хранить добавляемые элементы в виде дерева (точнее говоря, набора деревьев — леса), в каждой вершине будет лежать добавленный элемент и указатель на предшествующий ему в очереди (точнее, на соответствующую этому предшествующему элементу вершину дерева). Говоря в дальнейшем элемент очереди, я часто буду подразумевать именно соответствующую элементу вершину.

Непустая очередь в таком случае может быть представлена парой указателей на первый и последний элемент очереди, причем вершина, соответствующая первому элементу, обязательно будет предком вершины, соответствующей последнему (ну или совпадать с ней в случае очереди из одного элемента). Пример такой структуры и отображения в ней очереди:

Заметим, что операция push просто создает новую вершину, устанавливая ей в качестве родителя последний элемент исходной очереди (либо она становится новым корнем, если добавляли в пустую), а операция pop наш лес вообще не трогает, просто сдвигает указатель на первый элемент. Тем самым, после создания вершина остается неизменной до конца работы и можно не переживать, что новые операции могут каким-либо образом испортить уже существующие очереди.

Наша единственная проблема при таком подходе – это реализация операции pop (остальные три — тривиальны), непонятно, как определить на какую вершину сдвинуть указатель на первый элемент, ведь для вершины мы храним лишь указатель на родителя, но не на сыновей (коих у одной вершины может быть несколько штук, и, даже если их все хранить, совершенно неясно, какой из них соответствует следующему элементу нашей очереди). Поэтому для каждой очереди, в которой больше двух элементов, будем дополнительно хранить указатель на элемент некоторого односвязного списка, такого, что элемент списка по нашему указателю содержит указатель на второй элемент нашей очереди, а элементы, лежащие ниже его по списку, указатели на третий, четвертый и так далее соответственно. Имея такой указатель для исходной очереди, при выполнении pop'а нам не составит теперь труда определить новую голову очереди, а указатель на такой элемент списка для получившейся очереди – это просто указатель на следующий элемент в данном списке.

Однако, по причинам, аналогичным тем, по которым эмуляция очереди двумя стеками не работает, добиться того, чтобы для каждой очереди ниже по списку лежали абсолютно все её промежуточные вершины, у нас не выйдет, поэтому, пускай, в нем будут лежать только сколько-то первых из них, а мы, когда этот список начнет становиться слишком маленьким, будем строить новый список, продвигаясь шаг за шагом (то есть увеличивая строящийся список на 1 элемент с каждой операцией push или pop) с конца очереди в начало, идя по указателям на родителей вершин нашего дерева и стараясь, чтобы к моменту, когда старый список закончится, у нас уже был новый наготове.

Говоря более формально, для каждой очереди помимо указателей на начало и конец и указателя на элемент уже готового списка будем хранить ещё и указатель на элемент строящегося списка (в случае, если мы ничего не строим, он будет равен 0) и вычислять его значение для новой очереди (полученной после применения к исходной push’a или pop’a) по следующему простому алгоритму:

если у исходной очереди данный указатель был равен 0, проверим, не пора ли нам начать строить новый список (критерий такой проверки будет описан чуть ниже):
- если пора, то создаем элемент списка с нулевым указателем на следующий по списку (тем самым этот созданный элемент будет концом конструируемого списка), а указатель на вершину ставим на предпоследний элемент нашей очереди (родителя последнего элемента),
- если ещё не время, то указатель оставляем равным нулю.
В случае же ненулевого исходного указателя, достроим наш список вверх на один элемент: создадим новый элемент, указывающий на исходный в качестве следующего по списку и на родителя соответствующей этому исходному элементу вершины.

При этом ни сам исходный элемент списка, ни указатель на него, хранящийся для исходной очереди, мы менять не будем, и вообще, у нас все данные (вершины дерева, элементы списков, данные, хранящиеся для очередей) будут иммутабельны (то есть после создания никогда не будут менять своего значения). Изображение того, как это всё устроено и что происходит при push’e или pop’e, можно увидеть на схеме (сделать её более понятной не получилось, сколько ни старался):

Соответственно, если при достройке списка мы доходим до первого промежуточного элемента, то конструирование для этой очереди завершено (при этом какие-то другие очереди могут продолжать достраивать этот список, но так как старые элементы никогда не меняются, нам это никак не навредит). В таком случае на место указателя на элемент старого списка записываем указатель на элемент нового, а указатель на конструируемый список присваиваем нулю.

Из описания алгоритма видно, что при выполнении каждого запроса мы создаем не более одной новой вершины дерева и не более одного нового элемента списка и тратим на выполнение O(1) времени, то есть асимптотика та, которой мы и добивались, и осталось лишь обсудить правильный критерий.

Критерий проверки на начало конструирования

Будем действовать следующим образом: пока размер нашего списка больше либо равен 1/2 от количества промежуточных вершин (то есть вершин без первой и последней), мы ничего не предпринимаем, как только станет меньше, начинаем конструировать новый. Заметим, что если промежуточных вершин нет, то мы имеем неравенство 0 ≥ 0 и ничего не делаем, то есть в особый случай это выделять не нужно. Докажем, что при таком подходе мы никогда не окажемся в ситуации, когда старый список кончился, а новый ещё не готов.

Для начала докажем следующий инвариант: если мы конструируем новый список, то на каждом шаге 2k + l = s, где k — количество элементов в старом списке, l — в конструируемом (после уже выполненной на этом шагу достройки), s — суммарное количество промежуточных элементов. Доказывать будем методом математической индукции. Рассмотрим первый шаг, когда мы только начали конструирование (l = 1). Заметим, что для новой очереди 2k – s < 0 (наш критерий), однако для исходной 2k_old – s_old ≥ 0. Посмотрим, как такое могло случиться: если наша операция push, то k = k_old, а s = s_old + 1, а если pop, то k = k_old – 1 и s = s_old – 1. Как нетрудно заметить, в обоих случаях 2k – s меньше 2k_old – s_old ровно на единицу и, так как обе разности — целые числа, значит, вторая из них 0, а первая -1, следовательно, 2k + 1 = s, а наше l как раз единица и есть. База индукции доказана. Докажем переход: пусть на каком-то шаге конструирования 2k_old + l_old = s_old. Тогда l = l_old + 1 (достроили список на 1 элемент), в случае push’a: k = k_old, s = s_old + 1, в случае pop’a: k = k_old – 1, s = s_old – 1. В обоих случаях равенство выполняется, а значит утверждение доказано.

Предположим теперь, что мы делаем операцию pop, а у исходной очереди нужный нам список пустой (при push’е мы этот список никак не используем). Тогда может быть одно из двух:

либо для исходной очереди мы конструирование нового списка не начинали, тогда у этой очереди 2k ≥ s,
k = 0 => s = 0, а значит, это очередь размером 0, 1 или 2 и знания её последнего элемента для совершения pop’a достаточно,
либо начинали, тогда l ≠ 0, в силу инварианта 2k + l = s, k = 0 => l = s ≠ 0 => конструируемый список был непуст и содержал все промежуточные элементы, а значит, мы должны были произвести на том шаге замену и получить непустой список.

Осталось лишь доказать, что, когда мы заканчиваем конструирование, условие отсутствия конструирования выполняется, то есть длина получившегося списка не меньше 1/2 от общего количества промежуточных вершин, иными словами, что в момент завершения 2l ≥ s или, что равносильно, l ≥ s – l. Но что такое s – l? Это количество промежуточных вершин, которые не содержатся в нашем списке. Нетрудно понять, что оно равно количеству операций push, произошедших в процессе конструирования. Однако при каждой такой операции количество элементов в нашем списке также увеличивалось на 1 (возможна ситуация, когда на предыдущем шаге элемент конструируемого списка соответствует третьему по счету элементу очереди и мы делаем pop, тогда для новой очереди элемент списка начинает соответствовать первому промежуточному элементу сразу без достройки, но такое возможно только на последнем шаге конструирования и только при операции pop). Поэтому l ≥ количества таких push’ей (не трудно понять, что даже строго больше), что нам и требовалось доказать.

Для наглядности, продемонстрируем, что происходит в двух крайних случаях: когда мы все время выполняем pop и когда все время push'им:

Реализация на С++

Напоследок приведу реализацию вышеописанной структуры данных на языке С++ (при реализации используются нововведения С++11). Стоит воспринимать этот код в качестве прототипа, я старался написать его как можно проще и короче, жертвуя всем остальным в угоду этому.

persistent_queue.h

#ifndef PERSISTENT_QUEUE_H
#define PERSISTENT_QUEUE_H

#include <cstdlib>
#include <vector>

using Element_type = int;

class Persistent_queue {
	public:
		Persistent_queue();
		~Persistent_queue();
		Persistent_queue(const Persistent_queue&) = delete;
		Persistent_queue& operator =(const Persistent_queue&) = delete;

		using Queue_id = size_t;
		static const Queue_id start_queue_id = 0;
		Queue_id push(Queue_id queue_id, const Element_type& value);
		Queue_id pop(Queue_id queue_id);
		const Element_type& front(Queue_id queue_id);
		size_t size(Queue_id queue_id);
		bool empty(Queue_id queue_id);
	private:
		struct TreeNode;
		struct QueueIntermediateTreeNodeList;
		struct Queue {
			const TreeNode* const first;
			const TreeNode* const last;
			const size_t size;
			const QueueIntermediateTreeNodeList* const known_intermediate_list;
			const QueueIntermediateTreeNodeList* const constructing_intermediate_list;
			const bool own_last;
			const bool own_known_intermediate_list;

			Queue(const TreeNode* const first, const TreeNode* const last, const size_t size,
				const QueueIntermediateTreeNodeList* const known_intermediate_list,
				const QueueIntermediateTreeNodeList* const constructing_intermediate_list,
				const bool own_last, const bool own_known_intermediate_list);
			~Queue() = default;
			Queue(Queue&& source) = default; // needed for vector reallocation
			Queue(const Queue&) = delete;
			Queue& operator =(const Queue&) = delete;
		};
		std::vector<Queue> queues_;
		Queue_id register_new_queue(const TreeNode* const first, const TreeNode* const last,
			const size_t size,
			const QueueIntermediateTreeNodeList* const known_intermediate_list,
			const QueueIntermediateTreeNodeList* const constructing_intermediate_list,
			const bool own_last, const bool own_known_intermediate_list);
		void manage_intermediate_lists(const QueueIntermediateTreeNodeList*& known_intermediate_list,
			const QueueIntermediateTreeNodeList*& constructing_intermediate_list,
			bool& own_known_intermediate_list, const TreeNode* const first, const TreeNode* const last,
			const size_t size);
};

#endif // PERSISTENT_QUEUE_H

persistent_queue.cpp

#include "persistent_queue.h"
#include <cassert>

struct Persistent_queue::TreeNode {
	const TreeNode* const parent;
	const Element_type element;

	TreeNode(const TreeNode* const parent, const Element_type& value)
		: parent(parent), element(value) {}
	~TreeNode() = default;

	TreeNode(const TreeNode&) = delete;
	TreeNode& operator =(const TreeNode&) = delete;
};

struct Persistent_queue::QueueIntermediateTreeNodeList {
	const Persistent_queue::TreeNode* const front;
	const QueueIntermediateTreeNodeList* const next;
	const size_t size;

	QueueIntermediateTreeNodeList(const Persistent_queue::TreeNode* const front,
			const QueueIntermediateTreeNodeList* const tail_list)
		: front(front), next(tail_list), size{tail_list ? tail_list->size + 1 : 1} { assert(front); }
	~QueueIntermediateTreeNodeList() = default;

	QueueIntermediateTreeNodeList(const QueueIntermediateTreeNodeList&) = delete;
	QueueIntermediateTreeNodeList& operator =(const QueueIntermediateTreeNodeList&) = delete;
};



Persistent_queue::Queue::Queue(
	const Persistent_queue::TreeNode* const first, const Persistent_queue::TreeNode* const last,
	const size_t size, const Persistent_queue::QueueIntermediateTreeNodeList* const known_intermediate_list,
	const Persistent_queue::QueueIntermediateTreeNodeList* const constructing_intermediate_list,
	const bool own_last, const bool own_known_intermediate_list
)
	: first(first), last(last), size(size), known_intermediate_list(known_intermediate_list)
	, constructing_intermediate_list(constructing_intermediate_list)
	, own_last(own_last), own_known_intermediate_list(own_known_intermediate_list)
{
	// Some asserts
	if (size == 0) {
		assert(first == nullptr);
		assert(last == nullptr);
	} else {
		assert(first);
		assert(last);
		if (size > 1)
			assert(last->parent);
	}
	if (size <= 2) {
		assert(known_intermediate_list == nullptr);
		assert(constructing_intermediate_list == nullptr);
		if (size == 1)
			assert(first == last);
		if (size == 2)
			assert(first == last->parent);
	} else {
		assert(known_intermediate_list);
		assert(first == known_intermediate_list->front->parent);
	}
}



size_t Persistent_queue::size(const Persistent_queue::Queue_id queue_id)
{
	return queues_.at(queue_id).size;
}

bool Persistent_queue::empty(const Queue_id queue_id)
{
	return size(queue_id) == 0;
}

const Element_type& Persistent_queue::front(const Persistent_queue::Queue_id queue_id)
{
	assert(!empty(queue_id));
	return queues_.at(queue_id).first->element;
}

Persistent_queue::Queue_id
Persistent_queue::register_new_queue(const TreeNode* const first, const TreeNode* const last,
	const size_t size, const QueueIntermediateTreeNodeList* const known_intermediate_list,
	const QueueIntermediateTreeNodeList* const constructing_intermediate_list,
	const bool own_last, const bool own_known_intermediate_list)
{
	queues_.emplace_back(first, last, size, known_intermediate_list, constructing_intermediate_list,
		own_last, own_known_intermediate_list);
	return queues_.size() - 1;
}

Persistent_queue::Persistent_queue()
{
	register_new_queue(nullptr, nullptr, 0, nullptr, nullptr, false, false);
}

Persistent_queue::~Persistent_queue()
{
	for (const auto& q : queues_) {
		if (q.own_last)
			delete q.last;
		if (q.own_known_intermediate_list)
			delete q.known_intermediate_list;
		delete q.constructing_intermediate_list;
	}
}

Persistent_queue::Queue_id
Persistent_queue::push(const Persistent_queue::Queue_id queue_id, const Element_type& value)
{
	const auto& queue_for_push = queues_.at(queue_id);
	const size_t size = queue_for_push.size + 1;
	const bool own_last = true;
	const TreeNode* first;
	const TreeNode* last;
	if (queue_for_push.size == 0) {
		first = last = new TreeNode(nullptr, value);
	} else {
		first = queue_for_push.first;
		last = new TreeNode(queue_for_push.last, value);
	}
	bool own_known_intermediate_list;
	const QueueIntermediateTreeNodeList* known_intermediate_list = queue_for_push.known_intermediate_list;
	const QueueIntermediateTreeNodeList* constructing_intermediate_list =
		queue_for_push.constructing_intermediate_list;
	manage_intermediate_lists(known_intermediate_list, constructing_intermediate_list,
		own_known_intermediate_list, first, last, size);
	return register_new_queue(first, last, size, known_intermediate_list, constructing_intermediate_list,
		own_last, own_known_intermediate_list);
}

Persistent_queue::Queue_id Persistent_queue::pop(const Persistent_queue::Queue_id queue_id)
{
	const auto& queue_for_pop = queues_.at(queue_id);
	const bool own_last = false;
	const TreeNode* first;
	const TreeNode* last;
	size_t size;
	const QueueIntermediateTreeNodeList* known_intermediate_list;
	if (queue_for_pop.size <= 1) {
		first = last = nullptr;
		size = 0;
		known_intermediate_list = nullptr;
	} else {
		last = queue_for_pop.last;
		size = queue_for_pop.size - 1;
		if (queue_for_pop.size == 2) {
			first = queue_for_pop.last;
			known_intermediate_list = nullptr;
		} else {
			assert(queue_for_pop.known_intermediate_list != nullptr);
			first = queue_for_pop.known_intermediate_list->front;
			known_intermediate_list = queue_for_pop.known_intermediate_list->next;
		}
	}
	bool own_known_intermediate_list;
	const QueueIntermediateTreeNodeList* constructing_intermediate_list =
		queue_for_pop.constructing_intermediate_list;
	manage_intermediate_lists(known_intermediate_list, constructing_intermediate_list,
		own_known_intermediate_list, first, last, size);
	return register_new_queue(first, last, size, known_intermediate_list, constructing_intermediate_list,
		own_last, own_known_intermediate_list);
}

void Persistent_queue::manage_intermediate_lists(
	const Persistent_queue::QueueIntermediateTreeNodeList*& known_intermediate_list,
	const Persistent_queue::QueueIntermediateTreeNodeList*& constructing_intermediate_list,
	bool& own_known_intermediate_list, const Persistent_queue::TreeNode* const first,
	const Persistent_queue::TreeNode* const last, const size_t size)
{
	own_known_intermediate_list = false;
	const size_t intermediate_nodes_count = (size > 2 ? size - 2 : 0);
	size_t known_intermediate_list_size =
		(known_intermediate_list ? known_intermediate_list->size : 0);
	if (2*known_intermediate_list_size < intermediate_nodes_count) {
		auto try_to_replace_known_to_constructing = [&](){
			if (constructing_intermediate_list && constructing_intermediate_list->front->parent == first) {
				known_intermediate_list = constructing_intermediate_list;
				known_intermediate_list_size = constructing_intermediate_list->size;
				constructing_intermediate_list = nullptr;
				return true;
			}
			return false;
		};

		if (!try_to_replace_known_to_constructing()) {
			const auto adding_node = (constructing_intermediate_list ?
				constructing_intermediate_list->front->parent : last->parent);
			constructing_intermediate_list = new QueueIntermediateTreeNodeList(
				adding_node, constructing_intermediate_list);
			if (try_to_replace_known_to_constructing())
				own_known_intermediate_list = true;
		}
	}
	// Check invariants
	if (2*known_intermediate_list_size >= intermediate_nodes_count)
		assert(constructing_intermediate_list == nullptr);
	const size_t constructing_intermediate_list_size =
		(constructing_intermediate_list ? constructing_intermediate_list->size : 0);
	const auto invariant_sum = 2*known_intermediate_list_size + constructing_intermediate_list_size;
	assert(invariant_sum >= intermediate_nodes_count);
	if (constructing_intermediate_list)
		assert(invariant_sum == intermediate_nodes_count);
}

Типы TreeNode, Queue и QueueIntermediateTreeNodeList соотвествуют вершине дерева, очереди и элементу односвязного списка из нашего алгоритма. Булевы переменные в Queue используются для корректного освобождения памяти в деструкторе нашего класса: вершину дерева и элемент списка удаляет та очередь, которая их и создавала (как уже было отмечено выше, при каждом запросе создается не больше одной вершины и не больше одного элемента списка). Вершина дерева создается только при операции push и указатель на неё записывается в last, соответственно, own_last указывает, записана ли в last новая или старая вершина. Созданный же при конструировании элемент списка почти всегда записывается в constructing_intermediate_list, кроме случая, когда он был создан и конструирование на этом же шаге закончилось, в таком случае он переносится в known_intermediate_list, а constructing_intermediate_list становится нулем, и вторая булева переменная own_known_intermediate_list служит как раз для идентификации такого случая.

Второй возможно неочевидный момент — это закрытая функция-член manage_intermediate_lists, которая выглядит следующим образом:

void Persistent_queue::manage_intermediate_lists(
	const Persistent_queue::QueueIntermediateTreeNodeList*& known_intermediate_list,
	const Persistent_queue::QueueIntermediateTreeNodeList*& constructing_intermediate_list,
	bool& own_known_intermediate_list, const Persistent_queue::TreeNode* const first,
	const Persistent_queue::TreeNode* const last, const size_t size)
{
	own_known_intermediate_list = false;
	const size_t intermediate_nodes_count = (size > 2 ? size - 2 : 0);
	size_t known_intermediate_list_size =
		(known_intermediate_list ? known_intermediate_list->size : 0);
	if (2*known_intermediate_list_size < intermediate_nodes_count) {
		auto try_to_replace_known_to_constructing = [&](){
			if (constructing_intermediate_list && constructing_intermediate_list->front->parent == first) {
				known_intermediate_list = constructing_intermediate_list;
				known_intermediate_list_size = constructing_intermediate_list->size;
				constructing_intermediate_list = nullptr;
				return true;
			}
			return false;
		};

		if (!try_to_replace_known_to_constructing()) {
			const auto adding_node = (constructing_intermediate_list ?
				constructing_intermediate_list->front->parent : last->parent);
			constructing_intermediate_list = new QueueIntermediateTreeNodeList(
				adding_node, constructing_intermediate_list);
			if (try_to_replace_known_to_constructing())
				own_known_intermediate_list = true;
		}
	}
	// Check invariants
}

Эта функция реализует вышеописанный алгоритм работы с указателем на строящийся список (обратите внимание, первые три параметра передаются по неконстантной ссылке, причем для первых двух предполагается, что переменные по ссылке инициализированы нужными значениями перед вызовом). Важно перед достройкой списка сначала проверять, а не стал ли старый элемент первым промежуточным, потому что, как уже отмечалось, в случае pop'а такой вариант возможен. Может быть кто-то заметил, что мы всегда проверяем на наш критерий начала конструирования:

if (2*known_intermediate_list_size < intermediate_nodes_count) {

не выделяя отдельно случай, когда конструирование уже идет. Дело в том, что во время всего процесса конструирования наш критерий будет оставаться верным, это очевидным образом следует из нашего инварианта конструирования: 2k + l = s, l > 0 => 2k < s.

Возможные оптимизации

Во-первых, как видно на схеме, при совершении нескольких различных операций c одной и той же очередью, для которой идет конструирование (на схеме это операции pop(Q) и push(Q, 11)), создается несколько абсолютно идентичных между собой элементов списка (они указывают на один и тот же следующий элемент и одну и ту же вершину дерева — на схеме это два голубых кружочка с цифрой 7). Мы могли бы попробовать «склеить» такие элементы в один, используя, например, структуру, которая при достраивании говорила бы нам, а не сделал ли уже это кто-то перед нами (в качестве такой структуры можно использовать банальный вектор или двусвязный список). Очевидно, такая оптимизация будет хорошо работать (экономить много памяти) в случае сильно разветвленных деревьев.

Во-вторых, у нас есть ещё одно дублирование: когда элементы готового и строящегося списка указывают на одну и ту же вершину дерева (речь идет о зелёно-оранжевых элементах на этой картинке). Конечно, полностью такого дублирования нам не избежать, потому что у списков вполне может быть одинаковое начало и отличающиеся друг от друга продолжения, однако мы могли бы, когда первый из строящихся списков достигнет конца готового (а не начала очереди) просто «подклеить» его к этому концу, тем самым сэкономив немножко памяти. Для оставшихся списков (соответствующих этому готовому, разумеется) все равно придется дублировать. Тем самым, данная оптимизация лучше всего будут себя проявлять, когда у нас на деревьях много длинных прямых веток.

Наконец в-третьих, можно попробовать поиграть с константами. Например, можно достраивать за шаг не по 1 элементу, а по 2, тогда начинать конструирование достаточно при k < 1/3s. Возможно, это будет как-то полезно.

На этом всё, спасибо всем, кто дочитал.

Tags:

Hubs:

Algorithms