Платформа RunServer для MMO проектов: 2009

вторник, 24 ноября 2009 г.

Тесселяция и дисплейсмент. Часть 2

В этот раз буду краток.

Сделано в Unigine, на Unigine Script. Видео с максимальными настройками в Direct3D 9. FPS был около 65-70 (см. первый кадр), но Fraps его убил. Дисплейсмент происходит программно, без собственных шейдеров, Vertex Texture Fetch и пр. Все алгоритмы и код - моя собственная разработка. В дальнейшем будем использовать эту технологию в наших проектах, а возможно и выпустим отдельную утилиту.
Дальше..

пятница, 20 ноября 2009 г.

Тесселяция и дисплейсмент

Эта тема последнее время довольно популярна. Особенно в связи с выходом DirectX 11 и бенчмарком Unigine Heaven с его поддержкой.

Normal Normal Wireframe Displaced Displaced Wireframe

Как ни странно, на этой картинке не DX 11 и пресловутая реалтайм тесселяция, а DirectX 9 и результат работы оффлайновой утилиты.

Пост обновлен 21.11.09

Утилиту я сделал под влиянием "глобального заговора" - моя 9600GT не поддерживает новомодную тесселяцию, а попытки сделать дисплейсмент в 3dsmax дают деформацию фигуры, море полигонов, и вообще не очень приятный результат.
При тесселяции полигон разбивается на тысячи мелких полигонов, а вершины деформируются по карте высот. Эту часть мы прекрасно можем сделать и без помощи GPU, но тысячи дополнительных полигонов не пойдут на пользу скорости. Задачу я попробовал решать в лоб - оптимизацией полигонов после дисплейсмента.

Сетка модели без оптимизации выглядит примерно так:

Карта высот ~~64х64, 4096 вершин, 8192 полигона~~ 64x128, 8192 вершины, 16002 полигона. Невооруженным глазом заметно, что некоторые полигоны откровенно лишние. С учетом особенностей их расположения, есть широкое поле для оптимизаций.
Постараюсь не углубляться в технические детали. Сам процесс оптимизации в нашей утилите обьединяет соседние полигоны по разным критериям. Различные параметры позволяют задавать детализацию и устранять артефакты. Сама полученная сетка (см. начало поста) довольно далека от идеала - некоторые места слишком сложные, есть "висящие" вершины (примыкание вершины к грани треугольника) и пр. Важен другой факт - в модели двери 980 треугольников, это в 9 раз меньше, чем без оптимизации. Для максимального приблежения это вполне приемлимо, а на удаленных участках можно показывать плоскую текстуру. Моя видеокарта такую нагрузку просто не замечает.
Алгоритм оказалась очень требовательным к карте высот - чем "геометричнее" фигуры, тем меньше получается полигонов. Различные полутона, сглаживания, отверстия, градиенты - все это приводит к лишней полигональности.

Вручную нарисованная карта высот для оконной рамы дает на выходе 112 полигонов. Эту же фигуру в 3д пакете можно нарисовать с 74ю треугольниками. Возможно, если задаться целью или просто наплевать на правила, то можно и поменьше сделать. :) Важно другое - порядок чисел один и тот же, значит технология имеет право на жизнь.

Художники наверняка скажут, что это от лукавого и надо моделировать неровности руками. Это несомненно так, но я редко когда встречал, например, подручную библиотеку дверей, окон, камней - их для каждой модели предпочитают делать заново. В то же время библиотека текстур таких элементов - стандарт, и ничто не мешает хранить в ней еще и карты высот. В таком разрезе добавление дверей и окон сводится к расположению текстуры и нескольким запускам утилиты для генерации разных LODов.
Рано или поздно наступит светлое будущее, у всех будут DirectX 11 совместимые видеокарты, а эти текстуры пригодятся для аппаратного дисплейсмента. Но пока пользуемся тем, что есть :)

Update: Вспомнил, что карта высот для двери имеет соотношение 1/2, т.е. размер 64х128, а не 64х64, а сетка полигонов будет 63х127х2, т.е. 16002 треугольника. После оптимизации - 980, т.е. в 16 раз меньше.

Update 2: Подкрутил некоторые гайки и избавился от полигонов с высотой 0. В самом деле - зачем они нужны, если можно считать дисплейсмент добавлением деталей к существующей модели. Результат - 812 треугольников при таком же внешнем виде. По сравнению с 16002 оригинальными это уже оптимизация в ~19,7 раз, да и сетка довольно хороша.

Update 3: Человек - изворотливое создание. 699 треугольников.

Дальше..

вторник, 17 ноября 2009 г.

Неслучайные неслучайности

При тестировании серверной геометрии мы столкнулись с курьезной проблемой - время формирования случайного вектора было дольше времени расчета видимости этого вектора. Сложив это с постоянными репортами клиентов о сбоях генератора псевдослучайных чисел (повторах при многопоточных вызовах и пр.), я решил изучить этот вопрос поглубже.

Работая в среде Mono для генерации случайных чисел RunServer использует System.Random - есть предпосылки считать, что он базируется на /dev/random, но под .Net и Windows используется другой подход - обращение к системной функции RtlGenRandom, известной также под именем SystemFunction036.
Данная функция должна была гарантировать равномерное распределение случайных чисел, отсутствие повторений, многопоточную безопасность. Практика показала, что это не совсем так, а время вызова функции сравнительно велико.
Как оказалось, проблема была не в самой функции, а в ее использовании: при каждом обращении к классу Utility.Random вызывалась функция с временным буфером 4 байта, в то время как функция рассчитана на генерацию страницы cлучайных чисел. Повторения при многопоточном использовании могут быть вызываны различными внутренними кешированиями.
Я думал было отказаться от этой функции, но решил дать функции еще один шанс - вместо вызова для буфера в 4 байта, я сделал генерацию случайного блока в несколько килобайт и его кеширование. Конечно же, при этом встал вопрос синхронизации: боступ к пулу чисел должен быть последовательным, но использовать блокировки при каждом запросе - не очень выгодно. Вопрос был решен с помощью Interlocked операций:


const int PoolLength = 1024;
static readonly int[] s_randomPool = new int[PoolLength];
static int s_poolPosition;

static int rand()
{
       int pos = Interlocked.Increment(ref s_poolPosition) % PoolLength;

       if (pos == 0)
               RtlGenRandom(s_randomPool, PoolLength * 4);

       return s_randomPool[pos];
}

В приведенном коде RtlGenRandom заполняет буфер в 4096 байт, который для удобства хранится как массив int []. Использование Interlocked.Increment гарантирует, что пул будет обновляться один раз в 1024 вызова и извлечение одного и того же числа два раза возможно лишь при 1024 конкурирующих потоках.
Возможна ситуация, когда в одном потоке пул еще обновляется, а в другом идет вызов rand(). Если пул уже был заполнен, то ничего страшного в этом нет - будет извлечено число из нового пула (если заполнение буфера идет последовательно), либо закешированное значение из старого пула. Если первое заполнение еще не произошло, то в муле будут нули, потому целесообразно в статическом конструкторе класса единожды вызывать rand(), чтобы заполнить пул до его использования.

За счет подобной оптимизации в сотни раз сократилось время вызова метода rand(), была обеспечена многопоточная безопасность и равномерность распределения случайных чисел. Возможно, есть и более быстрые реализации, например, комбинация Interlocked операций с математическими, но в случае с RtlGenRandom можно не опасаться частых повторений одного и того же числа, частичного диапазона и других болезней генераторов псевдослучайных чисел.

Update: Обнаружен гадкий баг. Странно, что никто из читателей не заметил. Мы увеличиваем 32-битный инт и когда он дойдет до максимума, начнутся отрицательные значения. Их остаток от деления тоже отрицателен и нам грозит обращение по неверному адресу. Самый простой способ - не остаток от деления использовать, а маску. Например так:


const intPoolLength = 0x400;
const intPoolMask = PoolLength - 1;
...

int pos = Interlocked.Increment(ref s_poolPosition) & PoolMask;

Дальше..

среда, 11 ноября 2009 г.

Оптимизация геометрии для 64-битной платформы

Сейчас мы работаем над библиотеками серверной обработки геометрии (нахождение пути, проверка видимости и пр.). В тестовом проекте проявилась интересная проблема: геометрия, особенно со вспомогательными данными, занимала много памяти на платформе х86 и очень много на х64. На первый взгляд все было спроектировано верно, но на диске данные занимали около 100МБ, а в памяти – больше гигабайта.
Геометрия описывается треугольниками, каждый треугольник содержит координаты трех вершин и некоторые вспомогательные данные (нормаль, коэффициенты для расчета пересечения и пр.). Треугольники каждой модели упорядочены в дерево, каждый лист дерева хранит набор треугольников, причем один и тот же треугольник может присутствовать в разных листьях.

Сначала система была прототипирована без различных оптимизаций. Затем было решено отказаться от хранения координат в треугольнике – создан общий пул вершин для каждой модели и в треугольниках хранились только ссылки. Вторым шагом мы сделали то же самое для листьев дерева – заменили треугольники ссылками на общий пул. Именно в этот момент и было замечено чрезмерное потребление памяти, особенно в x64 режиме.
В упрощенной модели можно сказать, что дерево представляло собой массив массивов указателей на треугольники, каждый из которых – массив из трех указателей на вершины. В С++ это упрощенно можно записать так:


typedef Vertex** Triangle;
typedef Triangle** Leaf;
typedef Leaf* Tree;

Запись

Tree m_tree;

эквивалентна

Vertex ***** m_tree;

Выглядит достаточно страшно :). Для визуальности можно воспользоваться STL и придуманным шаблоном stdext::triplet и написать так:


typedef stdext::triplet<Vertex*, Vertex*, Vertex*> Triangle;
typedef std::vector<Triangle*> Leaf;
typedef std::vector<Leaf> Tree;

Запись

Tree m_tree;

эквивалентна


std::vector<
    std::vector<
        stdext::triplet<Vertex*, Vertex*, Vertex*>* > >
           m_tree;

Конечно же, в реальной ситуации треугольник, лист и дерево – отдельные классы с различными свойствами и методами, но сейчас нам важна именно схема их вложенности, иерархия. Не трудно догадаться, что каждый указатель в архитектуре x86 занимает 4 байта, а в x64 – 8 байт. У нас же указателей вышло много, что и вылилось в существенное потребление памяти.
Для серверной геометрии нередко используются упрощенные модели – нет особой разницы, выделяется ли оконная рама для просчета пути NPC, количество полигонов ствола дерева почти не влияет на расчет линии видимости возле него. Это обуславливает небольшой размер моделей – редко когда модель имеет несколько тысяч вершин. Выходит, что для адресации вершин и треугольников можно было бы использовать 16-битовые индексы, в то время как мы используем на х64 системе 64-битовые указатели.

Дальнейшее развитие оптимизации достаточно предсказуемо – мы заменили наиболее используемые ссылки индексами unsigned short, что уменьшило потребляемую иерархией память в 2 раза на х86 системах и в 4 раза на архитектуре х64. Следующим шагом были созданы шаблонные классы, которые позволяют использовать любой тип в качестве индексов: в зависимости от сложности модели создается Tree либо Tree. Более сложные модели удобнее разбивать на части, чем хранить с 32-битными индексами. Более 50% моделей из нашего тестового проекта попали в категорию с 8-битными индексами. По сравнению с изначальным вариантом с указателями разница получилась огромная.

А теперь немного цифр:

8-bit: models 5140, leafs 157489, leaf references 899038, triangles 409962
16-bit: models 4376, leafs 2950551, leaf references 13938081, triangles 6774482

Это значит, что ранее у нас было 21553332 указателей на вершины и 14837119 указателей на треугольники, что в 64-битах означает 291123608 байт ~= 277 мегабайт данных.
После оптимизации получилось 1229886 8-битных индексов вершин, 20323446 16-битных, 899038 8-битных указателей на треугольники, 13938081 16-битных. В сумме это 70651978 байт ~= 67 мегабайт данных. Выигрыш более чем в 4 раза на 64-битной архитектуре.

Были и другие оптимизации, например, в дереве массив листьев был превращен в единый массив индексов треугольника с разделителем, но наибольшее значение имел именно отказ от указателей в пользу индексов.

Дальше..

среда, 20 мая 2009 г.

КРИ 2009

В этом году мы ездили в Москву на КРИ 2009 показывать свой проект.
В прошлом году я уже был на этом мероприятии вместе с командой Syndicate Online и остался весьма доволен, потому расчитывал как минимум на радушный прием и благоприятную почву для сеяния семян RunServer.

Видимо, наши оценки влияния кризиса на игровую индустрию вцелом оказались не верны. Если говорить кратко, то некоторая польза от поездки была - проект показали, некоторое количество контактов наладили, раздали визитки, пообщались с коллегами. Ждали мы немного другого, но уж что есть, то есть.

Первый казус оказался с погодой - конец мая месяца выдался не просто холодным, а Очень холодным. Мы мёрзли в поеде, мёрзли в Москве, мёрзли в транспорте. При этом, на самой конференции вокруг "Ярмарки Проектов" были установлены довольно яркие лампы, от которых было откровенно жарко.

В первый день мы немного опоздали из-за заселения и пришли к обеду. Остальные проекты "Ярмарки" уже активно крутили видео и показывали демки, в то время как наш компьютер еще стоял в виде коробок под стендом в самом углу помещения. Особенно удивило расположение "Ярмарки" - небольшое помещение 5х15 метров, где приютилось 20 стендов по 2-3 участника от каждого. Было откровенно тесно. Долго удивляться времени не было, потому за пару минут техника была собрана и мы обнаружили, что там стоит Windows XP SP3 без последнего DirectX, без .Net Framework, кодеков видео и с проблемами обнаружения устройств (не определялась мышь, флешка и пр.).
Проблемы решились через некоторое время, но хорошего настроения вся эта ситуация не добавила.

Следующим ударом стала работа с интернетом. Для показа онлайн проекта он довольно полезен, но организаторы конференции этим вопросом озаботились очень условно, потому первый день мы подключались к Beeline EDGE/GPRS, который был просто удручающего качества.
На следующий день была приобретена карта Comstar WiFi, но у указанного провайдера в эти дни были проблемы с сервером авторизации, потому интернет работал лишь в третий день, когда был и не особо нужен. Кстати, качество и стабильность указанного Comstar также далеки от идеала.
Конечно же, эти небольшие неприятности не должны были составить особой проблемы, ведь у нас был с собой и локальный сервер, и несколько видеороликов, чего было бы достаточно для показа не привередливой публике. Проблема же заключалась в отсутствии этой публики: неизвестно, сколько было посетителей, но 95% ее составляли программисты с других стендов. Особого интереса "очередная фентези-онлайн РПГ" у них не вызывала и полноценное общение получалось лишь с теми, кому мы успевали рассказать, что показываем демо серверного движка. Как справедливо заметил один из собеседников, надо было повесить плакаты, графики, большими буквами написать "Мы - не просто игра", показывать в клиенте "бегающие пакеты", загрузку сервера и пр. Воспользуемся его советом в следующий раз, если соберемся снова посетить Москву.

Глобально конференция вышла очень бедной по сравнению с 2008м годом - в два раза меньше площадь, отсутствие толпы и зрителей, невзрачные Booth Babies. Большая часть проектов "Ярмарки" была онлайновыми, но интернет бывал редко и далеко не у всех. Инвесторов, да и просто желающих купить что-либо не было видно вообще. Что было на высоте, так это питание в ресторане "Калинка", но это наврядли заслуга организаторов :)

Напоследок - подборка из трех фотографий "эволюции" стенда 1C, выложенных тов grayraw:

Дальше..

понедельник, 27 апреля 2009 г.

Открытие сайта и анонс проекта MMT Online

Думаю, многим будет интересна причина малой активности в этом блоге за последние полгода. Как ни странно, заключается она не в потере интереса, а в активной работе над собственным игровым проектом.
Наш сайт был введен в действие несколько дней назад (http://runserver.net) и сегодня команда RunServer оффициально анонсирует проект MMT Online. Детальне читайте в новостях на сайте: http://runserver.net/ru/mmt/19-mmt-anounce

В двух словах расскажу, почему проект называется "демонстрационным".
Основная цель проекта - показать возможности нашей серверной платформы, да и нашей команды в целом. Это означает, что все усилия направлены на разработку одной-двух локаций и показ как можно большего количества серверных возможностей. Мы пока не планируем сотни континентов, различные расы, десятки подземелий и пр.
С другой стороны, наш гейм-дизайнер Ипполит придумал достаточно необычный мир (точнее два мира) и было бы интересно реализовать его идеи в будующем. Возможно, ситуация изменится, если будет найден инвестор.

Немного истории.
В гейм-деве мы достаточно давно (с 2004го года как минимум), но основным направлением была серверная часть, хотя и были эксперименты над клиентской (замороженный ныне проект Heroes Offline, различные аддоны к WoW, наработки на Ogre 3D и пр.). Не смотря на это, первый наш блин в 3D игростроении вышел, как водится, комом - проект на движке Unigine (http://unigine.com) стартовал в начале 2007го года, но через полгода был заморожен и закрыт. Сказался недостаток опыта и контента.
В конце 2007го года фирма МСМ Онлайн (дочерняя компания провайдера WNet) начала разработку проекта Syndicate Online (http://syndicate-online.com) c использованием платформы RunServer и понемногу начала снабжать нас 3д контентом. Это позволило осенью 2008го года начать разработку собственной игры. Движок взяли тот же - Unigine, но программную часть написали заново. Так и родился MMT Online. К предоставленному высококачественному контенту мы начали дорисовывать своими силами собственные поделия. Местами это смотрится хорошо, местами - убого :)
Надеюсь, участие в КРИ 2009 покажет, насколько мы продвинулись в нашей цели, и получилось ли привлечь внимание к RunServer и нашей команде.

Дальше..

вторник, 24 ноября 2009 г.

Тесселяция и дисплейсмент. Часть 2

пятница, 20 ноября 2009 г.

Тесселяция и дисплейсмент

вторник, 17 ноября 2009 г.

Неслучайные неслучайности

среда, 11 ноября 2009 г.

Оптимизация геометрии для 64-битной платформы

среда, 20 мая 2009 г.

КРИ 2009

понедельник, 27 апреля 2009 г.

Открытие сайта и анонс проекта MMT Online

Об авторе

Постоянные читатели

Темы

Архив блога

Полезные ссылки

вторник, 24 ноября 2009 г.

Тесселяция и дисплейсмент. Часть 2

пятница, 20 ноября 2009 г.

Тесселяция и дисплейсмент

вторник, 17 ноября 2009 г.

Неслучайные неслучайности

среда, 11 ноября 2009 г.

Оптимизация геометрии для 64-битной платформы

среда, 20 мая 2009 г.

КРИ 2009

понедельник, 27 апреля 2009 г.

Открытие сайта и анонс проекта MMT Online

Об авторе

Постоянные читатели

Темы

Архив блога

Полезные ссылки

вторник, 24 ноября 2009 г.

пятница, 20 ноября 2009 г.

вторник, 17 ноября 2009 г.

среда, 11 ноября 2009 г.

среда, 20 мая 2009 г.

понедельник, 27 апреля 2009 г.