PHP DM Gate v0.9 » Потоки

dmk © (30.01.18 12:14) [20]

>А как, я извиняюсь, другие рендеры работают, тоже со скоростью памяти мучаются ?
Именно так. В 3Ds max софтверные драйвера медленнее моих функций в несколько раз.

<Цитата>
dmk © (30.01.18 12:32) [21]

А вообще софтвер особо не в почете, когда есть видюхи.
Железный рендер быстрее в любом случае. Мне просто хотелось иметь свой софтверный
вариант. Оказалось процессоры под это не особо заточены.

<Цитата>
dmk © (30.01.18 14:55) [22]

>В 3Ds max софтверные драйвера медленнее моих функций в несколько раз.
У меня на 1 ядре ~500к полигонов с освещением по ламберту выдает 13-15 fps.
В 3ds max на 10 ядрах - 9-10 fps. У меня на 10 ядрах ~45-50 fps. Мелочь, а приятно :)

Вот скрин:
https://cdn1.radikalno.ru/uploads/2018/1/30/56bf85bf6fd189af421f397e711fc325-full.jpg

<Цитата>
dmk © (30.01.18 14:58) [23]

Тут лучше видно:
http://i102.fastpic.ru/big/2018/0130/7b/769ada593eeeb1cbcb9040c2b4f56c7b.jpg

<Цитата>
dmk © (30.01.18 15:08) [24]

>разные чудеса бывают если использовать глобальные(внешние) переменные внутри
>потоков. даже если это необходимо, но криво продумано/сделано.

Подскажите как правильно? Во всех примерах, которые я нашел
используются глобальные переменные с InterlockedIncrement.
Как мне их заставить рисовать последовательно?
Создавать на каждое действие свой класс потоков и вызывать из основного цикла?
Типа так?
1. Resume ClearBufferThreads
2. Очистка буферов (Класс потоков - ClearBufferThreads)
3. Suspend ClearBufferThreads
4. Resume ModifyObjectsThreads
5. Трансформация объектов (Класс потоков - ModifyObjectsThreads)
6. Suspend ModifyObjectsThreads
7. Resume RenderObjectsThreads
8. Рендер объектов (Класс потоков - RenderObjectsThreads)
9. Suspend RenderObjectsThreads
10. Вывод просчитанного в основном VCL-потоке.

В нынешнем варианте потоки очень много простаивают в циклах.
Серьезная потеря производительности. Если запустить просчет без ожидания потоков,
то скорость отрисовки возрастает до ~350 fps, что очень хотелось бы.

<Цитата>
Eraser © (30.01.18 16:44) [25]

> dmk © (30.01.18 14:55) [22]
> >В 3Ds max софтверные драйвера медленнее моих функций в
> несколько раз.
> У меня на 1 ядре ~500к полигонов с освещением по ламберту
> выдает 13-15 fps.
> В 3ds max на 10 ядрах - 9-10 fps. У меня на 10 ядрах ~45-
> 50 fps. Мелочь, а приятно :)

не то чтобы я не доверяю, но картинки только от твоего рендера, откуда взяты данные 3ds max - не ясно, также, ну и самое главное, при сравнении fps нужно сравнивать и качество картинки )

ну и небольшое отступление - модная нынче на форуме рубрика "минутка рекламы облаков". сколько можно выкладывать фотки на всякий помойках да еще и в невменяемом качестве?
https://disk.yandex.ru/
https://www.dropbox.com/
и т.д.
там не обязательно даже устанавливать что-то, за глаза хватит и веб-версии для хостинга картинок.

мне не совсем понятно, какой все таки этап ты хочешь распараллелить? вот статья для чайников https://habrahabr.ru/post/158983/ ткни пальцем, что именно ты пытаешься обрабатывать в потоках?

> Но он каким то волшебным образом вылетел из процедуры и
> «тусит» в другом цикле.

это ты как понял, через отладчик? так это, скорее всего, глюк отладчика, такой эффект бывает, при отладке многопоточного кода. 100% даст только логирование, в этом случае.

<Цитата>
dmk © (30.01.18 20:18) [26]

>не то чтобы я не доверяю
В 3ds max работаю по основной профессии. Не то чтобы круто, но лицензия стоит.

Вот видос моего редактора. Делаю в свободное время.
https://yadi.sk/i/QagOQ1em3Rvfjs

Пока делаю рендер. В основном VCL-потоке маленькие модели крутятся шустро,
а мне надо сделать поддержку многопоточности для крупных моделей.
В самом начале видоса - гоблин. 500к. Средняя модель. Моя версия многопоточности
видимо не очень хороша, т.к. медленно. 50-55 fps всего. Надо параллелить лучше.
Рендер у меня софтверный - свой. Свои примитивы, свои шейдеры и т.п. Свой mini-API.
OpenGL пока не подключен, ибо пойдет потом навесом.

Unity мне не надо. У меня стоит.

Вот я и думаю, а как лучше реализовать многопоточность, чтобы в цикле соблюдалась последовательность рендеринга?
У меня 5 этапов:
1. Очистка буферов
2. Трансформация
3. Рендеринг объектов
4. Постобработка.
5. Вывод на экран

>это ты как понял, через отладчик?
Ага. Вот это и напрягает. Delphi видимо плохо отлажена. У меня XE6 Prof.
Хотя при запуске все 19 потокв вошли в процедуру, а вышли из нее только 15.
4 испарилось где то посередине, хотя выхода там нигде нет.

<Цитата>
Eraser © (30.01.18 23:41) [27]

> dmk © (30.01.18 20:18) [26]

> Надо параллелить лучше.

в общем, исходя из всех твоих вопросов по многопоточному рендерингу, ларчик открывается просто. тебе надо подтянуть знания по работе с потоками. и в целом по системе, и в частности, по VCL. т.е. знания по графике у тебя приличные, а знания по созданию многопоточных приложений нужно подтянуть, там за вечер можно во всем разобраться, в отличие от создания графических движков )

http://rouse.drkb.ru/books.php#rihter там в самом низу. Рихтер.
Есть раздел про объекты синхронизации и т.д.
Интуитивно догадываюсь, что тебя в итоге спасет что-то вроде смеси семафоров и waitformultipleobjects.

<Цитата>
sniknik © (31.01.18 10:13) [28]

> Моя версия многопоточности
у тебя ее похоже и нет... и не нужна, судя по оговоркам о циклах потоков, ожидании завершения для начала работы другого.
у тебя есть куча лишнего, путающего тебя же, кода делающего то же что вызов процедур в простом цикле... в общем есть кривая и запутанная обработка линейной логики.
выкинь все лишнее связанное с потоками, упрости и все ускорится, пусть не намного (цикл или цепочка последовательных потоков равны, если +- секунды считать). ну или логику продумай под много поточность. сначала нужно конечно понять потоки, а не спрашивать "как правильно", правильно под разные случаи по разному.

<Цитата>
Игорь Шевченко © (31.01.18 10:32) [29]

> Delphi видимо плохо отлажена

Очевидно же

<Цитата>
dmk © (31.01.18 16:10) [30]

>Очевидно же
Для 64 битов при передаче более 3-х параметров компилятор иногда помещает
4-й и более параметр в RSP+OFFSET вместо регистров или RBP+OFFSET. Что приводит к AV.
Я же его не заставляю этого делать. А у меня вообще .NOFRAME стоит.
Align16 не работает ни при каких обстоятельствах. Еще некоторые директивы не работают.
Глюки есть. Это чтобы не слыть пустозвоном. В EDN все вопросы подняты, но стоят без ответов.

<Цитата>
dmk © (31.01.18 16:17) [31]

sniknik © (31.01.18 10:13) [28]
>у тебя ее похоже и нет...

Ну почему же нет. Вот мой цикл Execute.
Из вызываемых процедур в цикле только одну приведу, т.к. другие очень большие.
Работает, но асинхронная передача данных приводит к визуальным глюкам.
А так довольно шустро все распараллеливает.
В данном случае вместо 35 fps в одном потоке - ~175-177 fps.

procedure RenderThread.ClearBufferLines; var zA, pA: QWord; begin if (not gAllClear) then begin gLineIndex := InterlockedIncrement(gLineIndex) - 1; if (gLineIndex < RenderTarget^.BitmapRegion.H) then begin zA := RenderTarget^.ZAddress32(0, gLineIndex); pA := RenderTarget^.PAddress32(0, gLineIndex); StoreQWords(zA, TargetLen, ZQ); StoreQWords(pA, TargetLen, 0); gNumClearLines := InterlockedIncrement(gNumClearLines); end; end; gAllClear := (gNumClearLines >= RenderTarget^.BitmapRegion.H); end; procedure RenderThread.Execute; begin //Цикл отрисовки while (gDrawCounter <= gNumDrawCycles) do begin repeat ClearBufferLines; until gAllClear; //Трансформация repeat TransformObjects(ZStars); until gAllTransformed; //Отрисовка repeat DrawObjects(ZStars); until gAllPainted; //Ждем конца отрисовки всеми потоками repeat until (gAllClear and gAllTransformed and gAllPainted); //Флаг завершения обновления gUpdatingFinished := False; //Обновляет буфер один поток if (FNumberID = 0) then begin //Загрузка процессора if (gDrawCounter mod 10) = 0 then gUsage := GetCPUUsage(gCPUTimes); //Обновляем буфер Synchronize(TestForm.UpdateThreads); //TestForm.UpdateThreads; //Флаг завершения обновления gUpdatingFinished := True; end;//if (gNumEntered) //Ждем конца обновления repeat until gUpdatingFinished; //Проверка на ESC if gESC then Break; end;//while end;

<Цитата>
dmk © (31.01.18 16:36) [32]

В данном случае мне удалось заставить потоки делать все шаги последовательно.
Этот участок даже не нужен. Я его пока для отладки оставил.
repeat until (gAllClear and gAllTransformed and gAllPainted);

Вот что получается (видео 12 Мб):
https://yadi.sk/i/-rurTadp3RxJMD
Полоски в некоторых местах и иногда пробивает «нечто».
На самом деле это не дочищенный Buffer.

<Цитата>
sniknik © (31.01.18 18:43) [33]

> Ну почему же нет. Вот мой цикл Execute.
вот поэтому -
> В данном случае мне удалось заставить потоки делать все шаги последовательно.
потоки работают параллельно, независимо, на разных процессорах (если их несколько), если же они работают(/их заставляют) последовательно то это просто одно поточный цикл for реализованный сложным косвенным методом.

<Цитата>
dmk © (31.01.18 20:49) [34]

>последовательно то это просто одно поточный цикл for
Ну да, только многопоточный (усиленный). Этого и добиваюсь.

<Цитата>
dmk © (03.02.18 07:04) [35]

В общем сделал. Вот тут видос: https://yadi.sk/i/JOWjny6z3S3tP8
Распараллеливание записано c 7:40 до 9:25. Перед этим все на одном ядре работает.
Ускорение от 4,5 до 8 раз. Все упирается в скорость памяти к сожалению.
Даже одно ядро забивает почти всю пропускную способность памяти.
Но в целом 1 млн полигонов ~35 fps. Норм для софтрендера.

<Цитата>