Вычислительные эксперименты для оценки эффективности параллельного варианта метода Гаусса для решения систем линейных уравнений проводились при условиях, указанных в п. 6.5.5, и состоят в следующем.
Эксперименты производились на вычислительном кластере Нижегородского университета на базе процессоров Intel Xeon 4 EM64T, 3000 МГц и сети Gigabit Ethernet под управлением операционной системы Microsoft Windows Server 2003 Standard x64 Edition и системы управления кластером Microsoft Compute Cluster Server (см. п. 1.2.3).
Для оценки длительности ? базовой скалярной операции проводилось решение системы линейных уравнений при помощи последовательного алгоритма и полученное таким образом время вычислений делилось на общее количество выполненных операций – в результате подобных экспериментов для величины ? было получено значение 4,7 нсек. Эксперименты, выполненные для определения параметров сети передачи данных, показали значения латентности a и пропускной способности b соответственно 47 мкс и 53,29 Мбайт/с. Все вычисления производились над числовыми значениями типа double, т.е. величина w равна 8 байт.
Результаты вычислительных экспериментов приведены в таблице 8.1. Эксперименты выполнялись с использованием двух, четырех и восьми процессоров.
500 | 0,36 | 0,3302 | 1,0901 | 0,5170 | 0,6963 | 0,7504 | 0,4796 |
1000 | 3,313 | 1,5950 | 2,0770 | 1,6152 | 2,0511 | 1,8715 | 1,7701 |
1500 | 11,437 | 4,1788 | 2,7368 | 3,8802 | 2,9474 | 3,7567 | 3,0443 |
2000 | 26,688 | 9,3432 | 2,8563 | 7,2590 | 3,6765 | 7,3713 | 3,6204 |
2500 | 50,125 | 16,9860 | 2,9509 | 11,9957 | 4,1785 | 11,6530 | 4,3014 |
3000 | 85,485 | 28,4948 | 3,0000 | 19,1255 | 4,4696 | 17,6864 | 4,8333 |
Рис. 8.3. Зависимость ускорения от количества процессоров при выполнении параллельного алгоритма Гаусса для разных размеров систем линейных уравнений
Сравнение времени выполнения эксперимента и теоретической оценки Tp из (8.5) приведено в таблице 8.2 и на рис. 8.4.
Вычислительные эксперименты для оценки эффективности параллельного варианта метода сопряженных градиентов для решения систем линейных уравнений проводились при условиях, указанных в п. 8.2.7.
Результаты вычислительных экспериментов приведены в таблице 8.3. Эксперименты проводились на вычислительных системах, состоящих из двух, четырех и восьми процессоров.
500 | 0,5 | 0,4634 | 1,0787 | 0,4706 | 1,0623 | 1,3020 | 0,3840 |
1000 | 8,14 | 3,9207 | 2,0761 | 3,6354 | 2,2390 | 3,5092 | 2,3195 |
1500 | 31,391 | 17,9505 | 1,7487 | 14,4102 | 2,1783 | 20,2001 | 1,5539 |
2000 | 92,36 | 51,3204 | 1,7996 | 40,7451 | 2,2667 | 37,9319 | 2,4348 |
2500 | 170,549 | 125,3005 | 1,3611 | 85,0761 | 2,0046 | 87,2626 | 1,9544 |
3000 | 363,476 | 223,3364 | 1,6274 | 146,1308 | 2,4873 | 134,1359 | 2,7097 |
Рис. 8.6. Зависимость ускорения от количества процессоров при выполнении параллельного метода сопряженных градиентов для решения систем линейных уравнений
Сравнение времени выполнения эксперимента и теоретической оценки Tp из (8.13) приведено в таблице 8.4 и на рис. 8.7.
500 | 1,3042 | 0,4634 | 0,6607 | 0,4706 | 0,3390 | 1,3020 |
1000 | 10,3713 | 3,9207 | 5,2194 | 3,6354 | 2,6435 | 3,5092 |
34,9333 | 17,9505 | 17,5424 | 14,4102 | 8,8470 | 20,2001 | |
2000 | 82,7220 | 51,3204 | 41,4954 | 40,7451 | 20,8822 | 37,9319 |
2500 | 161,4695 | 125,3005 | 80,9446 | 85,0761 | 40,6823 | 87,2626 |
3000 | 278,9077 | 223,3364 | 139,7560 | 146,1308 | 70,1801 | 134,1359 |
Рис. 8.7. График зависимости экспериментального и теоретического времени проведения эксперимента на четырех процессорах от объема исходных данных