Вариант 6.
Задание 1.
Имеются следующие данные о выработке литья на одного работающего Х1(т), браке литья Х2(%) и себестоимости 1 т литья Y(руб.) по 20 литейным цехам различных заводов:
i |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| x1i | 44,1 | 16,4 | 44,5 | 83,9 | 76,8 | 42,3 | 80,3 | 32,5 | 63,2 | 67,5 |
| x2i | 5,9 | 7,5 | 8 | 1,3 | 8,6 | 6,6 | 3,5 | 6,3 | 3,4 | 7,5 |
| yi | 228,6 | 270,7 | 231,5 | 111,8 | 198,6 | 262,7 | 147,6 | 239,2 | 157,9 | 226,6 |
i |
11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| x1i | 53,8 | 56,6 | 42,7 | 58,8 | 38,3 | 20,5 | 42,2 | 48,4 | 38,6 | 85 |
| x2i | 8,7 | 6 | 3,1 | 3,9 | 3,4 | 2,8 | 7,7 | 2,9 | 5,6 | 3,7 |
| yi | 213,8 | 222,6 | 143 | 177,2 | 178,5 | 230,5 | 223,9 | 187,4 | 213,3 | 119,7 |
Необходимо установить связь между себестоимостью литья и выработкой литья на одного работающего
- без учёта производственного брака (найти уравнение парной регрессии Y по X1);
- и с учётом производственного брака (найти уравнение множественной регрессии Y по X1 и X2);
- оценить значимость полученных уравнений на уровне a = 0,05;
- установить значимость коэффициента регрессии при X2 на уровне a = 0,05;
- получить точечную оценку среднего значения себестоимости 1т литья в цехах, в которых выработка литья на одного работающего составляет 40 т, а брак литья составляет 5%.
Решение.
1) Определим характер связи между себестоимостью литья и выработкой литья на одного работающего без учёта производственного брака.
Построим диаграмму рассеяния:
Диаграмма рассеяния позволяет сформулировать гипотезу о наличии обратной линейной связи между двумя признаками.
Для расчета параметров а и b линейной регрессии решаем систему нормальных уравнений относительно а и b:
| Y | x1 | Yx1 | x12 | |
| 1 | 228,6 | 44,1 | 10081,26 | 1944,81 |
| 2 | 270,7 | 16,4 | 4439,48 | 268,96 |
| 3 | 231,5 | 44,5 | 10301,75 | 1980,25 |
| 4 | 111,8 | 83,9 | 9380,02 | 7039,21 |
| 5 | 198,6 | 76,8 | 15252,48 | 5898,24 |
| 6 | 262,7 | 42,3 | 11112,21 | 1789,29 |
| 7 | 147,6 | 80,3 | 11852,28 | 6448,09 |
| 8 | 239,2 | 32,5 | 7774 | 1056,25 |
| 9 | 157,9 | 63,2 | 9979,28 | 3994,24 |
| 10 | 226,6 | 67,5 | 15295,5 | 4556,25 |
| 11 | 213,8 | 53,8 | 11502,44 | 2894,44 |
| 12 | 222,6 | 56,6 | 12599,16 | 3203,56 |
| 13 | 143 | 42,7 | 6106,1 | 1823,29 |
| 14 | 177,2 | 58,8 | 10419,36 | 3457,44 |
| 15 | 178,5 | 38,3 | 6836,55 | 1466,89 |
| 16 | 230,5 | 20,5 | 4725,25 | 420,25 |
| 17 | 223,9 | 42,2 | 9448,58 | 1780,84 |
| 18 | 187,4 | 48,4 | 9070,16 | 2342,56 |
| 19 | 213,3 | 38,6 | 8233,38 | 1489,96 |
| 20 | 119,7 | 85 | 10174,5 | 7225 |
| Итого | 3985,1 | 1036,4 | 194583,7 | 61079,82 |
| Ср. знач. | 199,255 | 51,82 | 9729,187 | 3053,991 |
| Станд.откл. | 45,00874 | 19,69982 | ||
| Дисперсия | 2025,787 | 388,0827 |
Уравнение регрессии: у = 283,056 – 1,617·x. С увеличением выработки литья одного рабочего на 1 т. себестоимость 1 т. литья снижается в среднем на 1,617 руб.
Определим линейный коэффициент парной корреляции:
– связь сильная, обратная.
Коэффициент детерминации равен или 50,1% – такая доля вариации себестоимости 1 т. литья объясняется за счет вариации выработки на 1 рабочего.
2) Предположим наличие линейной зависимости между себестоимостью литья и выработкой литья на одного работающего с учетом производственного брака.
Рассчитаем параметры уравнения множественной линейной регрессии, используя МНК.
При его применении строится система нормальных уравнений, решение которой и позволяет получить оценки параметров уравнения регрессии:
Расчетные показатели представим в таблице:
| Y | x1 | x2 | Yx1 | x12 | Yx2 | x22 | x1x2 | Yтеор | (Y-Yтеор)2 | |
| 1 | 228,6 | 44,1 | 5,9 | 10081,26 | 1944,81 | 1348,74 | 34,81 | 260,19 | 295,05 | 4415,69 |
| 2 | 270,7 | 16,4 | 7,5 | 4439,48 | 268,96 | 2030,25 | 56,25 | 123 | 362,44 | 8415,95 |
| 3 | 231,5 | 44,5 | 8 | 10301,75 | 1980,25 | 1852 | 64 | 356 | 324,06 | 8566,80 |
| 4 | 111,8 | 83,9 | 1,3 | 9380,02 | 7039,21 | 145,34 | 1,69 | 109,07 | 165,73 | 2908,84 |
| 5 | 198,6 | 76,8 | 8,6 | 15252,48 | 5898,24 | 1707,96 | 73,96 | 660,48 | 280,30 | 6674,16 |
| 6 | 262,7 | 42,3 | 6,6 | 11112,21 | 1789,29 | 1733,82 | 43,56 | 279,18 | 307,85 | 2038,15 |
| 7 | 147,6 | 80,3 | 3,5 | 11852,28 | 6448,09 | 516,6 | 12,25 | 281,05 | 202,62 | 3027,27 |
| 8 | 239,2 | 32,5 | 6,3 | 7774 | 1056,25 | 1506,96 | 39,69 | 204,75 | 319,46 | 6441,31 |
| 9 | 157,9 | 63,2 | 3,4 | 9979,28 | 3994,24 | 536,86 | 11,56 | 214,88 | 228,86 | 5035,57 |
| 10 | 226,6 | 67,5 | 7,5 | 15295,5 | 4556,25 | 1699,5 | 56,25 | 506,25 | 279,80 | 2830,49 |
| 11 | 213,8 | 53,8 | 8,7 | 11502,44 | 2894,44 | 1860,06 | 75,69 | 468,06 | 318,90 | 11046,42 |
| 12 | 222,6 | 56,6 | 6 | 12599,16 | 3203,56 | 1335,6 | 36 | 339,6 | 276,25 | 2878,15 |
| 13 | 143 | 42,7 | 3,1 | 6106,1 | 1823,29 | 443,3 | 9,61 | 132,37 | 257,78 | 13173,78 |
| 14 | 177,2 | 58,8 | 3,9 | 10419,36 | 3457,44 | 691,08 | 15,21 | 229,32 | 243,04 | 4334,58 |
| 15 | 178,5 | 38,3 | 3,4 | 6836,55 | 1466,89 | 606,9 | 11,56 | 130,22 | 269,13 | 8213,56 |
| 16 | 230,5 | 20,5 | 2,8 | 4725,25 | 420,25 | 645,4 | 7,84 | 57,4 | 289,44 | 3474,11 |
| 17 | 223,9 | 42,2 | 7,7 | 9448,58 | 1780,84 | 1724,03 | 59,29 | 324,94 | 323,54 | 9928,18 |
| 18 | 187,4 | 48,4 | 2,9 | 9070,16 | 2342,56 | 543,46 | 8,41 | 140,36 | 245,74 | 3403,00 |
| 19 | 213,3 | 38,6 | 5,6 | 8233,38 | 1489,96 | 1194,48 | 31,36 | 216,16 | 299,71 | 7466,48 |
| 20 | 119,7 | 85 | 3,7 | 10174,5 | 7225 | 442,89 | 13,69 | 314,5 | 197,84 | 6106,51 |
| Итого | 3985,1 | 1036,4 | 106,4 | 194583,7 | 61079,82 | 22565,23 | 662,68 | 5347,78 | 5487,53 | 120379,03 |
| Ср. знач. | 199,255 | 51,82 | 5,32 | 9729,187 | 3053,991 | 1128,262 | 33,134 | 267,389 | 274,38 | 6018,95 |
| Станд.откл. | 45,0087 | 19,69982 | 2,255193 | |||||||
| Дисперсия | 2025,79 | 388,0827 | 5,085895 |
Решая систему методом Гаусса, находим:
Получили уравнение множественной регрессии:
Y = 206,522 – 1,352 · х1 + 11,8 · х2
Коэффициент множественной корреляции равен
– связь сильная
Коэффициент множественной детерминации равен 0,8371 или 83,71%, т.е. 83,71% вариации себестоимости 1 т литья объясняется за счет изменения выработки литья на одного работающего и брака литья.
3) оценим значимость полученных уравнений на уровне a = 0,05.
Уравнение парной линейной регрессии у = 283,056 – 1,617·x:
Fтабл = 4,35 < Fфакт, при а = 0,05.
Следовательно, отклоняется гипотеза Н0 о статистически незначимых параметрах этого уравнения.
Уравнение множественной регрессии Y = 206,522 – 1,352 · х1 + 11,8 · х2
Fтабл = 4,41 < Fфакт, при а = 0,05.
Таким образом, отклоняется гипотеза Н0 о статистически незначимых параметрах этого уравнения.
4) установим значимость коэффициента регрессии при X2 на уровне a = 0,05:
Оценку статистической значимости параметра регрессии а2 проведем с помощью t-статистики Стьюдента.
Выдвигаем гипотезу H0 о статистически незначимом отличии показателя от нуля:
tтабл для числа степеней свободы и составит 2,101.
Определим случайную ошибку :
,
где S2 – остаточная дисперсия на одну степень свободы,
Тогда .
Фактическое значение t-статистики ниже табличного значения:
поэтому гипотеза H0 принимается, т.е. параметр а2 случайно отличается от нуля и статистически незначим.
5) получим точечную оценку среднего значения себестоимости 1т литья в цехах, в которых выработка литья на одного работающего составляет 40 т, а брак литья составляет 5%:
Y = 206,522 – 1,352 · 40 + 11,8 · 5 = 206,522 – 54,08 + 59 = 211,442 (руб.)
Задание 2.
Имеются следующие данные о численности населения США в 1950-1985 гг. (млн. чел.)
| Год | 1950 | 1951 | 1952 | 1953 | 1954 | 1955 | 1956 | 1957 | 1958 |
| yt | 152,3 | 154,9 | 157,6 | 160,2 | 163,0 | 165,9 | 168,9 | 172,0 | 174,9 |
| Год | 1959 | 1960 | 1961 | 1962 | 1963 | 1964 | 1965 | 1966 | 1967 |
| yt | 177,8 | 180,7 | 183,7 | 186,5 | 189,2 | 191,9 | 194,3 | 196,6 | 198,7 |
| Год | 1968 | 1969 | 1970 | 1971 | 1972 | 1973 | 1974 | 1975 | 1976 |
| yt | 200,7 | 202,7 | 205,1 | 207,7 | 209,9 | 211,9 | 213,8 | 216,0 | 218,0 |
| Год | 1977 | 1978 | 1979 | 1980 | 1981 | 1982 | 1983 | 1984 | 1985 |
| yt | 220,2 | 222,6 | 225,1 | 227,7 | 230,0 | 232,3 | 234,8 | 237,0 | 239,3 |
Требуется обработать эти данные, выполнив следующие действия:
- представить ряд графически;
- подобрать подходящее уравнение тренда по методу наименьших квадратов или подходящую скользящую среднюю, если характер тренда неясен;
- удалить трендовую составляющую из временного ряда и построить график остатков;
- проанализировать поведение ряда остатков.
Решение.
1) Построим график динамического ряда. По оси Х откладываем годы, по оси Y – численность населения, млн. чел.:
График показывает увеличение численности населения США и позволяет предположить линейную форму тренда изучаемого показателя.
2) В данном случае для выражения основной тенденции мы применим метод аналитического выравнивания по прямой.
Для выравнивания ряда динамики по прямой используем уравнение .
Способ наименьших квадратов дает систему двух нормальных уравнений для нахождения параметров и :
где у – исходный уровень ряда динамики;
n – число уровней ряда;
t – показатель времени, который обозначается порядковыми номерами, начиная от низшего.
Для того, чтобы упростить технику расчета, мы придадим показателям времени t такие значения, чтобы их сумма была равна нулю: . В нашей задаче число уровней ряда четное (n = 36), поэтому учет времени будет вестись полугодиями. При этом уравнения системы примут следующий вид:
и ,
откуда – представляет собой средний уровень ряда динамики ();
.
В результате получаем следующее уравнение основной тенденции изменения численности населения США в период с 1950 по 1985 г.:
, где t – порядковый номер полугодия.
3) Удалим трендовую составляющую из временного ряда и построим график остатков. Расчетные данные представим в таблице:
| Год | y | t | t2 | ty | Yтеор | Y-Yтеор |
| 1950 | 152,3 | -35 | 1225 | -5330,5 | 154,9512 | -2,6512 |
| 1951 | 154,9 | -33 | 1089 | -5111,7 | 157,4046 | -2,50462 |
| 1952 | 157,6 | -31 | 961 | -4885,6 | 159,858 | -2,25805 |
| 1953 | 160,2 | -29 | 841 | -4645,8 | 162,3115 | -2,11147 |
| 1954 | 163 | -27 | 729 | -4401 | 164,7649 | -1,76489 |
| 1955 | 165,9 | -25 | 625 | -4147,5 | 167,2183 | -1,31832 |
| 1956 | 168,9 | -23 | 529 | -3884,7 | 169,6717 | -0,77174 |
| 1957 | 172 | -21 | 441 | -3612 | 172,1252 | -0,12517 |
| 1958 | 174,9 | -19 | 361 | -3323,1 | 174,5786 | 0,321411 |
| 1959 | 177,8 | -17 | 289 | -3022,6 | 177,032 | 0,767988 |
| 1960 | 180,7 | -15 | 225 | -2710,5 | 179,4854 | 1,214565 |
| 1961 | 183,7 | -13 | 169 | -2388,1 | 181,9389 | 1,761141 |
| 1962 | 186,5 | -11 | 121 | -2051,5 | 184,3923 | 2,107718 |
| 1963 | 189,2 | -9 | 81 | -1702,8 | 186,8457 | 2,354294 |
| 1964 | 191,9 | -7 | 49 | -1343,3 | 189,2991 | 2,600871 |
| 1965 | 194,3 | -5 | 25 | -971,5 | 191,7526 | 2,547447 |
| 1966 | 196,6 | -3 | 9 | -589,8 | 194,206 | 2,394024 |
| 1967 | 198,7 | -1 | 1 | -198,7 | 196,6594 | 2,040601 |
| 1968 | 200,7 | 1 | 1 | 200,7 | 199,1128 | 1,587177 |
| 1969 | 202,7 | 3 | 9 | 608,1 | 201,5662 | 1,133754 |
| 1970 | 205,1 | 5 | 25 | 1025,5 | 204,0197 | 1,08033 |
| 1971 | 207,7 | 7 | 49 | 1453,9 | 206,4731 | 1,226907 |
| 1972 | 209,9 | 9 | 81 | 1889,1 | 208,9265 | 0,973483 |
| 1973 | 211,9 | 11 | 121 | 2330,9 | 211,3799 | 0,52006 |
| 1974 | 213,8 | 13 | 169 | 2779,4 | 213,8334 | -0,03336 |
| 1975 | 216 | 15 | 225 | 3240 | 216,2868 | -0,28679 |
| 1976 | 218 | 17 | 289 | 3706 | 218,7402 | -0,74021 |
| 1977 | 220,2 | 19 | 361 | 4183,8 | 221,1936 | -0,99363 |
| 1978 | 222,6 | 21 | 441 | 4674,6 | 223,6471 | -1,04706 |
| 1979 | 225,1 | 23 | 529 | 5177,3 | 226,1005 | -1,00048 |
| 1980 | 227,7 | 25 | 625 | 5692,5 | 228,5539 | -0,8539 |
| 1981 | 230 | 27 | 729 | 6210 | 231,0073 | -1,00733 |
| 1982 | 232,3 | 29 | 841 | 6736,7 | 233,4608 | -1,16075 |
| 1983 | 234,8 | 31 | 961 | 7278,8 | 235,9142 | -1,11417 |
| 1984 | 237 | 33 | 1089 | 7821 | 238,3676 | -1,3676 |
| 1985 | 239,3 | 35 | 1225 | 8375,5 | 240,821 | -1,52102 |
| Итого | 7123,9 | 0 | 15540 | 19063,1 | 7123,9 | 6,82E-13 |
| Ср.знач. | 197,8861 | 0 | 431,6667 | 529,5306 | 197,8861 | 1,89E-14 |
| а0 | 197,8861 | |||||
| а1 | 1,226712 |
4) Диаграмма остатков позволяет предположить циклический характер отклонений от тренда.
Определим статистику Дарбина-Уотсона и коэффициент автокорреляции первого порядка. Для расчетов используем таблицу:
| Год | y | Yтеор | Y-Yтеор (ei) | ei-1 | eiei-1 | ei2 | ei-12 | (ei-ei-1)2 |
| 1950 | 152,3 | 154,9512 | -2,6512 | 0 | 0 | 7,028868 | 0 | 7,028868 |
| 1951 | 154,9 | 157,4046 | -2,50462 | -2,6512 | 6,640264 | 6,273145 | 7,028868 | 0,021485 |
| 1952 | 157,6 | 159,858 | -2,25805 | -2,50462 | 5,655563 | 5,098781 | 6,273145 | 0,0608 |
| 1953 | 160,2 | 162,3115 | -2,11147 | -2,25805 | 4,767804 | 4,458312 | 5,098781 | 0,021485 |
| 1954 | 163 | 164,7649 | -1,76489 | -2,11147 | 3,726525 | 3,114854 | 4,458312 | 0,120115 |
| 1955 | 165,9 | 167,2183 | -1,31832 | -1,76489 | 2,326693 | 1,737963 | 3,114854 | 0,199431 |
| 1956 | 168,9 | 169,6717 | -0,77174 | -1,31832 | 1,017401 | 0,595585 | 1,737963 | 0,298746 |
| 1957 | 172 | 172,1252 | -0,12517 | -0,77174 | 0,096595 | 0,015666 | 0,595585 | 0,418061 |
| 1958 | 174,9 | 174,5786 | 0,321411 | -0,12517 | -0,04023 | 0,103305 | 0,015666 | 0,199431 |
| 1959 | 177,8 | 177,032 | 0,767988 | 0,321411 | 0,24684 | 0,589806 | 0,103305 | 0,199431 |
| 1960 | 180,7 | 179,4854 | 1,214565 | 0,767988 | 0,932771 | 1,475167 | 0,589806 | 0,199431 |
| 1961 | 183,7 | 181,9389 | 1,761141 | 1,214565 | 2,13902 | 3,101618 | 1,475167 | 0,298746 |
| 1962 | 186,5 | 184,3923 | 2,107718 | 1,761141 | 3,711988 | 4,442474 | 3,101618 | 0,120115 |
| 1963 | 189,2 | 186,8457 | 2,354294 | 2,107718 | 4,962188 | 5,542702 | 4,442474 | 0,0608 |
| 1964 | 191,9 | 189,2991 | 2,600871 | 2,354294 | 6,123215 | 6,764529 | 5,542702 | 0,0608 |
| 1965 | 194,3 | 191,7526 | 2,547447 | 2,600871 | 6,625582 | 6,489488 | 6,764529 | 0,002854 |
| 1966 | 196,6 | 194,206 | 2,394024 | 2,547447 | 6,09865 | 5,731351 | 6,489488 | 0,023539 |
| 1967 | 198,7 | 196,6594 | 2,040601 | 2,394024 | 4,885247 | 4,164051 | 5,731351 | 0,124908 |
| 1968 | 200,7 | 199,1128 | 1,587177 | 2,040601 | 3,238795 | 2,519131 | 4,164051 | 0,205593 |
| 1969 | 202,7 | 201,5662 | 1,133754 | 1,587177 | 1,799468 | 1,285398 | 2,519131 | 0,205593 |
| 1970 | 205,1 | 204,0197 | 1,08033 | 1,133754 | 1,224829 | 1,167114 | 1,285398 | 0,002854 |
| 1971 | 207,7 | 206,4731 | 1,226907 | 1,08033 | 1,325465 | 1,505301 | 1,167114 | 0,021485 |
| 1972 | 209,9 | 208,9265 | 0,973483 | 1,226907 | 1,194374 | 0,94767 | 1,505301 | 0,064223 |
| 1973 | 211,9 | 211,3799 | 0,52006 | 0,973483 | 0,50627 | 0,270462 | 0,94767 | 0,205593 |
| 1974 | 213,8 | 213,8334 | -0,03336 | 0,52006 | -0,01735 | 0,001113 | 0,270462 | 0,306277 |
| 1975 | 216 | 216,2868 | -0,28679 | -0,03336 | 0,009568 | 0,082247 | 0,001113 | 0,064223 |
| 1976 | 218 | 218,7402 | -0,74021 | -0,28679 | 0,212283 | 0,547911 | 0,082247 | 0,205593 |
| 1977 | 220,2 | 221,1936 | -0,99363 | -0,74021 | 0,735498 | 0,987308 | 0,547911 | 0,064223 |
| 1978 | 222,6 | 223,6471 | -1,04706 | -0,99363 | 1,040391 | 1,096328 | 0,987308 | 0,002854 |
| 1979 | 225,1 | 226,1005 | -1,00048 | -1,04706 | 1,04756 | 1,000961 | 1,096328 | 0,002169 |
| 1980 | 227,7 | 228,5539 | -0,8539 | -1,00048 | 0,854314 | 0,729152 | 1,000961 | 0,021485 |
| 1981 | 230 | 231,0073 | -1,00733 | -0,8539 | 0,860161 | 1,014708 | 0,729152 | 0,023539 |
| 1982 | 232,3 | 233,4608 | -1,16075 | -1,00733 | 1,169256 | 1,347342 | 1,014708 | 0,023539 |
| 1983 | 234,8 | 235,9142 | -1,11417 | -1,16075 | 1,293279 | 1,241384 | 1,347342 | 0,002169 |
| 1984 | 237 | 238,3676 | -1,3676 | -1,11417 | 1,523742 | 1,870323 | 1,241384 | 0,064223 |
| 1985 | 239,3 | 240,821 | -1,52102 | -1,3676 | 2,080145 | 2,313505 | 1,870323 | 0,023539 |
| Итого | 7123,9 | 7123,9 | 6,82E-13 | 1,521021 | 80,01416 | 86,65502 | 84,34152 | 10,96822 |
| Ср.знач. | 197,8861 | 197,8861 | 1,89E-14 |
Коэффициент автокорреляции равен
Статистика Дарбина-Уотсона:
Остатки являются автокоррелированными, т.е. гипотеза об их цикличности подтверждена статистически, и отклонение остатков от линии тренда имеет неслучайный характер.