Ako je definovaný parabolický regresný model? Štúdium štatistickej závislosti zmien vlastností ložiska a formačných kvapalín v dôsledku rozvoja ropných polí

1. Ktoré z uvedených meraní patrí do triedy názvov meracích váh:
a) čísla kódujúce temperament;


d) telefónne čísla.

2. Ktoré z nasledujúcich meraní patrí do rádovej triedy meracích váh:

b) akademická hodnosť ako miera kariérneho postupu;
c) systém merania metrických vzdialeností;
d) telefónne čísla.

3. Ktoré z uvedených meraní patrí do triedy pomerov meracích stupníc:
a) čísla kódujúce temperament;
b) akademická hodnosť ako miera kariérneho postupu;
c) systém merania metrických vzdialeností;
d) telefónne čísla.

4. Ktorá z nasledujúcich vlastností patrí medzi kvantitatívne druhy:

b) rodinné väzby členov rodiny;
c) pohlavie a vek osoby;
d) sociálne postavenie vkladateľa;
e) počet detí v rodine;
f) maloobchodný obrat obchodných podnikov.

5. Ktorá z nasledujúcich vlastností patrí medzi kvalitatívne typy:
a) počet zamestnancov v spoločnosti;
b) rodinné väzby členov rodiny;
c) pohlavie a vek osoby;
d) sociálne postavenie vkladateľa;
e) počet detí v rodine;
f) maloobchodný obrat obchodných podnikov.

6. Aká stupnica sa používa na meranie úrovne inteligencie človeka:
a) mená;
b) radové;
c) interval;
d) vzťahy.

7. Štandardná odchýlka je:
a) druhá mocnina rozsahu variačného radu;
b) druhá odmocnina rozptylu;
c) kvadratický variačný koeficient;
d) druhá odmocnina veľkosti variačného rozsahu.

8. Variačný koeficient série je určený pomerom:
a) štandardná odchýlka od aritmetického priemeru hodnoty série;
b) rozptyl k mediánu série;
c) rozptyl na maximálnu hodnotu série;
d) absolútny ukazovateľ odchýlky od aritmetickej strednej hodnoty série.

9. Móda tejto variačnej série

x 10 15 35
n 1 2 3

toto:
a) 20;
b) 16;
na 3;
d) 35.

10. Aritmetický priemer populácie je:
a) hodnota charakteristiky v strede radu variácií;
b) polovičný rozdiel medzi maximálnymi a minimálnymi hodnotami série variácií;
c) polovica súčtu maximálnych a minimálnych hodnôt série variácií;
d) pomer súčtu všetkých veličín v populácii k ich celkovému počtu.

11. Známe sú údaje o pracovných skúsenostiach siedmich predavačov v predajni: 2; 3; 2; 5; 10; 7; 1 rok Nájdite priemernú hodnotu ich pracovných skúseností.
a) 4,3 roka;
b) 5 rokov;
c) 3 roky;
d) 3,8 roka.

12. Distribučný rad je:
a) postupnosť vzorových údajov;
b) usporiadané usporiadanie údajov podľa kvantitatívnych charakteristík;
c) číselná postupnosť údajov;
d) postupnosť hodnôt zoradená podľa kvalitatívnych charakteristík.

13. Frekvencia variantov variačného radu sa nazýva:
a) veľkosť vzorky;
b) význam variantov variačného radu;
c) počet jednotlivých variantov alebo skupín variačnej série;
d) počet skupín variačných sérií.

14. Móda je:
a) maximálna hodnota atribútu populácie;
b) najbežnejšiu hodnotu atribútu;
c) aritmetický priemer obyvateľstva.

15. Známe sú údaje o dĺžke služby predavačov v predajni: 2; 3; 2; 5; 10; 7; 1. Nájdite medián ich pracovných skúseností:
a) 4,5 roka;
b) 4,3 roka;
c) 3 roky;
d) 5 rokov.

16. Rozsah variácií tohto radu variácií:
x 10 15 20 30
n 1 2 3 2

toto:
a) 15;
b) 10;
c) 30;
d) 20.

17. Počet objednaných sérií je rozdelený na polovicu:
a) móda;
b) aritmetický priemer;
c) harmonický priemer;
d) medián.

18. Štatistické zoskupenie je:
a) kombinovanie alebo oddeľovanie údajov podľa základných charakteristík;
b) vedecká organizácia štatistického pozorovania;
c) druhy podávania správ;
d) priamy zber hromadných údajov.

19. Koeficient oscilácie je:
a) absolútny ukazovateľ;
b) priemerný;
c) relatívny ukazovateľ variácie.

20. Rozptyl variačného radu charakterizuje:
a) priemerná hodnota jednotlivých charakteristík;
b) rozptyl jednotlivých hodnôt charakteristík od priemernej hodnoty;
c) smerodajná odchýlka.

21. Rovnica lineárnej regresnej funkcie odráža dynamiku vývoja:
a) s premenlivým zrýchlením;

c) uniforma;
d) rovnomerne zrýchlené.

22. Ak je hodnota korelačného koeficientu 0,6, potom na stupnici Chedd.ka:
a) prakticky neexistuje žiadne spojenie;
b) spojenie je slabé;
c) spojenie je mierne;
d) spojenie je silné.

23. Údaje predstavujú skóre dospelých v teste Stanford-Binet IQ 104, 87, 101, 130, 148, 92, 97, 105, 134, 121. Nájdite rozsah variácií:
a) 61;
b) 60;
c) 75.

24. Nájdite vážený aritmetický priemer pre nasledujúce intervaly:

li ni
10-14 1
15-19 1
20-24 4
25-29 2
30-34 4

a) 24;
b) 24,92;
c) 25,38 hod.

25. Vypočítajte medián nasledujúcej série 2.1; 1,5; 1,6; 2,1; 2.4:
a) 2;
b) 1,5;
c) 2.1.

26. Vypočítajte režim nasledujúceho intervalového radu

frekvencia 5-7 8-10 11-13 14-16
interval 4 7 26 41

a) 14;
b) 14,54;
c) 15,23;

27. Ktoré z uvedených meraní patrí do triedy názvov meracích stupníc:
a) diagnóza pacienta;
b) poznávacie značky;
c) tvrdosť minerálu;
d) kalendárny čas;
e) hmotnosť osoby.

28. Ktoré z nasledujúcich meraní patrí do triedy radových meracích stupníc:
a) diagnóza pacienta;
b) poznávacie značky;
c) tvrdosť minerálu;
d) kalendárny čas;
e) hmotnosť osoby.

29. Ktoré z nasledujúcich meraní patrí do triedy intervalových meracích stupníc:
a) diagnóza pacienta;
b) poznávacie značky;
c) tvrdosť minerálu;
d) kalendárny čas;
e) hmotnosť osoby.
30. Ktoré z nasledujúcich meraní patrí do triedy pomerov meracích stupníc:
a) diagnóza pacienta;
b) poznávacie značky;
c) tvrdosť minerálu;
d) kalendárny čas;
e) hmotnosť osoby.

31. Aká stupnica sa používa pri meraní času:
a) interval;
b) vzťahy;
c) Chaddock.

32. Kvantitatívne typy zahŕňajú tieto charakteristiky:
a) výška človeka;
b) vyznamenania za zásluhy;
c) farba očí;
d) ŠPZ.

33. Kvalitatívne typy zahŕňajú tieto charakteristiky:
a) výška človeka;
b) vyznamenania za zásluhy;
c) farba očí;
d) ŠPZ

34. Režim výpočtu

xi 5 8 10 13 14
nie 7 4 5 9 1

a) 10;
b) 11;
c) 13

35. Pri veľkom počte žiakov v triedach je menšia úspešnosť získavania vedomostí v štvrtine ako v malých triedach. Čo je účinný znak?
a) počet žiakov v triede;
b) úspech pri získavaní vedomostí,
c) počet žiakov s úspešnosťou v získavaní vedomostí.

36. Dĺžka intervalu v intervalovom rade je:
a) rozsah variácie vydelený aritmetickým priemerom;
b) rozsah variácie vydelený počtom skupín;
c) rozptyl delený veľkosťou vzorky.

37. Príklad párovej korelácie: študenti, ktorí sa učia čítať skôr ako ostatní, majú tendenciu dosahovať vyššie študijné výsledky. Ktorý z týchto ukazovateľov: skorá schopnosť čítať alebo vysoké výsledky študentov sú ukazovateľom faktora?
a) schopnosť čítať skoro;
b) vysoký akademický výkon;
c) žiadny z nich.

38. Ktorú z nasledujúcich metód možno použiť pri porovnávaní priemerov troch alebo viacerých vzoriek:
a) Študentský test;
b) Fisherov test;
c) analýza rozptylu.

39. Veľkosť vzorky série variácií

xi 10 15 20 30
nie 1 2 3 2

a) 5;
b) 8;
v 12;
d) 30.

40. Móda variačných sérií

xi 10 15 20 25
nie 1 5 4 3

a) 15;
b) 5;
c) 23;
d) 3.

41. Rovnica parabolickej regresnej funkcie odráža dynamiku vývoja:
a) s premenlivým zrýchlením;
b) so spomalením rastu na konci obdobia;
c) uniforma;
d) rovnomerne zrýchlené.

42. Regresný koeficient B ukazuje:
a) očakávaná hodnota závislej premennej s nulovou hodnotou prediktora
b) očakávaná hodnota závislej premennej pri zmene prediktora o jednotku
c) pravdepodobnosť regresnej chyby
d) táto otázka ešte nie je definitívne vyriešená

43. Vzorkovanie je:
a) celý súbor predmetov, na ktorých je založená úvaha výskumníka;
b) množstvo predmetov dostupných pre empirický výskum;
c) všetky možné hodnoty rozptylu;
d) rovnako ako randomizácia.

44. Ktorý z nasledujúcich korelačných koeficientov demonštruje najväčší vzťah medzi premennými:
a) -0,90;
b) 0;
c) 0,07;
d) 0,01.

45. Všeobecná populácia je:
a) celý súbor predmetov, na ktorých je založená úvaha výskumníka;
b) množstvo predmetov dostupných pre empirický výskum;
c) všetky možné hodnoty matematického očakávania;
d) normálne rozdelenie.

46. ​​Ako sa porovnávajú veľkosti vzoriek a všeobecná populácia:
a) vzorka je zvyčajne výrazne menšia ako bežná populácia;
b) populácia je vždy menšia ako vzorka;
c) vzorka a populácia sa takmer vždy zhodujú;
d) neexistuje správna odpoveď.

47. Bodovo-dvojsériový korelačný koeficient je špeciálnym prípadom korelačného koeficientu:
a) Spearman;
b) Pearson;
c) Kendal;
d) všetky odpovede sú správne.

48. Na akej minimálnej úrovni významnosti je obvyklé zamietnuť nulovú hypotézu?
a) úroveň 5 %.
b) úroveň 7 %.
c) úroveň 9 %.
d) úroveň 10 %.

49. Ktorá z nasledujúcich metód sa zvyčajne používa pri porovnávaní priemerov v dvoch normálnych vzorkách:
a) Študentský test;
b) Fisherov test;
c) jednosmerná analýza rozptylu;
d) korelačná analýza.

50. Ako sa testujú štatistické hypotézy?
a) štatistik;
b) parametre;
c) pokusy;
d) pozorovania.

51. Ktorá z nasledujúcich hodnôt korelačného koeficientu nie je možná:
a) -0,54;
b) 2,18;
c) 0; d) 1.

52. Akú transformáciu je potrebné vykonať pri porovnaní dvoch korelačných koeficientov:
študentka;
b) Fischer;
c) Pearson;
d) Spearman.

53. Aký je medián rozdelenia:
a) rovnaké ako osi;
b) rovnaké ako móda;
c) aritmetický priemer;
d) 50 % kvantil distribúcie;
d) neexistuje správna odpoveď.

54. Bodovo-dvojsériový korelačný koeficient je špeciálnym prípadom korelačného koeficientu:
a) Spearman;
b) Pearson;
c) Kendall;
d) všetky odpovede sú správne.

55. Ktorá z nasledujúcich premenných je diskrétna:
a) typ temperamentu;
b) úroveň inteligencie;
c) reakčný čas;
d) všetky odpovede sú správne.

56. V akom rozsahu sa môže korelačný koeficient meniť:
a) od –1 do 1;
b) od 0 do 1;
c) od 0 do 100;
d) v akomkoľvek.

57. O čom sú predložené štatistické hypotézy:
a) koncepty;
b) štatistik;
c) vzorky;
d) parametre.

58. Ako sa volá neparametrický analóg analýzy rozptylu:
a) Študentský test;
b) Kruskal-Wallisova metóda;
c) Wilcoxonov test;
d) Mann-Whitneyho test.

59. Koncept korelačného koeficientu bol prvýkrát vyvinutý v prácach:
a) Fischer;
b) Študentský test;
c) Pearson;
d) Spearman.

60. Ktorá z nasledujúcich štatistík je nestranným odhadom očakávanej hodnoty:
a) aritmetický priemer;
b) móda;
c) medián;
d) všetky odpovede sú správne.

61. Ako porovnávajú Pearsonove a Spearmanove korelačné koeficienty:
a) Pearsonov koeficient je špeciálny prípad Spearmana;
b) Spearmanov koeficient je špeciálny prípad Pearsona;
c) tieto koeficienty majú odlišnú logiku konštrukcie;
d) je to to isté.

62. Podľa teoretických predpokladov analýzy rozptylu F-pomer nemôže byť:
a) rovná sa 1;
b) viac ako 1;
c) menej ako 1;
d) neexistuje správna odpoveď.

Vzťah medzi premennými X a Y možno opísať rôznymi spôsobmi. Najmä akákoľvek forma spojenia môže byť vyjadrená všeobecnou rovnicou y= f(x), kde y sa považuje za závisle premennú, alebo funkciu inej - nezávislej premennej x, tzv argument. Korešpondencia medzi argumentom a funkciou môže byť špecifikovaná tabuľkou, vzorcom, grafom atď. Zmena funkcie v závislosti od zmien jedného alebo viacerých argumentov sa nazýva regresia.

Termín "regresia"(z lat. regressio – spätný pohyb) zaviedol F. Galton, ktorý študoval dedičnosť kvantitatívnych znakov. Dozvedel sa. že potomkovia vysokých a nízkych rodičov sa vracajú (regresujú) o 1/3 smerom k priemernej úrovni tohto znaku v danej populácii. S ďalším rozvojom vedy tento výraz stratil svoj doslovný význam a začal sa používať na označenie korelácie medzi premennými Y a X.

Existuje mnoho rôznych foriem a typov korelácií. Úlohou výskumníka je v každom konkrétnom prípade identifikovať formu spojenia a vyjadriť ju pomocou vhodnej korelačnej rovnice, ktorá umožňuje predvídať možné zmeny v jednej charakteristike Y na základe známych zmien v inej charakteristike X, ktorá koreluje s prvou .

Rovnica paraboly druhého druhu

Niekedy môžu byť spojenia medzi premennými Y a X vyjadrené pomocou parabolického vzorca

Kde a,b,c sú neznáme koeficienty, ktoré je potrebné nájsť na základe známych meraní Y a X

Môžete riešiť pomocou maticovej metódy, ale už existujú vypočítané vzorce, ktoré použijeme

N - počet členov regresného radu

Y - hodnoty premennej Y

X - hodnoty premennej X

Ak používate tohto robota prostredníctvom klienta XMPP, syntax je nasledovná

regresný riadok X, riadok Y;2

Kde 2 - ukazuje, že regresia je vypočítaná ako nelineárna vo forme paraboly druhého rádu

No, je čas skontrolovať naše výpočty.

Takže je tu stôl

X Y
1 18.2
2 20.1
3 23.4
4 24.6
5 25.6
6 25.9
7 23.6
8 22.7
9 19.2

Z rôznych krajín sú k dispozícii nasledujúce údaje o indexe maloobchodných cien potravín (x) a indexe priemyselnej výroby (y).

Index maloobchodných cien potravín (x)Index priemyselnej produkcie (y)
1 100 70
2 105 79
3 108 85
4 113 84
5 118 85
6 118 85
7 110 96
8 115 99
9 119 100
10 118 98
11 120 99
12 124 102
13 129 105
14 132 112

Požadovaný:

1. Na charakterizovanie závislosti y od x vypočítajte parametre nasledujúcich funkcií:

A) lineárne;

B) sedatívum;

B) rovnostranná hyperbola.

3. Posúďte štatistickú významnosť regresných a korelačných parametrov.

4. Urobte prognózu hodnoty indexu priemyselnej produkcie y s prognózovanou hodnotou indexu maloobchodných cien potravín x=138.

Riešenie:

1. Vypočítať parametre lineárnej regresie

Riešime systém normálnych rovníc pre a a b:

Zostavme tabuľku vypočítaných údajov, ako je uvedené v tabuľke 1.

Tabuľka 1 Odhadované údaje pre odhad lineárnej regresie

NieXprixyx 2y 2
1 100 70 7000 10000 4900 74,26340 0,060906
2 105 79 8295 11025 6241 79,92527 0,011712
3 108 85 9180 11664 7225 83,32238 0,019737
4 113 84 9492 12769 7056 88,98425 0,059336
5 118 85 10030 13924 7225 94,64611 0,113484
6 118 85 10030 13924 7225 94,64611 0,113484
7 110 96 10560 12100 9216 85,58713 0,108467
8 115 99 11385 13225 9801 91,24900 0,078293
9 119 100 11900 14161 10000 95,77849 0,042215
10 118 98 11564 13924 9604 94,64611 0,034223
11 120 99 11880 14400 9801 96,91086 0,021102
12 124 102 12648 15376 10404 101,4404 0,005487
13 129 105 13545 16641 11025 107,1022 0,020021
14 132 112 14784 17424 12544 110,4993 0,013399
Celkom: 1629 1299 152293 190557 122267 1299,001 0,701866
Priemerná hodnota: 116,3571 92,78571 10878,07 13611,21 8733,357 X X
8,4988 11,1431 X X X X X
72,23 124,17 X X X X X

Priemerná hodnota je určená vzorcom:

Smerodajnú odchýlku vypočítame pomocou vzorca:

a výsledok zapíšte do tabuľky 1.

Umocnením výslednej hodnoty dostaneme rozptyl:

Parametre rovnice možno určiť aj pomocou vzorcov:

Takže regresná rovnica je:

Pri zvýšení indexu maloobchodných cien potravín o 1 sa teda index priemyselnej produkcie zvyšuje v priemere o 1,13.

Vypočítajme lineárny párový korelačný koeficient:

Spojenie je priame a celkom blízke.

Stanovme koeficient determinácie:

Odchýlka vo výsledku je 74,59 % vysvetlená zmenou x faktora.

Nahradením skutočných hodnôt x do regresnej rovnice určíme teoretické (vypočítané) hodnoty.

preto sú parametre rovnice určené správne.

Vypočítajme priemernú chybu aproximácie - priemernú odchýlku vypočítaných hodnôt od skutočných:

V priemere sa vypočítané hodnoty líšia od skutočných o 5,01%.

Kvalitu regresnej rovnice posúdime pomocou F-testu.

F-test pozostáva z testovania hypotézy H 0 o štatistickej nevýznamnosti regresnej rovnice a indikátora blízkosti vzťahu. Na tento účel sa vykoná porovnanie medzi skutočným F faktom a kritickými (tabuľkovými) hodnotami F tabuľky Fisherovho F-kritéria.

Fakt F je určený vzorcom:

kde n je počet jednotiek populácie;

m je počet parametrov pre premenné x.

Získané odhady regresnej rovnice umožňujú jej použitie na prognózovanie.

Ak je prognózovaná hodnota indexu maloobchodných cien potravín x = 138, prognózovaná hodnota indexu priemyselnej výroby bude:

2. Mocninná regresia má tvar:

Na určenie parametrov sa vykoná logaritmus výkonovej funkcie:

Na určenie parametrov logaritmickej funkcie sa pomocou metódy najmenších štvorcov zostrojí systém normálnych rovníc:

Zostavme tabuľku vypočítaných údajov, ako je uvedené v tabuľke 2.

Tabuľka 2 Vypočítané údaje pre odhad výkonu regresie

NieXprilg xlg ylg x * lg y(log x) 2(log y) 2
1 100 70 2,000000 1,845098 3,690196 4,000000 3,404387
2 105 79 2,021189 1,897627 3,835464 4,085206 3,600989
3 108 85 2,033424 1,929419 3,923326 4,134812 3,722657
4 113 84 2,053078 1,924279 3,950696 4,215131 3,702851
5 118 85 2,071882 1,929419 3,997528 4,292695 3,722657
6 118 85 2,071882 1,929419 3,997528 4,292695 3,722657
7 110 96 2,041393 1,982271 4,046594 4,167284 3,929399
8 115 99 2,060698 1,995635 4,112401 4,246476 3,982560
9 119 100 2,075547 2,000000 4,151094 4,307895 4,000000
10 118 98 2,071882 1,991226 4,125585 4,292695 3,964981
11 120 99 2,079181 1,995635 4,149287 4,322995 3,982560
12 124 102 2,093422 2,008600 4,204847 4,382414 4,034475
13 129 105 2,110590 2,021189 4,265901 4,454589 4,085206
14 132 112 2,120574 2,049218 4,345518 4,496834 4,199295
Celkom 1629 1299 28,90474 27,49904 56,79597 59,69172 54,05467
Priemerná hodnota 116,3571 92,78571 2,064624 1,964217 4,056855 4,263694 3,861048
8,4988 11,1431 0,031945 0,053853 X X X
72,23 124,17 0,001021 0,0029 X X X

Pokračovanie tabuľky 2 Vypočítané údaje pre odhad výkonu regresie

NieXpri
1 100 70 74,16448 17,34292 0,059493 519,1886
2 105 79 79,62057 0,385112 0,007855 190,0458
3 108 85 82,95180 4,195133 0,024096 60,61728
4 113 84 88,59768 21,13866 0,054734 77,1887
5 118 85 94,35840 87,57961 0,110099 60,61728
6 118 85 94,35840 87,57961 0,110099 60,61728
7 110 96 85,19619 116,7223 0,11254 10,33166
8 115 99 90,88834 65,79901 0,081936 38,6174
9 119 100 95,52408 20,03384 0,044759 52,04598
10 118 98 94,35840 13,26127 0,037159 27,18882
11 120 99 96,69423 5,316563 0,023291 38,6174
12 124 102 101,4191 0,337467 0,005695 84,90314
13 129 105 107,4232 5,872099 0,023078 149,1889
14 132 112 111,0772 0,85163 0,00824 369,1889
Celkom 1629 1299 1296,632 446,4152 0,703074 1738,357
Priemerná hodnota 116,3571 92,78571 X X X X
8,4988 11,1431 X X X X
72,23 124,17 X X X X

Riešením sústavy normálnych rovníc určíme parametre logaritmickej funkcie.

Dostaneme lineárnu rovnicu:

Po vykonaní jeho potenciácie dostaneme:

Nahradením skutočných hodnôt x do tejto rovnice získame teoretické hodnoty výsledku. Na základe nich vypočítame ukazovatele: tesnosť spojenia - korelačný index a priemerná chyba aproximácie.

Spojenie je celkom blízke.

V priemere sa vypočítané hodnoty líšia od skutočných o 5,02%.

Teda H 0 - hypotéza o náhodnosti hodnotených charakteristík sa zamieta a uznáva sa ich štatistická významnosť a spoľahlivosť.

Získané odhady regresnej rovnice umožňujú jej použitie na prognózovanie. Ak je prognózovaná hodnota indexu maloobchodných cien potravín x = 138, prognózovaná hodnota indexu priemyselnej výroby bude:

Na určenie parametrov tejto rovnice sa používa systém normálnych rovníc:

Urobme zmenu premenných

a získame nasledujúcu sústavu normálnych rovníc:

Riešením sústavy normálnych rovníc určíme parametre hyperboly.

Vytvorme tabuľku vypočítaných údajov, ako je uvedené v tabuľke 3.

Tabuľka 3 Vypočítané údaje na posúdenie hyperbolickej závislosti

NieXprizyz
1 100 70 0,010000000 0,700000 0,0001000 4900
2 105 79 0,009523810 0,752381 0,0000907 6241
3 108 85 0,009259259 0,787037 0,0000857 7225
4 113 84 0,008849558 0,743363 0,0000783 7056
5 118 85 0,008474576 0,720339 0,0000718 7225
6 118 85 0,008474576 0,720339 0,0000718 7225
7 110 96 0,009090909 0,872727 0,0000826 9216
8 115 99 0,008695652 0,860870 0,0000756 9801
9 119 100 0,008403361 0,840336 0,0000706 10000
10 118 98 0,008474576 0,830508 0,0000718 9604
11 120 99 0,008333333 0,825000 0,0000694 9801
12 124 102 0,008064516 0,822581 0,0000650 10404
13 129 105 0,007751938 0,813953 0,0000601 11025
14 132 112 0,007575758 0,848485 0,0000574 12544
Celkom: 1629 1299 0,120971823 11,13792 0,0010510 122267
Priemerná hodnota: 116,3571 92,78571 0,008640844 0,795566 0,0000751 8733,357
8,4988 11,1431 0,000640820 X X X
72,23 124,17 0,000000411 X X X

Pokračovanie tabuľky 3 Vypočítané údaje na posúdenie hyperbolickej závislosti

Uvažujme párový lineárny regresný model vzťahu medzi dvoma premennými, pre ktoré regresná funkcia φ(x) lineárne. Označme podľa r X podmienený priemer charakteristiky Y v populácii na pevnej hodnote X premenlivý X. Potom bude regresná rovnica vyzerať takto:

r X = sekera + b, Kde aregresný koeficient(ukazovateľ sklonu lineárnej regresnej priamky) . Regresný koeficient ukazuje, o koľko jednotiek sa premenná v priemere zmení Y pri zmene premennej X pre jednu jednotku. Pomocou metódy najmenších štvorcov sa získajú vzorce, ktoré možno použiť na výpočet parametrov lineárnej regresie:

Tabuľka 1. Vzorce na výpočet parametrov lineárnej regresie

Voľný člen b

Regresný koeficient a

Koeficient determinácie

Testovanie hypotézy o význame regresnej rovnice

N 0 :

N 1 :

, ,, Dodatok 7 (pre lineárnu regresiu p = 1)

Smer vzťahu medzi premennými sa určuje na základe znamienka regresného koeficientu. Ak je znamienko regresného koeficientu kladné, vzťah medzi závislou premennou a nezávislou premennou bude pozitívny. Ak je znamienko regresného koeficientu záporné, vzťah medzi závislou premennou a nezávisle premennou je negatívny (inverzný).

Na analýzu celkovej kvality regresnej rovnice sa používa koeficient determinácie R 2 , nazývaná aj druhá mocnina viacnásobného korelačného koeficientu. Koeficient determinácie (miera istoty) je vždy v rámci intervalu. Ak je hodnota R 2 blízko k jednote, to znamená, že skonštruovaný model vysvetľuje takmer všetku variabilitu zodpovedajúcich premenných. A naopak, význam R 2 blízko nuly znamená zlú kvalitu skonštruovaného modelu.

Koeficient determinácie R 2 ukazuje, akým percentom nájdená regresná funkcia opisuje vzťah medzi pôvodnými hodnotami Y A X. Na obr. Obrázok 3 ukazuje variáciu vysvetlenú regresným modelom a celkovú variáciu. V súlade s tým hodnota ukazuje, koľko percent variácie parametra Y v dôsledku faktorov, ktoré nie sú zahrnuté v regresnom modeli.

Pri vysokej hodnote koeficientu determinácie 75 %) je možné urobiť prognózu pre konkrétnu hodnotu v rozsahu počiatočných údajov. Pri predpovedaní hodnôt mimo rozsahu počiatočných údajov nie je možné zaručiť platnosť výsledného modelu. Vysvetľuje to skutočnosť, že sa môže objaviť vplyv nových faktorov, ktoré model nezohľadňuje.

Významnosť regresnej rovnice sa hodnotí pomocou Fisherovho kritéria (pozri tabuľku 1). Za predpokladu, že platí nulová hypotéza, má kritérium Fisherovo rozdelenie s počtom stupňov voľnosti , (pre párovú lineárnu regresiu p = 1). Ak je nulová hypotéza zamietnutá, potom sa regresná rovnica považuje za štatisticky významnú. Ak sa nulová hypotéza nezamietne, potom sa regresná rovnica považuje za štatisticky nevýznamnú alebo nespoľahlivú.

Príklad 1 V strojárni sa analyzuje štruktúra nákladov na výrobok a podiel nakupovaných komponentov. Bolo poznamenané, že náklady na komponenty závisia od času ich dodania. Prejdená vzdialenosť bola vybraná ako najdôležitejší faktor ovplyvňujúci čas doručenia. Vykonajte regresnú analýzu údajov o ponuke:

Vzdialenosť, míle

Čas, min

Ak chcete vykonať regresnú analýzu:

    zostrojte graf počiatočných údajov, približne určte povahu závislosti;

    zvoliť typ regresnej funkcie a určiť číselné koeficienty modelu metódou najmenších štvorcov a smer vzťahu;

    vyhodnotiť silu regresnej závislosti pomocou koeficientu determinácie;

    zhodnotiť významnosť regresnej rovnice;

    urobte predpoveď (alebo záver o nemožnosti predpovedania) pomocou prijatého modelu na vzdialenosť 2 míľ.

2. Vypočítajte množstvá potrebné na výpočet koeficientov rovnice lineárnej regresie a koeficientu determinácieR 2 :

; ;;.

Požadovaná regresná závislosť má tvar: . Určujeme smer vzťahu medzi premennými: znamienko regresného koeficientu je kladné, teda aj vzťah je kladný, čo potvrdzuje grafický predpoklad.

3. Vypočítajme koeficient determinácie: alebo 92 %. Lineárny model teda vysvetľuje 92 % variácií v dodacom čase, čo znamená, že faktor (vzdialenosť) bol zvolený správne. 8 % časových variácií nie je vysvetlených, čo je spôsobené inými faktormi, ktoré ovplyvňujú čas doručenia, ale nie sú zahrnuté v lineárnom regresnom modeli.

4. Overme si význam regresnej rovnice:

Pretože– regresná rovnica (lineárny model) je štatisticky významná.

5. Poďme vyriešiť problém prognózovania. Keďže koeficient determinácieR 2 má dostatočne vysokú hodnotu a vzdialenosť 2 míle, pre ktorú sa má vykonať predpoveď, je v rozsahu vstupných údajov, potom je možné vykonať predpoveď:

Regresnú analýzu možno pohodlne vykonať pomocou funkcií Excel. Pracovný režim "Regresia" sa používa na výpočet parametrov lineárnej regresnej rovnice a kontrolu jej primeranosti pre skúmaný proces. V dialógovom okne vyplňte nasledujúce parametre:

Príklad 2 Dokončite úlohu z príkladu 1 pomocou režimu „Regresia“.Excel.

ZÁVER VÝSLEDKOV

Regresná štatistika

Množné číslo R

R-štvorec

Normalizované R-štvorce

Štandardná chyba

Pozorovania

Odds

Štandardná chyba

t-štatistika

P-hodnota

Priesečník Y

Premenná X1

Pozrime sa na výsledky regresnej analýzy uvedené v tabuľke.

RozsahR-štvorec , nazývaná aj miera istoty, charakterizuje kvalitu výslednej regresnej priamky. Táto kvalita je vyjadrená mierou zhody medzi zdrojovými údajmi a regresným modelom (vypočítané údaje). V našom príklade je miera istoty 0,91829, čo naznačuje veľmi dobrú zhodu regresnej priamky s pôvodnými údajmi a zhoduje sa s koeficientom determinácie.R 2 , vypočítané podľa vzorca.

Množné číslo R - viacnásobný korelačný koeficient R - vyjadruje mieru závislosti nezávisle premenných (X) a závisle premennej (Y) a rovná sa druhej odmocnine koeficientu determinácie. V jednoduchej lineárnej regresnej analýzeviacnásobný R koeficientrovný koeficientu lineárnej korelácie (r = 0,958).

Koeficienty lineárneho modelu:Y - križovatka vytlačí hodnotu fiktívneho termínub, Apremenná X1 – regresný koeficient a. Potom rovnica lineárnej regresie je:

y = 2,6597X+ 5,9135 (čo dobre súhlasí s výsledkami výpočtu v príklade 1).

Ďalej skontrolujme význam regresných koeficientov:aAb. Porovnanie hodnôt stĺpcov v pároch Odds AŠtandardná chyba V tabuľke vidíme, že absolútne hodnoty koeficientov sú väčšie ako ich štandardné chyby. Okrem toho sú tieto koeficienty významné, ako sa dá posúdiť podľa hodnôt ukazovateľa P-hodnoty, ktoré sú menšie ako špecifikovaná hladina významnosti α = 0,05.

Pozorovanie

Predpokladaný Y

Zvyšky

Štandardné zostatky

V tabuľke sú uvedené výstupné výsledkyzvyšky jedla. Pomocou tejto časti správy môžeme vidieť odchýlky každého bodu od zostrojenej regresnej priamky. Najvyššia absolútna hodnotazvyšokv tomto prípade - 1,89256, najmenšia - 0,05399. Pre lepšiu interpretáciu týchto údajov vyneste pôvodné údaje a vytvorenú regresnú čiaru. Ako je zrejmé z konštrukcie, regresná čiara je dobre „prispôsobená“ hodnotám počiatočných údajov a odchýlky sú náhodné.

Ďalším typom jednofaktorovej regresie je aproximácia mocninnými polynómami v tvare:

Je prirodzené chcieť získať čo najjednoduchšiu závislosť, obmedzujúc sa na mocninné polynómy druhého stupňa, t.j. parabolická závislosť:
(5.5.2)

Vypočítajme parciálne derivácie vzhľadom na koeficienty b 0 , b 1 A b 2 :



(5.5.3)

Prirovnaním derivátov k nule dostaneme normálny systém rovníc:

(5.5.4)

Riešenie sústavy normálnych rovníc (5.5.2) pre konkrétny prípad hodnôt X i * , r i * ;
dostaneme optimálne hodnoty b 0 , b 1 A b 2 . Pre aproximáciu závislosťou (5.5.2) a ešte viac (5.5.1) neboli získané jednoduché vzorce na výpočet koeficientov a spravidla sa počítajú pomocou štandardných postupov v maticovej forme:

(5.5.5)

Obrázok 5.5.1 ukazuje typický príklad aproximácie pomocou parabolickej závislosti:

9 (5;9)

(1;1)

1

1 2 3 4 5 x

Obr.5.5.1. Súradnice experimentálnych bodov a približné

ich parabolická závislosť

Príklad 5.1. Experimentálne výsledky uvedené v tabuľke 5.1.1 aproximujte pomocou lineárnej regresnej rovnice
.

Tabuľka 5.1.1

Zostrojme experimentálne body podľa súradníc uvedených v tabuľke 5.1.1 na grafe na obr. 5.1.1.

pri

9

4

1 2 3 4 5 x

Podľa obr. 5.1.1, na ktorom nakreslíme priamku pre predbežné posúdenie, usúdime, že v umiestnení experimentálnych bodov je jasne vyjadrená nelinearita, ktorá však nie je veľmi významná a preto dáva zmysel. aproximovať ich lineárnou závislosťou. Všimnite si, že na získanie správneho matematického záveru je potrebné zostrojiť priamku pomocou metódy najmenších štvorcov.

Pred vykonaním regresnej analýzy je vhodné vypočítať

koeficient lineárnej korelácie medzi premennými X A pri:

Význam korelačného vzťahu je určený kritickou hodnotou lineárneho korelačného koeficientu vypočítanou pomocou vzorca:

Kritická hodnota Studentovho testu t Kréta zistené podľa štatistických tabuliek pre odporúčanú hladinu významnosti a = 0,05 a pre n-2 stupne slobody. Ak vypočítaná hodnota r xy nie menej ako kritická hodnota r Kréta, potom korelácia medzi premennými X A r považované za nevyhnutné. Urobme výpočty:










Vzhľadom k tomu, že
sme dospeli k záveru, že korelácia medzi premennými X A pri je významný a môže byť lineárny.

Vypočítajme koeficienty regresnej rovnice:

Takto sme dostali lineárnu regresnú rovnicu:

Pomocou regresnej rovnice nakreslíme priamku na obr. 5.1.2.

y (5;9,8)

9

4

(0;-0.2) 1 2 3 4 5 x

Obr.5.1.2. Súradnice experimentálnych bodov a približné

ich lineárna závislosť

Pomocou regresnej rovnice vypočítame hodnoty funkcie na základe experimentálnych bodov tabuľky 5.1.1 a rozdielu medzi experimentálnymi a vypočítanými hodnotami funkcie, ktoré uvádzame v tabuľke 5.1.2.

Tabuľka 5.1.2


Vypočítajme strednú štvorcovú chybu a jej pomer k priemernej hodnote:

Z hľadiska pomeru smerodajnej chyby k strednej hodnote bol získaný neuspokojivý výsledok, nakoľko bola prekročená odporúčaná hodnota 0,05.

Vyhodnoťme hladinu významnosti koeficientov regresnej rovnice pomocou Studentovho t-testu:


Zo štatistickej tabuľky pre 3 stupne voľnosti, zapíšme si riadky s hladinou významnosti - a hodnotu študentského kritéria t do tabuľky 5.1.3.

Tabuľka 5.1.3

Úroveň významnosti koeficientov regresnej rovnice:


Všimnite si, že podľa hladiny významnosti pre koeficient sa dosiahol uspokojivý výsledok a pre koeficient nevyhovujúce.

Vyhodnoťme kvalitu výslednej regresnej rovnice pomocou ukazovateľov vypočítaných na základe analýzy rozptylu:

Vyšetrenie:

Výsledok kontroly je pozitívny, čo naznačuje správnosť vykonaných výpočtov.

Vypočítajme Fisherovo kritérium:

s dvoma stupňami voľnosti:

Pomocou štatistických tabuliek nájdeme kritické hodnoty Fisherovho kritéria pre dve odporúčané gradácie hladiny významnosti:


Keďže vypočítaná hodnota Fisherovho testu presahuje kritickú hodnotu pre hladinu významnosti 0,01, budeme predpokladať, že hladina významnosti podľa Fisherovho testu je menšia ako 0,01, čo budeme považovať za vyhovujúce.

Vypočítajme koeficient viacnásobného určenia:

pre dva stupne voľnosti

Pomocou štatistickej tabuľky pre odporúčanú hladinu významnosti 0,05 a zistené dva stupne voľnosti zistíme kritickú hodnotu koeficientu viacnásobného určenia:

Keďže vypočítaná hodnota koeficientu viacnásobného určenia presahuje kritickú hodnotu pre hladinu významnosti
, potom hladina významnosti podľa koeficientu viacnásobného určenia
a výsledok získaný pre predložený ukazovateľ sa bude považovať za uspokojivý.

Takto získané vypočítané parametre z hľadiska pomeru smerodajnej chyby k strednej hodnote a hladiny významnosti podľa Studentovho testu sú nevyhovujúce, preto je vhodné zvoliť na aproximáciu inú približnú závislosť.

Príklad 5.2. Aproximácia experimentálneho rozdelenia náhodných čísel matematickou závislosťou

Experimentálne rozdelenie náhodných čísel uvedené v tabuľke 5.1.1 pri aproximácii lineárnou závislosťou neviedlo k uspokojivému výsledku, vr. z dôvodu nevýznamnosti koeficientu regresnej rovnice s voľným členom sa preto na zlepšenie kvality aproximácie pokúsime vykonať pomocou lineárnej závislosti bez voľného člena:

Vypočítajme hodnotu koeficientu regresnej rovnice:

Takto sme dostali regresnú rovnicu:

Pomocou výslednej regresnej rovnice vypočítame hodnoty funkcie a rozdiel medzi experimentálnymi a vypočítanými hodnotami funkcie, ktoré uvádzame vo forme tabuľky 5.2.1.

Tabuľka 5.2.1

X i

Podľa regresnej rovnice
na obr. 5.2.1 nakreslíme priamku.

y (5;9.73 )

(0;0) 1 2 3 4 5 x

Obr.5.2.1. Súradnice experimentálnych bodov a približné

ich lineárna závislosť

Na posúdenie kvality aproximácie vykonáme výpočty ukazovateľov kvality podobné výpočtom uvedeným v príklade 5.1.

(zostáva starý);

so 4 stupňami voľnosti;

Pre

Na základe výsledkov aproximácie konštatujeme, že z hľadiska hladiny významnosti koeficientu regresnej rovnice bol získaný uspokojivý výsledok; Pomer smerodajnej chyby k priemeru sa zlepšil, ale stále je nad odporúčanou hodnotou 0,05, preto sa odporúča zopakovať aproximáciu so zložitejším matematickým vzťahom.

Príklad 5.3. Na zlepšenie kvality aproximácie príkladov 5.1 a 5.2 vykonáme nelineárnu aproximáciu pomocou závislosti
. Aby sme to urobili, najprv urobíme priebežné výpočty a ich výsledky umiestnime do tabuľky 5.3.1.

hodnoty

Tabuľka 5.3.1

X 2

(lnX) 2

lnX lnY

Spočítajme navyše:

Približme si závislosť
. Pomocou vzorcov (5.3.7), (5.3.8) vypočítame koeficienty b 0 A b 1 :

Pomocou vzorcov (5.3.11) vypočítame koeficienty A 0 A A 1 :


Na výpočet štandardnej chyby sa vykonali medzivýpočty uvedené v tabuľke 5.3.2.

Tabuľka 5.3.2

Y i

r i

Suma: 7,5968

Štandardná chyba aproximácie sa ukázala byť oveľa väčšia ako v predchádzajúcich dvoch príkladoch, takže výsledky aproximácie považujeme za nepoužiteľné.

Príklad 5.4. Skúsme sa priblížiť ďalšou nelineárnou závislosťou
. Pomocou vzorcov (5.3.9), (5.3.10) podľa tabuľky 5.3.1 vypočítame koeficienty b 0 A b 1 :

Máme strednú závislosť:

Pomocou vzorcov (5.3.13) vypočítame koeficienty C 0 A C 1 :


Dostali sme konečnú závislosť:

Na výpočet štandardnej chyby vykonáme medzivýpočty a umiestnime ich do tabuľky 5.4.1.

Tabuľka 5.4.1

Y i

r i

Suma: 21,83152

Vypočítajme štandardnú chybu:

Štandardná chyba aproximácie sa ukázala byť oveľa väčšia ako v predchádzajúcom príklade, takže výsledky aproximácie považujeme za nepoužiteľné.

Príklad 5.5. Aproximácia experimentálneho rozdelenia náhodných čísel matematickou závislosťou r = b · lnx

Počiatočné údaje, ako v predchádzajúcich príkladoch, sú uvedené v tabuľke 5.4.1 a na obr. 5.4.1.

Tabuľka 5.4.1

Na základe analýzy obr. 5.4.1 a tabuľky 5.4.1 si všimneme, že s menšími hodnotami argumentu (na začiatku tabuľky) sa funkcia mení viac ako s väčšími hodnotami (na konci tabuľka), preto sa zdá byť vhodné zmeniť mierku argumentu a zaviesť z nej logaritmickú funkciu do regresnej rovnice a aproximovať ju s nasledujúcou matematickou závislosťou:

. Pomocou vzorca (5.4.3) vypočítame koeficient b:

Na posúdenie kvality aproximácie vykonáme medzivýpočty uvedené v tabuľke 5.4.2, z ktorých vypočítame veľkosť chyby a pomer štandardnej chyby k priemernej hodnote.

Tabuľka 5.4.2


Keďže pomer štandardnej chyby k strednej hodnote presahuje odporúčanú hodnotu 0,05, výsledok bude považovaný za neuspokojivý. Najmä si všimneme, že najväčšia odchýlka je daná hodnotou x=1, keďže s touto hodnotou lnx=0. Preto si závislosť priblížime r = b 0 +b 1 lnx

Pomocné výpočty uvádzame vo forme tabuľky 5.4.3.

Tabuľka 5.4.3

Pomocou vzorcov (5.4.6) a (5.4.7) vypočítame koeficienty b 0 a b 1 :

9 (5;9.12)

4

1 (1;0.93)

1 2 3 4 5 x

Na posúdenie kvality aproximácie vykonáme pomocné výpočty a určíme hladinu významnosti zistených koeficientov a pomer smerodajnej chyby k priemernej hodnote.

Úroveň významnosti mierne nad odporúčanou hodnotou 0,05 (
).


Vzhľadom na to, že podľa hlavného ukazovateľa - pomeru smerodajnej chyby k priemernej hodnote - bolo dosiahnuté takmer dvojnásobné prekročenie odporúčanej úrovne 0,05, budeme výsledky považovať za prijateľné. Všimnite si, že vypočítaná hodnota Študentovho testu t b 0 =2,922 odlišný od kritického
o relatívne malé množstvo.

Príklad 5.6. Približme experimentálne údaje z príkladu 5.1 hyperbolickou závislosťou
. Na výpočet koeficientov b 0 a b 1 Urobme predbežné výpočty uvedené v tabuľke 5.6.1.

Tabuľka 5.6.1

X i

X i = 1/X i

X i 2

X i r i

Na základe výsledkov tabuľky 5.6.1 pomocou vzorcov (5.4.8) a (5.4.9) vypočítame koeficienty b 0 a b 1 :

Takto sa získa hyperbolická regresná rovnica

.

Výsledky pomocných výpočtov na posúdenie kvality aproximácie sú uvedené v tabuľke 5.6.2.

Tabuľka 5.6.2

X i

Na základe výsledkov tabuľky 5.6.2 vypočítame štandardnú chybu a pomer štandardnej chyby k strednej hodnote:


Vzhľadom na to, že pomer smerodajnej chyby k strednej hodnote presahuje odporúčanú hodnotu 0,05, usudzujeme, že výsledky aproximácie sú nevhodné.

Príklad 5.7.

Na výpočet konkrétnych hodnôt príjmu z prevádzky výložníkových žeriavov v závislosti od času údržby je potrebné získať parabolickú závislosť.

Vypočítajme koeficienty tejto závislosti b 0 , b 1 , b 11 v maticovej forme podľa vzorca:

Nelineárne regresné rovnice spájajúce efektívny ukazovateľ s optimálnymi hodnotami na vykonávanie preventívnej údržby vežových žeriavov boli získané pomocou viacnásobnej regresnej procedúry aplikačného balíka Statistica 6.0. Ďalej uvádzame výsledky regresnej analýzy pre ukazovateľ efektívnej výkonnosti podľa tabuľky 5.7.1.

Tabuľka 5.7.1

V tabuľke 5.7.2 sú uvedené výsledky nelineárnej regresie pre ukazovateľ efektívnej výkonnosti a v tabuľke 5.7.3 sú uvedené výsledky analýzy rezíduí.

Tabuľka 5.7.2

Tabuľka 5.7.3

Ryža. 3.7.36. Analýza rezíduí.

Získali sme teda viacnásobnú regresnú rovnicu pre premennú
:

Pomer štandardnej chyby znamená:

14780/1017890=0,0145 < 0,05.

Keďže pomer štandardnej chyby k strednej hodnote nepresahuje odporúčanú hodnotu 0,05, výsledky aproximácie možno považovať za prijateľné. Ako nevýhodu podľa tabuľky 5.7.2 treba poznamenať, že všetky vypočítané koeficienty prekračujú odporúčanú hladinu významnosti 0,05.

Podobné články