Hogyan definiálható a parabolikus regressziós modell? A tározó és a képződő folyadékok tulajdonságainak változásának statisztikai függésének vizsgálata az olajmezők fejlődése következtében

1. Az alábbi mérések közül melyik tartozik a mérőmérlegek névosztályába:
a) temperamentumot kódoló számok;


d) telefonszámok.

2. Az alábbi mérések közül melyik tartozik a mérőskálák rendi osztályába:

b) tanulmányi rang, mint a szakmai előmenetel mércéje;
c) metrikus távolságmérő rendszer;
d) telefonszámok.

3. Az alábbi mérések közül melyik tartozik a mérőskálák arányosztályába:
a) temperamentumot kódoló számok;
b) tanulmányi rang, mint a szakmai előmenetel mércéje;
c) metrikus távolságmérő rendszer;
d) telefonszámok.

4. Az alábbi jellemzők közül melyik tartozik mennyiségi fajokhoz:

b) a családtagok családi kötelékei;
c) a személy neme és életkora;
d) a betétes szociális helyzete;
e) a gyermekek száma a családban;
f) kereskedelmi vállalkozások kiskereskedelmi forgalma.

5. Az alábbi jellemzők közül melyek tartoznak minőségi típusokba:
a) a vállalatnál foglalkoztatottak száma;
b) a családtagok családi kötelékei;
c) a személy neme és életkora;
d) a betétes szociális helyzete;
e) a gyermekek száma a családban;
f) kereskedelmi vállalkozások kiskereskedelmi forgalma.

6. Milyen skálát használnak egy személy intelligencia szintjének mérésére?
a) nevek;
b) sorszám;
c) intervallum;
d) kapcsolatok.

7. Átlagos szórás- Ez:
a) a variációs sorozat tartományának négyzete;
b) a variancia négyzetgyöke;
c) négyzetes variációs együttható;
d) a variációs tartomány nagyságának négyzetgyöke.

8. Egy sorozat variációs együtthatóját a következő arány határozza meg:
a) a sorozat számtani középértékének szórása;
b) eltérés a sorozat mediánjától;
c) diszperzió a sorozat maximális értékére;
d) a sorozat számtani középértékének eltérésének abszolút mutatója.

9. Ennek a variációs sorozatnak a divatja

x 10 15 35
n 1 2 3

Ez:
a) 20;
b) 16;
3-nál;
d) 35.

10. A sokaság számtani átlaga:
a) a jellemző értéke a variációs sorozat közepén;
b) a variációs sorozat maximális és minimális értéke közötti különbség fele;
c) a variációs sorozat maximális és minimális értékeinek összegének fele;
d) a sokaságban lévő összes mennyiség összegének az összlétszámhoz viszonyított aránya.

11. Hét bolti eladó munkatapasztalatára vonatkozó adatok ismertek: 2; 3; 2; 5; 10; 7; 1 év Keresse meg munkatapasztalataik átlagos értékét.
a) 4,3 év;
b) 5 év;
c) 3 év;
d) 3,8 év.

12. A terjesztési sorozat a következő:
a) mintaadatok sorrendje;
b) az adatok mennyiségi jellemzők szerinti rendezett elrendezése;
V) számsor adat;
d) értéksor, minőségi jellemzők szerint rendezve.

13. Egy variációs sorozat változatainak gyakoriságát:
a) mintanagyság;
b) a variációs sorozat változatainak jelentése;
c) egy variációsorozat egyedi változatainak vagy csoportjainak száma;
d) a variációs sorozat csoportjainak száma.

14. A divat:
a) a populációs jellemző maximális értéke;
b) az attribútum leggyakoribb értéke;
c) a sokaság számtani átlaga.

15. A bolti eladók szolgálati idejére vonatkozó adatok ismertek: 2; 3; 2; 5; 10; 7; 1. Keresse meg munkatapasztalataik mediánját:
a) 4,5 év;
b) 4,3 év;
c) 3 év;
d) 5 év.

16. Ennek a variációs sorozatnak a variációs tartománya:
x 10 15 20 30
n 1 2 3 2

Ez:
a) 15;
b) 10;
c) 30;
d) 20.

17. A rendezett sorozatok számát ketté kell osztani:
a) divat;
b) számtani átlag;
c) harmonikus átlag;
d) medián.

18. A statisztikai csoportosítás a következő:
a) az adatok összevonása vagy szétválasztása az alapvető jellemzők szerint;
b) a statisztikai megfigyelés tudományos szervezése;
c) a jelentéstétel típusai;
d) tömeges adatok közvetlen gyűjtése.

19. Az oszcillációs együttható:
a) abszolút mutató;
b) átlagos;
c) a változás relatív mutatója.

20. Egy variációs sorozat diszperziója jellemzi:
a) az egyedi jellemzők átlagértéke;
b) a jellemzők egyedi értékeinek szórása az átlagértékből;
c) szórás.

21. A lineáris regressziós függvény egyenlete a fejlődés dinamikáját tükrözi:
a) változó gyorsulással;

c) egységes;
d) egyenletesen gyorsított.

22. Ha a korrelációs együttható értéke 0,6, akkor a Chadd.ka skála szerint:
a) gyakorlatilag nincs kapcsolat;
b) gyenge a kapcsolat;
c) a kapcsolat közepes;
d) erős a kapcsolat.

23. Az adatok a felnőttek Stanford-Binet IQ-teszt 104., 87., 101., 130., 148., 92., 97., 105., 134., 121. pontjait reprezentálják. Határozza meg a variáció tartományát:
a) 61;
b) 60;
c) 75.

24. Határozza meg a súlyozott számtani átlagot a következő intervallumsorokhoz!

li ni
10-14 1
15-19 1
20-24 4
25-29 2
30-34 4

a) 24;
b) 24,92;
c) 25,38.

25. Számítsa ki a következő 2.1 sorozat mediánját; 1,5; 1,6; 2,1; 2.4:
a) 2;
b) 1,5;
c) 2.1.

26. Számítsa ki a következő intervallumsorozat módusát!

frekvencia 5-7 8-10 11-13 14-16
intervallum 4 7 26 41

a) 14;
b) 14,54;
c) 15,23;

27. Az alábbi mérések közül melyik tartozik a mérőmérlegek névosztályába?
a) a beteg diagnózisa;
b) rendszámok;
c) az ásvány keménysége;
d) naptári idő;
e) egy személy súlya.

28. Az alábbi mérések közül melyik tartozik az ordinális mérési skálák osztályába:
a) a beteg diagnózisa;
b) rendszámok;
c) az ásvány keménysége;
d) naptári idő;
e) egy személy súlya.

29. Az alábbi mérések közül melyik tartozik az intervallummérő skálák osztályába?
a) a beteg diagnózisa;
b) rendszámok;
c) az ásvány keménysége;
d) naptári idő;
e) egy személy súlya.
30. Az alábbi mérések közül melyik tartozik a mérőskálák arányosztályába:
a) a beteg diagnózisa;
b) rendszámok;
c) az ásvány keménysége;
d) naptári idő;
e) egy személy súlya.

31. Milyen skálát használnak az idő mérésénél:
a) intervallum;
b) kapcsolatok;
c) Chaddock.

32. A mennyiségi típusok a következő jellemzőket tartalmazzák:
a) embermagasság;
b) érdemdíjak;
c) szemszín;
d) rendszámok.

33. A minőségi típusok a következő jellemzőket tartalmazzák:
a) embermagasság;
b) érdemdíjak;
c) szemszín;
d) rendszámok

34. Számítási mód

xi 5 8 10 13 14
ni 7 4 5 9 1

a) 10;
b) 11;
c) 13

35. Az osztályokban nagy létszámú tanulóknál kevesebb sikert ér el az ismeretszerzés egy negyedben, mint a kis tagozatosokban. Mi a hatékony jel?
a) az osztály tanulóinak számát;
b) siker az ismeretszerzésben,
c) az ismeretszerzésben eredményes tanulók száma.

36. Egy intervallum sorozatban egy intervallum hossza:
a) a variációs tartomány osztva a számtani átlaggal;
b) a variációs tartomány osztva a csoportok számával;
c) variancia osztva a minta méretével.

37. Példa a páros összefüggésre: azok a tanulók, akik korábban tanulnak meg olvasni, általában magasabbak a tanulmányi teljesítményükben. Az alábbiak közül melyik indikátor: korai olvasási képesség vagy magas tanulói teljesítmény faktormutató?
a) a korai olvasás képessége;
b) magas tanulmányi teljesítmény;
c) egyik sem.

38. Az alábbi módszerek közül melyik használható három vagy több minta átlagainak összehasonlításakor:
a) Hallgatói teszt;
b) Fisher-teszt;
c) varianciaanalízis.

39. A variációs sorozat mintanagysága

xi 10 15 20 30
ni 1 2 3 2

a) 5;
b) 8;
12-kor;
d) 30.

40. Variációs sorozat divat

xi 10 15 20 25
ni 1 5 4 3

a) 15;
b) 5;
c) 23;
d) 3.

41. A parabolikus regressziós függvény egyenlete a fejlődés dinamikáját tükrözi:
a) változó gyorsulással;
b) a növekedés lassulásával az időszak végén;
c) egységes;
d) egyenletesen gyorsított.

42. B regressziós együttható:
a) a függő változó várható értéke a prediktor nulla értéke mellett
b) a függő változó várható értéke, ha a prediktor eggyel változik
c) a regressziós hiba valószínűsége
d) ez a kérdés még nincs véglegesen megoldva

43. A mintavétel a következő:
a) a tárgyak összessége, amelyről a kutató érvelése alapul;
b) az empirikus kutatáshoz rendelkezésre álló különféle objektumok;
c) a szóródás összes lehetséges értéke;
d) ugyanaz, mint a randomizáció.

44. Az alábbi korrelációs együtthatók közül melyik mutatja a legnagyobb kapcsolatot a változók között:
a) -0,90;
b) 0;
c) 0,07;
d) 0,01.

45. Az általános lakosság:
a) a tárgyak összessége, amelyről a kutató érvelése alapul;
b) az empirikus kutatáshoz rendelkezésre álló különféle objektumok;
c) a matematikai elvárás összes lehetséges értéke;
d) normál eloszlás.

46. ​​Hogyan alakulnak a mintaméretek és népesség:
a) a minta általában lényegesen kisebb, mint az általános sokaság;
b) a sokaság mindig kisebb, mint a minta;
c) a minta és a sokaság szinte mindig egybeesik;
d) nincs helyes válasz.

47. A pont-biszerial korrelációs együttható a korrelációs együttható speciális esete:
a) Spearman;
b) Pearson;
c) Kendal;
d) minden válasz helyes.

48. Milyen minimális szignifikanciaszinten szokás elvetni a nullhipotézist?
a) 5%-os szint
b) 7%-os szint
c) 9%-os szint
d) 10%-os szint

49. Az alábbi módszerek közül melyiket használják általában két normál minta átlagainak összehasonlításakor:
a) Hallgatói teszt;
b) Fisher-teszt;
c) egyirányú varianciaanalízis;
d) korrelációelemzés.

50. Hogyan tesztelik a statisztikai hipotéziseket?
a) statisztikus;
b) paraméterek;
c) kísérletek;
d) megfigyelések.

51. A korrelációs együttható alábbi értékei közül melyik lehetetlen:
a) -0,54;
b) 2,18;
c) 0; d) 1.

52. Milyen transzformációt kell végrehajtani két korrelációs együttható összehasonlításakor?
egy diák;
b) Fischer;
c) Pearson;
d) Spearman.

53. Mi az eloszlás mediánja:
a) ugyanaz, mint a felező;
b) ugyanaz, mint a divat;
c) számtani átlag;
d) az eloszlás 50%-a;
d) nincs helyes válasz.

54. A pont-biszerial korrelációs együttható a korrelációs együttható speciális esete:
a) Spearman;
b) Pearson;
c) Kendall;
d) minden válasz helyes.

55. A következő változók közül melyik a diszkrét:
a) temperamentum típusa;
b) intelligencia szintje;
c) reakcióidő;
d) minden válasz helyes.

56. Milyen tartományban változhat a korrelációs együttható:
a) –1-től 1-ig;
b) 0-tól 1-ig;
c) 0-tól 100-ig;
d) bármelyikben.

57. Milyen statisztikai hipotéziseket állítanak fel a következőkről:
a) fogalmak;
b) statisztikus;
c) minták;
d) paraméterek.

58. Mi a nemparaméteres analóg neve? varianciaanalízis:
a) Hallgatói teszt;
b) Kruskal-Wallis módszer;
c) Wilcoxon teszt;
d) Mann-Whitney teszt.

59. A korrelációs együttható fogalmát először a munkákban dolgozták ki:
a) Fischer;
b) Hallgatói teszt;
c) Pearson;
d) Spearman.

60. Az alábbi statisztikák közül melyik a várható érték elfogulatlan becslése:
a) számtani átlag;
b) divat;
c) medián;
d) minden válasz helyes.

61. Hogyan hasonlítják össze a Pearson és Spearman korrelációs együtthatók:
a) a Pearson-együttható Spearman speciális esete;
b) a Spearman-együttható Pearson speciális esete;
c) ezek az együtthatók eltérő felépítésűek;
d) ez ugyanaz.

62. A varianciaanalízis elméleti feltevései szerint az F-arány nem lehet:
a) egyenlő 1-gyel;
b) több mint 1;
c) 1-nél kisebb;
d) nincs helyes válasz.

közötti függőség változó mennyiségek X és Y különböző módon írható le. Az egyenlettel különösen a kapcsolat bármely formája kifejezhető Általános nézet y= f(x), ahol y-t függő változónak tekintjük, vagy egy másik - független x változó függvényének érv. Az argumentum és a függvény közötti megfelelést táblázat, képlet, grafikon stb. adhatja meg. A függvényben egy vagy több argumentum változásától függő változást ún. regresszió.

Term "regresszió"(latin regressio - visszafelé mozgás) F. Galton vezette be, aki a mennyiségi tulajdonságok öröklődését vizsgálta. Kitalálta. hogy a magas és alacsony szülők utódai 1/3-át térnek vissza (regressziót) ennek a tulajdonságnak az átlagos szintje felé az adott populációban. A tudomány további fejlődésével ez a kifejezés elvesztette szó szerinti jelentését, és az Y és X változók közötti összefüggés jelölésére kezdték használni.

Az összefüggéseknek sokféle formája és típusa létezik. A kutató feladata abban rejlik, hogy minden konkrét esetben azonosítsa a kapcsolat formáját és kifejezze azt a megfelelő korrelációs egyenlettel, amely lehetővé teszi, hogy előre jelezze az egyik Y karakterisztikában a lehetséges változásokat egy másik X ismert változása alapján, amely korrelál az elsővel. .

Második típusú parabola egyenlete

Néha az Y és X változók közötti kapcsolatok a parabola-képlettel fejezhetők ki

Ahol a,b,c ismeretlen együtthatók, amelyeket meg kell találni, Y és X ismert mérései alapján

Megoldhatod a mátrix módszerrel, de már vannak kiszámított képletek, amelyeket használni fogunk

N - a regressziós sorozat tagjainak száma

Y - az Y változó értékei

X - az X változó értékei

Ha ezt a botot XMPP kliensen keresztül használja, akkor a szintaxis a következő

regress X sor;2

ahol 2 - azt mutatja, hogy a regressziót nemlineárisnak számítjuk egy másodrendű parabola formájában

Nos, ideje ellenőrizni a számításainkat.

Tehát van egy asztal

x Y
1 18.2
2 20.1
3 23.4
4 24.6
5 25.6
6 25.9
7 23.6
8 22.7
9 19.2

A következő adatok állnak rendelkezésre különböző országok az élelmiszerek kiskereskedelmi árindexéről (x) és az ipari termelési indexről (y).

Kiskereskedelmi élelmiszerár-index (x)Ipari termelési index (y)
1 100 70
2 105 79
3 108 85
4 113 84
5 118 85
6 118 85
7 110 96
8 115 99
9 119 100
10 118 98
11 120 99
12 124 102
13 129 105
14 132 112

Kívánt:

1. Az y x-től való függésének jellemzéséhez számítsa ki a következő függvények paramétereit!

A) lineáris;

B) nyugtató;

B) egyenlő oldalú hiperbola.

3. Mérje fel a regressziós és korrelációs paraméterek statisztikai szignifikanciáját!

4. Készítsen előrejelzést az y ipari termelési index értékére a kiskereskedelmi élelmiszerárindex előrejelzési értékével x=138!

Megoldás:

1. Lineáris regressziós paraméterek kiszámítása

Megoldjuk az a és b normálegyenletrendszerét:

Készítsünk egy táblázatot a számított adatokból az 1. táblázat szerint.

1. táblázat Becsült adatok a lineáris regressziós becsléshez

Nem.xnál nélxyx 2y 2
1 100 70 7000 10000 4900 74,26340 0,060906
2 105 79 8295 11025 6241 79,92527 0,011712
3 108 85 9180 11664 7225 83,32238 0,019737
4 113 84 9492 12769 7056 88,98425 0,059336
5 118 85 10030 13924 7225 94,64611 0,113484
6 118 85 10030 13924 7225 94,64611 0,113484
7 110 96 10560 12100 9216 85,58713 0,108467
8 115 99 11385 13225 9801 91,24900 0,078293
9 119 100 11900 14161 10000 95,77849 0,042215
10 118 98 11564 13924 9604 94,64611 0,034223
11 120 99 11880 14400 9801 96,91086 0,021102
12 124 102 12648 15376 10404 101,4404 0,005487
13 129 105 13545 16641 11025 107,1022 0,020021
14 132 112 14784 17424 12544 110,4993 0,013399
Teljes: 1629 1299 152293 190557 122267 1299,001 0,701866
Átlagos érték: 116,3571 92,78571 10878,07 13611,21 8733,357 x x
8,4988 11,1431 x x x x x
72,23 124,17 x x x x x

Az átlagértéket a következő képlet határozza meg:

A szórást a következő képlet segítségével számítjuk ki:

és írja be az eredményt az 1. táblázatba.

A kapott érték négyzetre emelésével megkapjuk a szórást:

Az egyenlet paraméterei a következő képletekkel is meghatározhatók:

Tehát a regressziós egyenlet:

Ezért a kiskereskedelmi élelmiszerár-index 1-es növekedésével az ipari termelési index átlagosan 1,13-mal nő.

Számítsuk ki a lineáris pár korrelációs együtthatót:

A kapcsolat közvetlen és elég szoros.

Határozzuk meg a determinációs együtthatót:

Az eredmény ingadozása 74,59%-ban az x faktor változásával magyarázható.

Az x tényleges értékeit behelyettesítve a regressziós egyenletbe, meghatározzuk az elméleti (számított) értékeket.

ezért az egyenlet paramétereit helyesen határozzuk meg.

Számítsuk ki az átlagos közelítési hibát - a számított értékek átlagos eltérését a tényleges értékektől:

A számított értékek átlagosan 5,01%-kal térnek el a tényleges értékektől.

A regressziós egyenlet minőségét az F-próba segítségével értékeljük.

Az F-próba a regressziós egyenlet statisztikai jelentéktelenségére és a kapcsolat szorosságának mutatójára vonatkozó H 0 hipotézis teszteléséből áll. Ehhez összehasonlítjuk a tényleges F tényt és a Fisher F-kritérium kritikus (táblázatos) F táblázat értékeit.

Az F tényt a következő képlet határozza meg:

ahol n a lakossági egységek száma;

m az x változók paramétereinek száma.

A regressziós egyenlet kapott becslései lehetővé teszik az előrejelzéshez való felhasználását.

Ha a kiskereskedelmi élelmiszerár-index előrejelzett értéke x = 138, akkor az ipari termelési index előrejelzési értéke:

2. A hatványos regresszió alakja:

A paraméterek meghatározásához a hatványfüggvény logaritmusát hajtjuk végre:

A logaritmikus függvény paramétereinek meghatározásához normál egyenletrendszert szerkesztünk a legkisebb négyzetek módszerével:

Készítsünk egy táblázatot a számított adatokból a 2. táblázat szerint.

2. táblázat Számított adatok a teljesítményregresszió becsléséhez

Nem.xnál néllg xlg ylg x*lg y(log x) 2(log y) 2
1 100 70 2,000000 1,845098 3,690196 4,000000 3,404387
2 105 79 2,021189 1,897627 3,835464 4,085206 3,600989
3 108 85 2,033424 1,929419 3,923326 4,134812 3,722657
4 113 84 2,053078 1,924279 3,950696 4,215131 3,702851
5 118 85 2,071882 1,929419 3,997528 4,292695 3,722657
6 118 85 2,071882 1,929419 3,997528 4,292695 3,722657
7 110 96 2,041393 1,982271 4,046594 4,167284 3,929399
8 115 99 2,060698 1,995635 4,112401 4,246476 3,982560
9 119 100 2,075547 2,000000 4,151094 4,307895 4,000000
10 118 98 2,071882 1,991226 4,125585 4,292695 3,964981
11 120 99 2,079181 1,995635 4,149287 4,322995 3,982560
12 124 102 2,093422 2,008600 4,204847 4,382414 4,034475
13 129 105 2,110590 2,021189 4,265901 4,454589 4,085206
14 132 112 2,120574 2,049218 4,345518 4,496834 4,199295
Teljes 1629 1299 28,90474 27,49904 56,79597 59,69172 54,05467
Átlagos érték 116,3571 92,78571 2,064624 1,964217 4,056855 4,263694 3,861048
8,4988 11,1431 0,031945 0,053853 x x x
72,23 124,17 0,001021 0,0029 x x x

A 2. táblázat folytatása Számított adatok a teljesítményregresszió becsléséhez

Nem.xnál nél
1 100 70 74,16448 17,34292 0,059493 519,1886
2 105 79 79,62057 0,385112 0,007855 190,0458
3 108 85 82,95180 4,195133 0,024096 60,61728
4 113 84 88,59768 21,13866 0,054734 77,1887
5 118 85 94,35840 87,57961 0,110099 60,61728
6 118 85 94,35840 87,57961 0,110099 60,61728
7 110 96 85,19619 116,7223 0,11254 10,33166
8 115 99 90,88834 65,79901 0,081936 38,6174
9 119 100 95,52408 20,03384 0,044759 52,04598
10 118 98 94,35840 13,26127 0,037159 27,18882
11 120 99 96,69423 5,316563 0,023291 38,6174
12 124 102 101,4191 0,337467 0,005695 84,90314
13 129 105 107,4232 5,872099 0,023078 149,1889
14 132 112 111,0772 0,85163 0,00824 369,1889
Teljes 1629 1299 1296,632 446,4152 0,703074 1738,357
Átlagos érték 116,3571 92,78571 x x x x
8,4988 11,1431 x x x x
72,23 124,17 x x x x

Normálegyenletrendszer megoldásával meghatározzuk a logaritmikus függvény paramétereit.

Kapunk lineáris egyenlet:

A potencírozás végrehajtása után a következőket kapjuk:

Behelyettesítés adott egyenlet x tényleges értékeit megkapjuk az eredmény elméleti értékeit. Ezek alapján kiszámítjuk a mutatókat: kapcsolat szorossága - korrelációs index és átlagos közelítési hiba.

A kapcsolat elég szoros.

A számított értékek átlagosan 5,02%-kal térnek el a tényleges értékektől.

Így H 0 - a vizsgált jellemzők véletlenszerűségére vonatkozó hipotézist elvetjük, statisztikai szignifikanciájukat és megbízhatóságukat elismerjük.

A regressziós egyenlet kapott becslései lehetővé teszik az előrejelzéshez való felhasználását. Ha a kiskereskedelmi élelmiszerár-index előrejelzett értéke x = 138, akkor az ipari termelési index előrejelzési értéke:

Az egyenlet paramétereinek meghatározásához normál egyenletrendszert használunk:

Változtassuk meg a változókat

és megkapjuk a következő normálegyenletrendszert:

Normálegyenletrendszer megoldásával meghatározzuk a hiperbola paramétereit.

Készítsünk táblázatot a számított adatokból a 3. táblázat szerint.

3. táblázat Számított adatok a hiperbolikus függőség értékeléséhez

Nem.xnál nélzyz
1 100 70 0,010000000 0,700000 0,0001000 4900
2 105 79 0,009523810 0,752381 0,0000907 6241
3 108 85 0,009259259 0,787037 0,0000857 7225
4 113 84 0,008849558 0,743363 0,0000783 7056
5 118 85 0,008474576 0,720339 0,0000718 7225
6 118 85 0,008474576 0,720339 0,0000718 7225
7 110 96 0,009090909 0,872727 0,0000826 9216
8 115 99 0,008695652 0,860870 0,0000756 9801
9 119 100 0,008403361 0,840336 0,0000706 10000
10 118 98 0,008474576 0,830508 0,0000718 9604
11 120 99 0,008333333 0,825000 0,0000694 9801
12 124 102 0,008064516 0,822581 0,0000650 10404
13 129 105 0,007751938 0,813953 0,0000601 11025
14 132 112 0,007575758 0,848485 0,0000574 12544
Teljes: 1629 1299 0,120971823 11,13792 0,0010510 122267
Átlagos érték: 116,3571 92,78571 0,008640844 0,795566 0,0000751 8733,357
8,4988 11,1431 0,000640820 x x x
72,23 124,17 0,000000411 x x x

A 3. táblázat folytatása Számított adatok a hiperbolikus függőség értékeléséhez

Tekintsünk egy páros lineáris regressziós modellt két változó közötti kapcsolatra, amelyre a regressziós függvény φ(x) lineáris. Jelöljük azzal y x a jellemző feltételes átlaga Y a populációban rögzített értéken x változó x. Ekkor a regressziós egyenlet így fog kinézni:

y x = fejsze + b, Ahol aregressziós együttható(a lineáris regressziós egyenes meredekségének mutatója) . A regressziós együttható megmutatja, hogy átlagosan hány egységgel változik a változó Y változó megváltoztatásakor x egy egységenként. A legkisebb négyzetek módszerével képleteket kapunk, amelyek segítségével lineáris regressziós paramétereket számíthatunk ki:

1. táblázat: Képletek a lineáris regressziós paraméterek kiszámításához

Ingyenes tag b

Regressziós együttható a

Meghatározási együttható

A regressziós egyenlet jelentőségére vonatkozó hipotézis tesztelése

N 0 :

N 1 :

, ,, 7. függelék (lineáris regresszióhoz p = 1)

A változók közötti kapcsolat irányát a regressziós együttható előjele alapján határozzuk meg. Ha a regressziós együttható előjele pozitív, akkor a függő változó és a független változó közötti kapcsolat pozitív lesz. Ha a regressziós együttható előjele negatív, akkor a függő változó és a független változó közötti kapcsolat negatív (inverz).

A regressziós egyenlet általános minőségének elemzéséhez a determinációs együtthatót használjuk R 2 , amelyet a többszörös korrelációs együttható négyzetének is neveznek. A determinációs együttható (a bizonyosság mértéke) mindig az intervallumon belül van. Ha az érték R 2 közel egységhez, ez azt jelenti, hogy a felépített modell a megfelelő változók szinte minden változatosságát megmagyarázza. Fordítva, a jelentés R 2 a nullához közeli a megépített modell rossz minőségét jelenti.

Meghatározási együttható R 2 megmutatja, hogy a talált regressziós függvény hány százalékkal írja le az eredeti értékek közötti kapcsolatot YÉs x. ábrán. A 3. ábra a regressziós modell által magyarázott variációt és a teljes variációt mutatja. Ennek megfelelően az érték megmutatja, hogy a paraméter változásának hány százaléka Y a regressziós modellben nem szereplő tényezők miatt.

A determinációs együttható magas, 75%-os értékével a kiindulási adatok tartományán belül egy konkrét értékre készíthető előrejelzés. A kiindulási adatok tartományán kívüli értékek előrejelzésekor a kapott modell érvényessége nem garantálható. Ez azzal magyarázható, hogy megjelenhet olyan új tényezők hatása, amelyeket a modell nem vesz figyelembe.

A regressziós egyenlet jelentőségét a Fisher-kritérium segítségével értékeljük (lásd 1. táblázat). Feltéve, hogy a nullhipotézis igaz, a kritériumnak Fisher-eloszlása ​​van a szabadságfok számával. , (páros lineáris regresszióhoz p = 1). Ha a nullhipotézist elvetjük, akkor a regressziós egyenlet statisztikailag szignifikánsnak minősül. Ha a nullhipotézist nem utasítják el, akkor a regressziós egyenlet statisztikailag jelentéktelennek vagy megbízhatatlannak minősül.

1. példa A gépműhelyben elemzik a termékköltségek szerkezetét és a vásárolt alkatrészek arányát. Megjegyezték, hogy az alkatrészek költsége a szállítási időponttól függ. A megtett távolságot választották a szállítási időt befolyásoló legfontosabb tényezőnek. A kínálati adatok regressziós elemzése:

Távolság, mérföld

Idő, min

A regressziós elemzés elvégzéséhez:

    a kiindulási adatok grafikonjának elkészítése, a függőség jellegének megközelítő meghatározása;

    válassza ki a regressziós függvény típusát és határozza meg a modell numerikus együtthatóit a legkisebb négyzetek módszerével és a kapcsolat irányával;

    értékelje a regressziós függőség erősségét a determinációs együttható segítségével;

    értékelje a regressziós egyenlet jelentőségét;

    készítsen előrejelzést (vagy következtetést az előrejelzés lehetetlenségéről) az elfogadott modell segítségével 2 mérföldes távolságra.

2. Számítsa ki a lineáris regressziós egyenlet együtthatóinak és a determinációs együttható kiszámításához szükséges összegeketR 2 :

; ;;.

A szükséges regressziós függőség a következőképpen alakul: . Meghatározzuk a változók közötti kapcsolat irányát: a regressziós együttható előjele pozitív, ezért a kapcsolat is pozitív, ami megerősíti a grafikus feltételezést.

3. Számítsuk ki a determinációs együtthatót: vagy 92%. Így a lineáris modell a szállítási idő változásának 92%-át magyarázza, ami azt jelenti, hogy a tényezőt (távolságot) helyesen választották meg. Az időbeli eltérések 8%-a nincs megmagyarázva, ami más, a szállítási időt befolyásoló, de a lineáris regressziós modellben nem szereplő tényezőknek köszönhető.

4. Ellenőrizzük a regressziós egyenlet jelentőségét:

Mert– a regressziós egyenlet (lineáris modell) statisztikailag szignifikáns.

5. Oldjuk meg az előrejelzési feladatot! Mivel a determinációs együtthatóR 2 elég magas értéke van, és a 2 mérföldes távolság, amelyre az előrejelzést meg kell adni, a bemeneti adatok tartományán belül van, akkor az előrejelzés elkészíthető:

A regressziós elemzés kényelmesen elvégezhető a lehetőségek segítségével Excel. A "Regression" üzemmód a lineáris regressziós egyenlet paramétereinek kiszámítására és a vizsgált folyamatra való megfelelőségének ellenőrzésére szolgál. A párbeszédpanelen adja meg a következő paramétereket:

2. példa Hajtsa végre az 1. példa feladatát a "Regresszió" móddalExcel.

AZ EREDMÉNYEK KÖVETKEZTETÉSE

Regressziós statisztika

Többes szám R

R-négyzet

Normalizált R-négyzet

Standard hiba

Észrevételek

Esély

Standard hiba

t-statisztika

P-érték

Y kereszteződés

X változó 1

Nézzük meg a táblázatban bemutatott regresszióanalízis eredményeit.

NagyságrendR-négyzet , amelyet a bizonyosság mértékének is neveznek, a kapott regressziós egyenes minőségét jellemzi. Ezt a minőséget fejezi ki a forrásadatok és a regressziós modell (számított adatok) közötti megfelelés mértéke. Példánkban a bizonyosság mértéke 0,91829, ami a regressziós egyenesnek az eredeti adatokhoz való nagyon jó illeszkedését jelzi, és egybeesik a determinációs együtthatóvalR 2 képlettel számolva.

Többes szám R - többszörös korrelációs együttható R - a független változók (X) és a függő változó (Y) függésének mértékét fejezi ki, és egyenlő a determinációs együttható négyzetgyökével. Egyszerű lineáris regressziós elemzésbentöbbszörös R együtthatóegyenlő lineáris együtthatóösszefüggések (r = 0,958).

Lineáris modell együtthatók:Y -útkereszteződés kiírja a fiktív kifejezés értékétb, AX1 változó – regressziós együttható a. Ekkor a lineáris regressziós egyenlet:

y = 2,6597x+ 5,9135 (ami jól egyezik az 1. példa számítási eredményeivel).

Ezután ellenőrizzük a regressziós együtthatók jelentőségét:aÉsb. Oszlopértékek összehasonlítása párban Esély És Standard hiba A táblázatban azt látjuk, hogy az együtthatók abszolút értékei nagyobbak, mint a standard hibáik. Ezenkívül ezek az együtthatók szignifikánsak, amint azt a P-érték mutató értékei alapján lehet megítélni, amelyek kisebbek, mint a megadott szignifikanciaszint α = 0,05.

Megfigyelés

Megjósolta Y

Maradék

Standard egyenlegek

A táblázat a kimeneti eredményeket mutatjamaradék. A jelentés ezen részét felhasználva láthatjuk az egyes pontok eltéréseit a megszerkesztett regressziós egyenestől. A legnagyobb abszolút értékmaradékebben az esetben - 1,89256, a legkisebb - 0,05399. Az adatok jobb értelmezéséhez ábrázolja az eredeti adatokat és a megszerkesztett regressziós egyenest. A konstrukcióból látható, hogy a regressziós egyenes jól „illeszthető” a kiindulási adatok értékeihez, az eltérések véletlenszerűek.

Az egytényezős regresszió másik típusa a következő alak hatványpolinomjaival történő közelítés:

Természetes, hogy a lehető legegyszerűbb függőséget szeretnénk elérni, korlátozva magunkat a másodfokú hatványpolinomokra, pl. parabola függőség:
(5.5.2)

Számítsuk ki a parciális deriváltokat az együtthatók alapján b 0 , b 1 És b 2 :



(5.5.3)

A deriváltokat nullával egyenlővé téve egy normális egyenletrendszert kapunk:

(5.5.4)

A normálegyenletrendszer (5.5.2) megoldása egy adott értékesetre x én * , y én * ;
kapunk optimális értékeket b 0 , b 1 És b 2 . A függőség (5.5.2) és még inkább (5.5.1) szerinti közelítéshez nem kaptak egyszerű képleteket az együtthatók kiszámításához, és általában standard eljárásokkal számítják ki őket mátrix formában:

(5.5.5)

Az 5.5.1. ábra egy tipikus példát mutat a parabolafüggőséggel történő közelítésre:

9 (5;9)

(1;1)

1

1 2 3 4 5 x

5.5.1. ábra. A kísérleti pontok koordinátái és közelítése

parabolafüggőségük

5.1. példa. Közelítse az 5.1.1. táblázatban megadott kísérleti eredményeket lineáris regressziós egyenlettel
.

5.1.1. táblázat

Az 5.1.1. ábrán bemutatott grafikonon készítsünk kísérleti pontokat az 5.1.1. táblázatban megadott koordináták szerint.

nál nél

9

4

1 2 3 4 5 x

Az 5.1.1. ábra szerint, amelyre az előzetes értékeléshez egyenes vonalat húzunk, arra a következtetésre jutunk, hogy a kísérleti pontok elhelyezkedésében van egy egyértelműen kifejezett nemlinearitás, de ez nem túl jelentős, ezért van értelme. közelíteni őket lineáris függőség. Megjegyzendő, hogy a helyes matematikai következtetés levonásához egy egyenest kell megszerkeszteni a legkisebb négyzetek módszerével.

A regressziós elemzés elvégzése előtt célszerű kiszámítani

változók közötti lineáris korrelációs együttható xÉs nál nél:

A korrelációs kapcsolat jelentőségét a lineáris korrelációs együttható kritikus értéke határozza meg, amelyet a következő képlettel számítunk ki:

A Student-féle teszt kritikus értéke t Kréta statisztikai táblázatok szerint talált az ajánlott szignifikancia szintre α=0,05és azért n-2 szabadsági fokokat. Ha a számított érték r xy nem kevesebb a kritikus értéknél r Kréta, akkor a változók közötti korreláció x És y elengedhetetlennek tartják. Végezzük el a számításokat:










Annak a ténynek köszönhető, hogy a
arra a következtetésre jutunk, hogy a változók közötti korreláció xÉs nál nél jelentős és lehet lineáris.

Számítsuk ki a regressziós egyenlet együtthatóit:

Így egy lineáris regressziós egyenletet kaptunk:

A regressziós egyenlet segítségével egyenest húzunk az 5.1.2.

y (5;9,8)

9

4

(0;-0.2) 1 2 3 4 5 x

5.1.2. ábra. A kísérleti pontok koordinátái és közelítése

lineáris függőségük

A regressziós egyenlet segítségével kiszámítjuk a függvény értékeit az 5.1.1. táblázat kísérleti pontjai alapján, valamint a függvény kísérleti és számított értékei közötti különbséget, amelyet az 5.1.2. táblázatban mutatunk be.

5.1.2. táblázat


Számítsuk ki az átlagos négyzethibát és annak az átlaghoz viszonyított arányát:

Az átlagértékhez viszonyított standard hibához képest nem kielégítő eredményt kaptunk, mivel az ajánlott 0,05-ös értéket túlléptük.

Értékeljük a regressziós egyenlet együtthatóinak szignifikancia szintjét a Student-féle t-próbával:


A statisztikai táblázatból 3 szabadságfok esetén felírjuk a szignifikanciaszintű sorokat - és a Student-féle teszt értéke t az 5.1.3. táblázathoz.

5.1.3. táblázat

A regressziós egyenlet együtthatók szignifikancia szintje:


Vegye figyelembe, hogy az együttható szignifikanciaszintje szerint kielégítő eredményt kaptunk, és az együtthatóra elégtelen.

Értékeljük a kapott regressziós egyenlet minőségét a varianciaanalízis alapján számított mutatók segítségével:

Vizsgálat:

Az ellenőrzés eredménye pozitív, ami az elvégzett számítások helyességét jelzi.

Számítsuk ki a Fisher-kritériumot:

két szabadságfokkal:

Statisztikai táblázatok segítségével megtaláljuk a Fisher-kritérium kritikus értékeit a szignifikanciaszint két ajánlott fokozatához:


Mivel a Fisher-teszt számított értéke meghaladja a 0,01-es szignifikanciaszint kritikus értékét, feltételezzük, hogy a Fisher-teszt szerinti szignifikanciaszint kisebb, mint 0,01, ami kielégítőnek tekinthető.

Számítsuk ki a többszörös meghatározási együtthatót:

két szabadságfokért

A statisztikai táblázatot felhasználva az ajánlott 0,05-ös szignifikanciaszinthez és a talált két szabadságfokhoz, megkapjuk a többszörös meghatározási együttható kritikus értékét:

Mivel a többszörös meghatározás együtthatójának számított értéke meghaladja a szignifikanciaszint kritikus értékét
, akkor a többszörös meghatározás együtthatója szerinti szignifikanciaszint
és a benyújtott mutatóra kapott eredményt kielégítőnek tekintjük.

Így a kapott számított paraméterek a standard hiba és az átlagérték aránya, valamint a Student-féle teszt szerinti szignifikancia szint tekintetében nem kielégítőek, ezért célszerű egy másik közelítő függést választani a közelítéshez.

5.2. példa. A véletlen számok kísérleti eloszlásának közelítése matematikai függőséggel

Az 5.1.1. táblázatban megadott véletlenszámok kísérleti eloszlása ​​lineáris függőséggel közelítve nem vezetett kielégítő eredményre, beleértve az 5.1.1. a szabad tagú regressziós egyenlet együtthatójának jelentéktelensége miatt, ezért a közelítés minőségének javítása érdekében azt próbáljuk meg szabad tag nélküli lineáris függéssel végrehajtani:

Számítsuk ki a regressziós egyenlet együtthatójának értékét:

Így megkaptuk a regressziós egyenletet:

A kapott regressziós egyenlet segítségével kiszámítjuk a függvény értékeit és a függvény kísérleti és számított értékei közötti különbséget, amelyet az 5.2.1 táblázat formájában mutatunk be.

5.2.1. táblázat

x én

A regressziós egyenlet szerint
az 5.2.1. ábrán egy egyenest fogunk húzni.

y (5;9.73 )

(0;0) 1 2 3 4 5 x

5.2.1. ábra. A kísérleti pontok koordinátái és közelítése

lineáris függőségük

A közelítés minőségének értékeléséhez az 5.1. példában szereplő számításokhoz hasonló minőségi mutatók számításokat végzünk.

(régi marad);

4 szabadságfokkal;

Mert

A közelítés eredményei alapján megjegyezzük, hogy a regressziós egyenlet együtthatójának szignifikanciaszintjét tekintve kielégítő eredményt kaptunk; A standard hiba átlaghoz viszonyított aránya javult, de még mindig meghaladja az ajánlott 0,05-ös értéket, ezért javasolt a közelítés megismétlése összetettebb matematikai összefüggéssel.

5.3. példa. Az 5.1 és 5.2 példák közelítésének minőségének javítása érdekében nemlineáris közelítést végzünk a függéssel
. Ehhez először közbülső számításokat végzünk, és ezek eredményeit az 5.3.1. táblázatban helyezzük el.

Értékek

5.3.1. táblázat

x 2

(lnX) 2

lnX lnY

Számítsuk ki még:

Közelítsük a függőséget
. Az (5.3.7), (5.3.8) képletek segítségével kiszámítjuk az együtthatókat b 0 És b 1 :

Az (5.3.11) képletek segítségével kiszámítjuk az együtthatókat A 0 És A 1 :


A standard hiba kiszámításához közbenső számításokat végeztünk, amelyeket az 5.3.2. táblázat mutat be.

5.3.2. táblázat

Y én

y én

Összeg: 7,5968

A közelítés standard hibája jóval nagyobbnak bizonyult, mint az előző két példában, ezért a közelítési eredményeket használhatatlannak tartjuk.

5.4. példa. Próbáljunk meg közelíteni egy másik nemlineáris függőséggel
. Az 5.3.1. táblázat szerinti (5.3.9), (5.3.10) képletek segítségével kiszámítjuk az együtthatókat b 0 És b 1 :

Köztes függőséget kaptunk:

Az (5.3.13) képletek segítségével kiszámítjuk az együtthatókat C 0 És C 1 :


Megkaptuk a végső függőséget:

A standard hiba kiszámításához közbenső számításokat végzünk, amelyeket az 5.4.1. táblázatban helyezünk el.

5.4.1. táblázat

Y én

y én

Összeg: 21,83152

Számítsuk ki a standard hibát:

A közelítés standard hibája sokkal nagyobbnak bizonyult, mint az előző példában, ezért a közelítés eredményeit használhatatlannak tekintjük.

5.5. példa. A véletlen számok kísérleti eloszlásának közelítése matematikai függőséggel y = b · lnx

A kezdeti adatokat az előző példákhoz hasonlóan az 5.4.1. táblázat és az 5.4.1. ábra mutatja.

5.4.1. táblázat

Az 5.4.1. ábra és az 5.4.1. táblázat elemzése alapján megjegyezzük, hogy az argumentum kisebb értékeivel (a táblázat elején) a függvény többet változik, mint nagyobb értékekkel (a táblázat végén). táblázat), ezért célszerűnek tűnik megváltoztatni az argumentum skáláját, és bevezetni belőle egy logaritmikus függvényt a regressziós egyenletbe, és közelíteni a következő matematikai függéssel:

. Az (5.4.3) képlet segítségével kiszámítjuk az együtthatót b:

A közelítés minőségének felmérésére az 5.4.2. táblázatban bemutatott közbenső számításokat végzünk, amelyekből kiszámítjuk a hiba nagyságát és a standard hiba átlagos értékhez viszonyított arányát.

5.4.2. táblázat


Mivel a standard hiba és az átlagérték aránya meghaladja az ajánlott 0,05-ös értéket, az eredmény nem tekinthető kielégítőnek. Külön megjegyezzük, hogy a legnagyobb eltérést az érték adja x=1, hiszen ezzel az értékkel lnx=0. Ezért közelítjük a függőséget y = b 0 +b 1 lnx

A segédszámításokat az 5.4.3 táblázat formájában mutatjuk be.

5.4.3. táblázat

Az (5.4.6) és (5.4.7) képletekkel kiszámítjuk az együtthatókat b 0 és b 1 :

9 (5;9.12)

4

1 (1;0.93)

1 2 3 4 5 x

A közelítés minőségének értékeléséhez segédszámításokat végzünk, és meghatározzuk a talált együtthatók szignifikancia szintjét, valamint a standard hiba és az átlagérték arányát.

Jelentősségi szint valamivel meghaladja az ajánlott 0,05 értéket (
).


Tekintettel arra, hogy a fő mutató - a standard hiba és az átlagos érték aránya - szerint az ajánlott 0,05-ös szint közel kétszeres túllépése született, az eredményeket elfogadhatónak tekintjük. Vegye figyelembe, hogy a Student-féle teszt számított értéke t b 0 =2,922 különbözik a kritikustól
viszonylag kis mennyiségben.

5.6. példa. Közelítsük az 5.1. példa kísérleti adatait a hiperbolikus függéssel
. Az együtthatók kiszámításához b 0 és b 1 Végezzük el az 5.6.1. táblázatban megadott előzetes számításokat.

5.6.1. táblázat

x én

x én =1/X én

x én 2

x én y én

Az 5.6.1. táblázat eredményei alapján (5.4.8) és (5.4.9) képletekkel kiszámítjuk az együtthatókat b 0 és b 1 :

Így egy hiperbolikus regressziós egyenletet kapunk

.

A közelítés minőségének értékelésére szolgáló segédszámítások eredményeit az 5.6.2. táblázat tartalmazza.

5.6.2. táblázat

x én

Az 5.6.2. táblázat eredményei alapján kiszámítjuk a standard hibát és a standard hiba és az átlagérték arányát:


Tekintettel arra, hogy a standard hiba és az átlagérték aránya meghaladja az ajánlott 0,05-ös értéket, arra a következtetésre jutottunk, hogy a közelítési eredmények nem megfelelőek.

5.7. példa.

A karbantartó daruk működéséből származó bevétel konkrét értékeinek kiszámításához a karbantartási munkák idejétől függően parabolikus függőséget kell szerezni.

Számítsuk ki ennek a függőségnek az együtthatóit b 0 , b 1 , b 11 mátrix formában a következő képlet szerint:

A Statistica 6.0 alkalmazáscsomag többszörös regressziós eljárásával készültek a nemlineáris regressziós egyenletek, amelyek összekötik az effektív mutatót a toronydaruk megelőző karbantartásának optimális értékeivel. Ezt követően az effektív teljesítménymutató regressziós elemzésének eredményeit mutatjuk be az 5.7.1. táblázat szerint.

5.7.1. táblázat

Az 5.7.2. táblázat az effektív teljesítménymutató nemlineáris regressziójának eredményeit, az 5.7.3. táblázat pedig a reziduumok elemzésének eredményeit mutatja.

5.7.2. táblázat

5.7.3. táblázat

Rizs. 3.7.36. Maradékelemzés.

Így a változóra többszörös regressziós egyenletet kaptunk
:

A standard hiba aránya:

14780/1017890=0,0145 < 0,05.

Mivel a standard hiba és az átlagérték aránya nem haladja meg az ajánlott 0,05 értéket, a közelítési eredmények elfogadhatónak tekinthetők. Az 5.7.2. táblázat szerinti hátrányként meg kell jegyezni, hogy minden számított együttható meghaladja az ajánlott 0,05-ös szignifikancia szintet.



Hasonló cikkek