Оценката на параметъра се нарича ефективна, ако. Точкова оценка и нейните свойства

5. Основни проблеми на приложната статистика - описание на данни, оценка и проверка на хипотези

Последователност, безпристрастност и ефективност на оценките

Как да сравняваме методите за оценка един с друг? Сравнението се извършва въз основа на такива показатели за качество на методите за оценка като последователност, безпристрастност, ефективност и др.

Разгледайте оценката θ нчисленият параметър θ, определен при н= 1, 2, … Оценка θ н Наречен богат, ако сходи по вероятност към стойността на оценения параметър θ с неограничено увеличение на размера на извадката. Нека изразим казаното по-подробно. θ статистика не последователна оценка на параметъра θ тогава и само ако за всяко положително число ε граничното отношение е валидно

Пример 3.От закона за големите числа следва, че θ н= е последователна оценка θ = M(X)(Теоремата на Чебишев по-горе допуска съществуването на дисперсия д(х); обаче, както е доказано от A.Ya. Хинчин, достатъчно е да се изпълни по-слабо условие - съществуването математическо очакване M(X)).

Пример 4.Всички горепосочени оценки на параметрите нормална дистрибуцияса богати.

Като цяло, всички (с редки изключения) оценки на параметрите, използвани във вероятностно-статистическите методи за вземане на решения, са последователни.

Пример 5. И така, според теоремата на V.I. Гливенко, емпирична функция на разпределение Fn(х) е последователна оценка на функцията на разпределение на резултатите от наблюдението Е(х).

При разработването на нови методи за оценка първо трябва да се провери валидността на предложените методи.

Второто важно свойство на оценките е неразместен. Безпристрастна оценка на θ не оценка на параметъра θ, чието математическо очакване е равно на стойността на оценявания параметър: Мн) = θ.

Пример 6.От горните резултати следва, че и са безпристрастни оценки на параметрите м И σ 2нормална дистрибуция. Тъй като M() = M( м** ) = м, след това примерната медиана и полусумата на екстремните членове на вариационната серия м** - също безпристрастни оценки на математическите очаквания мнормална дистрибуция. въпреки това

следователно оценки с 2 и ( σ 2)** не са валидни оценки на дисперсията σ 2нормална дистрибуция.

Оценки, за които съотнош Мн) = θ е неправилно, наречено предубедено. В този случай разликата между математическото очакване на оценката θ ни оцененият параметър θ, т.е. Мн) – θ, се нарича отклонение на оценката.

Пример 7.За ставка с 2, както следва от горното, изместването е равно на

М(с 2) - σ 2 = - σ 2/н.

Пристрастност на оценката с 2 клони към 0, когато н → ∞.

Извиква се оценка, при която отклонението се доближава до 0, когато размерът на извадката се доближава до безкрайност асимптотично безпристрастен. Пример 7 показва, че оценката с 2 е асимптотично безпристрастен.

Почти всички оценки на параметри, използвани във вероятностно-статистическите методи за вземане на решения, са или безпристрастни, или асимптотично безпристрастни. За безпристрастни оценки индикатор за точността на оценката е дисперсията - колкото по-малка е дисперсията, толкова по-добра е оценката. За пристрастни оценки индикаторът за точност е математическото очакване на квадрата на оценката Мн– θ) 2 . Както следва от основните свойства на математическото очакване и дисперсията,

тези. математическото очакване на квадратната грешка е сумата от дисперсията на оценката и квадрата на нейното отклонение.

За по-голямата част от оценките на параметрите, използвани във вероятностно-статистическите методи за вземане на решения, дисперсията е от порядъка на 1/ н, а преместването е не повече от 1/ н, Където н– размер на извадката. За такива оценки въобще нвторият член от дясната страна на (3) е незначителен в сравнение с първия и приблизителното равенство е в сила за тях

Където с– число, определено от метода за изчисляване на оценките θ ни истинската стойност на оценения параметър θ.

Третото важно свойство на метода за оценка е свързано с дисперсията на оценката: ефективност. Ефективният оценител е безпристрастен оценител, който има най-малката дисперсия от всички възможни безпристрастни оценители на даден параметър.

Доказано е, че и са ефективни оценки на параметрите м И σ 2нормална дистрибуция. В същото време ограничаващата връзка е валидна за медианата на извадката

С други думи, ефективността на медианата на извадката, т.е. коефициент на дисперсия на ефективната оценка на параметъра м до дисперсията на безпристрастната оценка на този параметър за големи n е близо до 0,637. Именно поради относително ниската ефективност на медианата на извадката, средната аритметична извадка обикновено се използва като оценка на математическото очакване на нормалното разпределение.

Понятието ефективност се въвежда за безпристрастни оценки, за които Мн) = θ за всички възможни стойности на параметъра θ. Ако не изискваме безпристрастност, тогава можем да посочим оценки, които за някои θ имат по-малка дисперсия и средна квадратна грешка от ефективните.

Пример 8.Помислете за „оценката“ на математическото очакване м 1 ≡ 0. Тогава д(м 1 ) = 0, т.е. винаги по-малко отклонение д() ефективна оценка. Очакване на средна квадратна грешка d n(м 1 ) = м 2 , т.е. когато имаме d n(м 1 ) < d n(). Ясно е обаче, че статистиката мНяма смисъл да се разглежда 1 ≡ 0 като оценка на математическото очакване м.

Пример 9.| Повече ▼ интересен примерпрегледано от американския математик J. Hodges:

Това е ясно Tn– последователна, асимптотично безпристрастна оценка на математическото очакване м, докато, както е лесно да се изчисли,

Последната формула показва, че когато м≠ 0 оценка Tnне по-лошо (в сравнение със средната квадратична грешка d n), и когато м= 0 – четири пъти по-добре.

По-голямата част от оценките на θ н, използвани във вероятностно-статистическите методи, са асимптотично нормални, т.е. за тях са валидни следните гранични отношения:

за всеки х, Където F(x)– функция на стандартното нормално разпределение с математическо очакване 0 и дисперсия 1. Това означава, че за големи размери на извадката (практически няколко десетки или стотици наблюдения), разпределенията на оценките са напълно описани от техните математически очаквания и дисперсии , а качеството на оценките е от стойностите на средните квадратни грешки d nн).

Предишен

Разпределението на случайна променлива (разпределение на популацията) обикновено се характеризира с редица числени характеристики:

  • за нормално разпределение N(a, σ) е математическото очакване a и стандартното отклонение σ;
  • за равномерно разпределение R(a,b) е границите на интервала, в който се наблюдават стойностите на тази случайна променлива.
Такива числени характеристики, обикновено неизвестни, се наричат параметри на населението . Оценка на параметъра - съответната числена характеристика, изчислена от извадката. Оценките на параметрите на населението попадат в два класа: точкаИ интервал.

Когато резултатът се определя от едно число, той се извиква точкова оценка. Точковата оценка, като функция на извадката, е случайна променлива и варира от проба на проба с повтарящи се експерименти.
Точковите оценки имат изисквания, на които трябва да отговарят, за да бъдат „доброкачествени“ във всеки смисъл. Това неразместен, ефективностИ богатство.

Интервални оценкисе определят от две числа - краищата на интервала, който покрива оценявания параметър. За разлика от точковите оценки, които не дават представа колко далеч може да бъде оцененият параметър от тях, интервалните оценки ни позволяват да установим точността и надеждността на оценките.

Като точкови оценки на математическото очакване, дисперсията и средната стойност квадратно отклонениеизползват се характеристики на извадката, съответно: извадкова средна стойност, извадкова дисперсия и извадково стандартно отклонение.

Свойство на безпристрастна оценка.
Желателно изискване за оценка е липсата на систематична грешка, т.е. при многократно използване вместо параметъра θ неговата оценка, средната стойност на апроксимационната грешка е нула - това е свойство на безпристрастна оценка.

Определение. Една оценка се нарича безпристрастна, ако нейното математическо очакване е равно на истинската стойност на оценения параметър:

Средната аритметична извадка е безпристрастна оценка на математическото очакване, а дисперсията на извадката - предубедена оценка на общата дисперсия д. Безпристрастната оценка на общата дисперсия е оценката

Свойство на последователност на оценката.
Второто изискване за оценка - нейната последователност - означава, че оценката се подобрява с увеличаване на размера на извадката.

Определение. Степен се нарича последователен, ако се сближава по вероятност към оценения параметър θ като n→∞.


Конвергенцията във вероятността означава, че при голям размер на извадката вероятността от големи отклонения на оценката от истинската стойност е малка.

Свойство за ефективна оценка.
Третото изискване ви позволява да изберете най-добрата оценка от няколко оценки на един и същ параметър.

Определение. Един безпристрастен оценител е ефективен, ако има най-малката дисперсия сред всички безпристрастни оценители.

Това означава, че ефективната оценка има минимална дисперсия спрямо истинската стойност на параметъра. Обърнете внимание, че не винаги съществува ефективна оценка, но от две оценки обикновено е възможно да се избере по-ефективната, т.е. с по-малко отклонение. Например, за неизвестен параметър a на нормална популация N(a,σ), както средната аритметична извадка, така и медианата на извадката могат да се приемат като безпристрастна оценка. Но дисперсията на медианата на извадката е приблизително 1,6 пъти по-голяма от дисперсията на средната аритметична стойност. Следователно по-ефективна оценка е средната аритметична извадка.

Пример №1. Намерете безпристрастна оценка на дисперсията на измерванията на някаква случайна променлива с помощта на едно устройство (без систематични грешки), резултатите от измерването на което (в mm): 13,15,17.
Решение. Таблица за изчисляване на показатели.

х|x - x av |(x - x ср.) 2
13 2 4
15 0 0
17 2 4
45 4 8

Обикновено средно аритметично(безпристрастна оценка на математическото очакване)


дисперсия- характеризира мярката за дисперсия около нейната средна стойност (мярка за дисперсия, т.е. отклонение от средната - предубедена оценка).


Безпристрастен оценител на дисперсията- последователна оценка на дисперсията (коригирана дисперсия).

Пример №2. Намерете безпристрастна оценка на математическото очакване на измерванията на определена случайна променлива от едно устройство (без систематични грешки), резултатите от измерването на което (в mm): 4,5,8,9,11.
Решение. m = (4+5+8+9+11)/5 = 7,4

Пример №3. Намерете коригираната дисперсия S2 за размер на извадката от n=10, ако дисперсията на извадката е D = 180.
Решение. S 2 = n*D/(n-1) = 10*180/(10-1) = 200

) проблеми на математическата статистика.

Нека приемем, че има параметрично семейство от вероятностни разпределения (за простота ще разгледаме разпределението на случайни променливи и случая на един параметър). Ето числов параметър, чиято стойност е неизвестна. Изисква се да се оцени въз основа на наличната извадка от стойности, генерирани от това разпределение.

Има два основни вида оценки: точкови оценкиИ доверителни интервали.

Точкова оценка

Точковата оценка е вид статистическа оценка, при която стойността на неизвестен параметър се апроксимира с отделно число. Тоест, необходимо е да се уточни функцията на извадката (статистика)

,

чиято стойност ще се счита за приближение на неизвестната истинска стойност.

ДА СЕ общи методиконструирането на точкови оценки на параметрите включва: метод на максимална правдоподобност, метод на моменти, метод на квантили.

По-долу са някои свойства, които точковите оценки могат или не могат да имат.

Богатство

Едно от най-очевидните изисквания за точкова оценка е, че може да се очаква сравнително добро приближение до истинската стойност на параметъра за достатъчно големи размери на извадката. Това означава, че оценката трябва да се сближи с истинската стойност при . Това свойство за оценка се нарича богатство. Тъй като ние говорим заО случайни променливиах, за които има различни видовеконвергенция, тогава това свойство може да бъде точно формулирано по различни начини:

Когато просто използвате термин богатство, тогава обикновено имаме предвид слаба консистенция, т.е. конвергенция във вероятността.

Условието за съгласуваност е практически задължително за всички оценки, използвани в практиката. Оценките за отказ се използват изключително рядко.

Безпристрастност и асимптотична безпристрастност

Оценката на параметъра се нарича безпристрастен, ако неговото математическо очакване е равно на истинската стойност на оценения параметър:

.

По-слабо състояние е асимптотичен безпристрастен, което означава, че математическото очакване на оценката се сближава с истинската стойност на параметъра с увеличаване на размера на извадката:

.

Безпристрастността е препоръчително свойство за оценки. Неговото значение обаче не трябва да се надценява. Най-често съществуват безпристрастни оценки на параметрите и след това се опитват да вземат предвид само тях. Възможно е обаче да има статистически проблеми, при които не съществуват безпристрастни оценки. Най-известният пример е следният: разгледайте разпределението на Поасон с параметър и поставете проблема за оценка на параметъра. Може да се докаже, че няма безпристрастен оценител за този проблем.

Сравнение на рейтинги и ефективност

За сравняване на различни оценки на един и същ параметър се използва следният метод: изберете някои рискова функция, която измерва отклонението на оценката от истинската стойност на параметъра, като за най-добра се счита тази, за която тази функция приема по-малка стойност.

Най-често математическото очакване на квадрата на отклонението на оценката от истинската стойност се разглежда като функция на риска

За безпристрастни оценки това е просто дисперсията.

Има долна граница на тази рискова функция, наречена Неравенство на Крамър-Рао.

(Безпристрастни) оценители, които постигат тази долна граница (т.е. имащи възможно най-малката дисперсия), се наричат ефективен. Наличието на ефективна оценка обаче е доста силно изискване за задачата, което не винаги е така.

По-слабо състояние е асимптотична ефективност, което означава, че съотношението на дисперсията на безпристрастната оценка към долната граница на Cramer-Rao клони към единица при .

Имайте предвид, че при достатъчно широки допускания за изследваното разпределение, методът на максималната вероятност дава асимптотично ефективна оценка на параметъра и ако съществува ефективна оценка, тогава тя дава ефективна оценка.

Достатъчна статистика

Статистиката се нарича достатъчноза параметъра, ако условното извадково разпределение при условие, че не зависи от параметъра за всички.

Важността на концепцията за достатъчна статистика се определя от следното одобрение. Ако е достатъчна статистика и е безпристрастна оценка на параметъра, тогава условното очакване също е безпристрастна оценка на параметъра и неговата дисперсия е по-малка или равна на дисперсията на първоначалната оценка.

Спомнете си, че условното очакване е случайна променлива, която е функция на . По този начин, в класа на безпристрастните оценки е достатъчно да се разгледат само тези, които са функции на достатъчна статистика (при условие, че такава статистика съществува за даден проблем).

Оценката на (безпристрастния) ефективен параметър винаги е достатъчна статистика.

Можем да кажем, че достатъчната статистика съдържа цялата информация за оценявания параметър, която се съдържа в извадката.

Избрани характеристики. Богат,

В началото на курса бяха разгледани понятия като класическа и статистическа вероятност.

Ако класическата вероятност е теоретична характеристика, която може да се определи без прибягване до опит, тогава статистическата вероятност може да се определи само от резултатите от експеримент. При по-голям брой експерименти стойността W(A) може да служи като оценка на вероятността P(A). Достатъчно е да си припомним класическите експерименти на Буфон и Пиърсън. Подобни аналогии могат да бъдат продължени по-нататък. Например за теоретична характеристика M(x) такава аналогия би била - средно аритметично:

= i f i / n ,

за вариация D(x) емпиричният аналог би бил статистическа дисперсия:

S 2 (х) = (x i - ) 2 f i/n .

Емпирични характеристики, С 2 (х) ,W(A) са оценки на параметри M(x) ,D(x) ,P(A) . В случаите, когато емпиричните характеристики се определят на базата на голям брой експерименти, използването им като теоретични параметри няма да доведе до значителни грешки в изследването, но в случаите, когато броят на експериментите е ограничен, грешката при заместването ще бъде значителна . Следователно към емпиричните характеристики, които са оценки на теоретичните параметри, се налагат три изисквания:

оценките трябва да бъдат последователни, безпристрастни и ефективни.

Една оценка се нарича последователна, ако вероятността за нейното отклонение от оценения параметър със сума, по-малка от произволно малко положително число, клони към единица с неограничено увеличение на броя на наблюденията н, тези.

P(| - | < ) = 1

Където - някакъв параметър на генералната съвкупност,

/ - оценка на този параметър. Повечето оценки на различни числени параметри отговарят на тези изисквания. Само това изискване обаче не е достатъчно. Необходимо е и те да са неразместени.

Една оценка се нарича безпристрастна, ако математическото очакване на тази оценка е равно на оценения параметър:

М ( / ) = .

Пример за последователна и безпристрастна оценка на систематичното очакване е средното аритметично:

М() = .

Пример за последователна и пристрастна оценка е

дисперсия:

М ( С 2 (х)) = [ (n – 1)/n ] D(x) .

Следователно, за да се получи безпристрастна оценка на теоретичната дисперсия D(x) нужда от емпирична вариация С 2 (х) умножете по n/(n – 1) , т.е.

S 2 (х) = (x i - ) 2 f i/n n/(n – 1) = (x i - ) 2 f i /(n – 1) .

На практика тази корекция се прави при изчисляване на оценката на дисперсията в случаите, когато н< 30 .

Може да има няколко валидни безпристрастни оценки. Например, за да се оцени центърът на дисперсия на нормално разпределение, заедно със средната аритметична стойност може да се вземе медианата . Медианата също е безпристрастна последователна оценка на центъра на групиране. От две последователни безпристрастни оценки за един и същ параметър е естествено да се даде предпочитание на тази с по-малка дисперсия.


Такива оценката, чиято дисперсия е най-малка спрямо оценявания параметър, се нарича ефективна. Например, от две оценки на центъра на дисперсия на нормално разпределение M(x) ефективна оценка е, а не , тъй като дисперсията е по-малка от дисперсията . Сравнителна ефективностот тези оценки с голяма извадка е приблизително равно на: D() / D= 2/ = 0,6366.

На практика това означава, че центърът на разпределението на населението (да го наречем 0) се определя от със същата точност за n наблюдения, както за 0,6366 н наблюдения с помощта на средната аритметична стойност.

4.4. Свойства на извадкови средни и дисперсии.

1. Ако размерът на извадката е достатъчно голям, тогава въз основа на закона за големите числа с вероятност, близка до единица, може да се твърди, че средната аритметична и дисперсия S 2 ще се различава възможно най-малко от M(x) И D(x ), т.е.

M(x) ,S 2 (x) D(x ), и дисперсия Д() , независимо от размера на извадката н, стига броят на пробите да е достатъчно голям.

4. Когато дисперсия D(x ), населението е неизвестно, тогава за големи стойности н С по-голяма вероятност за малка грешка, дисперсията на извадковите средни стойности може да се изчисли приблизително по равенството:

Д() = С 2 (x)/n,

Където С 2 (х) = (x i - ) 2 f i/n - дисперсия на голяма извадка.

Определение.Случайната променлива се извиква Оценяваненеизвестен параметър, ако стойността на тази случайна променлива, намерена от резултатите от поредица от измервания, може да се приеме като приблизителна стойност на този параметър, т.е. ако равенството е вярно.

Пример.Ако вероятността за настъпване на определено събитие се разглежда като неизвестен параметър, тогава оценката на този параметър е честотата на настъпване на събитието в независими опити (вижте статистическата дефиниция на вероятността и теоремата на Бернули).

Пример.Нека случайните променливи имат едно и също математическо очакване, т.е. . Тогава оценката на стойността на общото математическо очакване на такива случайни променливи е средноаритметичното тези случайни променливи. Важен частен случай на разглежданата ситуация е следният

Пример. Оценка на определен параметър е средноаритметичната стойност резултати независими измервания на този параметър (вижте теоремата на Чебишев).

При директно използване на приблизителното равенство говоря за точкова оценканеизвестен параметър.

Също така е възможно интервална оценканеизвестен параметър. За да обясним от какво се състои, въвеждаме следните понятия.

Определение.За произволен интервал се извиква доверителен интервал;в този случай се извиква самото количество пределна извадкова грешка.

Определение.Нарича се вероятността неизвестната стойност на оценения параметър да бъде покрита от доверителен интервал вероятност за доверие.

По този начин, ако оценка на параметъра , Че

– доверителна вероятност (приемаме, че оценката е непрекъсната случайна променлива).

Интервалната оценка се състои, например, в изчисляване на доверителната вероятност за дадена максимална грешка на извадката.

Решаването на проблема с интервалната оценка е свързано с определяне на естеството на закона за разпределение на използваната оценка .

Нека сега разгледаме някои свойства на оценките.

Определение.Оценката на параметъра се нарича безпристрастен, ако математическото очакване на тази оценка е равно на оценения параметър, т.е.

Определение.Оценката на параметъра се нарича богат, ако следната гранична връзка е валидна за произволна

С други думи, оценката на параметър е последователна, ако тази оценка се сближава по вероятност с дадения параметър. (Припомнете си, че примери за конвергенция от този вид са дадени от теоремите на Бернули и Чебишев, вижте § 6.2.)

Определение.Извиква се безпристрастна оценка на някакъв параметър ефективен, ако има най-малката дисперсия сред всички безпристрастни оценки, намерени от извадка с даден размер.


Пример.Честота настъпването на някакво събитие е безпристрастна, последователна и ефективна оценка на вероятността това събитие . Имайте предвид, че свойствата на безпристрастност и последователност на честотата всъщност бяха разгледани от нас по-рано в малко по-различен контекст. Наистина, честотната безпристрастност - равенството - е едно от свойствата на случайна променлива с биномно разпределение (вижте § 3.3). Съгласуваността на честотата се посочва от теоремата на Бернули (вижте § 6.2).

Пример. Средната аритметична стойност на определен брой независими и еднакво разпределени случайни променливи е безпристрастна и последователна оценка на общото математическо очакване на тези случайни променливи. Наистина, безпристрастността е свойство 5 на математическото очакване (вижте § 3.3). Съгласуваността се потвърждава от теоремата на Чебишев (виж § 6.2).



Подобни статии