Wp/isv/Statistika

Statistika (od něm.: statistik) prvobitno «opisanije državy, strany»)[1] jest disciplina, ktora vklučaje sbiranje, organizaciju, analizu, interpretaciju i prědstavljenje dannyh.[2] Pri priměnjenju statistiky k naučnoj, industrialnoj ili obščestvennoj problemě, je obvyklo začinati s statističnoj populacijeju ili statističnym modelom. Populacije mogut byti različne grupy ljudi ili predmetov, kako «vsě ljudi živuče v strane» ili «každy atom sostavljajučy kristal». Statistika imaje delo s každym aspektom dannyh, vklučajučy planovanje sbiranja dannyh v smyslu projektirovanija anket i eksperimentov.[3]
«Statistika jest i nauka neoprěděljenosty, i tehnologija vydobyvanja informacij iz dannyh.» — Medžunarodnaja enciklopedija statističeskoj nauki.[4]
Etimologija
[edit | edit source]Slovo statistika prihodi ultimativno iz latinskogo slova status, znače «situacija» ili «sostojanje» v obščestvě, ktore v pozdnoj latiny prijalo značenje «država». Iz togo političesky naučnik Готфрид Ахенваль (Gottfried Achenwall)Gottfried Achenwall (Gotfrid Ahenval) skovał němečsko slovo Statistik («obzor togo kako stojat věci»). V 1770 roku termin prišel v anglijsky jezyk črez němečsky i odnosil se na izslědovanje političnyh ustroj. Termin dostigał svojego sučasnogo značenija v 1790-yh letah v rabotah Джон Синклэр (John Sinclair)John Sinclair (Džon Sinkler).[5][6]
Vvedenije v statistiku
[edit | edit source]Statistika sčitaje se naukoju ili větvju matematiky. Ona opiraje se na teoriju vjerojatnosty, větvju matematiky ktora izslěduje slučajne događaje. Statistika sčitaje se naukoju neoprěděljenosty. Toje voznike iz sposobov borjby s pogrěšnostyami izměrenij i vzorčitanja, a takože s neoprěděljenostjami pri modelirovaniji.
Hotja vjerojatnostj i statistika sut někogda spojene zajedno jak jedin predmet, one sut koncepcijalno različne. Pervaja opiraje se na dedukciju otvetov k oprěděljonym situacijam iz obščej teoriji vjerojatnosty, kogda statistika induktivno vyvodit tvrdjenija o populaciji na osnovy podatkovogo nabora.[4]
Sbiranje dannyh
[edit | edit source]Populacija i vzorek
[edit | edit source]Kogda dannje popisа (vklučajuče každogo člena cělevoj populacije) ne mogut byti sbrane, statisticy sbirajut dannje, razvijajuče oprěděljene eksperimentalne projekty i vzorke anket. Reprezentativno vzorčitanje zaručivaje, čto vyvody i zaključenija mogut razumno prěhoditi od vzorky na populaciju v cělom.
Eksperimentalne i observacijske izslědovanija
[edit | edit source]Obščy celj statističnogo izslědovatelnjego projekta jest izslědovati pričinnostj i v osoblivi narisovati zaključenije o vlyvu izměn v vrědnostyah prědskazčikov ili nězavisimyh perěmennyh na závislé perěmenné. Sut dva glavne typy kauzalnih statističnih izslědovanij: eksperimentalne i observacijske izslědovanija.
Eksperimentalno izslědovanije vklučaje izměrenije sistemy pod izslědovanijem, manipulaciju sistemy, i potom vzjatije dopolnitelnih izměrenij s koristanjem togo samogo postupka, aby oprěděliti jesli manipulacija izměnila vrědnosty izměrenij.
Observacijsko izslědovanije ne vklučaje eksperimentalnoj manipulacije. Namesto togo, dannje sut sbirane i korelacije medžu prědskazčikami i otvetami sut izslědovane.
Znaměnito Hortonskoje izslědovanije izslědovalo izměny v rabočem okruženju v zavody Вестерн Электрик Компани (Western Electric Company)Western Electric Company (Vestern Elektrik Kompani). Izslědovateli byli zainteresovani v oprědělenju jesli povyšeno osvetlenije povysit produktivnostj rabotnikov konvejera. Izslědovanije jest silno kritikovano za pogrěšky v eksperimentalnyh procedurah, osoblivo za otsutstvije kontrolnoj grupy. Hortonsky effekt odnosi se k otkrytiju, čto rezultat izměnil se iz-za samogo nabljudenija.[7]
Tipy dannyh
[edit | edit source]
Razne popytky byli sděljane za tvorjenije taksonomiji niveljev izměrenija. Psiholog Стэнли Смит Стивенс (Stanley Smith Stevens)Stanley Smith Stevens (Stenli Smit Stivens) oprědělil nominalne, ordinalne, intervalnje i razmerje škaly:
- Nominalne izměrenija ne imajut smysljenogo rednogo porjadka medžu vrědnostyami.
- Ordinalne izměrenija imajut neoprecizne razlicy medžu susědonimi vrědnostyami, ale imajut smysljeny porjadok.
- Intervalnje izměrenija imajut smysljenye distancije medžu izměrenijami, ale nuleva vrědnostj jest arbitrarna (kako v slučaju temperatury v Celsijevyh ili Fahrenhejtovyh stupnjah).
- Razmerje izměrenija imajut i smysljenuju nulevuju vrědnostj, i oprěděljene distancije medžu razlicnymi izměrenijami.
Zaneže perěmenne, soobrazne toliko nominalnym ili ordinalnym izměrenjam, ne mogut byti razumno izměrene číselno, někogda one sut grupovane zajedno kako kategorijalne perěmenne, kogda razmerje i intervalnje izměrenija sut grupovane kako količestvenne perěmenne, ktore mogut byti ili diskretne ili njeprěryvne.
Opisna statistika
[edit | edit source]
Opisna statistika jest sumarnaja statistika, ktora količestvenno opisuje ili sumarizuje harraktery sbirky informacij.[8] Opisna statistika razlicuje se od induktivnoj (inferentnoj) statistiky v tom, čto opisna statistika cěli sumarizovati vzorek, a ne koristati dannje za izučenije populacije, kuju vzorek dannyh prědstavluje.
Opisna statistika je najčesče zainteresovana dvěma skupinami vlastnostij distribucije (vzorka ili populacije):
- Centralna tendencija (ili položenije) cěli harrakteizovati centralnu ili typičnu vrědnostj distribucije.
- Razprědělenost (ili varijabilnostj) harrakteizuje stěpen v ktorem členy distribucije otstupajet od svojego centra i od sebě navzajem.
Induktivna statistika
[edit | edit source]
Induktivna statistika jest process koristanja analizy dannyh za dedukciju vlastnostij ležeče distribuciji vjerojatnosty.[9] Induktivna statistična analiza vyvodi vlastnosty populacije, na primjer prěz testiranje hipotez i izvedenije ocěnov.
Nuleva i alternativna hipoteza
[edit | edit source]Interpretacija statističnyh informacij često vklučaje razvoj nulevoj hipotezy (H₀), ktora jest ordinerno tvrdjenije, čto medžu perěmennymi ne jest nikakoje vzejemodějstvije ili čto so vrěmenom ne bylo nikakogo izměnenija.[10] Alternativna hipoteza (H₁) jest ime hipotezy, ktora protirěčit nulevoj hipotezy.
Najlěpša ilustracija za novačka jest zatrudnenije v kriminalnom processy: nuleva hipoteza H₀ tvrdžaje, čto obžalovany jest nevinen, kogda alternativna hipoteza H₁ tvrdžaje, čto jest vinen. H₀ osta v sily, dokud H₁ ne jest podprěta dokazami «mimo razumnogo sumnenja».
Rabotajučy iz nulevoj hipotezy, sut raspoznane dvě kategoriji pogrěšnostij:
- Pogrěšnostj typa I — nuleva hipoteza jest ložno otklonjena, daje «ložno pozitivny» rezultat.
- Pogrěšnostj typa II — nuleva hipoteza ne jest otklonjena, kogda faktična razlica medžu populacijami jest propuščena, daje «ložno negativny» rezultat.
Priměnenije statistiky
[edit | edit source]
Statistika imaje široke priměnenije vo mnogo oblastjah:
- Medicina i epidemiologija: klinične ispytanija, izslědovanija zdravja populacije, ocěnjenje riska bolěznej
- Ekonomika i finansy: prědskazanje ekonomičeskih indikatorov, analiza rynkov
- Socialne nauki: demografija, sociologičeske ankety, analiza obščestvennyh tendencij
- Inženerija i industria: kontrola kačestva, testiranje nadežnosty
- Psihologija: eksperimentalne izslědovanija ljudskogo povedenja
- Astronomija i fizika: analiza observacijskih dannyh
Historija
[edit | edit source]
Formalne diskusije o statističeskom vyvody datujut se do matematikov i kriptografov Islamskej Zlatnoj Epochy medžu 8. i 13. věkom. Аль-Халиљ ибн Ахмад аљ-ФарахидиAl-Khalil ibn Ahmad al-Farahidi (717–786) napisal «Knigu Kriptografičnih Poslanij», ktora soderže jedno iz prvyh koristanj permutacij i kombinacij, za pereeislenjenije vsih možnyh arabskyh slov s samoglasnikami i bez nih.[11] «Rukopis аљ-Кинди1al-Kindija o Dešifrovanju Kriptografičnih Poslanij» dal podrobno opisanje kako koristati frekventnu analizu za dešifrovanje šifrovanyh poslanij, davaje ranny primer statističeskoj indukciji za dekodovanje. Ибн АдланIbn Adlan (1187–1268) pozdněje sdělal važny vklad v koristanje vělikosty vzorky v frekventnoj analizy.
Hotja termin statistica byl vvěden italskim učencom Джироламо Гилини (Girolamo Ghilini)Girolamo Ghilini (Džirolamo Gilini) v 1589 roku v odnosu k sbirky faktov i informacij o državě, byl němečky Готфрид Ахенваљ (Gottfried Achenwall)Gottfried Achenwall (Gotfrid Ahenvalj) v 1749 roku, ktory počal koristati termin za sbirku količestvennyh informacij v sučasnom koristanju dlja tutoj nauki.[12] Najrannějše pisanje soderže statistiku v Evropě datuje se do 1663 roku, s publikacijeju «Naturalnih i Političnih Observacij nad Listami Smertnosti» Джона Граунта (John'a Graunt'a)John'a Graunt'a (Džon Graunt).[13]

Matematične osnovy statistiky razvily se iz diskusij o igrah na sreču medžu matematikamy kako Джероламо Кардано (Gerolamo Cardano)Gerolamo Cardano (Džerolamo Kardano), Блез Паскаљ (Blaise Pascal)Blaise Pascal (Blez Paskalj), Пьер де Ферма (Pierre de Fermat)Pierre de Fermat (Pjer de Ferma) i Христиан Гюйгенс (Christiaan Huygens)Christiaan Huygens (Kristiaan Hujgens). Teorija vjerojatnosty jako matematična disciplina formovaly se na samom koncu 17. věka, osoblivo v posthumnom dělu Якоб Бернулли (Jacob Bernoulli)Jacob Bernoulli (Jakob Bernulli) Ars Conjectandi. To byla prva kniga, v ktoroj oblast iger na sreču i oblast vjerojatnjego (ktora imała delo z mnenijem, dokazami i argumentom) sut spojene i podvergnuty matematičnoj analizy.[14] Metod najmenšyh kvadratov byl pervo opisany Адриен-Мари Лежандр (Adrien-Marie Legendre)Adrien-Marie Legendre (Adrien-Mari Ležandr) v 1805 roku, hotja Карл Фридрих Гаусс (Carl Friedrich Gauss)Carl Friedrich Gauss (Karl Fridrih Gauss) prědpoložitelno koristal jego deset lět ranje v 1795 roku.

V 1830–1850-yh letah «statističeske uriady» i nacionalne «statističeske obščestva» sut stvorene v Evropě i Ameriky. Belgijsky naučnik Адољф Кетле (Adolphe Quetelet)Adolphe Quetelet (Adolf Ketle) (1796–1874) vvedel koncepciju «srědnjego člověka» (l'homme moyen) kako sredstvo razuměnja složnyh obščestvennyh javlenij, kako stopy kriminalnosty, brakosočetanija i samoubijstjv. V 1853 roku Кетле (Quetelet)Quetelet (Ketle) organizoval v Brjusele Pervy Medžunarodni Statističesky Kongres s cělom unifikacije izměrenij v statističeskich izslědovanijah.[15]
Sučasno polje statistiky vozniklo v pozdnom 19. i rannom 20. věky v treh etapah.[16] Perva volna, na prělomu věkov, byla vedena rabotami Фрэнсис Гальтон (Francis Galton)Francis Galton (Frensis Galton) i Карл Пирсон (Karl Pearson)Karl Pearson (Karl Pirson), ktori transformirovali statistiku v stroguju matematičnu disciplinu. Гальтон (Galton)Galton (Galton) vvedel koncepty standartnjego otstupanija, korelacije i regresivnoj analizy, priměnivše ih na izslědovanje raznoobrazija ljudskih harrakteristik. Пирсон (Pearson)Pearson (Pirson) razvil Pearsonov koeficient korelacije, metod momentov za prilaganje distribucij k vzorkam i Pearsonovu distribuciju. Гальтон (Galton)Galton (Galton) i Пирсон (Pearson)Pearson (Pirson) osnovali Biometrika jako pervy žurnal matematičeskoj statistiky i biostatistiky{ a posledny osnoval pervy v světě universitetsky statističesky departament pri University College London.[17]
Druga volna 1910–1920-yh godov byla iniciirana Уиљям Силай Госсет (William Sealy Gosset)William Sealy Gosset (Vilijam Silej Goset) i dostignula svoego kulminaciju v vkladah Рональд Фишер (Ronald Fisher)Ronald Fisher (Ronald Fišer), ktory napisal učebniky, ktore oprědělily akademičesku disciplinu v universitetah po vsem světě. Najvažnějše publikacije Фишера (Fisher)Fisher (Fišera)a: seminalny artikel 1918 roku «Korelacija medžu Rodstveny na Supposiciji Mendeljevskoho Naslědovanija» (pervo koristanie statističeskog termina variancija), klassično dělo 1925 roku «Statističeske Metody dlja Izslědovatelnev» i «Projektirovanije Eksperimentov» 1935 roku, v ktoryh on razvil stroge modely projektirovanija eksperimentov. On takože skovał termin nulevoj hipotezy v eksperimentě «Dama kuša čaj», ktora «nikogda ne jest dokazana ili ustanovljena, ale jest možno oprovergnuty v toku eksperimentirovanija».[18]
Třetja volna, ktora glavno viděla usoverfenstvovanije i razširenje rannějšyh razvitij, voznikla iz kolaborativnoj raboty medžu Эгон Пирсон (Egon Pearson)Egon Pearson (Egon Pirson) i Ежи Нейман (Jerzy Neyman)Jerzy Neyman (Ježi Nejman) v 1930-yh letah. One vveli koncepty «Pogrěšnosty Typa II», sily testa i intervaljev věrovatnosty. Ежи Нейман (Jerzy Neyman)Jerzy Neyman (Ježi Nejman) v 1934 roku pokazal, čto stratifikovano slučajno vzorčitanje jest v obščem lěpšy metod ocěnenija než namerne vzorčitanje.[19]
Dodnes statističeske metody sut priměnjene vo vsih oblastyah, ktore vklučajut prinjatije rěšenij. Koristanje sučasnyh kompjuterov uskorilo masštabne statističeske izčislenija i takože umožnilo nove metody, ktore praktično ne bylo možno vypolnjati vrucno. Statistika ostaje oblastju aktivnyh izslědovanij, na primjer v problemě kako analizovati veliky dannje.[20]
Iztočniky
[edit | edit source]- ↑ Romijn, Jan-Willem (2014). Philosophy of Statistics. Stanford Encyclopedia of Philosophy.
- ↑ Dodge, Y. (2006). The Oxford Dictionary of Statistical Terms. Oxford University Press. ISBN 0-19-920613-9.
- ↑ Dodge, Y. (2006). The Oxford Dictionary of Statistical Terms. Oxford University Press.
- 1 2 Hand, D.J. (2010). Statistics: A Very Short Introduction. Oxford University Press. ISBN 978-0-19-954145-4.
- ↑ Willcox, Walter F. (1935). The Founder of Statistics. Revue de l'Institut International de Statistique.
- ↑ Upton, Graham; Cook, Ian (2008). A Dictionary of Statistics. Oxford University Press. ISBN 978-0-19-954145-4.
- ↑ Levitt, Steven D.; List, John A. (2011). "Was There Really a Hawthorne Effect at the Hawthorne Plant?". American Economic Journal: Applied Economics. 3: 224–238.
- ↑ Mann, P.S. (1995). Introductory Statistics. Wiley. ISBN 0-471-31009-3.
- ↑ Upton, Graham; Cook, Ian (2008). Oxford Dictionary of Statistics. Oxford University Press. ISBN 978-0-19-954145-4.
- ↑ Nickerson, Raymond S. (2000). Null Hypothesis Significance Testing. Psychological Methods. 5. str. 241–301.
- ↑ Broemeling, Lyle D. (1 novembra 2011). "An Account of Early Statistical Inference in Arab Cryptology". The American Statistician. 65 (4): 255–257.
- ↑ Ostasiewicz, Walenty (2014). "The emergence of statistical science". Śląski Przegląd Statystyczny. 12 (18): 76–77.
- ↑ Willcox, Walter (1938) "The Founder of Statistics". Review of the International Statistical Institute 5(4): 321–328.
- ↑ Franklin, James (2002). The Science of Conjecture. Taylor & Francis. ISBN 978-0-8018-7109-2.
- ↑ Hayes, M. (1855). Compte rendu des travaux du congrès général de statistique. Bruxelles.
- ↑ Walker, Helen Mary (1975). Studies in the history of statistical method. Arno.
- ↑ "Karl Pearson (1857–1936)". Department of Statistical Science, University College London.
- ↑ Фишер (Fisher)Fisher (Fišer) 1935. The Design of Experiments, Chapter II, Section 8.
- ↑ Neyman, J. (1934). "On the two different aspects of the representative method". Journal of the Royal Statistical Society. 97 (4): 557–625.
- ↑ "Science in a Complex World – Big Data: Opportunity or Threat?". Santa Fe Institute. 2 dekembra 2013.
Gledite takože
[edit | edit source]
- Tutoj članok imaje prěvod iz članka "Statistics" v Vikipediji na anglijskom (spis avtorov; dozvoljenje CC BY-SA 4.0).