Nyttige tip

Excel-patchsporing

Pin
Send
Share
Send
Send


Hypotesetestning er baseret på en bekræftende tilgang til dataanalyse. I en tidligere note blev omfattende hypotese-testprocedurer baseret på en enkelt prøve ekstraheret fra en enkelt population overvejet. Denne note beskriver hypotesetestprocedurer baseret på to numeriske prøver, der er ekstraheret fra to populationer. Er det gennemsnitlige ugentlige salg af BLK cola i specialiserede hylder og på almindelige hylder lige?

Anvendelsen af ​​statistikker i denne note vises i et gennemgående eksempel. ”Afhænger salgsmængden af ​​typen af ​​hylder i butikken?” Forestil dig, at du er en regional salgschef for BLK Foods og vil sammenligne salgsmængderne af BLK Cola, der vises i almindelige hylder og på specialiserede stativer. For at gøre dette opretter du et udvalg bestående af 20 butikker med BLK Foods, der annoncerede et fuldt salg af varer. Derefter deler du denne prøve tilfældigt i halvdelen: Tildel 10 butikker til den første gruppe og de resterende 10 til den anden. Butikledere i den første gruppe placerer BLK-cola-flasker i almindelige hylder, blandt andet sodavand. Samtidig bør butikschefer fra den anden gruppe placere flaskerne med BLK Cola på specialiserede stativer og placere reklamer på dem. Hvordan kan man bestemme, om salgsmængderne af BLK-cola er ens i butikkerne fra disse to grupper? Stemmer volatiliteten i salget i disse butikker? Hvordan bruges svarene på disse spørgsmål til at øge salget af BLK-cola?

Brug af Z-testen til at evaluere forskellen mellem to matematiske forventninger

Antag, at en tilfældig prøve af volumen ekstraheres fra den første population. n1 og fra den anden - en tilfældig prøve, hvis volumen er lig med n2. Det kræves at analysere de data, der hører til hver prøve. Angiv forventningen til den første befolkning med μ1og standardafvigelsen er igennem σ1. Tilsvarende er den matematiske forventning til den anden befolkning angivet med μ1og standardafvigelsen er σ2. Statistikkerne, der ligger til grund for kriteriet for at kontrollere ligestillingen af ​​matematiske forventninger hos to populationer, er baseret på forskellen mellem eksemplerne 12. I henhold til den tidligere begrænsede sætning, der er formuleret tidligere, for tilstrækkelig store prøvestørrelser, har disse statistikker en standardiseret normalfordeling. Derfor kan vi formulere følgende for at estimere forskellen mellem to matematiske forventninger Z-test:

hvor 1 - den gennemsnitlige værdi af stikprøven fra den første generelle befolkning μ1 - den matematiske forventning til den første generelle befolkning - variationen af ​​den første generelle befolkning n1 - størrelsen af ​​prøven udvundet fra den første population 2 - den gennemsnitlige værdi af stikprøven fra den anden population μ2 - den matematiske forventning til den anden population, - variationen i den anden befolkning n2 - størrelsen af ​​prøven udvundet fra den anden population. Statistik Z har en standardiseret normalfordeling.

Download noten i Word- eller pdf-format, eksempler i Excel2013-format

ansøgningt-kriterier for at estimere forskellen mellem matematiske forventninger ved hjælp af den samlede varians

I de fleste situationer er afvigelser og standardafvigelser for de to populationer ukendt. Den eneste information, der er tilgængelig for forskeren, er eksempelmidler, prøvevarians og prøvestandardafvigelser. Hvis prøverne er tilfældige, uafhængige og ekstraheret fra normalt distribuerede populationer med samme varians (dvs. =), for at teste hypotesen om en signifikant forskel mellem de to populations matematiske forventninger t-test ved hjælp af total varians. Nullhypotesen er, at de matematiske forventninger fra to uafhængige populationer ikke adskiller sig fra hinanden:

En alternativ hypotese er, at matematiske forventninger ikke stemmer overens med:

t-test til estimering af forskellen mellem to matematiske forventninger ved anvendelse af total varians

hvor er den totale varians 1 - den gennemsnitlige værdi af stikprøven fra den første generelle befolkning μ1 - den matematiske forventning til den første generelle befolkning - variansen af ​​prøven fra den første generelle befolkning n1 - størrelsen af ​​prøven udvundet fra den første population 2 - den gennemsnitlige værdi af stikprøven fra den anden population μ2 - den matematiske forventning til den anden generelle befolkning - variationen af ​​prøven fra den anden generelle befolkning n2 - størrelsen af ​​prøven udvundet fra den anden population. Statistik t har tStudentfordeling med n1+n2– 2 grader af frihed.

For et givet signifikansniveau α afviser det tosidede kriterium nulhypotesen, hvis t-statistik er større end den øvre kritiske værdi eller mindre end den lavere kritiske værdi. Ovennævnte kriterium afviser nulhypotesen, hvis t-statistik er større end den øvre kritiske værdi, og kriteriet afgrænset nedenfor - hvis det er mindre end den lavere kritiske værdi.

Fig. 1. Områder med accept og afvisning af hypoteser ved hjælp af bilaterale t-kriterium til vurdering af forskellen mellem to matematiske forventninger

Vis ansøgning t-kriterion ved hjælp af den totale varians, for eksempel scenariet beskrevet i begyndelsen af ​​noten. Gør det gennemsnitlige salg af BLK-cola, placeret på almindelige hylder og specialiserede stativer, sammen. I dette problem overvejes to populationer. Den første generelle befolkning består af alle slags ugentlige salgsmængder af BLK-cola, hvis alle supermarkeder i BLK bruger almindelige stativer. Den anden generelle befolkning inkluderer alle slags ugentlige salgsmængder af BLK-cola, hvis alle supermarkeder i BLK-selskabet bruger specialiserede stativer.

Fig. 2. Sammenligning af ugentlig salg af BLK cola placeret i forskellige hylder (antal køb)

Null- og alternative hypoteserne er formuleret som følger: H0: μ1 = μ2 eller μ1 – μ2 = 0, H1: μ1 ≠ μ2 eller μ1 – μ2 ≠ 0. Hvis vi antager, at prøverne ekstraheres fra normalt distribuerede populationer med samme varians (dvs. =), anvender vi t-kriterion ved hjælp af total varians. Denne statistik har t- distribution med 10 + 10 - 2 = 18 frihedsgrader. Hvis signifikansniveauet for det tosidede kriterium a er 0,05, er det kritiske område opdelt i to dele, der hver svarer til en sandsynlighed på 0,025. Kritiske værdier t-statistik: lavere = STUDENT.OBR (0,025,18) = –2,1009, øvre = STUDENT.OBR (0,975,18) = +2,1009. Beslutningsreglen har følgende form: hvis t> +2.1009 eller t 3.04 eller t tn - 1 eller t 0 (i gennemsnit er en standardpakke langsommere end en ny). Vi indstiller signifikansniveauet α lig med 0,05 og antager, at forskellene normalt er fordelt. Dette giver dig mulighed for at ansøge t-kriterion for parrede prøver er formel (5). For en prøve på 10 opgaver har beslutningsreglen følgende form: nullhypotese H0 afviger hvis t> t9 = STUDENT.OBR (0.05.9) = 1.8331, ellers afviger det ikke.

Den gennemsnitlige forskel mellem resultaterne opnået i parvise sammenligninger D̅ = 0,084 og standardafvigelse SD = 0,0844, t = +3,149. Da værdien t = +3.15 ligger i det kritiske område, er nulhypotesen H0 afvist. I gennemsnit kører en ny pakke hurtigere end en standardpakke.

Fig. 10. Beregning t-test

Fig. 11. Det kritiske område i envej tkriterium med et 5% signifikansniveau og 9 frihedsgrader

At beregne tstatistik (og r-værdier) kan du bruge analysepakken. Bemærk, at i dette tilfælde kan du ikke finde forskellen (kolonne forskel (Djeg) ikke påkrævet). Gå gennem menuen. dataDataanalyse og vælg linjen Parret t-prøve t-test for medium. som r- værdien er lig med 0,006 og mindre end α 2-statistikker, tilnærmet med en χ 2-fordeling med en frihedsgrad. Som vi vil se, er disse to kriterier ækvivalente.

Uafhængige prøver kan bruges til at estimere forskelle mellem to populationer baseret på uafhængige prøver. Z-test. Baseret på forskellen mellem to prøveandele af karakteristikken Ps1Ps2 beregnes Z-statistik brugt til at estimere forskellen mellem de to dele af træk i befolkningen. Hvis prøvestørrelsen er stor nok, har denne teststatistik en standardiseret normalfordeling. Z-kriterium for vurdering af forskellen mellem to aktier:

hvor ps1 - andel af succes i den første prøve X1 - antallet af succeser i den første prøve n1 - stikprøvestørrelse fra den første generelle befolkning p1 - andel af succes i den første generelle befolkning ps2 - andel af succes i den anden prøve X2 - antallet af succeser i den anden prøve n2 - stikprøvestørrelse fra den anden generelle befolkning r2 - andel af succes i den anden generelle befolkning R - vurdering af succesraten i den samlede befolkning.

Med en tilstrækkelig stor prøvestørrelse Z-statistik adlyder en standardiseret normalfordeling.

Nullhypotesen er, at proportioner af attributten i de to generelle populationer er de samme. Følgelig kan verificeringen af ​​ligheden mellem de karakteristiske andele i to generelle populationer reduceres til at vurdere andelen af ​​karakteristikken i den samlede generelle befolkning. Det samlede estimat er lig med resultatet af at dividere antallet af succeser i begge prøver X1+ X2 i mængden af ​​prøvestørrelser n1+ n2.

med Z-kriterium, kan du bestemme, om der er forskelle mellem succesraten i de to grupper (tosidetest), og også for at bestemme, om succesfrekvensen i den ene gruppe overstiger succesraten i den anden (ensidig test).

Fig. 13. Tre muligheder Z-test

At teste nul og alternativ hypotese H0: p1 = p2, H1: p1 ≠ s2skal bruge test Z-statistik - formler (7). For et givet signifikansniveau α afvises nulhypotesen, hvis den beregnes Z-statistik er større end den øvre eller mindre end den lavere kritiske værdi af den standardiserede normalfordeling.

At illustrere Zkriterium for afprøvning af hypotesen om ligestilling mellem to aktier, antag at du er manager for virksomheden T. S. Resort Properties. På en af ​​øerne T.C. Resort Properties ejes to hoteller: Beachcomer og Windsurfer. På spørgsmålet “Har du planer om at vende tilbage til vores hotel igen?” 163 ud af 227 gæster på Beachcomer svarede “Ja”, mens 154 ud af 262 gæster på Windsurfer besvarede dette spørgsmål: “Nej.” Er det muligt at sige, at der med et signifikansniveau på 0,05 ikke er nogen signifikant forskel mellem graden af ​​tilfredshed hos gæsterne på begge hoteller (sandsynligheden for, at de vender tilbage til hotellet i næste sæson)? Null- og alternative hypoteserne er formuleret som følger: H0: p1 = p2, H1: p1 ≠ s2.

Da signifikansniveauet er 0,05, er kritiske værdier ZL = NORM.ST.OBR (0.025) = –1.96 og ZU = NORM.ST.OBR (0.975) = +1.96, og beslutningsreglen har følgende form: nullhypotese H0 afviger hvis Z +1.96, ellers nulhypotesen H0 afviger ikke.

Fig. 14. Test af hypotesen om forskellen mellem de to aktier i et signifikansniveau på α = 0,05

Med et signifikansniveau på 0,05, nulhypotesen H0 afviger, fordi Z = +3,01> +1,96. Hvis nulhypotesen er sand, er sandsynligheden for, at Z-statistik vil være mere end +1.96 og mindre end -1.96 standardafvigelser fra centrum Z-fordeling lig med 0,05. Det observerede signifikansniveau er sandsynligheden for, at forskellen mellem de to prøvefraktioner er p (Z = 3,01) = (1-NORM.ST. RASP (3,01, SAND)) * 2 = 0,00262. Det kan således hævdes, at de to hoteller varierer betydeligt i servicekvalitet. Med andre ord er andelen af ​​gæster, der planlægger at vende tilbage, større hos Beachcomer end hos Windsurfer.

anvendelse afFkriterium for vurdering af forskellen mellem to afvigelser

Det bliver ofte nødvendigt at kontrollere, om to uafhængige populationer har samme varians. For eksempel er dette påkrævet for at vælge den rigtige. t-kriterion - ved hjælp af den totale eller separate spredning. Kontrol af forskellen mellem to populations afvigelser er baseret på studiet af deres forhold. Hvis hver population normalt fordeles, er forholdet S1 2 / S2 2 adlyder F-fordeling, opkaldt efter den berømte statistiker R. Fisher. Kritisk værdi F-fordeling afhænger af to sæt grader af frihed. Tællerens frihedsgrader vedrører den første prøve og graden af ​​frihed for nævneren til den anden. For at verificere ligheden mellem to afvigelser i kriterierne, F-statistik beregnet ved formlen:

hvor S1 2 - variansen af ​​stikprøven fra den første population n1 - størrelsen af ​​prøven udvundet fra den første population S2 2 - variansen af ​​stikprøven fra den anden population n2 - størrelsen af ​​prøven udvundet fra den anden population n1 – 1 - antallet af frihedsgrader for tælleren n2 – 1 - antallet af grader af frihed for nævneren.

Fstatistik har Fdistribution med n1 – 1 og n2 – 1 grader af frihed. For et givet signifikansniveau α er nul og alternativ hypotese: H0: σ1 2 = σ2 2, H1: σ1 2 ≠ σ2 2. hvis F-statistik er større end den øvre kritiske værdi FU eller mindre end den lavere kritiske værdi FL fra F-fordelinger med n1 – 1 frihedsgrader i tælleren og n2 – 1 grader af frihed i nævneren, nulhypotesen afvises. Den afgørende regel er således som følger: nullhypotese H0 afviger hvis F> FU eller F2 = σ2 2, H1: σ1 2 ≠ σ2 2 .

Da kriteriet er tosidigt, er det kritiske område opdelt i to dele afgrænset af venstre og højre hale F-fordeling. Hvis signifikansniveauet er α = 0,05, svarer hvert af disse områder til en sandsynlighed på 0,025. Da prøverne indeholder 10 butikker med forskellige hyldetyper, er der i den første og anden gruppe 10 - 1 = 9 grader af frihed. Øvre kritisk værdi F-fordelinger = F. OBR (0,975,9,9) = 4,026, lavere kritisk værdi F-fordelinger = F. OBR (0,025,9,9) = 0,248.

Fig. 16. Det kritiske område af det bilaterale Fkriterium med et signifikansniveau på 0,05 og 9 frihedsgrader i tælleren og nævneren

Så den afgørende regel: nullhypotesen H0 afviger hvis F> FU = 4,026 eller F2 af denne prøve er 56,0. Fra den anden distribuerede population, uafhængig af den første, en stikprøve af volumen n2 = 10. Spredning S2 2 af denne prøve er 24,0. Kontroller nulhypotesen om, at der ikke er nogen signifikant forskel mellem variationerne i disse populationer.

Øvre kritisk værdi F-f distributioner FU = F. OBR (0,975,7,9) = 4,197, lavere kritisk værdi F-f distributioner FL = F. OBD (0,025,7,9) = 0,207. F-statistik = S1 2 / S2 2 = 56/24 = 2.333. Den afgørende regel ser sådan ud: Nulhypotesen H0 afviger hvis F> FU = 4.197 eller F

Materialerne i bogen bruges af Levin m.fl. Statistik for ledere. - M .: Williams, 2004 .-- s. 579-640

Hvis prøvestørrelsen er stor nok, angiver den centrale grænsesteorem, at den gennemsnitlige forskel har en normal fordeling.

Excel Patch Tracking Oversigt

Når fixsporingstilstand er aktiveret, fremhæves hver celle, hvor ændringerne er sket, med specielle rammer og en markør. Når du holder musepekeren over den markerede celle, vil du se detaljerne i korrektionen.Dette giver dig og andre korrekturlæsere mulighed for at sikre, at alt løses, før du godkender den endelige version af bogen.

Der er et antal rettelser, som Excel ikke kan spore. Før du bruger denne mulighed, anbefaler vi, at du gør dig bekendt med listen over ændringer, der ikke spores og ikke fremhæves på Microsofts websted.

Du kan ikke bruge patch-sporingstilstand, hvis arbejdsbogen indeholder tabeller. Sådan slettes en tabel: vælg den, gå til fanen designerog vælg derefter kommandoen Konverter til rækkevidde.

Sådan aktiveres patch tracking mode

  1. fanen Peer review tryk på kommando berigtigelse, og vælg derefter Fremhæv korrektioner.
  2. I den dialogboks, der vises berigtigelse markér afkrydsningsfeltet Spor korrektioner. Sørg for, at emnet er valgt. Fremhæv rettelser på skærmenog klik derefter på OK.
  3. Hvis du bliver bedt om at bekræfte, at bogen er gemt, skal du klikke på OK.
  4. Patchsporing vil være aktiveret. Nu vil enhver redigeret celle markeres med en farvet kant og en trekant i øverste venstre hjørne. Hvis der er flere korrekturlæsere, tildeles hver af dem en anden farve.
  5. Vælg en redigeret celle for at se en liste over foretagne ændringer. I det følgende eksempel ændrede vi indholdet i celle E6 fra “?” Til “Andrey”.

Når du aktiverer patch tracking, deles bogen automatisk. Essensen af ​​at dele arbejdsbøger er muligheden for at gemme dem, hvor flere brugere samtidig kan åbne og redigere dem. Derudover kan du spore korrektioner i både de lokale og personlige kopier af bogen.

Foretagelse af alle korrektioner på et separat ark

Excel har evnen til at se ændringer på et separat ark kaldet Skift log. Denne tidsskrift indeholder en liste over alle ændringer i bogen, inklusive Gammel mening (gammelt celleindhold) og værdi (nuværende celleindhold).

  1. Gem arbejdsbogen.
  2. fanen Peer review vælg team berigtigelseog klik derefter på rullemenuen Fremhæv korrektioner.
  3. I den dialogboks, der vises berigtigelse markér afkrydsningsfeltet Foretag ændringer til et separat arkklik derefter på OK.
  4. Korrektioner gives på et separat ark med titlen magasinet.

Sådan fjernes Skift log fra en Excel-projektmappe kan du enten gemme projektmappen eller fjerne markeringen Foretag ændringer til et separat ark i dialogboksen berigtigelse.

Se videoen: Ryan Reynolds & Jake Gyllenhaal Answer the Web's Most Searched Questions. WIRED (September 2023).

Pin
Send
Share
Send
Send