Vertrauensbereich

In der Statistik ist ein Vertrauensbereich eine mehrdimensionale Verallgemeinerung eines Konfidenzintervalls. Es ist eine Reihe von Punkten in einem n-dimensionalen Raum, die oft als ein Ellipsoid um einen Punkt, der eine geschätzte Lösung für ein Problem dargestellt, obwohl auch andere Formen auftreten können.

Der Vertrauensbereich ist derart, dass, wenn eine Reihe von Messungen wurden mehrere Male wiederholt und ein Vertrauensbereich in gleicher Weise auf jeden Satz von Messungen berechnet, dann wird ein bestimmter Prozentsatz der Zeit, im Durchschnitt, die Vertrauensbereich würde auch berechnete der Punkt, der die "wahren" Werte der Satz von Variablen, die geschätzt. Aber es sei denn, bestimmte Annahmen über die vorherigen Wahrscheinlichkeiten getroffen werden, es bedeutet nicht, wenn eine Vertrauensbereich berechnet worden ist, dass es eine 95% Wahrscheinlichkeit, dass der "wahre" Werte in der Region liegen, da wir keinen bestimmten Wahrscheinlichkeit nicht davon ausgehen, Verteilung der "wahren" Werte und wir können oder nicht haben andere Informationen, wo sie wahrscheinlich liegen, sind.

Der Fall von unabhängigen, identisch normalverteilten Fehlern

Angenommen, wir haben eine Lösung für die folgenden überbestimmtes Problem gefunden:

wobei Y eine n-dimensionalen Spaltenvektor, der beobachteten Werte, X ein n-mal-p-Matrix, die ein physikalisches Modell darstellen kann und von der angenommen wird, genau bekannt ist, ist ein Spaltenvektor der p Parameter, die geschätzt werden sollen, enthält, und ein n-dimensionaler Spaltenvektor der Fehler, die annimmt, dass sie unabhängig voneinander mit Normalverteilung mit einem Mittelwert von Null verteilt werden und die jeweils die gleiche unbekannte Varianz.

Eine gemeinsame 100% Vertrauensbereich für die Elemente wird durch die Menge von Werten des Vektors b, die die folgende Ungleichung erfüllen vertreten:

wobei die Variable b für jeden Punkt in der Vertrauensbereich ist, p die Anzahl der Parameter, dh die Zahl der Elemente des Vektors ist und s eine erwartungstreue Schätzung gleich

Weiterhin ist das Quantil F Funktion der F-Verteilung mit p und Freiheitsgrade, ist die statistische Signifikanzniveau und das Symbol bedeutet die Transponierte.

Die obige Ungleichung definiert eine ellipsoide Region in der p-dimensionalen Kartparameterraum R. Der Mittelpunkt des Ellipsoids auf die Lösung. Laut Presse et al., Ist es einfacher, das Ellipsoid nachdem ich Singulärwertzergliederung plotten. Die Längen der Achsen des Ellipsoids sind proportional zum Kehrwerte der Werte auf der Diagonalen der diagonalen Matrix und die Richtungen dieser Achsen werden durch die Zeilen der dritten Matrix der Zersetzung angegeben.

Gewichtet und verallgemeinerte kleinste Quadrate

Betrachten wir nun den allgemeineren Fall, wo einige verschiedene Elemente der ungleich Null haben Kovarianz bekannt ist, und / oder die Standardabweichungen der Fehler sind nicht alle gleich. Angenommen, der Kovarianzmatrix ist, wobei V ein n-mal-n-singuläre Matrix, die gleich in der spezielleren Fall, in dem vorigen Abschnitt behandelt war, aber hier darf Null verschiedenen Nichtdiagonalelemente, die die Kovarianz Paare haben Einzelbeobachtungen sowie die nicht unbedingt alle Diagonalelemente gleich.

Es ist möglich, eine nicht singuläre symmetrische Matrix P, so dass zu finden

In der Tat ist P eine Quadratwurzel der Kovarianzmatrix V.

Das Problem der kleinsten Quadrate

kann dann durch Links Multiplizieren jedes Terms mit dem Kehrwert P, der Bildung einer neuen Problemformulierung überführt werden

woher

Eine gemeinsame Vertrauensbereich für die Parameter, dh für die Elemente, wird dann durch den Ellipsoid gegeben durch begrenzt wird:

Hier F die Prozentpunkt der F-Verteilung und die Mengen p und np sind die Freiheitsgrade, die die Parameter dieser Verteilung sind.

Nichtlineare Probleme

Vertrauen Regionen kann für jede Wahrscheinlichkeitsverteilung definiert werden. Kann der Experimentator das Signifikanzniveau und die Form des Bereichs zu wählen, und dann die Größe des Bereichs wird durch die Wahrscheinlichkeitsverteilung bestimmt. Eine natürliche Wahl ist, um als eine Grenze mit konstanten Werten verwenden eine Menge von Punkten.

Ein Ansatz ist es, eine lineare Näherung an die nicht lineare Modell, das eine gute Annäherung im Bereich der Lösung kann zu verwenden, und dann die Analyse für ein lineares Problem, um eine ungefähre Vertrauensbereich zu finden. Dies kann es vernünftig sein, wenn der Vertrauensbereich nicht sehr groß ist, und die zweiten Ableitungen des Modells sind auch nicht sehr groß.

Bootstrapping Ansätze können ebenfalls verwendet werden.

Siehe Unsicherheit Quantifizierung # Methoden für zukunfts Unsicherheitspropagation verwandte Konzepte.

(0)
(0)
Kommentare - 0
Keine Kommentare

Fügen Sie einen Kommentar

smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile
Zeichen übrig: 3000
captcha