Tuesday 30 May 2017

Detrending Zeit Serie Daten In Stata Forex

Sie können eine Variable wie folgt demeanieren: Wenn Sie einen Batch von Variablen haben, können Sie eine Schleife verwenden. Nehmen wir an, dass Sie drei Variablen namens peter, paul und mary haben: Wenn Sie fehlende Werte haben und die Variablen in einer Regression verwenden möchten, sollten Sie eventuell listweise löschen. Dies bedeutet, dass Sie nicht berücksichtigen obsevrations, die Versäumnisse für eine der Variablen haben. Zum Nachteilen haben Sie mehrere Möglichkeiten. Wenn Sie einen linearen Trend von einer Variablen y entfernen möchten, können Sie folgendes tun, wenn t der Zeitindex ist: Sie können auch einen Blick auf die statistische Stationarität haben: Eine stationäre Zeitreihe ist eine, deren statistische Eigenschaften wie Mittelwert, Varianz , Autokorrelation usw. über die Zeit konstant sind. Die meisten statistischen Prognosemethoden basieren auf der Annahme, dass die Zeitreihe durch die Verwendung von mathematischen Transformationen annähernd stationär (d. h. Eine stationarisierte Serie ist relativ einfach vorherzusagen: Sie prognostizieren einfach, dass ihre statistischen Eigenschaften in Zukunft dieselben sein werden, wie sie es in der Vergangenheit waren (erinnern Sie sich an unsere berühmten Prognosezitate.) Die Prognosen für die stationäre Reihe können dann zertifiziert werden Durch Umkehrung, was mathematische Transformationen vorher verwendet wurden, um Vorhersagen für die ursprüngliche Reihe zu erhalten. (Die Details werden in der Regel von Ihrer Software betreut.) Das Finden der Sequenz von Transformationen, die für die Stationarisierung einer Zeitreihe erforderlich sind, liefert oft wichtige Hinweise bei der Suche nach einem geeigneten Prognosemodell. Stationarisierung einer Zeitreihe durch Differenzierung (wo nötig) ist ein wichtiger Teil des Prozesses der Montage eines ARIMA-Modells. Wie auf den Seiten der ARIMA-Seiten beschrieben. Ein weiterer Grund für den Versuch, eine Zeitreihe zu stationarisieren, besteht darin, sinnvolle Stichprobenstatistiken wie Mittelwerte, Abweichungen und Korrelationen mit anderen Variablen zu erhalten. Solche Statistiken sind als Deskriptoren des zukünftigen Verhaltens nur dann nützlich, wenn die Serie stationär ist. Wenn z. B. die Reihe im Laufe der Zeit kontinuierlich zunimmt, wachsen die Stichprobenmittelwerte und die Varianz mit der Größe der Stichprobe, und sie werden den Mittelwert und die Varianz in zukünftigen Perioden immer unterschätzen. Und wenn der Mittelwert und die Varianz einer Reihe nicht gut definiert sind, so sind sie auch keine Korrelationen mit anderen Variablen. Aus diesem Grund sollten Sie vorsichtig sein, wenn Sie versuchen, Regressionsmodelle zu extrapolieren, die an nichtstationäre Daten angepasst sind. Die meisten wirtschaftlichen und ökonomischen Zeitreihen sind weit von stationär, wenn sie in ihren ursprünglichen Maßeinheiten ausgedrückt werden, und selbst nach Deflation oder Saisonbereinigung werden sie typischerweise immer noch Trends, Zyklen, zufälliges Gehen und anderes nicht-stationäres Verhalten aufweisen. Hat die Baureihe einen stabilen Langzeittrend und neigt nach einer Störung dazu, in die Trendlinie zurückzukehren, kann sie durch Abtrennung (zB durch Anpassen einer Trendlinie und Subtrahieren vor dem Einbau eines Modells, Oder indem man den Zeitindex als eine unabhängige Variable in einem Regression - oder ARIMA-Modell einbindet), möglicherweise in Verbindung mit dem Protokollieren oder dem Entleeren. Solch eine Reihe soll tendenziell stationär sein. Jedoch reicht es manchmal auch nicht aus, die Serie stationär zu machen, wobei es in diesem Fall notwendig sein kann, sie in eine Reihe von Periodenperiodenperioden und - oder Jahreszeitunterschieden umzuwandeln. Wenn der Mittelwert, die Varianz und die Autokorrelationen der ursprünglichen Reihe nicht zeitlich konstant sind, werden die Statistiken der Veränderungen in der Reihe zwischen den Perioden oder zwischen den Jahreszeiten möglicherweise auch nach der Detrierung konstant sein. Eine solche Reihe wird als Differenz stationär bezeichnet. (Manchmal kann es schwierig sein, den Unterschied zwischen einer Serie, die Trend-stationär und eine, die Differenz-stationär ist zu erzählen, und ein so genannter Einheit Root-Test kann verwendet werden, um eine endgültigere Antwort erhalten werden. Wir kehren zu diesem Thema Später im Kurs.) (Rückkehr nach oben.) Der erste Unterschied einer Zeitreihe ist die Reihe von Änderungen von einer Periode zur nächsten. Wenn Y t den Wert der Zeitreihe Y in der Periode t angibt, ist die erste Differenz von Y in der Periode t gleich Y t - Y t-1. In Statgraphics wird die erste Differenz von Y als DIFF (Y) ausgedrückt, und in RegressIt ist es YDIFF1. Wenn die erste Differenz von Y stationär und auch vollständig zufällig (nicht autokorreliert) ist, dann wird Y durch ein zufälliges Wandermodell beschrieben: jeder Wert ist ein zufälliger Schritt von dem vorherigen Wert entfernt. Wenn die erste Differenz von Y stationär, aber nicht vollständig zufällig ist - d. h. Wenn sein Wert in der Zeit t mit seinem Wert zu früheren Perioden autokorreliert wird - dann kann ein anspruchsvolleres Prognosemodell, wie Exponentialglättung oder ARIMA, geeignet sein. (Hinweis: wenn DIFF (Y) stationär und zufällig ist, bedeutet dies, dass ein zufälliges Wandermodell für die ursprüngliche Serie Y geeignet ist, nicht dass ein zufälliges Wandermodell an DIFF (Y) angebracht werden sollte Ist logisch gleichbedeutend mit der Anpassung eines mittleren (nur konstanten) Modells an DIFF (Y). Hier ist ein Graph der ersten Differenz von AUTOSALECPI, der deflationierten Auto-Verkaufsreihe. Beachten Sie, dass es jetzt ungefähr stationär aussieht (mindestens das Mittel und die Varianz sind mehr oder weniger konstant), aber es ist überhaupt nicht zufällig (ein starkes saisonales Muster bleibt): Die folgende Kalkulationstabelle veranschaulicht, wie die erste Differenz für die Deflation berechnet wird Auto Verkaufsdaten:


No comments:

Post a Comment