Thursday 13 July 2017

Bergerak Rata Rata Stasioner


Seperti judulnya, inilah masalah saya: Biarkan Zt menjadi urutan yang sangat stasioner. Tentukan Xt Zt theta Z. Tunjukkan bahwa urutan ini juga benar-benar stasioner. Heres masalah saya. Definisi saya tentang stasioner ketat adalah bahwa kita memiliki distribusi (Zt, Z, titik, Z) tidak bergantung pada t semua m dalam mathbb dan semua h dalam mathbb. Tapi bagaimana saya melihatnya (Xt, X, titik, X) (Zt theta Z, titik, Z theta Z) yang akan bebas dari t-1 dengan cara Zt diasumsikan. Bagaimana kita menggeser ini ke kemandirian t bertanya 12 Februari 13 di 17:34 Saya tidak berpikir bahwa itu adalah masalah yang nyata: kemandirian dari t-1 sama dengan kemerdekaan dari t dan Anda melihatnya dengan jelas dengan menulisnya secara lebih jelas: untuk H1 Anda hanya mendapatkan Zttheta Z sim Z theta Ztquadforall tinmathbb Z yang sama forall (t-1) inmathbb Z. Jangan bingung dengan ketergantungan variabel, stationarity adalah tentang distribusi mereka sebenarnya sebuah serie konstan memiliki variabel dependen yang distribusinya. Tidak tergantung t. Atau apakah saya salah memahami pertanyaan Anda Pengantar Singkat tentang Seri Waktu Modern Definisi Suatu deret waktu adalah fungsi acak x t dari sebuah argumen t pada himpunan T. Dengan kata lain, deret waktu adalah keluarga dari variabel acak. X t-1 X t. X t1. Sesuai dengan semua elemen di himpunan T, di mana T seharusnya merupakan rangkaian tak terhitung dan tak terbatas. Definisi Suatu deret waktu yang teramati t t e T o T dianggap sebagai bagian dari satu realisasi fungsi acak x t. Satu set kemungkinan realisasi yang mungkin teramati disebut ansambel. Untuk menempatkan hal-hal lebih ketat, deret waktu (atau fungsi acak) adalah fungsi nyata x (w, t) dari dua variabel w dan t, di mana wW dan t T. Jika kita memperbaiki nilai w. Kita memiliki fungsi nyata x (t w) dari waktu t, yang merupakan realisasi deret waktu. Jika kita memperbaiki nilai t, maka kita memiliki variabel acak x (w t). Untuk suatu titik waktu tertentu ada distribusi probabilitas lebih dari x. Jadi fungsi acak x (w, t) dapat dianggap sebagai salah satu keluarga variabel acak atau sebagai keluarga realisasi. Definisi Kita mendefinisikan fungsi distribusi dari variabel acak dengan t 0 sebagai P o) x (x). Demikian pula kita dapat mendefinisikan distribusi bersama untuk n variabel acak Poin-poin yang membedakan analisis deret waktu dari analisis statistik biasa adalah sebagai berikut (1) Ketergantungan di antara pengamatan pada titik kronologis yang berbeda pada waktunya memainkan peran penting. Dengan kata lain, urutan pengamatan itu penting. Dalam analisis statistik biasa diasumsikan bahwa pengamatan saling terkait satu sama lain. (2) Domain t tidak terbatas. (3) Kita harus membuat kesimpulan dari satu realisasi. Realisasi variabel acak dapat diamati hanya sekali pada setiap titik waktu. Dalam analisis multivariat kita memiliki banyak pengamatan terhadap sejumlah variabel yang terbatas. Perbedaan kritis ini mengharuskan asumsi adanya stasioneritas. Definisi Fungsi acak x t dikatakan benar-benar stasioner jika semua fungsi distribusi berdimensi hingga yang menentukan x t tetap sama bahkan jika keseluruhan kelompok titik t 1. T 2. T n bergeser sepanjang sumbu waktu. Artinya, jika untuk bilangan bulat t 1. T 2. T n dan k. Secara grafis, seseorang dapat membayangkan realisasi dari rangkaian stasioner yang ketat karena tidak hanya memiliki tingkat yang sama dalam dua interval yang berbeda, namun juga fungsi distribusi yang sama, hingga parameter yang menentukannya. Asumsi stasioneritas membuat hidup kita lebih sederhana dan lebih murah. Tanpa stasioneritas, kita harus sering mencicipi proses ini pada setiap titik waktu untuk membangun karakterisasi fungsi distribusi dalam definisi sebelumnya. Stationarity berarti bahwa kita dapat membatasi perhatian kita pada beberapa fungsi numerik yang paling sederhana, yaitu saat-saat distribusi. Saat-saat sentral diberikan oleh Definisi (i) Nilai rata-rata dari deret waktu t adalah momen orde pertama. (Ii) Fungsi autocovariance dari t adalah momen kedua tentang mean. Jika ts maka Anda memiliki varians dari x t. Kita akan menggunakan untuk menunjukkan autocovariance dari rangkaian stasioner, di mana k menunjukkan perbedaan antara t dan s. (Iii) Fungsi autokorelasi (ACF) dari t adalah Kita akan menggunakan untuk menunjukkan autokorelasi dari rangkaian stasioner, di mana k menunjukkan perbedaan antara t dan s. (Iv) autokorelasi parsial (PACF). F kk Adalah korelasi antara z t dan z tk setelah menghilangkan ketergantungan linier mereka pada variabel intervening z t1. Z t2 Z tk-1 Salah satu cara sederhana untuk menghitung autokorelasi parsial antara z t dan z tk adalah dengan menjalankan dua regresi kemudian menghitung korelasi antara dua vektor residual. Atau, setelah mengukur variabel sebagai penyimpangan dari meannya, autokorelasi parsial dapat ditemukan sebagai koefisien regresi LS pada z t pada model dimana titik di atas variabel menunjukkan bahwa ia diukur sebagai deviasi dari meannya. (V) Persamaan Yule-Walker memberikan hubungan penting antara autokorelasi parsial dan autokorelasi. Kalikan kedua sisi persamaan 10 dengan z tk-j dan ambillah ekspektasi. Operasi ini memberi kita persamaan perbedaan berikut dalam autocovariances atau, dalam hal autokorelasi Representasi yang tampaknya sederhana ini benar-benar merupakan hasil yang hebat. Yaitu untuk j1,2. K kita dapat menulis sistem persamaan lengkap, yang dikenal sebagai persamaan Yule-Walker, Dari aljabar linier Anda tahu bahwa matriks r adalah pangkat penuh. Oleh karena itu dimungkinkan untuk menerapkan aturan Cramser berturut-turut untuk k1,2. Untuk memecahkan sistem autokorelasi parsial. Tiga yang pertama adalah Kami memiliki tiga hasil penting pada seri stasioner yang ketat. Implikasinya adalah kita bisa menggunakan realisasi berurutan dari urutan untuk memperkirakan mean. Kedua. Jika t benar-benar stasioner dan E t 2 lt maka Implikasinya adalah bahwa autocovariance hanya bergantung pada perbedaan antara t dan s, bukan kronologis mereka pada waktunya. Kita bisa menggunakan sepasang interval dalam perhitungan autocovariance selama waktu di antara keduanya konstan. Dan kita bisa menggunakan realisasi data yang terbatas untuk memperkirakan autocovariances. Ketiga, fungsi autokorelasi dalam hal stasioneritas ketat diberikan oleh Implikasinya adalah bahwa autokorelasi hanya bergantung pada selisih antara t dan s juga, dan sekali lagi dapat diperkirakan dengan realisasi data yang terbatas. Jika tujuan kami adalah untuk memperkirakan parameter yang deskriptif tentang kemungkinan realisasi dari deret waktu, maka mungkin stasioner ketat terlalu ketat. Misalnya, jika mean dan kovarians dari x t konstan dan tidak bergantung pada titik kronologisnya, maka mungkin tidak penting bagi kita bahwa fungsi distribusi sama untuk interval waktu yang berbeda. Definisi Fungsi acak bersifat stasioner dalam arti luas (atau lemah stasioner, atau stasioner dalam pengertian Khinchin, atau stasioner kovarian) jika m 1 (t) m dan m 11 (t, s). Strukturalitas yang ketat tidak dengan sendirinya menyiratkan stasioneritas yang lemah. Lemahnya stasioneritas tidak menyiratkan stasioneritas yang ketat. Strukturalitas yang ketat dengan E t 2 ini berarti lemahnya stasioneritas. Teorema ergodik berkaitan dengan pertanyaan tentang kondisi yang diperlukan dan cukup untuk membuat kesimpulan dari satu realisasi deret waktu. Pada dasarnya, ini bermuara pada asumsi lemahnya stasioneritas. Teorema Jika t lemah stasioner dengan mean m dan fungsi kovariansi, maka untuk itu, untuk setiap gt 0 dan h gt 0 ada beberapa nomor T o sehingga untuk semua T gt T o. Jika dan hanya jika kondisi yang diperlukan dan memadai ini adalah bahwa autocovariances mati, dalam hal ini mean sampel adalah estimator yang konsisten untuk mean populasi. Konsekuensi Jika t lemah dengan E tk xt 2 lt untuk setiap t, dan E tk xtx tsk x ts tidak bergantung pada t untuk bilangan bulat apapun, maka jika dan hanya jika jika Konsekuensi dari konsekuensi sebenarnya adalah asumsi bahwa xtx tk adalah Lemah stasioner Teorema Ergodik tidak lebih dari sebuah hukum dalam jumlah besar bila pengamatannya berkorelasi. Orang mungkin bertanya pada saat ini tentang implikasi praktis dari stasioneritas. Penerapan teknik time series yang paling umum adalah pemodelan data makroekonomi, baik teori maupun atheoretik. Sebagai contoh yang pertama, seseorang mungkin memiliki model multiplier-accelerator. Agar model menjadi stasioner, parameter harus memiliki nilai tertentu. Uji model ini kemudian mengumpulkan data yang relevan dan memperkirakan parameternya. Jika perkiraan tidak sesuai dengan stasioneritas, maka seseorang harus memikirkan kembali model teoretis atau model statistik, atau keduanya. Kami sekarang memiliki mesin yang cukup untuk mulai berbicara tentang pemodelan data rangkaian waktu univariat. Ada empat langkah dalam prosesnya. 1. membangun model dari teori dan pengalaman pengetahuan 2. mengidentifikasi model berdasarkan data (seri yang diamati) 3. menyesuaikan model (memperkirakan parameter model) 4. memeriksa model Jika pada langkah keempat kita tidak Puas kita kembali ke langkah pertama. Proses ini berulang sampai pemeriksaan lebih lanjut dan penilaian tidak menghasilkan perbaikan lebih lanjut dalam hasil. Diagramatik Definisi Beberapa operasi sederhana meliputi: Operator backshift Bx tx t-1 Operator depan Fx tx t1 Operator perbedaan 1 - B xtxt - x t-1 Operator perbedaan berperilaku dengan mode yang konsisten dengan konstanta dalam deret tak terbatas. . Artinya, kebalikannya adalah batas jumlah tak terbatas. Yaitu, -1 (1-B) -1 1 (1-B) 1BB 2. Operator gabungan S -1 Karena kebalikan dari operator perbedaan, operator gabungan berfungsi untuk menyusun penjumlahan. BANGUNAN MODEL Pada bagian ini kami menawarkan tinjauan singkat tentang model deret waktu yang paling umum. Berdasarkan pengetahuan tentang proses penghasil data, seseorang memilih kelas model untuk identifikasi dan estimasi dari kemungkinan yang mengikutinya. Definisi Misalkan Ex t m independen dari t. Model seperti dengan karakteristik disebut model autoregresif dari urutan p, AR (p). Definisi Jika variabel dependen waktu (proses stokastik) t memenuhi maka t dikatakan memuaskan properti Markov. Pada LHS, harapan dikondisikan pada sejarah tak terbatas x t. Di RHS itu dikondisikan hanya pada sebagian dari sejarah. Dari definisi tersebut, model AR (p) terlihat memuaskan properti Markov. Dengan menggunakan operator backshift kita dapat menulis model AR kita sebagai Teorema Suatu kondisi yang diperlukan dan cukup untuk model AR (p) menjadi stasioner adalah bahwa semua akar polinomial berada di luar lingkaran unit. Contoh 1 Perhatikan AR (1) Akar satunya dari 1 - f 1 B 0 adalah B 1 f 1. Kondisi untuk stationarity mensyaratkan hal itu. Jika kemudian seri yang diamati akan nampak sangat hingar bingar. Misalnya. Pertimbangkan di mana istilah white noise memiliki distribusi normal dengan mean nol dan varians dari satu. Hasil observasi beralih dengan hampir setiap pengamatan. Jika, di sisi lain, maka seri yang diamati akan jauh lebih mulus. Pada seri ini observasi cenderung berada di atas 0 jika pendahulunya berada di atas nol. Perbedaan dari e t adalah s e 2 untuk semua t. Perbedaan dari x t. Bila sudah nol berarti, diberikan oleh Karena seri itu stasioner kita bisa menulis. Oleh karena itu, fungsi autocovariance dari rangkaian AR (1) adalah, seandainya tanpa kehilangan generalitas m 0 Untuk melihat seperti apa parameter AR ini, kita akan menggunakan fakta bahwa kita dapat menulis xt sebagai berikut Mengalikan dengan x Tk dan mengambil ekspektasi Perhatikan bahwa autocovariances mati saat k tumbuh. Fungsi autokorelasi adalah autocovariance dibagi dengan varians istilah white noise. Atau, . Dengan menggunakan formula Yule-Walker sebelumnya untuk autokorelasi parsial yang kita miliki Untuk AR (1) autokorelasi mati secara eksponensial dan autokorelasi parsial menunjukkan lonjakan pada satu lag dan nol setelahnya. Contoh 2 Perhatikan AR (2) Polinomial yang terkait pada operator lag adalah Akar dapat ditemukan dengan menggunakan rumus kuadrat. Akarnya adalah Ketika akar itu nyata dan akibatnya seri akan menurun secara eksponensial sebagai respons terhadap kejutan. Bila akarnya sangat rumit dan deretnya akan muncul sebagai gelombang tanda teredam. Teorema stasioneritas membebankan kondisi berikut pada koefisien AR Autocovariance untuk proses AR (2), dengan mean nol, Membagi melalui varians xt memberikan fungsi autokorelasi Karena kita dapat menulis serupa untuk autokorelasi kedua dan ketiga Yang lain Autokorelasi dipecahkan secara rekursif. Pola mereka diatur oleh akar persamaan diferensial linier orde kedua Jika akarnya nyata maka autokorelasi akan menurun secara eksponensial. Bila akarnya rumit, autokorelasi akan muncul sebagai gelombang sinus yang teredam. Dengan menggunakan persamaan Yule-Walker, autokorelasi parsial adalah Sekali lagi, autokorelasi mati perlahan. Autokorelasi parsial di sisi lain cukup khas. Ini memiliki lonjakan pada satu dan dua kelambatan dan nol setelahnya. Teorema Jika x t adalah proses AR (p) stasioner maka dapat dituliskan secara ekivalen sebagai model filter linier. Artinya, polinom di operator backshift bisa terbalik dan AR (p) ditulis sebagai moving average dari pesanan tak terbatas. Contoh Misalkan z t adalah proses AR (1) dengan mean nol. Apa yang benar untuk periode sekarang juga harus benar untuk periode sebelumnya. Jadi dengan substitusi rekursif kita dapat menulis Square kedua sisi dan mengambil ekspektasi sisi kanan lenyap seperti k karena f lt 1. Oleh karena itu jumlah konvergen ke z t dalam mean kuadrat. Kita bisa menulis ulang model AR (p) sebagai filter linier yang kita tahu bersifat stasioner. Fungsi Autokorelasi dan Autokorelasi Parsial Umumnya Misalkan rangkaian stasioner z t dengan mean nol diketahui bersifat autoregresif. Fungsi autokorelasi AR (p) ditemukan dengan mengambil harapan dan membagi melalui variansi z t Ini memberi tahu kita bahwa r k adalah kombinasi linear dari autokorelasi sebelumnya. Kita bisa menggunakan ini dalam menerapkan aturan Cramster untuk (i) dalam pemecahan untuk fkk. Secara khusus kita dapat melihat bahwa ketergantungan linier ini akan menyebabkan f kk 0 untuk k gt p. Fitur unik dari seri autoregressive ini akan sangat berguna ketika menyangkut identifikasi seri yang tidak diketahui. Jika Anda memiliki MathCAD atau MathCAD Explorer maka Anda dapat melakukan eksperimen interactivley dengan beberapa ide AR (p) yang disajikan di sini. Model Bergerak Rata-rata Perhatikan model dinamis di mana rangkaian minat bergantung hanya pada beberapa bagian dari sejarah istilah white noise. Secara diagram ini mungkin digambarkan sebagai Definisi Misalkan t adalah urutan yang tidak berkorelasi dari i. i.d. Variabel acak dengan mean nol dan varians terbatas. Kemudian proses rata-rata order bergerak q, MA (q), diberikan oleh Teorema: Suatu proses rata-rata bergerak selalu stasioner. Bukti: Daripada memulai dengan bukti umum, kita akan melakukannya untuk kasus tertentu. Misalkan z t adalah MA (1). Kemudian . Tentu saja, t memiliki mean nol dan varian terbatas. Rata-rata z t selalu nol. Autocovariances akan diberikan oleh Anda dapat melihat bahwa mean dari variabel acak tidak bergantung pada waktu dengan cara apapun. Anda juga bisa melihat bahwa autocovariance hanya bergantung pada offset s, bukan di tempat di seri yang kita mulai. Kita bisa membuktikan hasil yang sama lebih umum dengan memulai dengan, yang memiliki representasi rata-rata pergerakan alternatif. Pertimbangkan dulu varians dari z t. Dengan substitusi rekursif Anda dapat menunjukkan bahwa ini sama dengan jumlah yang kita ketahui sebagai rangkaian konvergen sehingga variansnya terbatas dan tidak tergantung waktu. Kovarians adalah, misalnya, Anda juga dapat melihat bahwa kovarian otomatis hanya bergantung pada titik relatif pada waktunya, bukan pada kronologis waktu. Kesimpulan kami dari semua ini adalah bahwa proses MA () tidak bergerak. Untuk general MA (q) proses fungsi autokorelasi diberikan oleh fungsi autokorelasi parsial akan mati dengan lancar. Anda dapat melihat ini dengan membalik proses untuk mendapatkan proses AR (). Jika Anda memiliki MathCAD atau MathCAD Explorer maka Anda dapat melakukan eksperimen secara interaktif dengan beberapa gagasan MA (q) yang disajikan di sini. Mixed Autoregressive - Moving Average Models Definition Misalkan t adalah urutan yang tidak berkorelasi dari i. i.d. Variabel acak dengan mean nol dan varians terbatas. Kemudian proses order rata-rata autoregresif, bergerak rata-rata (p, q), ARMA (p, q), yang diberikan oleh Akar operator autoregresif semuanya berada di luar lingkaran unit. Jumlah yang tidak diketahui adalah pq2. P dan q sudah jelas. 2 meliputi tingkat proses, m. Dan varians istilah white noise, sa 2. Misalkan kita menggabungkan representasi AR dan MA kita sehingga model dan koefisien dinormalisasi sehingga bo 1. Maka representasi ini disebut ARMA (p, q) jika Akar (1) semua terletak di luar lingkaran unit. Anggaplah bahwa y t diukur sebagai penyimpangan dari mean sehingga kita bisa menjatuhkan o. Maka fungsi autocovariance diturunkan dari jika jgtq maka istilah MA drop out dengan harapan memberi. Artinya, fungsi autocovariance terlihat seperti AR biasa untuk kelambatan setelah q mereka mati dengan lancar setelah q, tapi kita tidak bisa mengatakan bagaimana 1,2,133, Q akan terlihat Kita juga bisa memeriksa PACF untuk kelas model ini. Model dapat ditulis sebagai Kita dapat menulis ini sebagai proses MA (inf) yang menunjukkan bahwa PACF mati dengan perlahan. Dengan beberapa aritmatika, kita dapat menunjukkan bahwa ini terjadi hanya setelah lonjakan p pertama disumbangkan oleh bagian AR. Hukum Empiris Sebenarnya, rangkaian waktu stasioner dapat ditunjukkan oleh p 2 dan q 2. Jika bisnis Anda memberikan perkiraan yang baik terhadap kenyataan dan kebaikan yang sesuai adalah kriteria Anda maka model yang hilang lebih disukai. Jika minat Anda adalah efisiensi prediktif maka model pelit itu lebih diutamakan. Bereksperimenlah dengan gagasan ARMA yang disajikan di atas dengan lembar kerja MathCAD. Autoregressive Mengintegrasikan Model Bergerak Rata-rata Filter MA filter AR Mengintegrasikan filter Terkadang proses, atau rangkaian, kita mencoba untuk model tidak diam di tingkat. Tapi itu mungkin diam di, katakanlah, perbedaan pertama. Artinya, dalam bentuk aslinya, autocovariances untuk serial ini mungkin tidak terlepas dari titik kronologisnya pada waktunya. Namun, jika kita membangun seri baru yang merupakan perbedaan pertama dari seri aslinya, seri baru ini memenuhi definisi stasioneritas. Hal ini sering terjadi pada data ekonomi yang sangat cenderung. Definisi Misalkan z t tidak stasioner, tapi z t - z t-1 memenuhi definisi stasioneritas. Juga, pada, istilah white noise memiliki mean dan varian yang terbatas. Kita bisa menulis model seperti ini dinamakan model ARIMA (p, d, q). P mengidentifikasi urutan operator AR, d mengidentifikasi daya. Q mengidentifikasi urutan operator MA. Jika akar f (B) berada di luar lingkaran satuan maka kita dapat menulis ulang ARIMA (p, d, q) sebagai filter linier. Yaitu. Itu bisa ditulis sebagai MA (). Kami menyimpan diskusi tentang pendeteksian akar unit untuk bagian lain dari catatan kuliah. Perhatikan sebuah sistem dinamis dengan x t sebagai rangkaian input dan y sebagai output series. Secara diagram kita memiliki Model-model ini adalah analogi diskrit dari persamaan diferensial linier. Kita menganggap hubungan berikut dimana b menunjukkan penundaan murni. Ingat itu (1-B). Dengan membuat substitusi ini model dapat dituliskan Jika koefisien polinomial pada y t dapat terbalik maka model dapat dituliskan sebagai V (B) dikenal sebagai fungsi respon impuls. Kita akan menemukan terminologi ini lagi dalam pembahasan vektor autoregresif kita nanti. Kointegrasi dan koreksi kesalahan model. IDENTIFIKASI MODEL Setelah memutuskan kelas model, seseorang harus mengidentifikasi urutan proses yang menghasilkan data. Artinya, seseorang harus membuat tebakan terbaik mengenai urutan proses AR dan MA yang mengemudikan seri stasioner. Seri stasioner benar-benar dicirikan oleh mean dan autocovariances-nya. Untuk alasan analitis, biasanya kita bekerja dengan autokorelasi dan autokorelasi parsial. Dua alat dasar ini memiliki pola unik untuk proses AR dan MA stasioner. Seseorang dapat menghitung perkiraan sampel autokorelasi dan fungsi autokorelasi parsial dan membandingkannya dengan hasil tabulasi untuk model standar. Contoh Autocovariance Function Contoh Fungsi Autokorelasi Autokorelasi parsial sampel akan Menggunakan autokorelasi dan autokorelasi parsial cukup sederhana secara prinsip. Misalkan kita memiliki seri z t. Dengan mean nol, yaitu AR (1). Jika kita menjalankan regresi z t2 pada z t1 dan z t kita akan berharap untuk menemukan bahwa koefisien pada z t tidak berbeda dari nol karena autokorelasi parsial ini seharusnya nol. Di sisi lain, autokorelasi untuk seri ini seharusnya menurun secara eksponensial untuk meningkatkan kelambatan (lihat contoh AR (1) di atas). Misalkan seri itu benar-benar bergerak rata-rata. Autokorelasi harus nol di mana-mana tapi pada lag pertama. Autokorelasi parsial harus mati secara eksponensial. Bahkan dari kegilaan kita yang sekilas melalui dasar analisis deret waktu, jelaslah bahwa ada dualitas antara proses AR dan MA. Dualitas ini dapat dirangkum dalam tabel berikut. Model ARMA (p, q) Moving Average ARMA (p, q) untuk Analisis Seri Waktu - Bagian 1 Pada artikel terakhir kita melihat jalan acak dan white noise sebagai model deret waktu dasar untuk instrumen keuangan tertentu, seperti Sebagai ekuitas harian dan harga indeks ekuitas. Kami menemukan bahwa dalam beberapa kasus, model jalan acak tidak cukup untuk menangkap perilaku autokorelasi instrumen penuh, yang memotivasi model yang lebih canggih. Dalam beberapa artikel berikutnya kita akan membahas tiga jenis model, yaitu model urutan orisinil Autoregressive (AR), model Moving Average (MA) order q dan model mixed autogressive Moving Average (ARMA) order p , Q. Model ini akan membantu kita mencoba menangkap atau menjelaskan lebih banyak korelasi serial yang ada dalam instrumen. Pada akhirnya mereka akan memberi kita sarana untuk meramalkan harga di masa depan. Namun, sudah diketahui bahwa deret waktu keuangan memiliki properti yang dikenal sebagai volatility clustering. Artinya, volatilitas instrumen tidak konstan pada waktunya. Istilah teknis untuk perilaku ini dikenal sebagai heteroskedastisitas bersyarat. Karena model AR, MA dan ARMA tidak heteroskedastisitas kondisional, artinya mereka tidak memperhitungkan pengelompokan volatilitas, pada akhirnya kita memerlukan model prediksi yang lebih canggih. Model seperti itu termasuk model Autertressive Conditional Heteroskedastic (ARCH) dan model generalised Autogressive Conditional Heteroskedastic Conditional Heteroskedastic (GARCH), dan banyak variannya. GARCH sangat terkenal di bidang keuangan kuantitatif dan terutama digunakan untuk simulasi time series keuangan sebagai alat untuk memperkirakan risiko. Namun, seperti semua artikel QuantStart lainnya, saya ingin membangun model ini dari versi yang lebih sederhana sehingga kita dapat melihat bagaimana setiap varian baru mengubah kemampuan prediksi kita. Terlepas dari kenyataan bahwa AR, MA dan ARMA adalah model rangkaian waktu yang relatif sederhana, model ini menjadi dasar model yang lebih rumit seperti Autoregressive Integrated Moving Average (ARIMA) dan keluarga GARCH. Oleh karena itu penting bagi kita untuk mempelajarinya. Salah satu strategi perdagangan pertama kami dalam seri artikel seri waktu adalah menggabungkan ARIMA dan GARCH untuk memprediksi harga n periode sebelumnya. Namun, kita harus menunggu sampai kita membahas baik ARIMA maupun GARCH secara terpisah sebelum kita menerapkannya pada strategi nyata Bagaimana Kita Akan Lanjutkan Pada artikel ini kita akan menggariskan beberapa konsep rangkaian waktu baru yang dibutuhkan dengan baik untuk metode yang tersisa, yaitu ketat Stationarity dan kriteria informasi Akaike (AIC). Setelah konsep baru ini, kita akan mengikuti pola tradisional untuk mempelajari model time series baru: Dasar Pemikiran - Tugas pertama adalah memberikan alasan mengapa tertarik dengan model tertentu, sebagai quants. Mengapa kita memperkenalkan model deret waktu Apa efek yang dapat ditangkap Apa yang kita dapatkan (atau hilang) dengan menambahkan kompleksitas ekstra Definisi - Kita perlu memberikan definisi matematis penuh (dan notasi terkait) dari model deret waktu untuk meminimalkan Ambiguitas apapun Properti Pesanan Kedua - Kami akan membahas (dan dalam beberapa kasus menurunkan) sifat pesanan kedua dari model deret waktu, yang mencakup mean, varians dan fungsi autokorelasinya. Correlogram - Kami akan menggunakan properti pesanan kedua untuk merencanakan correlogram realisasi model deret waktu untuk memvisualisasikan perilakunya. Simulasi - Kami akan mensimulasikan realisasi model deret waktu dan kemudian menyesuaikan model dengan simulasi ini untuk memastikan kami memiliki implementasi yang akurat dan memahami proses pemasangannya. Data Keuangan Riil - Kami akan memasukkan model time series ke data keuangan riil dan mempertimbangkan correlogram residual untuk melihat bagaimana model menyumbang korelasi serial pada seri aslinya. Prediksi - Kami akan membuat prakiraan n-step di depan model time series untuk realisasi tertentu agar menghasilkan sinyal perdagangan. Hampir semua artikel yang saya tulis pada model time series akan jatuh ke dalam pola ini dan ini akan memungkinkan kita untuk dengan mudah membandingkan perbedaan antara masing-masing model saat kita menambahkan kompleksitas lebih lanjut. Akan mulai dengan melihat stasioneritas ketat dan AIC. Strictly Stationary Kami menyediakan definisi stasioneritas dalam artikel tentang korelasi serial. Namun, karena kita akan memasuki ranah banyak seri keuangan, dengan berbagai frekuensi, kita perlu memastikan bahwa model (akhirnya) kita memperhitungkan volatilitas bervariasi dari rangkaian ini. Secara khusus, kita perlu mempertimbangkan heteroskedastisitasnya. Kami akan membahas masalah ini saat kami mencoba menyesuaikan model tertentu dengan seri historis. Umumnya, tidak semua korelasi serial pada residual model pas dapat dihitung tanpa memperhitungkan heteroskedastisitas. Ini membawa kita kembali ke stasioneritas. Serangkaian tidak stasioner dalam varians jika memiliki volatilitas bervariasi, menurut definisi. Ini memotivasi definisi stasioner yang lebih ketat, yaitu stasioneritas yang ketat: Seri Strictly Seriesary Model time series, sangat ketat jika distribusi statistik gabungan dari elemen x, ldot, x sama dengan xm, ldot, xm, Forall ti, m. Kita bisa memikirkan definisi ini hanya karena distribusi deret waktu tidak berubah untuk setiap pergeseran abstrak dalam waktu. Secara khusus, mean dan variansnya konstan pada waktunya untuk rangkaian stasioner yang ketat dan autocovariance antara xt dan xs (katakanlah) hanya bergantung pada perbedaan mutlak t dan s, t-s. Kami akan meninjau ulang seri stasioner secara ketat di posting masa depan. Kriteria Informasi Akaike yang saya sebutkan di artikel sebelumnya bahwa pada akhirnya kita perlu mempertimbangkan bagaimana memilih antara model terbaik yang terpisah. Hal ini benar tidak hanya analisis deret waktu, tapi juga pembelajaran mesin dan, secara lebih luas, statistik pada umumnya. Dua metode utama yang akan kita gunakan (untuk sementara waktu) adalah Kriteria Informasi Akaike (AIC) dan Kriteria Informasi Bayesian (seiring dengan kemajuan kita dalam artikel Statistik Bayesian). Pertimbangkan sebentar AIC, karena akan digunakan di Bagian 2 artikel ARMA. AIC pada dasarnya adalah alat untuk membantu pemilihan model. Artinya, jika kita memiliki pilihan model statistik (termasuk deret waktu), maka AIC memperkirakan kualitas setiap model, relatif terhadap yang lain yang kita miliki. Hal ini didasarkan pada teori informasi. Yang sangat menarik, dalam topik yang sayangnya kita cant masuk ke terlalu banyak detail tentang. Ini mencoba untuk menyeimbangkan kompleksitas model, yang dalam hal ini berarti jumlah parameter, dengan seberapa baik data tersebut sesuai. Mari memberi definisi: Kriteria Informasi Akaike Jika kita mengambil fungsi kemungkinan untuk model statistik, yang memiliki parameter k, dan L memaksimalkan kemungkinannya. Maka Kriteria Informasi Akaike diberikan oleh: Model pilihan, dari pilihan model, memiliki minium AIC kelompok. Anda dapat melihat bahwa AIC tumbuh seiring dengan jumlah parameter, k, meningkat, namun berkurang jika log-likelihood negatif meningkat. Pada dasarnya itu menghukum model yang terlalu banyak. Kami akan menciptakan model AR, MA dan ARMA dari berbagai pesanan dan satu cara untuk memilih model terbaik sesuai dengan dataset tertentu adalah dengan menggunakan AIC. Inilah yang sebaiknya dilakukan di artikel berikutnya, terutama untuk model ARMA. Autoregressive (AR) Model order p Model pertama akan dipertimbangkan, yang merupakan basis dari Bagian 1, adalah model urutan orisinil dari urutan p, yang sering disingkat menjadi AR (p). Pada artikel sebelumnya kita menganggap random walk. Di mana setiap istilah, xt bergantung hanya pada istilah sebelumnya, x dan istilah white stochastic white, wt: Model autoregresif hanyalah perpanjangan dari jalan acak yang mencakup persyaratan lebih jauh ke masa lalu. Struktur modelnya linier. Itu adalah model yang bergantung secara linear pada istilah sebelumnya, dengan koefisien untuk setiap istilah. Di sinilah regresif berasal dari autoregresif. Ini pada dasarnya adalah model regresi dimana istilah sebelumnya adalah prediktor. Autoregressive Model order p Model time series,, adalah model pesanan autoregresif p. AR (p), jika: mulai xt alpha1 x ldot alphap x wt sum p alphai x wt end Dimana white noise dan alphai dalam mathbb, dengan alphap neq 0 untuk proses autoregressive p-order. Jika kita mempertimbangkan Backward Shift Operator. (Lihat artikel sebelumnya) maka kita dapat menulis ulang fungsi heta di atas sebagai berikut: mulai thetap () xt (1 - alpha1 - alpha2 2 - ldots - alphap) xt wt end Mungkin hal pertama yang harus diperhatikan tentang model AR (p) Adalah bahwa jalan acak hanya AR (1) dengan alpha1 sama dengan kesatuan. Seperti yang kita nyatakan di atas, model autogressif adalah perpanjangan dari jalan acak, jadi ini masuk akal. Sangat mudah untuk membuat prediksi dengan model AR (p), untuk setiap saat t, karena begitu kita memiliki koefisien alfa yang ditentukan, perkiraan kita Hanya menjadi: begin hat t alpha1 x ldots alphap x end Maka kita bisa membuat n-step ahead prakiraan dengan menghasilkan topi t, topi, topi, dll sampai ke topi. Sebenarnya, begitu kita mempertimbangkan model ARMA di Bagian 2, kita akan menggunakan fungsi prediksi R untuk membuat perkiraan (bersama dengan band interval kepercayaan kesalahan standar) yang akan membantu kita menghasilkan sinyal perdagangan. Keterpaduan untuk Proses Autoregresif Salah satu aspek terpenting model AR (p) adalah tidak selalu diam. Memang, stasioneritas model tertentu bergantung pada parameter. Saya telah menyinggung hal ini sebelumnya di artikel sebelumnya. Untuk menentukan apakah proses AR (p) bersifat stasioner atau tidak, kita perlu menyelesaikan persamaan karakteristik. Persamaan karakteristik hanyalah model autoregresif, yang ditulis dalam bentuk pergeseran ke belakang, diset ke nol: Kami menyelesaikan persamaan ini untuk. Agar proses autoregresif tertentu menjadi stasioner kita membutuhkan semua nilai absolut dari akar persamaan ini untuk melebihi satu kesatuan. Ini adalah properti yang sangat berguna dan memungkinkan kita untuk dengan cepat menghitung apakah proses AR (p) bersifat tidak bergerak atau tidak. Mari pertimbangkan beberapa contoh untuk membuat gagasan ini konkret: Random Walk - Proses AR (1) dengan alpha1 1 memiliki persamaan karakteristik theta 1 -. Jelas ini memiliki akar 1 dan karena itu tidak diam. AR (1) - Jika kita memilih alpha1 frac kita dapatkan xt frac x wt. Ini memberi kita persamaan karakteristik 1 - frac 0, yang memiliki akar 4 gt 1 sehingga proses AR (1) ini tidak bergerak. AR (2) - Jika kita atur alpha1 alpha2 frac maka kita akan mendapatkan xc frac x frac x wt. Persamaan karakteristiknya menjadi - frac () () 0, yang menghasilkan dua akar dari 1, -2. Karena ini memiliki unit root, ini adalah rangkaian non-stasioner. Namun, seri AR (2) lainnya bisa jadi stasioner. Properti Pesanan Kedua Rerata proses AR (p) adalah nol. Namun, autocovariances dan autokorelasi diberikan oleh fungsi rekursif, yang dikenal sebagai persamaan Yule-Walker. Sifat lengkap diberikan di bawah ini: mulailah mux E (xt) 0 akhir mulai gammak sum p alphai gamma, enspace k 0 akhir mulailah rhok sum p alphai rho, enspace k 0 end Perhatikan bahwa perlu diketahui nilai parameter alir sebelum Menghitung autokorelasi Sekarang weve menyatakan properti urutan kedua kita dapat mensimulasikan berbagai perintah AR (p) dan plot correlogram yang sesuai. Simulasi dan Correlogram Mari kita mulai dengan proses AR (1). Ini mirip dengan jalan acak, kecuali alfa1 tidak harus sama dengan kesatuan. Model kita akan memiliki alpha1 0.6. Kode R untuk membuat simulasi ini diberikan sebagai berikut: Perhatikan bahwa loop kita dilakukan dari 2 sampai 100, tidak 1 sampai 100, sebagai xt-1 bila t0 tidak dapat diindeks. Demikian pula untuk proses AR (p) orde tinggi, t harus berkisar dari p sampai 100 dalam loop ini. Kita dapat merencanakan realisasi model ini dan correlogram yang terkait dengan menggunakan fungsi tata letak: Mari sekarang coba pasang proses AR (p) ke data simulasi yang baru saja dihasilkan, untuk melihat apakah kita dapat memulihkan parameter yang mendasarinya. Anda mungkin ingat bahwa kami melakukan prosedur serupa dalam artikel tentang kebisingan putih dan jalan-jalan acak. Karena ternyata R memberikan perintah yang berguna agar sesuai dengan model autoregresif. Kita dapat menggunakan metode ini untuk memberi tahu kita urutan terbaik model (seperti yang ditentukan oleh AIC di atas) dan memberi kami perkiraan parameter untuk alphai, yang kemudian dapat kami gunakan untuk membentuk interval kepercayaan. Untuk kelengkapan, mari kita ciptakan seri x: Sekarang kita menggunakan perintah ar agar sesuai dengan model autoregresif pada proses AR (1) simulasi, dengan menggunakan estimasi likelihood maximum (MLE) sebagai prosedur pemasangan. Kami akan terlebih dahulu mengekstrak pesanan terbaik yang diperoleh: Perintah ar telah berhasil menentukan bahwa model deret waktu yang mendasarinya adalah proses AR (1). Kita kemudian dapat memperoleh estimasi parameter alfa: Prosedur MLE telah menghasilkan perkiraan, topi 0,523, yang sedikit lebih rendah dari nilai true alpha1 0.6. Akhirnya, kita dapat menggunakan kesalahan standar (dengan varians asimtotik) untuk membangun 95 interval kepercayaan di sekitar parameter yang mendasarinya. Untuk mencapai hal ini, kita cukup membuat sebuah vektor c (-1,96, 1,96) dan kemudian memperbanyaknya dengan kesalahan standar: Parameter sebenarnya tidak termasuk dalam interval kepercayaan 95, seperti yang diharapkan dari fakta yang dihasilkan dari model yang spesifik. . Bagaimana jika kita mengubah alpha1 -0.6 Seperti sebelum kita bisa memasukkan model AR (p) menggunakan ar: Sekali lagi kita mengembalikan urutan model yang benar, dengan perkiraan yang sangat bagus -0,597 alpha1-0.6. Kita juga melihat bahwa parameter sebenarnya berada dalam interval kepercayaan 95 sekali lagi. Mari menambahkan beberapa kompleksitas lagi ke proses autoregresif kita dengan mensimulasikan model pesanan 2. Secara khusus, kita akan mengatur alpha10.666, tapi juga mengatur alpha2 -0.333. Heres kode penuh untuk mensimulasikan dan plot realisasi, serta correlogram untuk seri seperti: Seperti sebelumnya kita dapat melihat bahwa correlogram berbeda secara signifikan dari white noise, seperti yang diharapkan. Ada puncak yang signifikan secara statistik pada k1, k3 dan k4. Sekali lagi, akan menggunakan perintah ar agar sesuai dengan model AR (p) terhadap realisasi AR (2) yang mendasarinya. Prosedurnya sama seperti untuk AR (1) fit: Urutan yang benar telah ditemukan dan parameter perkiraan topi 0.696 dan hat -0.395 tidak terlalu jauh dari nilai parameter sebenarnya dari alpha10.666 dan alpha2-0.333. Perhatikan bahwa kami menerima pesan peringatan konvergensi. Perhatikan juga bahwa R sebenarnya menggunakan fungsi arima0 untuk menghitung model AR. Seperti juga belajar di artikel berikutnya, model AR (p) hanyalah model ARIMA (p, 0, 0), dan dengan demikian model AR adalah kasus khusus ARIMA tanpa komponen Moving Average (MA). Nah juga gunakan perintah arima untuk menciptakan interval kepercayaan di beberapa parameter, karena itulah saya lupa melakukannya di sini. Sekarang setelah dibuat beberapa data simulasi, saatnya menerapkan model AR (p) ke deret waktu aset keuangan. Data Keuangan Amazon Inc. Mari mulai dengan mendapatkan harga saham untuk Amazon (AMZN) menggunakan quantmod seperti pada artikel terakhir: Tugas pertama adalah selalu merencanakan harga untuk inspeksi visual yang singkat. Dalam kasus ini, baik dengan menggunakan harga penutupan harian: Anda akan melihat bahwa quantmod menambahkan beberapa format untuk kita, yaitu tanggal, dan grafik yang sedikit lebih cantik dari pada grafik R biasa: Kita sekarang akan mengambil logaritma dari AMZN dan kemudian yang pertama - perbedaan deret dari seri untuk mengubah rangkaian harga asli dari rangkaian non-stasioner menjadi stasioner (berpotensi) stasioner. Hal ini memungkinkan kita untuk membandingkan apel dengan apel antara ekuitas, indeks atau aset lainnya, untuk digunakan dalam statistik multivariat berikutnya, seperti saat menghitung matriks kovarians. Jika Anda ingin penjelasan rinci mengapa pengembalian kembali lebih baik, lihat artikel ini di Quantivity. Mari membuat seri baru, amznrt. Untuk menahan pengembalian balok yang berbeda: Sekali lagi, kita dapat merencanakan seri: Pada tahap ini, kita ingin merencanakan correlogram. Ingin melihat apakah deringan yang dibedakan seperti white noise. Jika tidak maka ada korelasi serial yang tidak dapat dijelaskan, yang mungkin bisa dijelaskan oleh model autoregresif. Kami melihat puncak statistik yang signifikan pada k2. Oleh karena itu ada kemungkinan yang wajar dari korelasi serial yang tidak dapat dijelaskan. Perlu diketahui juga, bahwa ini mungkin karena bias sampling. Dengan demikian, kita dapat mencoba model AR (p) sesuai dengan seri dan menghasilkan interval kepercayaan untuk parameter: Mengikuti model autoregresif ke urutan pertama, serangkaian harga log yang berbeda menghasilkan model AR (2), dengan topi -0,0278 Dan topi -0.0687. Ive juga menampilkan varians aysmptotic sehingga kita dapat menghitung kesalahan standar untuk parameter dan menghasilkan interval kepercayaan. Kami ingin melihat apakah nol adalah bagian dari interval kepercayaan 95, seolah-olah, ini mengurangi kepercayaan diri kita bahwa kita memiliki proses AR (2) yang benar untuk seri AMZN. Untuk menghitung interval kepercayaan pada tingkat 95 untuk setiap parameter, kita menggunakan perintah berikut. Kami mengambil akar kuadrat dari elemen pertama matriks varian asimtotik untuk menghasilkan kesalahan standar, kemudian membuat interval kepercayaan dengan mengalikannya dengan -1,96 dan 1,96 masing-masing, untuk tingkat 95: Perhatikan bahwa ini menjadi lebih mudah saat menggunakan fungsi arima , Tapi tunggu sampai Bagian 2 sebelum mengenalkannya dengan benar. Dengan demikian kita dapat melihat bahwa untuk alpha1 nol terkandung dalam interval kepercayaan, sedangkan untuk alpha2 nol tidak terdapat dalam interval kepercayaan. Oleh karena itu kita harus sangat berhati-hati dalam berpikir bahwa kita benar-benar memiliki model generik AR (2) yang mendasari untuk AMZN. Secara khusus, kami mencatat bahwa model autoregresif tidak memperhitungkan pengelompokan volatilitas, yang mengarah pada pengelompokkan korelasi serial dalam deret waktu keuangan. Bila kita mempertimbangkan model ARCH dan GARCH di artikel selanjutnya, kita akan menjelaskan hal ini. Ketika kita menggunakan fungsi arima penuh pada artikel berikutnya, kita akan membuat prediksi dari seri harga log harian untuk memungkinkan kita membuat sinyal perdagangan. Indeks Ekuitas Sampp500 AS Seiring dengan saham individu, kami juga dapat mempertimbangkan indeks Ekuitas AS, yaitu SampP500. Mari kita menerapkan semua perintah sebelumnya ke seri ini dan menghasilkan plot seperti sebelumnya: Kita dapat merencanakan harga: Seperti sebelumnya, buatlah selisih pesanan pertama dari harga penutupan kayu: Sekali lagi, kita dapat merencanakan seri: Jelas Dari grafik ini volatilitasnya tidak stasioner pada waktunya. Hal ini juga tercermin dalam plot correlogram. Ada banyak puncak, termasuk k1 dan k2, yang secara statistik signifikan melebihi model white noise. Selain itu, kita melihat bukti proses ingatan lama karena ada beberapa puncak yang signifikan secara statistik pada k16, k18 dan k21: Akhirnya kita memerlukan model yang lebih canggih daripada model pesanan autoregresif. Namun, pada tahap ini kita masih bisa mencoba pas model seperti itu. Mari kita lihat apa yang kita dapatkan jika kita melakukannya: Menggunakan ar menghasilkan model AR (22), yaitu model dengan 22 parameter non-nol Apa yang dikatakan oleh kita Ini adalah indikasi bahwa ada kemungkinan kompleksitas yang jauh lebih banyak dalam korelasi serial daripada Model linier sederhana dari harga masa lalu dapat benar-benar diperhitungkan. Namun, kita sudah tahu ini karena kita bisa melihat ada korelasi serial yang signifikan dalam volatilitas. Misalnya, perhatikan periode yang sangat fluktuatif sekitar tahun 2008. Hal ini memotivasi rangkaian model berikutnya, yaitu Moving Average MA (q) dan Autoregressive Moving Average ARMA (p, q). Nah pelajari tentang keduanya di Bagian 2 artikel ini. Seperti yang berulang kali kami sebutkan, ini akhirnya akan membawa kita ke model ARIMA dan GARCH model, yang keduanya akan memberikan kecocokan yang jauh lebih baik dengan kompleksitas korelasi serial Samp500. Ini akan memungkinkan kita untuk memperbaiki prakiraan kita secara signifikan dan pada akhirnya menghasilkan strategi yang lebih menguntungkan. Memulai dengan Perdagangan Kuantitatif

No comments:

Post a Comment