Wednesday 20 December 2017

متوسط نماذج الموسمية الانحدار المتكاملة الحركة ،


A ريما لتقف على الانحدار التلقائي نماذج المتوسط ​​المتحرك. المتغير أحادي المتغير (أريفا فيكتور) أريما هي تقنية التنبؤ التي تقوم بتطوير القيم المستقبلية لسلسلة تعتمد بشكل كامل على الجمود الخاص بها. تطبيقه الرئيسي هو في مجال التنبؤ على المدى القصير تتطلب ما لا يقل عن 40 نقطة البيانات التاريخية. وهو يعمل بشكل أفضل عندما تظهر بياناتك نمطا مستقرا أو متسقا مع مرور الوقت مع الحد الأدنى من القيم المتطرفة. في بعض الأحيان تسمى بوكس-جينكينز (بعد المؤلفين الأصليين)، أريما عادة ما تكون متفوقة على الأساليب التمهيد الأسي عندما تكون البيانات طويلة إلى حد معقول، والارتباط بين الملاحظات الماضية مستقرة. إذا كانت البيانات قصيرة أو متقلبة للغاية، ثم بعض طريقة تمهيد قد تؤدي بشكل أفضل. إذا لم يكن لديك ما لا يقل عن 38 نقطة بيانات، يجب عليك النظر في بعض الطرق الأخرى من أريما. الخطوة الأولى في تطبيق منهجية أريما هي التحقق من الاستبانة. ويعني الاستقرارية أن المسلسل لا يزال على مستوى ثابت إلى حد ما مع مرور الوقت. إذا كان هناك اتجاه، كما هو الحال في معظم التطبيقات الاقتصادية أو التجارية، ثم البيانات الخاصة بك ليست ثابتة. وينبغي أن تظهر البيانات أيضا تباينا ثابتا في تقلباتها مع مرور الوقت. وينظر إلى هذا بسهولة مع سلسلة التي موسمية بشكل كبير وتنمو بمعدل أسرع. في مثل هذه الحالة، فإن الصعود والهبوط في الموسمية سوف تصبح أكثر دراماتيكية مع مرور الوقت. وبدون استيفاء شروط الاستبقاء هذه، لا يمكن حساب العديد من الحسابات المرتبطة بالعملية. إذا كانت مؤامرة رسومية من البيانات تشير إلى نونستاتيوناريتي، ثم يجب أن الفرق السلسلة. الفرق هو وسيلة ممتازة لتحويل سلسلة غير ثابتة إلى واحدة ثابتة. ويتم ذلك بطرح الملاحظة في الفترة الحالية من الفترة السابقة. إذا تم هذا التحول مرة واحدة فقط لسلسلة، ويقول لك أن البيانات قد اختلفت أولا. هذه العملية تلغي أساسا الاتجاه إذا سلسلة الخاص ينمو بمعدل ثابت إلى حد ما. إذا كان ينمو بمعدل متزايد، يمكنك تطبيق نفس الإجراء والفرق البيانات مرة أخرى. البيانات الخاصة بك ثم سيكون ديفيرنسد الثانية. أوتوكوريلاتيونس هي قيم رقمية تشير إلى كيفية ارتباط سلسلة البيانات نفسها بمرور الوقت. وبشكل أدق، فإنه يقيس مدى ارتباط قيم البيانات في عدد محدد من الفترات المتباعدة ببعضها البعض بمرور الوقت. وعادة ما يطلق على عدد الفترات المتبقية الفارق الزمني. على سبيل المثال، يقيس الارتباط الذاتي عند التأخر 1 كيفية ارتباط القيم 1 لفترة متباعدة ببعضها البعض طوال السلسلة. ويقيس الارتباط الذاتي عند التأخر 2 كيفية ارتباط البيانات بفترتين منفصلتين طوال السلسلة. قد تتراوح أوتوكوريلاتيونس من 1 إلى -1. تشير قيمة قريبة من 1 إلى وجود ارتباط إيجابي عال في حين أن قيمة قريبة من -1 تعني ارتباطا سلبيا كبيرا. وغالبا ما يتم تقييم هذه التدابير من خلال المؤامرات الرسومية تسمى كوريلاغاغرامز. ويحدد الرسم البياني المترابط قيم الترابط التلقائي لسلسلة معينة عند فترات تأخر مختلفة. ويشار إلى ذلك على أنه دالة الترابط الذاتي وهي مهمة جدا في أسلوب أريما. محاولات منهجية أريما لوصف التحركات في سلسلة زمنية ثابتة كدالة لما يسمى بارامترات الانحدار الذاتي والمتوسط ​​المتحرك. ويشار إلى هذه على النحو المعلمات أر (أوتوريجيسيف) ومعلمات ما (المتوسطات المتحركة). يمكن كتابة نموذج أر مع معلمة واحدة فقط ك. (X) (t) A (1) X (t-1) E (t) حيث تكون السلسلة الزمنية X (t) قيد التحقيق A (1) معلمة الانحدار الذاتي للترتيب 1 X (t-1) (t) مصطلح خطأ النموذج يعني هذا ببساطة أن أي قيمة معينة X (t) يمكن تفسيرها بوظيفة معينة من قيمتها السابقة X (t-1)، بالإضافة إلى بعض الأخطاء العشوائية غير القابلة للتفسير، E (t). إذا كانت القيمة المقدرة ل A (1) .30، فإن القيمة الحالية للمسلسل ستكون مرتبطة ب 30 من قيمته قبل 1. وبطبيعة الحال، يمكن أن تكون مرتبطة سلسلة إلى أكثر من مجرد قيمة واحدة الماضية. على سبيل المثال، X (t) A (1) X (t-1) A (2) X (t-2) E (t) يشير هذا إلى أن القيمة الحالية للسلسلة هي مزيج من القيمتين السابقتين مباشرة، X (t-1) و X (t-2)، بالإضافة إلى بعض الخطأ العشوائي E (t). نموذجنا هو الآن نموذج الانحدار الذاتي للنظام 2. تتحرك متوسط ​​نماذج: وهناك نوع الثاني من نموذج بوكس ​​جينكينز يسمى نموذج المتوسط ​​المتحرك. على الرغم من أن هذه النماذج تبدو مشابهة جدا لنموذج أر، والمفهوم وراءها هو مختلف تماما. أما المعلمات المتوسطة المتحركة فتتصل بما يحدث في الفترة t فقط بالأخطاء العشوائية التي حدثت في الفترات الزمنية السابقة أي E (t-1) و E (t-2) وما إلى ذلك بدلا من X (t-1) و X ( t-2)، (شت-3) كما هو الحال في نهج الانحدار الذاتي. ويمكن كتابة نموذج متوسط ​​متحرك بمصطلح "ما" على النحو التالي. (T) 1 (E) (T) E (t) يطلق على المصطلح B (1) ما من النظام 1. وتستخدم الإشارة السلبية أمام المعلمة للاتفاقية فقط وعادة ما يتم طباعتها خارج معظم السيارات بشكل تلقائي. يقول النموذج أعلاه ببساطة أن أي قيمة معينة من X (t) ترتبط مباشرة فقط إلى الخطأ العشوائي في الفترة السابقة، E (t-1)، وإلى مصطلح الخطأ الحالي، E (t). وكما هو الحال بالنسبة لنماذج الانحدار الذاتي، يمكن تمديد نماذج المتوسط ​​المتحرك لتشمل هياكل ذات ترتيب أعلى تغطي مجموعات مختلفة وأطوال متوسط ​​متحرك. وتسمح منهجية أريما أيضا بنماذج يمكن أن تدمج معا متوسطات الانحدار الذاتي والمتوسط ​​المتحرك معا. وغالبا ما يشار إلى هذه النماذج على أنها نماذج مختلطة. على الرغم من أن هذا يجعل أداة التنبؤ أكثر تعقيدا، قد هيكل محاكاة حقا سلسلة أفضل وإنتاج توقعات أكثر دقة. نماذج نقية تشير ضمنا إلى أن بنية تتكون فقط من أر أو ما المعلمات - ليس على حد سواء. وعادة ما تسمى النماذج التي تم تطويرها من خلال هذا النهج نماذج أريما لأنها تستخدم مزيج من الانحدار الذاتي (أر) والتكامل (I) - مشيرا إلى عملية عكسية عكسية لإنتاج التنبؤات، ومتوسط ​​الحركة (ما) العمليات. ويشار عادة إلى نموذج أريما على أنه أريما (p، d، q). ويمثل ذلك ترتيب مكونات الانحدار الذاتي (p) وعدد مشغلي الاختلاف (d) وأعلى ترتيب للمتوسط ​​المتحرك. على سبيل المثال، أريما (2،1،1) يعني أن لديك نموذج ترتيب الانحدار الثاني من الدرجة الثانية مع العنصر المتوسط ​​المتحرك الأول ترتيب الذي تم اختلاف سلسلة مرة واحدة للحث على الاستقرارية. اختيار الحق مواصفات: المشكلة الرئيسية في الكلاسيكية بوكس-جينكينز تحاول أن تقرر أي مواصفات أريما لاستخدام - i. e. كم عدد المعلمات أر أو ما لتشمل. هذا هو ما خصص الكثير من بوكس-جينكينغز 1976 لعملية تحديد الهوية. وهو يعتمد على التقييم البياني والعددي لعينة الارتباط الذاتي ووظائف الترابط الذاتي الجزئي. حسنا، لنماذج الأساسية الخاصة بك، والمهمة ليست صعبة للغاية. لكل منها وظائف الارتباط الذاتي التي تبدو بطريقة معينة. ومع ذلك، عندما ترتفع في التعقيد، لا يتم الكشف عن أنماط بسهولة. لجعل الأمور أكثر صعوبة، تمثل بياناتك عينة من العملية الأساسية فقط. وهذا يعني أن أخطاء أخذ العينات (القيم المتطرفة، خطأ القياس، وما إلى ذلك) قد تشوه عملية تحديد الهوية النظرية. هذا هو السبب في النمذجة التقليدية أريما هو الفن بدلا من العلوم. جورنال الرياضيات والإحصاء المجلد 7، الإصدار 1 بيان المشكلة: معظم النماذج الموسمية المتحركة الانحدار الذاتي الموحد (ساريما) التي تستخدم للتنبؤ السلاسل الزمنية الموسمية هي نماذج ساريما المضاعفة. تفترض هذه النماذج أن هناك معلمة هامة نتيجة الضرب بين المعلمات غير الموسمية والموسمية دون اختبار من قبل اختبار إحصائي معين. وعلاوة على ذلك، فإن معظم البرامج الإحصائية شعبية مثل مينيتاب و سبس فقط مرفق لتناسب نموذج المضاعف. والهدف من هذا البحث هو اقتراح إجراء جديد لتحديد الترتيب الأنسب لنموذج ساريما سواء كان ينطوي على ترتيب فرعي أو مضاعف أو مضاف. وعلى وجه الخصوص، بحثت الدراسة ما إذا كانت هناك معلمة مضاعفة في نموذج ساريما. النهج: تم أولا مناقشة الاشتقاق النظري حول الارتباط الذاتي (أسف) وجزئية الارتباط الذاتي (باسف) وظائف من مجموعة ساريما، المضاعف والمضافات ساريما نموذج ثم تم استخدام R برنامج لإنشاء الرسومات من أسف النظري و باسف. وبعد ذلك، استخدمت مجموعتا بيانات شهريتان كدراسات حالة، أي بيانات ركاب الطيران الدولي وسلسلة حول عدد السياح الوافدين إلى بالي في إندونيسيا. تم تحديد خطوة تحديد النموذج لتحديد ترتيب نموذج أريما باستخدام برنامج مينيتاب وخطوة تقدير نموذجية تستخدم برنامج ساس لاختبار ما إذا كان النموذج يتألف من ترتيب فرعي أو مضاعف أو مضاف. النتائج: أظهرت أسف النظرية و باسف أن نماذج ساريما الفرعية، المضاعفة والمضافة لها أنماط مختلفة، وخاصة في الفارق الزمني نتيجة الضرب بين الفترات غير الموسمية والفترات الموسمية. وقد أسفرت نمذجة بيانات شركة الطيران عن نموذج ساريما الفرعي كأفضل نموذج، في حين أن نموذج ساريما الإضافي هو أفضل نموذج للتنبؤ بعدد السياح الوافدين إلى بالي. الاستنتاج: أظهرت كل من دراسات الحالة أن نموذج ساريما المضاعف لم يكن أفضل نموذج للتنبؤ بهذه البيانات. وأظهر تقييم املقارنة أن منوذج ساريما واملجموعة املضافة من سايما أعطى قيم متوقعة أكثر دقة يف جمموعات البيانات اخلارجية للعينة مقارنة بنموذج ساريما املضاعف ملجموعات بيانات الوافدين اجلويين والسائحين على التوايل. هذه الدراسة هي مساهمة قيمة في إجراء مربع جينكينز وخاصة في تحديد نموذج وتقدير الخطوات في نموذج ساريما. ويمكن أن توفر المزيد من الأعمال التي تنطوي على نماذج موسمية متعددة من أريما، مثل التنبؤ بالبيانات على المدى القصير في بعض البلدان، المزيد من الأفكار فيما يتعلق بالطلبات الفرعية أو المضاعفة أو المضافة. نسخة 2011 سوهارتونو. هذا هو مقالة الوصول المفتوح موزعة وفقا لشروط رخصة المشاع الإبداعي. التي تسمح بالاستخدام غير المقيد والتوزيع والاستنساخ في أي وسيط، بشرط أن يقيد المؤلف الأصلي والمصدر الأصلي. النماذج الموسمية المتوسطة الانحدار الانحداري المتكامل الموحد لبيانات العد مع تطبيق الملاريا سلسلة زمنية مع انخفاض أرقام الحالات الانتماءات المعهد الدولي لإدارة المياه، كولومبو، سريلانكا، قسم الأوبئة والصحة العامة، المعهد السويسري الاستوائي والصحة العامة، بازل، سويسرا، جامعة بازل، بازل، سويسرا الانتماء المعهد الدولي لإدارة المياه المكتب الإقليمي الفرعي لجنوب آسيا، باتانشيرو، ولاية اندرا براديش، الهند الانتماءات قسم الأوبئة والصحة العامة، والمعهد السويسري الاستوائي والصحة العامة، بازل، سويسرا، جامعة بازل، بازل، سويسرا نماذج الانحدار التدريجي الموحد المتكاملة الموسمية المتكاملة للبيانات العد مع التطبيق على الملاريا سلسلة زمنية مع انخفاض أرقام الحالة أوليفييه جت بريت، برياني H. أميراسينغ ، بينيلوبي فوناتسو إن التدریب مع تجدد حملة التخلص من الملاریا، ھناك حاجة لتحسین أدوات المراقبة. في حين أن تحليل السلاسل الزمنية هو أداة هامة للمراقبة والتنبؤ وقياس تأثير التدخلات، فإن التقريبات عن طريق طرق غاوس شائعة الاستخدام تكون عرضة لعدم الدقة عندما تكون أعداد الحالات منخفضة. ولذلك، يلزم اتباع طرائق إحصائية مناسبة لبيانات العد، لا سيما أثناء مرحلتي التجميع ومرحلة ما قبل الإزالة. وتم توسيع نماذج المتوسط ​​المتحرك المعمم للانحدار الذاتي (غارما) إلى نماذج المتوسط ​​المتحرك المتكامل للانحدار الذاتي الموسمية (غساريما) للنمذجة القائمة على المراقبة من خلال سلاسل زمنية غير موسمية غوسية وغير ثابتة وكونية من بيانات العد. وقد طبقت النماذج على السلاسل الزمنية الشهرية لحالات الملاريا في مقاطعة في سري لانكا، حيث انخفضت الملاريا بشكل كبير في السنوات الأخيرة. وأظهرت سلسلة الملاريا تغيرات طويلة الأجل في المتوسط ​​والتباين غير المستقر والموسمية. بعد تركيب نماذج بايزية سلبية ثنائية الحدين، تم اختيار كل من غساريما و غاريما نموذج الموسمية الحتمية على أساس معايير مختلفة. وأشارت التوزيعات التنبؤية اللاحقة إلى أن النماذج السلبية ثنائية الحدود وفرت تنبؤات أفضل من النماذج الغوسية، خاصة عندما كانت التعدادات منخفضة. تمكنت نماذج G (S) أريما من التقاط الارتباط الذاتي في السلسلة. الاستنتاجات G (S) نماذج أريما قد تكون مفيدة بشكل خاص في حملة نحو القضاء على الملاريا، لأن سلسلة العد سلسلة غالبا ما تكون موسمية وغير ثابتة، وخصوصا عندما يتم زيادة السيطرة. على الرغم من أن بناء وتركيب نماذج غساريما شاقة، فإنها قد توفر توزيعات التنبؤ أكثر واقعية من الطرق الغاوسية وربما تكون أكثر ملاءمة عندما تكون التهم منخفضة. الاستشهاد: بريت أوجت، أميراسينغ ف، فوناتسو P (2013) تعميم نماذج الانحدار الذاتي الموحد الانحدار الموسمية للبيانات العد مع تطبيق الملاريا سلسلة زمنية مع أرقام حالة منخفضة. بلوس وان 8 (6): e65761. دوي: 10.1371journal. pone.0065761 المحرر: كليف شيف، جامعة جونز هوبكنز، الولايات المتحدة الأمريكية تاريخ الاستلام: 25 يناير 2013 تاريخ القبول: 29 أبريل 2013 تاريخ النشر: 13 يونيو 2013 كوبيرايت: 2013 بريت إت آل. هذه مقالة مفتوحة الوصول موزعة وفقا لشروط ترخيص كريتيف كومونس أتريبوتيون والتي تسمح بالاستخدام غير المقيد والتوزيع والاستنساخ في أي وسيط، بشرط أن يقيد المؤلف الأصلي والمصدر الأصلي. التمويل: تم تمويل هذه الدراسة من خلال الإدارة المشتركة للمحيطات والغلاف الجوي (نوا)، والمؤسسة الوطنية للعلوم (نسف)، ووكالة حماية البيئة (إيبا)، ومعهد بحوث الطاقة الكهربائية (إبري) برنامج مشترك بشأن تغير المناخ وصحة الإنسان. ولم يكن للممولين دور في تصميم الدراسة، وجمع البيانات وتحليلها، أو قرار نشرها، أو إعداد المخطوطة. تضارب المصالح: أعلن المؤلفون أنه لا توجد مصالح متنافسة. مقدمة هناك اهتمام متزايد باستخدام نماذج التنبؤ بالملاريا لمساعدة الخدمات الصحية السريرية والعامة على تنفيذ تدابير الوقاية والمكافحة بشكل استراتيجي 1 5 - وقد قامت إدارة حملة مكافحة الملاريا التابعة لوزارة الصحة في سري لانكا باختبار نظام التنبؤ بالملاريا الذي يستخدم الانتكاس الذاتي الموسمية المضاعف (ساريما)، التي تفترض أن بيانات عد حالة الملاريا الشهرية التي تحولت لوغارتميا هي تقريبا غوسية موزعة. ويستخدم هذا النهج على نطاق واسع في النمذجة التنبؤية للأمراض المعدية. 4 - 6 - والملاريا في سري لانكا موسمية وغير مستقرة وتتقلب شدة، مكانيا وزمانيا على السواء 8 - كانت الملاريا مشكلة صحية عمومية رئيسية في البلد 9 حتى وقوع الإصابة بدأت تتضاءل في عام 2000 10 - ودخلت سري لانكا مرحلة ما قبل القضاء في عام 2007 وتقدمت إلى مرحلة القضاء في عام 2011 11. وقد يؤدي تحويل فئة بوكس-كوكس من التعدادات الملاريا (مثل التحول اللوغاريتمي) إلى بيانات موزعة تقريبا عن غاوس، إلا أن التقريب يكون أقل قربا من الملاحظات ذات المتوسط ​​المنخفض المتوقع 12. كما أن بيانات العد المنخفض قد تشمل الأصفار، تحول كوكس غير قابل للتطبيق. للتغلب على هذه المشكلة، يمكن إضافة ثابت صغير إلى البيانات. قد يؤدي النمذجة الغوسية مع البيانات المحولة إلى توزيعات التنبؤ غير الدقيقة. وھذا مشکلة، خاصة عندما تکون التعدادات الشھریة الأخیرة منخفضة، وھو ما یمیل إلی أن یکون ھو الحال في البلدان التي تمر بمرحلة متقدمة من الإزالة .3 النماذج التي تفترض توزیع ثنائي الحیوي سلبي ل بیانات العد الملاریا قد تکون أکثر ملاءمة 13 15. ، والنماذج ثنائية الحدين السلبية التي تتضمن هيكل ساريما ليست متاحة بعد. يوفر بنيامين وزملاؤه 16 إطارا لنماذج المتوسط ​​المتحرك الخطي الانحداري الخطي المعمم (غارما)، ومناقشة نماذج بواسون والبيانات السلبية الموزعة ثنائية الحدود، وغيرها. نماذج غارما هي نماذج يحركها الرصد التي تسمح الاعتماد المتأخر في الرصدات. وبدلا من ذلك، تسمح النماذج التي تعتمد على المعلمات (أيضا) بالاعتماد على المتغيرات الكامنة. 17 - ويسهل تقدير نماذج غارما والتنبؤ بها مبسط، بينما يسهل تفسير النماذج التي يحركها المعامل .21 - وجد يونغ وزملاؤه 23 أن كلا النوعين من نماذج أداء مماثل. ترتبط نماذج غارما بالتنبؤات ومكونات أرما بتحويل المعلمة المتوسطة لتوزيع البيانات ()، من خلال وظيفة الوصلة. وتضمن وظيفة وصلة السجل أن تكون مقيدة لنطاق الأرقام الحقيقية الإيجابية. ولذلك، ينبغي أيضا أن تتحول الملاحظات المتخلفة المستخدمة كمتغيرات متغيرة إلى لوغاريتميا، وهو أمر غير ممكن بالنسبة للملاحظات ذات القيمة صفر. للتحايل على هذه المشكلة، زيجر و قاقيش 24 مناقشة إضافة ثابت صغير إلى البيانات، إما لجميع البيانات أو فقط إلى الأصفار. غرونوالد وزملاؤه 25 النظر في نموذج الانحدار الخطي الشرطي (كلار) الشرطي مع وظيفة وصلة الهوية. من أجل ضمان إيجابية. يمكن وضع قيود على المعلمات. ويقدم ديفيس وزملاؤه نموذجا مختلفا لنموذج غارما، وهو نموذج متوسط ​​متحرك خطي للانحدار الذاتي (غلارما). هاينن 26 يقترح فئة من الانحدار الذاتي المشروط بواسون (أكب) نماذج مع الأساليب التي تسمح لأكثر وتحت التشتت في التوزيع الهامشي للبيانات. وهناك فئة أخرى من نماذج بويسون ذات بنية خطأ مترابطة ذاتي تستخدم ترقق ثنائي الحدود، وتسمى نماذج الانحدار الذاتي ذات القيمة الصحيحة (إينار). 27 يمكن أن تمتد نماذج إينار نظريا إلى المتوسط ​​المتحرك (إنما) ونماذج إنارما 28. 29. ولكن هذه النماذج ليست نفذت بسهولة 30. ويفترض نهج نمذجة بديل يحركه المعامل عملية الانحدار الذاتي في التأثيرات العشوائية المحددة زمنيا التي أدخلت في البنية المتوسطة باستخدام دالة وصلة لوغاريتمية .31 ويسمى هذا النموذج أحيانا نموذج متوسط ​​الانحدار الذاتي العشوائي (23) وكثيرا ما طبق في النمذجة الزمنية والزمانية المكانية الزمانية. من النماذج التي تمت مناقشتها أعلاه، يبدو أن إطار غارما هو الأكثر مرونة لنمذجة بيانات العد مع هيكل الانحدار الذاتي والانحدار المتحرك. يطبق بنيامين وزملاؤه 16 نموذجا ثابتا غارما على سلسلة زمنية من حالات شلل الأطفال مع اتجاه موسمي، وذلك باستخدام وظيفة سينيكوسين مع خليط من دورة سنوية ونصف سنوية. ومع ذلك، إذا افترض أن العنصر الموسمي هو مؤشر ستوكاستيك، فإن نموذج غارما الذي قدمه بنجامين وزملاؤه 16 ليس مناسبا. أيضا، العديد من السلاسل الزمنية من البيانات العد، بما في ذلك حالات الملاريا، ليست ثابتة. هنا، تم توسيع غارما إلى فئة من النماذج النمطية المتكاملة للانحدار الذاتي الموحد (غساريما) المضاعفة الموسمية، مماثلة لنماذج ساريما للبيانات الموزعة الغاوسية. وتشمل فئة طرازات غساريما نماذج متوسطة ومتوسطة الحركة (غريما). تم تنفيذ نموذج صالح باستخدام الاستدلال بايزي الكامل. وظهر تأثير الافتراضات التوزيعية غير الصحيحة على التوزيعات التنبؤية الخلفية باستخدام بيانات عد حالات الملاريا المحاكاة والحقيقية من سري لانكا. يتم توفير رمز البرنامج كمعلومات داعمة. نموذج الصيغة اسمحوا أن تكون سلسلة زمنية من بيانات العد طول n الناشئة عن توزيع ثنائي الحدين سلبي مع و. الشكل المحدود للتوزيع ذي الحدين السلبي، أي. هو توزيع بواسون. يمكن كتابة النموذج: أين هي وظيفة الوصلة،. و. هو مشغل باكشيفت مع (لاحظ أن). هو متجه للمعاملات التي تشمل مضاعف اعتراض (عادة ما تؤخذ على أنها) والمتغيرات التي تعتمد على الوقت. وفي إطار غارما، يمكن نمذجة بيانات العد عن طريق لوغاريتمي أو وظيفة وصلة هوية، أيهما أكثر ملاءمة للسلسلة. ولتجنب مشكلة أخذ اللوغاريتم من الملاحظات ذات القيمة صفر تحت الوصلة اللوغاريتمية، يقترح زيجر وقاقيش 24 تحولا مثل. من الآن فصاعدا دعا ZQ1. ويقترح زيجر وقاقيش 24 أيضا طريقة بديلة، تسمى من الآن فصاعدا ZQ2، والتي تترجم إلى نموذج البديل: تحت وصلة الهوية، قد تكون القيود ضرورية لضمان إيجابية. اعتمادا على البيانات ونموذج المعلمات. ويمكن توسيع النماذج المذكورة أعلاه إلى نظائرها من خلال تضمين موسمية (S) ومكونات الاختلاف (I) على النحو التالي: أين هو طول الفترة (للبيانات الشهرية مع دورة سنوية)،. . . . وهي على النحو الوارد أعلاه. وترد في التذييل S1 أمثلة على الحدين السلبيين والنماذج ذات وظيفة وصلة السجل وتحويل ZQ1. ويتم أيضا تقييم تأثير اختيار وظيفة الوصلة وتحويلات البيانات على توزيع البيانات في التذييل S1. بنيامين وزملاؤه 16 توظيف أقصى تقدير الاحتمالات من خلال تكرارية المربعات الصغرى مرجحة واستدلال قاعدة على نتائج متناظرة. في هذه الورقة، تم صياغة النموذج في إطار بايزي. وفي الاستدلال البيزي، يلزم تخصيص توزيعات سابقة لجميع المعلمات النموذجية. وافترض وجود نموذج ثابت ضعيف، وبالتالي تم تقييد معاملات الارتباط التلقائي والمتوسط ​​المتحرك باستخدام خوارزمية قدمها جونز 37. ولهذا الغرض، أعيد تحديد معلمات الانحدار الذاتي والمتوسط ​​المتحرك في الاحتمال، واعتمدت التوزيعات السابقة على النظام الجديد بنفسجية. فعلى سبيل المثال، أعيد تحديد معلمات الانحدار الذاتي غير الموسمية من حيث. . حيث و. تم افتراض التوزيعات السابقة التالية:. حيث يدل على جزء صحيح من. تم اختيار المزيد من الفائزين كانوا و. وبالنسبة للملاحظات الأولى، تم ضبط البقايا على مقياس التنبؤ (على سبيل المثال في حالة وظيفة الوصلة اللوغاريتمية) على الصفر. ويمكن وضع قيود على المتوسط ​​نفسه، أي عندما يتم استخدام وصلة الهوية. وقد تم تقدير نماذج غساريما باستخدام برنامج بايزي البرمجيات الحرة، جاغس 38. التي توظف ماركوف سلسلة مونتي كارلو (مسمك) أساليب المحاكاة. يتم توفير أمثلة من التعليمات البرمجية المكتوبة لاستخدام جاغس ضمن البرنامج R، لنماذج ثنائية الاتجاه غزريما السلبية مع وظيفة الارتباط لوغاريتمي وتحويل ZQ1، كمعلومات داعمة انظر ملف إضافي S1. ويستعرض الملحق S1 قدرة هذه النماذج على تقدير سلاسل البيانات المحاكاة مع بنية نظام غساريما. ويتم أيضا تقييم وتوضيح تأثير (سوء) تحديد وظيفة الوصلة وتحويل البيانات عند تقدير معلمات نموذج غارما في التذييل S1. تطبيق لتحليل سلسلة الوقت الملاريا يقدم هذا القسم مثالا على نموذج غساريما تطبيقها على عدد حالات الملاريا الشهرية للفترة 19722005 في منطقة غامباها في سري لانكا (الشكل 1A)، مع هطول الأمطار كما المتغيرات (الشكل 1B). يتم توفير كود التحليل كمعلومات داعمة في ملف S2 إضافي. وأبلغت المرافق الصحية الحكومية عن سجلات أفلام الدم الإيجابية للملاريا، وتجمعها حملة مكافحة الملاريا في سري لانكا. وكان هطول الأمطار هو متوسط ​​الارتفاع الشهري في منطقة عمود هطول الأمطار، الذي استمد من الأسطح الشهرية على طول الجزيرة. وقد نشأت هذه الأسطح الناجمة عن هطول الأمطار عن طريق الاستيفاء المكاني لسجلات هطول الأمطار التي جمعتها 342 محطة في جميع أنحاء الجزيرة. وقد وصفت البيانات في وقت سابق في العمل السابق 8 - وقد احتوت السلاسل الزمنية التي بلغت 408 أشهر على ثلاثة أشهر من حالات الملاريا الصفراوية: تشرين الأول / أكتوبر 1982 وآذار / مارس وآب / أغسطس 2005. وقد تحسن هطول الأمطار بشكل طفيف من التنبؤات بالملاريا من قبل نماذج ساريما الغوسية المجهزة ببيانات حالة الملاريا المتحولة إلى لوغاريتميا إلى أربعة أشهر في المستقبل 2. الشكل 1. أعداد حالات الملاريا الشهرية وهطول الأمطار في منطقة غامباها مع مرور الوقت. وتظهر اللوحة أ التعداد الشهري لحالات الملاريا، وتظهر اللوحة B هطول الأمطار الشهري. أولي متكرر غوسيان ساريما نموذج تحديد لأن نموذج بايزي تناسب باستخدام خوارزميات مسمك هو مكلفة حسابيا، وتحديد النموذج الأولي لاختيار المعلمات ساريما، ص. د . س. ص. د . و Q. باستخدام أدوات قياسية (متكررة) وضعت لسلسلة زمنية مع أخطاء هامشية غوسية، بدلا من تركيب العديد من نماذج مسمك الممكنة. كشف التحليل البصري للسلسلة الزمنية للملاريا (الشكل 1) وجود تغير طويل الأجل (سنوي) في المستوى المتوسط، والتباين غير المستقر (الذي يبدو أنه يزداد مع المتوسط)، والموسمية المضاعفة (حجم فإن التأثير الموسمية يتناسب مع المتوسط). وهكذا، لتحليل غوسي الأولي، تم تحويل البيانات باستخدام تحويل مربع مربع كوكس 39. من أجل تحقيق الاستقرار في التباين، لجعل المضافات تأثير الموسمية، وجعل البيانات توزع بشكل طبيعي تقريبا 40. الاتجاه في مربع تم التعامل مع سلسلة - Cox المحولة على أنها اتجاه مؤشر ستوكاستيك، الذي كان (الدرجة الأولى) الفرق ثابتة. تم استخدام اختبار ديكي فولر المعزز 41 على ترتيب تأخر 15 للكشف عن وجود جذر وحدة، لتقييم ما إذا كانت السلسلة تحتاج إلى أن تكون متكاملة (ديفيرنسد). وقد تم تركيب نماذج ساريما غاوسا ونماذج أريما ذات العنصر الموسمية التوافقي من الدرجة الثانية، مع كل من d 1 بسبب وجود جذر الوحدة، مع احصائيات حزمة البرامج (المتكرر) R، وتم تقييم النماذج استنادا إلى معيار معلومات أكايكس (إيك ). وتعطى المصفوفة المتغايرية للتأثير الموسمي باستخدام التوافقيات من الدرجة الثانية (أي باستخدام أزواج جيب وجيب التمام). لم يتم تضمين اعتراض (الوقت المستقل) لأن المعترض يسقط من المعادلة بعد اختلاف الترتيب الأول. اختيار نموذج غساريما تم تنفيذ نسخ ثنائية ثنائية سلبية ثنائية الأبعاد من أربعة طرازات ساريما ونموذجين أريما، مع التوافقيات الثانية التي تم تحديدها في التحليل الأولي، في جاغس على البيانات غير المحولة، وذلك باستخدام وظيفة لوغاريتمي وصلة وتحويل ZQ1. وبما أنه لم يكن هناك سوى ثلاث ملاحظات مع عدد صفر، فإن النتائج لن تكون حساسة لاختيار ثابت التحول بالنسبة إلى ZQ1، وقد تم تحديد ذلك عند c 1. كما تم النظر في إصدارات ذات وصلة هوية. تم تقييم النماذج بناء على معيارين. وكان الأول هو معيار انحراف المعلومات (ديك) الذي تم حسابه كمتوسط ​​التوزيع الخلفي للانحراف الشرطي على الملاحظات الأولى (مع تساوي الحد الأقصى w من النماذج مقارنة)، مع زيادة عدد المعلمات المقدرة الفعالة كعقوبة لمنع أكثر من المناسب. وتعتبر النماذج ذات انخفاض ديك أن لديها أفضل ملاءمة. ويعرف المعيار الثاني بأنه متوسط ​​الخطأ النسبي المطلق للقيم المجهزة (مار): مار. حيث يوجد عدد مناسب من حالات الملاريا في فترة زمنية منفصلة t. و f و l هما الفاصل الزمني الأول والأخير المنفصلان، على التوالي، للفترة الزمنية قيد النظر. وقد تم حساب النسبة المئوية مار لكل السلسلة (باستثناء الملاحظات الأولى)، عندما تم تركيب النماذج على السلسلة الزمنية بأكملها (f 1، لن 408)، وبالنسبة للنصف الثاني من السلسلة الزمنية (f 205، l 408) ، عندما تم تركيب النماذج على النصف الأول من السلسلة الزمنية فقط. وبما أن التوزيعات التنبؤية (الخلفية) المقدرة عند كل نقطة بيانات مزودة كانت متحيزة، فقد أخذ متوسط ​​التوزيع الخلفي. وتتشابه النسبة المئوية للمتوسط ​​(مار) مع متوسط ​​الخطأ النسبي المطلق (ميب) الذي ينطبق على السلسلة التي يعتمد التباين فيها على المتوسط ​​40. ومع ذلك، وبما أن القاسم يساوي أو أكبر من واحد، فإن ذلك يمنع المشاكل التي تسببها القيم الكبيرة من خلال تقسيمها بأعداد صغيرة، ونقد كبير ل ميب 5. إحصاء مار ليس لديه عقوبة مضمنة لمنع أكثر من المناسب، ولكن بين نماذج ذات قيمة مماثلة من مار، ويفضل النموذج مع أقل عدد من المعلمات . وميكن مقارنة تقدير معدل الفائدة املتوازية بني النماذج مع افتراضات توزيعية مختلفة، على عكس ديك. تم تشغيل النماذج مع ثلاثة سلاسل ماركوف من 11،000 تكرار كل منها حرق في من 1000 التكرارات. تم تقييم التقارب من خلال دراسة مؤامرات إحصائية التقارب جيلمان-روبين (على البارامترات المقدرة)، كما تم تعديلها من قبل بروكس وجيلمان 42. التحليل المتبقي معرفة ما إذا كانت النماذج المختارة وتوزيعاتها الأساسية تتلاءم مع الاختلاف في البيانات بشكل ملائم. إذا تم استخدام هذه النماذج للتنبؤ حالات الملاريا في فترة زمنية منفصلة (في هذه الحالة، في الشهر)، ثم ليس فقط هو تقدير نقطة من التوزيع التنبئي الخلفي من الفائدة، ولكن أيضا التوزيع بأكمله. دعونا تكون التراكمي الخلفي وظيفة التوزيع التنبؤية لل. الاحتمال أقل ذيل المتبقية. أي قيمة التوزيع التراكمي الخلفي التراكمي المحسوب على البيانات الملحوظة. وتسمى أيضا احتمال تحويل لا يتجزأ، ويمكن حساب لكل شهر. وتسمح دالة التوزيع التراكمي لجميع أشهر الفائدة بتحليل ملاءمة النموذج بما في ذلك التوزيع الأساسي المفترض. إذا كان النموذج يناسب البيانات بشكل مناسب، فإن دالة التوزيع التراكمي لقيم الاحتمالات المتبقية (C-R بلوت) ستتبع خط قطري مستقيم تقريبا بين الأصل والنقطة (1،1)، على غرار مؤامرة الاحتمالية الاحتمالية. على سبيل المثال، عندما يناسب النموذج بشكل مناسب، 50 من المشاهدات لها قيمة احتمال متبقي مرتبطة بمقدار 0.5. يتم إعطاء مزيد من التفاصيل حول مؤامرة C-R كمعلومات داعمة انظر ملف إضافي S3. ويرد مثال أيضا في المعلومات الداعمة التي تستخدم فيها مؤامرات C-R لتقييم ملاءمة النماذج المجهزة بسلاسل زمنية مع بنية بواسون غاريما (1،1،0) انظر الملف الإضافي S4. وهكذا، بعد تركيب نموذج والحصول على التوزيعات الخلفية، تم حساب لكل ملاحظة. وبسبب حقيقة أن دالة التوزيع التراكمي للنماذج ذات الحدين السالبة منفصلة، ​​فإن قيمة الاحتمال المتبقي كانت عشوائية عن طريق رسم قيمة عشوائية من التوزيع الموحد في الفاصل الزمني. بعد إجراء قام به كل من دن وسميث 43. حيث تم تقديره ب 30،000 عينة من هذا التوزيع. ويدعو هذا الإجراء من قبل بنجامين وزملاؤه 16 لنماذج غارما منفصلة. وتمت مقارنة ملاءمة النماذج المختارة باستخدام قطع من وظائف التوزيع التراكمي لها لقيم الاحتمال المتبقي (العشوائية)، سواء في السلسلة الزمنية لحالة الملاريا بأكملها أو على فترة تضم آخر 50 ملاحظة، حيث كانت أعداد الحالات منخفضة نسبيا. ومن الممارسة المعتادة اختبار مخلفات نموذج السلاسل الزمنية لباقي الارتباط الذاتي. ومع ذلك، فإن الأدوات القياسية تفترض ما يقرب من البيانات الموزعة غاوس. ولذلك، تم تحويل قيم الاحتمالات المتبقية العشوائية إلى مخلفات كمية عشوائية عشوائية. باستخدام الدالة الكمية (دالة التوزيع التراكمي العكسية) للتوزيع الطبيعي مع متوسط ​​الصفر والتباين في الوحدة. وقبل التحويل، تم تحديد قيم الاحتمالات المتبقية العشوائية الصفرية (عندما تكون جميع العينات البالغ عددها 000 30 عينة من دالة التوزيع التنبؤية الخلفية أعلى من القيمة الملاحظة) إلى 0.00001 وقيم الاحتمال المتبقي العشوائي لواحد (عندما كانت جميع العينات البالغة 000 30 عينة من دالة التوزيع التنبؤية الخلفية أقل من القيمة الملحوظة) إلى 0.99999. وقد تم تحليل المخلفات الكمية المعيارية المعيارية من أجل الارتباط الذاتي المتبقي مع اختبار يجونغ بوكس ​​44 والتحليل البصري للربط الذاتي ووظائف الترابط الذاتي الجزئي. النتائج والمناقشة لغرض تحديد نموذج غاوسا ساريما، تم تحديد التحول مربع كوكس عن طريق المناسب لسلسلة زمنية العد حالات الملاريا. وكانت معلمات مربع كوكس المجهزة قوة قدرها 0.249، وبالنظر إلى أن السلسلة تحتوي على ملاحظات ذات عدد صفر، فقد أضيف ثابت قدره 0.0251 لكل ملاحظة قبل التحول. كما لوحظ في السلسلة الأصلية، كان وجود تغيير على المدى الطويل في المستوى المتوسط ​​واضحا في سلسلة زمنية تحولت (الشكل S1). وعلى الرغم من أن التغيرات في المستوى المتوسط ​​يمكن أن تكون ذات صلة بجهود مكافحة الملاريا، وتطوير الطفيليات ومقاومة النواقل، وما إلى ذلك لم يتم النظر في هذه البيانات المتغرية هنا. وأدى اختبار ديكي فولر المعزز إلى دعم وجود وحدة جذر (p 0.14) في سلسلة بوكس-كوكس المحولة وتم اختلاف السلسلة. أظهرت المؤامرات من دالة ارتباط السيارات (أسف) (الشكل S2) ودالة الارتباط التلقائي الجزئي (الشكل S3) لسلسلة الاختلاف ارتباطا كبيرا (جزئي) لصناعة السيارات عند فترات تأخر تتراوح بين ثلاثة واثني عشر شهرا. واستنادا إلى التحليل الأولي لسلسلة بوكس-كوكس المحولة، تم في البداية اختيار أربعة نماذج غاوسية ساريما ونموذجين غاوسيان أريما مع التوافقيات من الدرجة الثانية (سوه)، استنادا إلى إيك (الجدول 1). كانت نماذج أريما-سوه أقل (أفضل) إيك مقارنة مع نماذج ساريما. كانت نماذج أريما-سوه بما في ذلك هطول الأمطار كمتغايرات أقل قليلا إيك من نماذج أريما-سوه دون هطول الأمطار. ومع ذلك، بالنسبة لنماذج ساريما، كان العكس صحيحا. الجدول 3. تقديرات المعلمات (متوسط ​​و 95 فترة موثوق بها) من نماذج ثنائية الحدين السلبية المختارة. وعلى الرغم من أن النموذج يحتوي على ديك أعلى (أسوأ) من النموذج، إلا أن العينة من النموذج مار كانت أفضل بنسبة 5.7 في المائة من العينة النموذجية للري (مار) من النموذج، وكانت تتطلب أقل من نصف عدد المعلمات المجهزة. ويشير ذلك إلى أن النموذج كان على الأرجح أكثر ملاءمة للبيانات، واصفا الخطأ العشوائي بدلا من العملية الأساسية. تم اختيار النموذج لمزيد من التحليل. ويوضح الشكل 2 التوزيعات التنبؤية الخلفية للأشهر الاثني عشر الأخيرة من السلسلة بواسطة النموذج وتلك التي قام بها نموذج غاوسي (بايزي) على البيانات المحولة من بوكس-كوكس عند تركيبها على مجموعة البيانات بأكملها. وتظهر الاختلافات في التوزيعات التنبؤية الخلفية بين النموذجين مع التوزيعات التنبؤية النموذجية الغاوسية التي لها ذيل طويل أطول. الشكل 2. التوزيعات التنبؤية اللاحقة للأشهر ال 12 الأخيرة من سلسلة عدوى الملاريا في غامباها. في كل لوحة، تمثل كل شهر في السنة الأخيرة من السلسلة، والخطوط السوداء والخطوط الحمراء هي الرسم البياني مخطط لكثافة التوزيع التنبؤية الخلفية للنموذج ثنائي الحدين السلبي ونموذج غوسي (بايزي) على مربع كوكس البيانات المحولة، على التوالي. وتم تركيب النماذج على مجموعة البيانات بأكملها. في كل لوحة، يتم تمثيل عدد الحالات الملحوظة بنقطة زرقاء. تم مقارنة مؤامرة C-R للنموذج الثنائي السلبي صالح مع أن (بايزي) غاوسيان على مربع كوكس تحولت البيانات في الشكل 3. مؤامرة C-R على سلسلة كاملة (الشكل 3A) ليست مرضية تماما لأي من النموذجين. ل غاوسيان. ويبدو أن التوزيع التنبئي الخلفي هو بلاتيكورتيك (لقيم الاحتمال المتبقية أقل من 0.5، وهناك عدد قليل جدا من الملاحظات، وبالنسبة للقيم فوق 0.5، وهناك الكثير جدا). وبالنسبة للنموذج ذي الحدين السلبي، بالنسبة لقيم الاحتمالات المتبقية العشوائية التي تقل عن 0،5 تقريبا، فإن عددا أقل من المشاهدات التراكمية كان له قيم من توزيعات الكثافة الخلفية. لذلك، في المتوسط، تم توزيع جزء من توزيعات الكثافة الخلفية تحت المتوسط ​​إلى حد كبير إلى اليسار. وبالتالي فإن الحدود الدنيا لفترات المصداقية للتوزيعات كانت في المتوسط ​​منخفضة جدا. وبالنسبة للقيم التي تزيد عن 0،5، تتبع دالة التوزيع التراكمي القطر. ويقارن الشكل 3B كلا النموذجين للأشهر الخمسين الأخيرة من السلسلة فقط، حيث كانت أعداد الحالات الشهرية أصغر من 35. وبالنسبة لهذه الأعداد المنخفضة، كان النموذج ذو الحدين السلبي أكثر ملاءمة. الشكل 3. دالة التوزيع التراكمي للاحتمالات التراكمية العشوائية. ويمثل الخط الأسود دالة التوزيع التراكمي للاحتمالات التراكمية العشوائية للنموذج على الأرقام الشهرية لحالات الملاريا في غامباها، سري لانكا. ويمثل الخط الأحمر دالة التوزيع التراكمي للاحتمالات المتبقية العشوائية للنموذج الغوسي على البيانات المحولة من صندوق كوكس. ويمثل الخط القطري الرمادي الفاتح (التوزيع التراكمي يساوي الاحتمال العشوائي) في المتوسط ​​توزيعات تنبؤية مناسبة. وتمثل الخطوط المنقوطة 95 حدود ثقة للنسب تعادل الاحتمال. ا . على مدى 392 شهرا الماضية في هذه السلسلة. ب . على مدى الأشهر الخمسين الماضية في هذه السلسلة. ويبين الشكل 4 مؤامرة Q-Q العادية للمخلفات الكمية المعيارية المعيارية للنموذج، الذي توزيع ليبتوكورتيك قليلا. تظهر مؤامرة من هذه المخلفات الكمية العشوائية المعيارية مع الزمن (الشكل S4) مبعثر عشوائي لأول وهلة، ولكن عند الفحص الدقيق، تحدث المخلفات المتطرفة بشكل أكثر تواترا خلال الفترات ذات التغيرات النسبية الأقوى. وذلك لأن بقايا،. ترتبط ارتباطا إيجابيا بالتغير النسبي في حالات الملاريا، مع خط الانحدار الخطي. (الشكل 5). الشكل 4. مؤامرة Q-Q العادية من المخلفات الكمية العشوائية المعيارية للنموذج المحدد. الشكل 5. قطعة من المخلفات الكمية العشوائية المعيارية للنموذج مقابل لوغاريتم التغير النسبي. تم تحويل أعداد حالات الملاريا الشهرية إلى لوغاريتميا بعد إضافة واحدة. ثم لكل شهر، تم أخذ الفرق بين هذه القيمة والقيمة للشهر السابق. القطر هو خط الانحدار المجهز. حقيقة أن هذا الخط لا تمر من خلال الأصل ولكن لديه اعتراض إيجابي (صغيرة ولكنها مهمة plt0.05) هو مؤشر آخر على أن التوزيعات الخلفية لديها، في المتوسط، الكثير من الكتلة إلى اليسار، وبالتالي، في المتوسط، المبالغة في تقدير بقايا. ويبين الشكل 6 مؤامرة دالة الترابط الذاتي للمخلفات الكمية المعيارية المقيسة للنموذج. لا يوجد مؤشر على الارتباط الذاتي الكبير في البقايا، وهو ما أكده اختبار لجونغ بوكس ​​44. كانت إحصاءات لجونغ بوكس ​​19.8 على أساس 24 تأخرا، والتي لم تكن كبيرة (p 0.65) لأن الكميات المقابلة لل 95 النسبة المئوية للتوزيع تشي مربع مع 23 درجة الحرية (24 درجة ناقص واحد معلمة أرما المجهزة) هو 35.17. اختبار ليونغ بوكس ​​صالح في ظل هذه الظروف المعتدلة من غير طبيعية، على الرغم من أن أقوى غير طبيعي، واختبار لجونغ بوكس ​​ليست قوية، وتميل إلى رفض الفرضية الفارغة من عدم وجود الارتباط الذاتي بسرعة 45 أيضا. الشكل 6. مؤامرة الدالة الترابط الذاتي للمخلفات الكمية المعيارية المقيسة للنموذج المختار. الاستنتاجات لوضع نموذج من التهم الشهرية لحلقات الملاريا الجديدة في منطقة في سري لانكا، تم تطوير نماذج غساريما ونماذج غاريما مع عنصر موسمية حتمي. نماذج غاريما و غريما هي امتداد لفئة نماذج غارما 16. وهي مناسبة لنمذجة شاذة من سلسلة زمنية موسمية غير ثابتة من (أكثر من فرقت) بيانات العد مع توزيع المشروط ثنائي الحدين السلبية. وعرضت النماذج مع اختيار وظيفة وصلة الهوية أو وظيفة الوصلة اللوغاريتمية، وللنماذج الأخيرة، مع الاختيار بين طريقتين للتحول للتعامل مع رصدات القيمة الصفرية واستخدام معلمة العتبة. عندما يكون لسلسلة زمنية العد ملاحظات كثيرة من الصفر، ينبغي استكشاف كل من طرق التحول وعوامل العتبة عدة من أجل العثور على أفضل نموذج المناسب. Bayesian GSARIMA and GARIMA models were applied to malaria case count time series data from Gampaha District in Sri Lanka. Both a GSARIMA and a GARIMA model with a deterministic seasonality component were selected, based on different criteria. The GARIMA model with deterministic seasonality showed a lower DIC, but the GSARIMA model had a lower mean absolute relative error on out of sample data, and needed fewer parameters. Bayesian modelling allowed for analysis of the posterior predictive distributions. The performance of the selected negative binomial model was compared with that of a Gaussian version of the model on Box-Cox transformed data. These distributions did not perfectly mirror the distribution of the residuals for either model. This is possibly an indication that the assumptions about the underlying distributions were not entirely appropriate for either case. However, analysis of the residuals showed that the posterior predictive distributions were much better for the negative binomial GSARIMA model than for its Gaussian version on transformed data when counts were low. Both models could account for autocorrelation in the data, but the negative binomial model had an 8 better MARE than the Gaussian version on transformed data (0.388 vs 0.423). The fact that the cumulative distribution functions do not perfectly match the diagonal in Figure 3A indicates that there is room for improvement, through modelling a more complex autocorrelation structure ( e. g. through time varying SARIMA parameters) and through the inclusion of covariates. It is also possible that assuming an underlying negative binomial distribution is not entirely appropriate. In the latter case, the DIC, which was based on this assumption, has less value than the MARE for comparison between models. Apart from the fact that the MARE does not depend on the assumption of a true underlying distribution, it is easier to for malaria control staff to interpret. G(S)ARIMA models may be particularly useful in the drive towards malaria elimination, but could also be applied to other fields. Although building and fitting Bayesian GSARIMA models is laborious, they may provide more realistic prediction distributions for time series of counts than do Gaussian methods on transformed data, especially when counts are low. Supporting Information8.5 Non-seasonal ARIMA models If we combine differencing with autoregression and a moving average model, we obtain a non-seasonal ARIMA model. ARIMA is an acronym for AutoRegressive Integrated Moving Average model (integration in this context is the reverse of differencing). The full model can be written as where y is the differenced series (it may have been differenced more than once). The predictors on the right hand side include both lagged values of yt and lagged errors. We call this an ARIMA(p, d, q) model . where p order of the autoregressive part d degree of first differencing involved q order of the moving average part. The same stationarity and invertibility conditions that are used for autoregressive and moving average models apply to this ARIMA model. Once we start combining components in this way to form more complicated models, it is much easier to work with the backshift notation. Then equation (ref ) can be written as begin (1-phi1B - cdots - phip Bp) amp (1-B)d y amp ampc (1 theta1 B cdots thetaq Bq)et uparrow amp uparrow amp ampuparrow text amp text amp amptext end Selecting appropriate values for p, d and q can be difficult. The auto. arima() function in R will do it for you automatically. Later in this chapter, we will learn how the function works, and some methods for choosing these values yourself. Many of the models we have already discussed are special cases of the ARIMA model as shown in the following table. plot 40 forecast 40 fit, h 10 41,include 80 41 Understanding ARIMA models The auto. arima() function is very useful, but anything automated can be a little dangerous, and it is worth understanding something of the behaviour of the models even when you rely on an automatic procedure to choose the model for you. The constant c has an important effect on the long-term forecasts obtained from these models. If c0 and d0, the long-term forecasts will go to zero. If c0 and d1, the long-term forecasts will go to a non-zero constant. If c0 and d2, the long-term forecasts will follow a straight line. If cne0 and d0, the long-term forecasts will go to the mean of the data. If cne0 and d1, the long-term forecasts will follow a straight line. If cne0 and d2, the long-term forecasts will follow a quadratic trend. The value of d also has an effect on the prediction intervals the higher the value of d, the more rapidly the prediction intervals increase in size. For d0, the long-term forecast standard deviation will go to the standard deviation of the historical data, so the prediction intervals will all be essentially the same. This behaviour is seen in Figure 8.8 where d0 and cne 0. In this figure, the prediction intervals are the same for the last few forecast horizons, and the point forecasts are equal to the mean of the data. The value of p is important if the data show cycles. To obtain cyclic forecasts, it is necessary to have pge2 along with some additional conditions on the parameters. For an AR(2) model, cyclic behaviour occurs if phi124phi2lt0. In that case, the average period of the cycles is 1 frac (-phi1(1-phi2)(4phi2)). ACF and PACF plots It is usually not possible to tell, simply from a time plot, what values of p and q are appropriate for the data. However, it is sometimes possible to use the ACF plot, and the closely related PACF plot, to determine appropriate values for p and q. Recall that an ACF plot shows the autocorrelations which measure the relationship between yt and y for different values of k. Now if yt and y are correlated, then y and y must also be correlated. But then yt and y might be correlated, simply because they are both connected to y , rather than because of any new information contained in y that could be used in forecasting yt. To overcome this problem, we can use partial autocorrelations . These measure the between y and y after removing the effects of other time lags -- 1, 2, 3, dots, k - 1. So the first partial autocorrelation is identical to the first autocorrelation, because there is nothing between them to remove. The partial autocorrelations for lags 2, 3 and greater are calculated as follows: Varying the number of terms on the right hand side of this autoregression model gives alphak for different values of k. (In practice, there are more efficient algorithms for computing alphak than fitting all these autoregressions, but they give the same results.) Figure 8.9 shows the ACF and PACF plots for the US consumption data shown in Figure 8.7. The partial autocorrelations have the same critical values of pm 1.96sqrt as for ordinary autocorrelations, and these are typically shown on the plot as in Figure 8.9. Figure 8.9: ACF and PACF of quarterly percentage change in US consumption. A convenient way to produce a time plot, ACF plot and PACF plot in one command is to use the tsdisplay function in R. par 40 mfrow c 40 1. 2 41 41 Acf 40 usconsumption 91. 1 93,main quotquot 41 Pacf 40 usconsumption 91. 1 93,main quotquot 41 If the data are from an ARIMA(p, d,0) or ARIMA(0,d, q) model, then the ACF and PACF plots can be helpful in determining the value of p or q. If both p and q are positive, then the plots do not help in finding suitable values of p and q. The data may follow an ARIMA(p, d,0) model if the ACF and PACF plots of the differenced data show the following patterns: the ACF is exponentially decaying or sinusoidal there is a significant spike at lag p in PACF, but none beyond lag p. The data may follow an ARIMA(0,d, q) model if the ACF and PACF plots of the differenced data show the following patterns: the PACF is exponentially decaying or sinusoidal there is a significant spike at lag q in ACF, but none beyond lag q. In Figure 8.9, we see that there are three spikes in the ACF and then no significant spikes thereafter (apart from one just outside the bounds at lag 14). In the PACF, there are three spikes decreasing with the lag, and then no significant spikes thereafter (apart from one just outside the bounds at lag 8). We can ignore one significant spike in each plot if it is just outside the limits, and not in the first few lags. After all, the probability of a spike being significant by chance is about one in twenty, and we are plotting 21 spikes in each plot. The pattern in the first three spikes is what we would expect from an ARIMA(0,0,3) as the PACF tends to decay exponentially. So in this case, the ACF and PACF lead us to the same model as was obtained using the automatic procedure. arc cos is the inverse cosine function. You should be able to find it on your calculator. It may be labelled acos or cos .1608617

No comments:

Post a Comment