Wednesday, 27 December 2017

التفاعلات المناسبة في فوركس ستاتا


الاختبار المسبق والاختبار إلى الأمام: أهمية الترابط التجار الذين يتوقون لمحاولة فكرة التداول في السوق الحية غالبا ما تجعل من الخطأ الاعتماد بشكل كامل على نتائج الاختبار الخلفي لتحديد ما إذا كان النظام سوف تكون مربحة. في حين أن باكتستينغ يمكن أن توفر التجار مع معلومات قيمة، وغالبا ما يكون مضللا، وأنها ليست سوى جزء واحد من عملية التقييم. ويتيح الاختبار خارج العينة واختبار الأداء إلى الأمام مزيدا من التأكيد فيما يتعلق بفعالية الأنظمة، ويمكن أن يبين الألوان الحقيقية للأنظمة، قبل أن يكون النقد الحقيقي على الخط. إن وجود علاقة جيدة بين نتائج الاختبار المسبق واختبار الأداء خارج العينة ونتائج الاختبار للأمام أمر حيوي لتحديد جدوى نظام التداول. (نحن نقدم بعض النصائح حول هذه العملية التي يمكن أن تساعد على تحسين استراتيجيات التداول الحالية. للاطلاع على مزيد من المعلومات، اقرأ القراءة السابقة: تفسير الماضي.) أساسيات باكتستينغ تشير باكتستينغ إلى تطبيق نظام التداول على البيانات التاريخية للتحقق من كيفية أداء النظام خلال الفترة الزمنية المحددة. العديد من منصات التداول اليوم تدعم باكتستينغ. يمكن للتجار اختبار الأفكار مع عدد قليل من ضربات المفاتيح والحصول على نظرة ثاقبة على فعالية فكرة دون المخاطرة بالأموال في حساب التداول. يمكن أن تقيس باكتستينغ الأفكار البسيطة، مثل كيفية أداء كروسوفر المتوسط ​​المتحرك على البيانات التاريخية، أو أنظمة أكثر تعقيدا مع مدخلات متنوعة ومحفزات. طالما أن فكرة يمكن كميا فإنه يمكن باكتستد. قد يطلب بعض التجار والمستثمرين خبرة مبرمج مؤهل لتطوير الفكرة إلى شكل قابل للاختبار. وعادة ما ينطوي ذلك على مبرمج ترميز الفكرة إلى اللغة الملكية التي تستضيفها منصة التداول. يمكن للمبرمج دمج المتغيرات المدخلات المعرفة من قبل المستخدم التي تسمح للتاجر لقرص النظام. ومن الأمثلة على ذلك في نظام كروس أوفر المتوسط ​​البسيط المبين أعلاه: أن يكون المتداول قادرا على إدخال (أو تغيير) أطوال المتوسطين المتحركين المستخدمين في النظام. يمكن للمتداول أن يقوم باكتست لتحديد أي الأطوال من المتوسطات المتحركة كانت ستؤدي أفضل النتائج على البيانات التاريخية. (الحصول على مزيد من التبصر في تعليم التجارة الإلكترونية.) دراسات الأمثل العديد من منصات التداول تسمح أيضا للدراسات الأمثل. وهذا ينطوي على إدخال نطاق للمدخلات المحددة والسماح للكمبيوتر القيام الرياضيات لمعرفة ما المدخلات التي كان أداء أفضل. يمكن للتحسين متعدد المتغيرات القيام بالرياضيات لمتغيرين أو أكثر معا لتحديد المستويات التي يمكن أن تحقق معا أفضل النتائج. على سبيل المثال، يمكن للمتداولين إخبار البرنامج بالمدخلات التي يرغبون في إضافتها إلى إستراتيجيتهم، ومن ثم يتم تحسينها إلى أوزانهم المثالية نظرا للبيانات التاريخية المختبرة. باكتستينغ يمكن أن تكون مثيرة في أن نظام غير مربحة يمكن في كثير من الأحيان تتحول سحرية إلى آلة صنع المال مع عدد قليل من التحسينات. لسوء الحظ، فإن تعديل نظام لتحقيق أعلى مستوى من الربحية السابقة يؤدي في كثير من الأحيان إلى نظام من شأنه أن يؤدي بشكل ضعيف في التداول الحقيقي. هذا الإفراط في التحسين يخلق النظم التي تبدو جيدة على الورق فقط. منحنى المناسب هو استخدام التحليلات الأمثل لإنشاء أكبر عدد من الصفقات الفوز بأكبر ربح على البيانات التاريخية المستخدمة في فترة الاختبار. على الرغم من أنها تبدو مثيرة للإعجاب في باكتستينغ النتائج، ومنحنى المناسب يؤدي إلى أنظمة لا يمكن الاعتماد عليها منذ النتائج مصممة خصيصا خصيصا لتلك البيانات الخاصة والفترة الزمنية. تقدم باكتستينغ والتحسين العديد من الفوائد للتاجر ولكن هذا هو فقط جزء من العملية عند تقييم نظام التداول المحتمل. الخطوة التالية للتجار هي تطبيق النظام على البيانات التاريخية التي لم يتم استخدامها في مرحلة باكتستينغ الأولية. (من السهل حساب المتوسط ​​المتحرك، و بمجرد رسمه على الرسم البياني، هو أداة مرئية قوية لتحديد الاتجاه، لمزيد من المعلومات، اقرأ المتوسطات المتحركة البسيطة تجعل الاتجاهات تتوقف.) في العينة مقابل البيانات خارج العينة عند اختبار فكرة عن البيانات التاريخية، من المفيد حجز فترة زمنية للبيانات التاريخية لأغراض الاختبار. ويشار إلى البيانات التاريخية الأولية التي يتم اختبار الفكرة وتحسينها على أنها البيانات في العينة. وتعرف مجموعة البيانات المحجوزة ببيانات خارج العينة. هذا الإعداد هو جزء مهم من عملية التقييم لأنه يوفر وسيلة لاختبار الفكرة على البيانات التي لم تكن عنصرا في نموذج التحسين. ونتيجة لذلك، لن تكون الفكرة قد تأثرت بأي شكل من الأشكال من البيانات خارج العينة والتجار سوف تكون قادرة على تحديد مدى أداء النظام على البيانات الجديدة أي في التداول في الحياة الحقيقية. قبل الشروع في أي اختبار أو تحسين، يمكن للمتداولين تخصيص نسبة مئوية من البيانات التاريخية التي سيتم حجزها للاختبار خارج العينة. وتتمثل إحدى الطرق في تقسيم البيانات التاريخية إلى الثلثين وفصل الثلث لاستخدامها في الاختبار خارج العينة. يجب استخدام البيانات داخل العينة فقط للاختبار الأولي وأي تحسين. ويبين الشكل 1 خطا زمنيا يحتفظ فيه بثلث البيانات التاريخية للاختبار خارج العينة، ويستخدم ثلثاها في اختبار العينة. على الرغم من أن الشكل 1 يصور البيانات خارج العينة في بداية الاختبار، فإن الإجراءات النموذجية سيكون لها الجزء خارج العينة الذي يسبق مباشرة الأداء الأمامي. الشكل 1: خط زمني يمثل الطول النسبي للبيانات داخل العينة وخارج العينة المستخدمة في عملية الاختبار الخلفي. وبمجرد وضع نظام تجاري باستخدام بيانات داخل العينة، يكون جاهزا للتطبيق على البيانات خارج العينة. يمكن للمتداولين تقييم ومقارنة نتائج الأداء بين البيانات داخل العينة وخارج العينة. ويشير الارتباط إلى أوجه الشبه بين الأداء والاتجاهات العامة لمجموعتي البيانات. ويمكن استخدام مقاييس الترابط في تقييم تقارير أداء الاستراتيجية التي تم إنشاؤها خلال فترة الاختبار (وهي ميزة توفرها معظم منصات التداول). وكلما كان الترابط أقوى بين الاثنين، كلما كان احتمال أداء النظام جيدا في اختبار الأداء إلى الأمام والتداول المباشر أفضل. ويوضح الشكل 2 نظامين مختلفين تم اختبارهما وتحسينهما على بيانات العينة، ثم تطبيقهما على البيانات خارج العينة. يظهر الرسم البياني على اليسار نظاما كان منحنى بشكل واضح - صالح للعمل بشكل جيد على البيانات داخل العينة وفشلت تماما على البيانات خارج العينة. ويظهر الرسم البياني على اليمين نظاما يؤدي أداء جيدا في البيانات داخل وخارج العينة. الشكل 2: اثنين من منحنيات الأسهم. تمثل بيانات التجارة قبل كل سهم أصفر اختبار في العينة. وتشير الصفقات المتولدة بين الأسهم الصفراء والأحمر إلى اختبار خارج العينة. الصفقات بعد الأسهم الحمراء هي من مراحل اختبار الأداء إلى الأمام. إذا كان هناك ارتباط بسيط بين الاختبار في العينة وخارج العينة، مثل الرسم البياني الأيسر في الشكل 2، فمن المرجح أن النظام قد تم تجاوزه بشكل مفرط ولن يؤدي أداء جيدا في التداول المباشر. إذا كان هناك ارتباط قوي في الأداء، كما هو مبين في الرسم البياني الصحيح في الشكل 2، المرحلة التالية من التقييم ينطوي على نوع إضافي من اختبار خارج العينة المعروفة باسم اختبار الأداء إلى الأمام. (لمزيد من القراءة حول التنبؤ، الرجوع إلى التنبؤ المالي: طريقة بايزي). أساسيات اختبار الأداء إلى الأمام اختبار الأداء إلى الأمام، والمعروف أيضا باسم تداول الورق. يوفر للمتداولين مجموعة أخرى من البيانات خارج العينة لتقييم النظام. اختبار الأداء إلى الأمام هو محاكاة التداول الفعلي ويشمل اتباع منطق الأنظمة في السوق الحية. ويسمى أيضا تداول الورق حيث أن جميع الصفقات يتم تنفيذها على الورق فقط، أي أن الإدخالات التجارية والمخارج موثقة مع أي ربح أو خسارة للنظام، ولكن لا يتم تنفيذ صفقات حقيقية. جانب مهم من اختبار الأداء إلى الأمام هو اتباع منطق الأنظمة بالضبط خلاف ذلك، يصبح من الصعب، إن لم يكن من المستحيل، لتقييم هذه الخطوة من العملية بدقة. يجب على التجار أن يكونوا صادقين حول أي مداخل تجارية ومخارج وتجنب السلوك مثل الصفقات قطف الكرز أو لا تشمل التجارة على ترشيد الورق أنني لم تأخذ أبدا تلك التجارة. وإذا كانت التجارة ستحدث بعد منطق الأنظمة، فينبغي توثيقها وتقييمها. العديد من السماسرة تقدم حساب التداول محاكاة حيث يمكن وضع الصفقات وتحسب الربح والخسارة المقابلة. استخدام حساب التداول محاكاة يمكن أن تخلق جو شبه واقعية التي لممارسة التداول ومواصلة تقييم النظام. ويبين الشكل 2 أيضا نتائج اختبار الأداء إلى الأمام على نظامين. مرة أخرى، فشل النظام الممثلة في الرسم البياني الأيسر في القيام بما هو أبعد بكثير من الاختبار الأولي على البيانات في العينة. ومع ذلك، يستمر النظام المعروض في المخطط الصحيح في الأداء بشكل جيد من خلال جميع المراحل، بما في ذلك اختبار الأداء للأمام. وهناك نظام يظهر نتائج إيجابية مع وجود علاقة جيدة بين العينة، خارج العينة واختبار الأداء إلى الأمام جاهز ليتم تنفيذها في السوق الحية. الخط السفلي باكتستينغ هو أداة قيمة متوفرة في معظم منصات التداول. تقسيم البيانات التاريخية إلى مجموعات متعددة لتوفير الاختبار في العينة وخارج العينة يمكن أن توفر للتجار وسيلة عملية وفعالة لتقييم فكرة التداول والنظام. وبما أن معظم التجار يستخدمون تقنيات التحسين في الاختبار المسبق، فمن المهم بعد ذلك تقييم النظام على البيانات النظيفة لتحديد جدواها. إن مواصلة اختبار خارج العينة مع اختبار األداء األمامي يوفر طبقة أخرى من السالمة قبل وضع نظام في السوق يخاطر بالمخاطر النقدية الحقيقية. وتؤدي النتائج الإيجابية والارتباط الجيد بين الاختبار في الاختبار الأولي والعينة للاختبارات الأولية واختبار الأداء إلى الأمام إلى زيادة احتمال أن يؤدي النظام أداء جيدا في التداول الفعلي. (للاطلاع على نظرة شاملة على التحليل الفني انظر التحليل الفني: مقدمة). إشعار: ستقوم مجموعة الاستشارات الإحصائية إدر بترحيل الموقع إلى نظام إدارة المحتوى وردبريس كمس في فبراير لتسهيل الصيانة وإنشاء محتوى جديد. ستتم إزالة بعض صفحاتنا القديمة أو وضعها في الأرشيف بحيث لا يتم الاحتفاظ بها بعد الآن. سنحاول الحفاظ على عمليات إعادة التوجيه بحيث تستمر عناوين ورل القديمة في العمل بأفضل ما في وسعنا. مرحبا بكم في معهد للبحوث الرقمية والتعليم مساعدة مجموعة ستات الاستشارية من خلال إعطاء هدية الانحدار مع ستاتا الفصل 3 - الانحدار مع التنبؤات الفئوية الفصل المخطط 3.0 الانحدار مع التنبؤات الفئوية 3.1 الانحدار مع متغير 01 3.2 الانحدار مع متغير 12 3.3 الانحدار مع 123 متغير 3.4 الانحدار مع التنبؤات الفئوية متعددة 3.5 التنبؤات الفئوية مع التفاعلات 3.6 المتغيرات المستمرة والفئوية 3.7 التفاعلات المستمرة من قبل 01 المتغيرات الفئوية 3.8 المتغيرات المستمرة والفئوية والتفاعل مع 123 متغير 3.9 الملخص 3.10 التقييم الذاتي 3.11 لمزيد من المعلومات يرجى ملاحظة ما يلي: صفحة يجعل استخدام البرنامج xi3 التي لم يعد الحفاظ عليها، وكان من أرشيفنا. سوف تترك الإشارات إلى xi3 في هذه الصفحة لأنها توضح مبادئ محددة لترميز المتغيرات الفئوية. في الفصول السابقة، ركزنا على تحليلات الانحدار باستخدام المتغيرات المستمرة. ومع ذلك، فمن الممكن أن تشمل التنبؤات الفئوية في تحليل الانحدار، لكنه يتطلب بعض العمل الإضافي في إجراء التحليل والعمل الإضافي في تفسير النتائج بشكل صحيح. سيوضح هذا الفصل كيف يمكنك استخدام ستاتا لإدراج المتنبئين الفئوية في التحليل الخاص بك ووصف كيفية تفسير نتائج هذه التحليلات. ستاتا لديه بعض الأدوات الرائعة التي حقا تخفيف عملية تضمين المتغيرات الفئوية في تحليل الانحدار الخاص بك، وسوف نؤكد على استخدام هذه الأدوات مرات. هذا الفصل سوف تستخدم البيانات elemapi2 التي رأيتموها في الفصول السابقة. وسوف نركز على أربعة متغيرات api00. سوميكول. يرند و ميلكات. والتي تأخذ وجبات الطعام وكسر عنه في 3 فئات. دعونا نلقي نظرة سريعة على هذه المتغيرات. المتغير api00 هو مقياس لأداء المدارس. في ما يلي معلومات الكودبوك ل api00 المتغير سوميكول هو متغير مستمر يقيس النسبة المئوية للوالدين في المدرسة الذين التحقوا بالكلية، وترد أدناه معلومات الكودبوك. متغير يرند هو متغير فئوي يتم ترميزه 0 إذا لم تكن المدرسة على مدار السنة، و 1 إذا كانت على مدار السنة، انظر أدناه. الوجبات المتغيرة هي النسبة المئوية للطلاب الذين يتلقون وجبات مجانية برعاية الدولة ويمكن استخدامها كمؤشر للفقر. تم تقسيم هذا إلى 3 فئات (لجعل المجموعات على قدم المساواة الحجم) خلق متغير ميلكات. وترد معلومات دفتر الشفرة ل ميلكات أدناه. 3.1 الانحدار مع متغير 01 أبسط مثال على متنبأ قاطع في تحليل الانحدار هو متغير 01، يسمى أيضا متغير وهمية. يتيح استخدام المتغير يرند كمثال للمتغير وهمية. يمكننا تضمين متغير وهمية كمؤشر في تحليل الانحدار كما هو مبين أدناه. قد يبدو هذا غريبا في البداية، ولكن هذا هو تحليل مشروع. ولكن ماذا يعني هذا أن نعود إلى الأساسيات ونكتب معادلة الانحدار التي ينطوي عليها هذا النموذج. حيث كونس هو اعتراض (أو ثابت)، ونحن نستخدم بيرند لتمثيل معامل لمتغير يرند. ملء القيم من معادلة الانحدار، نحصل على إذا كانت المدرسة ليست مدرسة على مدار العام (أي يرند هو 0) فإن معادلة الانحدار تبسيط إلى إذا كانت المدرسة هي مدرسة على مدار السنة، فإن معادلة الانحدار تبسيط ل نحن يمكن رسم بياني القيم الملحوظة والقيم المتوقعة باستخدام الأمر مبعثر كما هو موضح أدناه. على الرغم من أن يرند يحتوي فقط على قيمتين، لا يزال بإمكاننا رسم خط الانحدار الذي يوضح العلاقة بين يرند و api00. واستنادا إلى النتائج الواردة أعلاه، نرى أن القيمة المتوقعة للمدارس غير المدرة للسنوات هي 684.539 والقيمة المتوقعة للمدارس على مدار السنة هي 524.032، ومنحدر الخط سلبي، وهو أمر منطقي لأن معامل ال يرند كان سلبي (-160.5064). يتيح مقارنة هذه القيم المتوقعة مع متوسط ​​درجات api00 للمدارس على مدار العام وغير مدار العام. كما ترون، تتوقع معادلة الانحدار أن قيمة api00 ستكون القيمة المتوسطة، اعتمادا على ما إذا كانت المدرسة هي مدرسة على مدار السنة أو مدرسة غير مدتها سنة. يتيح ربط هذه القيم المتوقعة مرة أخرى إلى معادلة الانحدار. أما بالنسبة للمدارس التي لا تعمل على مدار السنة، فإن متوسطها هو نفسه المعترض (684.539). معامل ال يرند هو المبلغ الذي نحتاج إلى إضافته للحصول على المتوسط ​​للمدارس على مدار السنة، بمعنى أننا نحتاج إلى إضافة -160.5064 للحصول على 524.0326، المتوسط ​​بالنسبة للمدارس غير على مدار السنة. وبعبارة أخرى، بيرند هو متوسط ​​درجة api00 للمدارس على مدار السنة ناقص متوسط ​​درجة api00 للمدارس غير مدار السنة، أي يعني (على مدار السنة) - يعني (على مدار السنة). قد يكون من المستغرب أن نلاحظ أن هذا التحليل الانحدار مع متغير وهمية واحدة هو نفس إجراء اختبار تي مقارنة المتوسط ​​api00 للمدارس على مدار السنة مع المدارس على مدار السنة (انظر أدناه). يمكنك أن ترى أن قيمة t أدناه هي نفس قيمة t ل يرند في الانحدار أعلاه. ويرجع ذلك إلى أن بيرند يقارن بين جولات السنة والجولات غير السنوية (لأن المعامل يعني (على مدار السنة) - متوسط ​​(غير مدار السنة)). منذ اختبار تي هو نفسه كما تفعل أنوفا. يمكننا الحصول على نفس النتائج باستخدام الأمر أنوفا كذلك. إذا قمنا بقياس القيمة t من الاختبار t، نحصل على نفس القيمة مثل القيمة F من الأنوفا. 3.2 الانحدار مع متغير 12 لا يلزم ترميز متغير التنبؤ القطاعي 01 ليستخدم في نموذج الانحدار. ومن الأسهل فهم وتفسير النتائج من نموذج مع المتغيرات وهمية، ولكن النتائج من متغير مشفر 12 ينتج أساسا نفس النتائج. يتيح جعل نسخة من المتغير يرند يسمى yrrnd2 التي تم ترميز 12، 1non على مدار السنة و 2 سنة. يتيح تنفيذ الانحدار التنبؤ api00 من yrrnd2. لاحظ أن معامل يرند هو نفس yrrnd2. لذلك، يمكنك أن ترى أنه إذا كنت رمز يرند كما 01 أو 12، معامل الانحدار يعمل إلى أن تكون هي نفسها. ومع ذلك اعتراض (سلبيات) هو أقل قليلا بديهية. عندما استخدمنا يرند. كان الاعتراض هو المتوسط ​​بالنسبة للجولات غير السنوية. عند استخدام yrrnd2. الاعتراض هو المتوسط ​​للجولات غير العامة ناقص Byrndnd2. أي 684.539 - (-160.506) 845.045 لاحظ أنه يمكنك استخدام الترميز 01 أو 12 ونتائج المعامل تخرج نفسها، ولكن تفسير الثابت في معادلة الانحدار مختلف. وكثيرا ما يكون من الأسهل تفسير التقديرات الخاصة بالرمز 01. وباختصار، تشير هذه النتائج إلى أن درجات أبي 00 تختلف اختلافا كبيرا بالنسبة للمدارس تبعا لنوع المدرسة، والمدرسة على مدار السنة مقابل المدرسة على مدار السنة. المدارس غير المدروسة على مدار العام لديها أعلى بكثير من درجات أبي من المدارس على مدار السنة. واستنادا إىل نتائج االنحدار، فإن املدارس غري املدرسية عىل مدار السنة لديها درجات أعىل من املدارس التي تدور عىل مدار العام بنسبة 160.5 نقطة. 3.3 الانحدار مع متغير 123 3.3.1 خلق متغيرات وهمية يدويا يقول، أننا نود أن نفحص العلاقة بين مقدار الفقر وعشرات المعهد. فنحن لا نملك مقياسا للفقر، ولكننا يمكن أن نستعمل وجبة الطعام كمؤشر لقياس الفقر. أدناه نكرر معلومات دفتر الدفاتر عن وجبة عرض القيم للفئات الثلاث. قد يميل إلى محاولة تضمين وجبة الطعام في الانحدار من هذا القبيل. ولكن هذا هو النظر في التأثير الخطي من ميلكات مع api00. ولكن ميلكات ليس متغير الفاصل الزمني. بدلا من ذلك، سوف تحتاج إلى رمز المتغير بحيث يتم احتساب جميع المعلومات المتعلقة المستويات الثلاثة. يمكنك وديكات كود وهمية مثل هذا. لقد أنشأنا الآن mealcat1 هذا هو 1 إذا ميلكات هو 1، و 0 خلاف ذلك. وبالمثل، mealcat2 هو 1 إذا ميلكات هو 2، و 0 وإلا تم إنشاء وجبةcatcat3. يمكننا أن نرى هذا أدناه. يمكننا الآن استخدام اثنين من هذه المتغيرات وهمية (وجبةcat 2 و mealcat3) في تحليل الانحدار. يمكننا اختبار الاختلافات الشاملة بين المجموعات الثلاث باستخدام أمر الاختبار كما هو موضح أدناه. وهذا يدل على أن الفروق الشاملة بين المجموعات الثلاث كبيرة. إن تفسير المعاملات يشبه إلى حد كبير المتغيرات الثنائية. المجموعة 1 هي المجموعة المحذوفة، وبالتالي فإن النسبة المئوية هي متوسط ​​المجموعة 1. معامل وجبة pickcat2 هو متوسط ​​المجموعة 2 ناقص متوسط ​​المجموعة المحذوفة (المجموعة 1). والمعامل ل mealcat3 هو متوسط ​​المجموعة 3 ناقص متوسط ​​المجموعة 1. يمكنك التحقق من ذلك من خلال مقارنة المعاملات مع وسائل المجموعات. واستنادا إلى هذه النتائج، يمكننا القول أن المجموعات الثلاث تختلف في درجاتها api00، وأن المجموعة 2 بشكل خاص تختلف اختلافا كبيرا عن المجموعة 1 (لأن وجبة food2 كانت كبيرة) والمجموعة 3 تختلف اختلافا كبيرا عن المجموعة 1 (لأن وجبة الكاتات 3 كانت كبيرة). 3.3.2 باستخدام الأمر إكسي يمكننا استخدام الأمر إكسي للقيام بالعمل بالنسبة لنا لإنشاء متغيرات المؤشرات وتشغيل الانحدار في أمر واحد، كما هو موضح أدناه. عندما نستخدم إكسي وتشمل مصطلح i. mealcat في النموذج، ستاتا يخلق المتغيرات Imealcat2 و Imealcat3 التي هي متغيرات وهمية تماما مثل mealcat2 و mealcat3 التي أنشأنا من قبل. هناك حقا لا فرق بين mealcat2 و Imealcat2. كما ترون، فإن النتائج هي نفسها كما في التحليل السابق. إذا أردنا اختبار التأثير الكلي للبيتكات نستخدم أمر الاختبار كما هو موضح أدناه، والذي يعطي لنا أيضا نفس النتائج التي وجدناها باستخدام المتغيرات وهمية mealcat2 و mealcat3. لاحظ أنه إذا كنت تفعل هذا في ستاتا الإصدار 6 المتغيرات ستسمى Imealc2 و Imealc3 بدلا من Imealcat2 و Imealcat3. واحد من التحسينات في ستاتا 7 هو أن أسماء المتغيرات يمكن أن تكون أطول من 8 أحرف، وبالتالي فإن أسماء المتغيرات التي تم إنشاؤها بواسطة الأمر إكسي هي أسهل لفهم من في الإصدار 6. من هذه النقطة إلى الأمام، سوف نستخدم أسماء المتغيرات التي في الإصدار 7. ماذا لو أردنا أن تكون مجموعة مختلفة هي المجموعة المرجعية. إذا قمنا بإنشاء متغيرات وهمية عبر جدول. تولد () ثم يمكننا بسهولة اختيار المتغير الذي سيكون المجموعة المحذوفة، على سبيل المثال، يتيح حذف المجموعة 3. مع حذف المجموعة 3، يكون الثابت الآن متوسط ​​المجموعة 3 و mealcat1 هو Group1-group3 و mealcat2 هو group2-group3 . ونحن نرى أن كلا من هذه المعاملات كبيرة، مشيرا إلى أن المجموعة 1 تختلف اختلافا كبيرا عن المجموعة 3 والمجموعة 2 تختلف اختلافا كبيرا عن المجموعة 3. عندما نستخدم الأمر إكسي، كيف يمكننا اختيار المجموعة التي تم حذف المجموعة افتراضيا، تم حذف المجموعة الأولى، ولكن نريد أن يتم حذف المجموعة 3. يمكننا استخدام الأمر شار كما هو موضح أدناه لنقول ستاتا أننا نريد المجموعة الثالثة لتكون المجموعة المحذوفة للمتغير ميلكات. ثم، عندما نستخدم الأمر إكسي باستخدام ميلكات سيتم حذف مجموعة mealcat3. إذا قمت بحفظ ملف البيانات، ستاتا سوف نتذكر هذا لجلسات ستاتا في المستقبل. يمكنك مقارنة ونرى أن هذه النتائج هي مماثلة لتلك التي تم العثور عليها باستخدام mealcat1 و mealcat2 كما التنبؤات. 3.3.3 باستخدام أمر أنوفا يمكننا أيضا القيام بهذا التحليل باستخدام أمر أنوفا. فائدة الأمر أنوفا هو أنه يعطينا اختبار التأثير الكلي للبيتكات دون الحاجة إلى استخدام الأمر اختبار كما فعلنا مع الأمر تراجع. يمكننا أن نرى أن اختبار أنوفا لتأثير ميلكات هو نفس الأمر اختبار من قيادة تراجع. يمكننا حتى متابعة هذا مع أنوفا، تراجع الأمر ومقارنة تقديرات المعلمة مع تلك التي أجريناها سابقا. ملاحظة: تقديرات المعلمة هي نفسها لأن كودكات مشفرة بنفس الطريقة في الأمر ريجريس وفي الأمر أنوفا، في كلتا الحالتين يتم إسقاط الفئة الأخيرة (الفئة 3). بينما يمكنك التحكم في الفئة التي تم حذفها الفئة عند استخدام الأمر ريجريس، أنوفا، الأمر تراجع دائما قطرة الفئة الأخيرة. 3.3.4 مخططات التشفير الأخرى من الملائم عموما استعمال التشفير الوهمي ولكن ليس هذا النوع الوحيد من التشفير الذي يمكن استخدامه. كما رأيت، عند استخدام الترميز الوهمية واحدة من المجموعات يصبح المجموعة المرجعية وجميع المجموعات الأخرى تتم مقارنتها بتلك المجموعة. قد لا تكون هذه المجموعة الأكثر إثارة للاهتمام من المقارنات. لنفترض أنك تريد مقارنة المجموعة 1 بالمجموعتين 2 و 3، ولمقارنة ثانية مقارنة المجموعة الثانية مع المجموعة الثالثة، يجب عليك إنشاء مخطط ترميز يشكل هذه المقارنات 2. سنوضح هذا باستخدام برنامج ستاتا، xi3. (نسخة محسنة من الحادي عشر) من شأنها أن تخلق المتغيرات التي تحتاجها لمثل هذه المقارنات (فضلا عن مجموعة متنوعة من المقارنات المشتركة الأخرى). المقارنات التي وصفناها (مقارنة المجموعة 1 مع 2 و 3، ومن ثم مقارنة المجموعتين 2 و 3) تتوافق مع مقارنات هلميرت (انظر الفصل 5 لمزيد من التفاصيل). نستخدم h. (بدلا من البادئة i) للإشارة إلى أننا نرغب في إجراء مقارنات هلميرت على الوسيطة المتغيرة. خلاف ذلك، ترى أن xi3 يعمل مثل الأمر إكسي. إذا قارنت تقديرات المعلمات بالوسائل (انظر أدناه)، يمكنك التحقق من أن معامل Imealcat1 هو متوسط ​​المجموعة 1 ناقص متوسط ​​المجموعتين 2 و 3 (805.71756 - (639.39394 504.37956) 2 233.83081) ومعامل Imealcat2 هو متوسط ​​المجموعة 2 ناقص المجموعة 3 (639.39 - 504.37 135.01). كل من هذه المقارنات كبيرة، مما يدل على أن المجموعة 1 تختلف بشكل كبير عن المجموعتين 2 و 3 مجتمعة، والمجموعة 2 تختلف بشكل كبير عن المجموعة 3. وقيمة السندات هي المتوسط ​​غير المرجح لوسائل المجموعات الثلاث. باستخدام مخطط الترميز المقدم من قبل xi3. كنا قادرين على تشكيل اختبارات أكثر إثارة للاهتمام من تلك التي تقدمها الترميز وهمية. يمكن لبرنامج xi3 إنشاء متغيرات وفقا لمخططات الترميز الأخرى، وكذلك مخططات الترميز المخصصة التي تقوم بإنشائها، راجع المساعدة xi3 والفصل 5 للحصول على مزيد من المعلومات. 3.4 الانحدار مع اثنين من التنبؤات الفئوية 3.4.1 باستخدام شي: الأمر سابقا نظرنا في استخدام يرند للتنبؤ api00 وكنا أيضا نظرت في وجبة باستخدام الأمر إكسي يمكننا أن تشمل كل من يرند و ميلكات معا في نفس النموذج. يمكننا اختبار التأثير العام للبيتكات مع أمر الاختبار، وهو أمر مهم. لأن هذا النموذج له تأثيرات رئيسية فقط (لا توجد تفاعلات) يمكنك تفسير بيرند على أنه الفرق بين السنة وعلى مدار السنة. معامل Imealcat1 (الذي سوف نسميه BImealcat1) هو الفرق بين وجبة 1 و foodcat3، و pemealcat2 والفرق بين mealcat2 و mealcat3. يتيح حفر تحت السطح ونرى كيف ترتبط المعاملات القيم المتوقعة. يتيح عرض الخلايا التي شكلتها عبور يرند و ميلكات وعدد الخلايا من الخلية 1 إلى cell6. فيما يتعلق وجبة. مجموعة وجبةcat 3 هي الفئة المرجعية، وفيما يتعلق يرند المجموعة yrrnd0 هي فئة مرجعية. ونتيجة لذلك، الخلية 3 هي الخلية المرجعية. والثابت هو القيمة المتوقعة لهذه الخلية. معامل ال يرند هو الفرق بين الخلية 3 و الخلية 6. وبما أن هذا النموذج له تأثيرات رئيسية فقط، فهو أيضا الفرق بين الخلية 2 و الخلية 5، أو من الخلية 1 و الخلية 4. وبعبارة أخرى، بيرند هو المبلغ الذي تضيفه إلى القيمة المتوقعة عندما تذهب من غير مدار السنة إلى المدارس على مدار السنة. معامل Imealcat1 هو الفرق المتوقع بين الخلية 1 و cell3. وبما أن هذا النموذج له تأثيرات رئيسية فقط، فهو أيضا الفرق المتوقع بين الخلية 4 و الخلية 6. وبالمثل، BImealcat2 هو الفرق المتوقع بين الخلية 2 و cell3، وأيضا الفرق المتوقع بين الخلية 5 و cell6. لذا، فإن القيم المتوقعة، من حيث المعاملات، سيكون هو أننا يجب أن نلاحظ أنه إذا كنت حساب القيم المتوقعة لكل خلية، فإنها لا تتطابق تماما مع الوسائل في الخلايا 6. والوسائل المتوقعة ستكون قريبة من الوسائل التي لوحظت في الخلايا، ولكن ليس بالضبط نفس. وذلك لأن نموذجنا له فقط تأثيرات رئيسية ويفترض أن الفرق بين الخلية 1 و cell4 هو بالضبط نفس الفرق بين الخلايا 2 و 5 وهو نفس الفرق بين الخلايا 3 و 6. وبما أن القيم الملحوظة لا تتبع هذا النمط، هناك بعض التناقض بين الوسائل المتوقعة والوسائل المرصودة. 3.4.2 استخدام الأمر أنوفا يمكننا تشغيل نفس التحليل باستخدام الأمر أنوفا مع الآثار الرئيسية فقط لاحظ أننا نحصل على نفس المعلومات التي نقوم بها من الحادي عشر. ريجريس، متبوعا بأمر الاختبار. يوفر الأمر أنوفا تلقائيا المعلومات التي يوفرها أمر الاختبار. إذا أردنا ذلك، يمكننا أيضا طلب تقديرات المعلمة في وقت لاحق بمجرد القيام بذلك. سوف أنوفا عرض تقديرات المعلمة من نموذج أنوفا الماضي. ومع ذلك، فإن الأمر أنوفا جامدة في تحديد أي مجموعة ستكون المجموعة المحذوفة ويتم إسقاط المجموعة الأخيرة. وبما أن هذا يختلف عن الترميز الذي استخدمناه في أوامر الانحدار أعلاه، فإن تقديرات المعلمة من هذا الأمر أنوفا تختلف عن الأمر التراجع أعلاه. وباختصار، تشير هذه النتائج إلى وجود فروق كبيرة بين المدارس على مدار السنة والمدارس غير السنوية، كما أن الفروق بين مجموعات الوديكات الثلاث كبيرة. 3.5 متوقعة كاتيغوريكال مع التفاعلات يتيح أداء نفس التحليل الذي أجرينا أعلاه، وهذه المرة يتيح تضمين التفاعل من ميلكات التي كتبها يرند. عند استخدام إكسي. فمن السهل أن تشمل مصطلح التفاعل، كما هو مبين أدناه. يمكننا اختبار التفاعل العام مع أمر الاختبار. تأثير التفاعل هذا ليس كبيرا. من المهم أن نلاحظ كيف يتغير معنى المعاملات في وجود مصطلحات التفاعل هذه. على سبيل المثال، في النموذج السابق، مع التأثيرات الرئيسية فقط، يمكن أن نفسر بيرند على أنه الفرق بين السنة وعلى مدار السنة. ومع ذلك، والآن بعد أن أضفنا مصطلح التفاعل، فإن مصطلح بيرند يمثل الفرق بين الخلية 3 وخلايا 6، أو الفرق بين السنة وعلى مدار السنة المدارس على مدار السنة عندما وجبة 3 (لأن وجبة 3 كانت المجموعة حذفت). إن وجود تفاعل يعني أن الفرق بين المدارس على مدار السنة والمدارس غير الرسمية يعتمد على مستوى وجبة الطعام. تمثل شروط التفاعل BImeaXyrrn1 و BImeaXyrrn2 المدى الذي يتغير فيه الفرق بين السنة المدورة على مدار السنة عند وجبة 1 وعند وجبة food2 (بالمقارنة مع المجموعة المرجعية، mealcat3). على سبيل المثال المصطلح BImeaXyrrn1 يمثل الفرق بين الجولة على مدار السنة و غير على مدار السنة ل mealcat1 مقابل الفرق ل mealcat3. وبعبارة أخرى، BImeaXyrrn1 في هذا التصميم هو (cell1-cell4) - (cell3-cell6)، أو أنها تمثل مدى تأثير يرند يختلف بين mealcat1 و mealcat3. وفيما يلي عرضنا القيم المتوقعة للخلايا الست من حيث المعاملات في النموذج. إذا قارنت هذا إلى نموذج الآثار الرئيسية، سترى أن القيم المتوقعة هي نفسها باستثناء إضافة ImeaXyrrn1 (في الخلية 4) و ImeaXyrrn2 (في الخلية 5). قد يكون من الصعب جدا تفسير مصطلحات التفاعل هذه إذا كنت ترغب في تشكيل مقارنات محددة. على سبيل المثال، إذا أردت إجراء اختبار للتأثير الرئيسي البسيط ل يرند عند ميلكات 1، أي مقارنة الخلية 1 مع الخلية 4، فإنك ترغب في المقارنة بين PEMAalcat1 و كونس B يرند BImealcat1 BImeaXyrrn1 وبما أن سلبيات و Imealcat1 سوف يتسربون، ونحن سوف اختبار هذا الاختبار هو كبير، مشيرا إلى أن تأثير يرند مهم لمجموعة ميلكات 1. كما سنرى، يمكن إجراء هذه الاختبارات بسهولة أكبر عن طريق أنوفا. 3.5.2 استخدام أنوفا إنشاء هذه التفاعلات يمكن أن يكون أسهل إلى حد ما عند استخدام الأمر أنوفا. كما ترون أدناه، أمر أنوفا يعطينا اختبار التأثيرات الرئيسية الشاملة والتفاعلات دون الحاجة لأداء أوامر الاختبار اللاحقة. فمن السهل لإجراء اختبارات الآثار الرئيسية بسيطة باستخدام الأمر سم. يمكنك تحميل سم من داخل ستاتا عن طريق كتابة فينديت سم (انظر كيف يمكنني استخدام الأمر فينديت للبحث عن البرامج والحصول على مساعدة إضافية لمزيد من المعلومات حول استخدام فينديت). الآن يمكننا اختبار الآثار الرئيسية بسيطة من يرند في كل مستوى من ميلكات. النتائج من سم تبين لنا تأثير يرند في كل من مستويات 3 من ميلكات. يمكننا أن نرى أن المقارنة بالنسبة للبيتكات 1 مباريات تلك التي قمنا بحسابها أعلاه باستخدام بيان الاختبار، ومع ذلك، كان أسهل بكثير وأقل عرضة للخطأ باستخدام الأمر سم. على الرغم من أن هذا القسم قد ركز على كيفية التعامل مع التحليلات التي تنطوي على التفاعلات، لا تظهر هذه النتائج المحددة أي مؤشر على التفاعل. يمكننا أن نقرر حذف مصطلحات التفاعل من التحليلات المستقبلية بعد أن وجدنا أن التفاعلات غير هامة. وهذا من شأنه تبسيط التحليلات المستقبلية، ولكن بما في ذلك مصطلح التفاعل يمكن أن يكون مفيدا لضمان القراء أن مصطلح التفاعل غير هام. 3.6 المتغيرات المستمرة والفئوية 3.6.1 استخدام الانحدار قل أننا نرغب في تحليل المتغيرات المستمرة والفئوية في تحليل واحد. على سبيل المثال، يتيح تضمين يرند و سوميكول في نفس التحليل. يمكننا إنشاء القيم المتوقعة باستخدام الأمر التنبؤ. يتيح رسم بياني القيم المتوقعة من قبل سوميكول. معامل سوميكول يشير إلى أنه لكل وحدة زيادة في سوميكول ومن المتوقع أن يزيد بمقدار 2.23 وحدة النتيجة api00. This is the slope of the lines shown in the above graph. The graph has two lines, one for the year round schools and one for the non-year round schools. The coefficient for yrrnd is -149.16, indicating that as yrrnd increases by 1 unit, the api00 score is expected to decrease by about 149 units. As you can see in the graph, the top line is about 150 units higher than the lower line. You can see that the intercept is 637 and that is where the upper line crosses the Y axis when X is 0. The lower line crosses the line about 150 units lower at about 487. 3.6.2 Using anova We can run this analysis using the anova command. The anova command assumes that the variables are categorical, thus, we need to use the continuous() option (which can be abbreviated as cont() ) to specify that somecol is a continuous variable. If we square the t-values from the regress command (above), we would find that they match those of the anova command. 3.7 Interactions of Continuous by 01 Categorical variables Above we showed an analysis that looked at the relationship between somecol and api00 and also included yrrnd . We saw that this produced a graph where we saw the relationship between somecol and api00 but there were two regression lines, one higher than the other but with equal slope. Such a model assumed that the slope was the same for the two groups. Perhaps the slope might be different for these groups. Lets run the regressions separately for these two groups beginning with the non-year round schools. Likewise, lets look at the year round schools. Note that the slope of the regression line looks much steeper for the year round schools than for the non-year round schools. This is confirmed by the regression equations that show the slope for the year round schools to be higher (7.4) than non-year round schools (1.3). We can compare these to see if these are significantly different from each other by including the interaction of somecol by yrrnd . an interaction of a continuous variable by a categorical variable. 3.7.1 Computing interactions manually We will start by manually computing the interaction of somecol by yrrnd . Lets start fresh and use the elemapi2 data file using the , clear option to clear out any variables we have previously created. Next, lets make a variable that is the interaction of some college ( somecol ) and year round schools ( yrrnd ) called yrXsome . We can now run the regression that tests whether the coefficient for somecol is significantly different for year round schools and non-year round schools. Indeed, the yrXsome interaction effect is significant. We can make a graph showing the regression lines for the two types of schools showing how different their regression lines are. We first create the predicted value, we call it yhata . Then, we create separate variables for the two types of schools which will be called yhata0 for non-year round schools and yhata1 for year round schools. We can then graph the predicted values for the two types of schools by somecol . You can see how the two lines have quite different slopes, consistent with the fact that the yrXsome interaction was significant. The c(ll) option indicates that yhata0 should be connected with a line, and yhata1 should be connected with dashed lines (because we included after the l ). If we had used l. it would have made a dotted line. The options to make dashed and dotted lines are new to Stata 7 and you can find more information via help grsym . We can replot the same graph including the data points. The graph above used the same kind of dots for the data points for both types of schools. Lets make separate variables for the api00 scores for the two types of schools called api000 for the non-year round schools and api001 for the year round schools. We can then make the same graph as above except show the points differently for the two types of schools. Below we use small circles for the non-year round schools, and triangles for the year round schools. Lets quickly run the regressions again where we performed separate regressions for the two groups Now, lets show the regression for both types of schools with the interaction term. Note that the coefficient for somecol in the combined analysis is the same as the coefficient for somecol for the non-year round schools This is because non-year round schools are the reference group. Then, the coefficient for the yrXsome interaction in the combined analysis is the Bsomecol for the year round schools (7.4) minus Bsomecol for the non year round schools (1.41) yielding 5.99. This interaction is the difference in the slopes of somecol for the two types of schools, and this is why this is useful for testing whether the regression lines for the two types of schools are equal. If the two types of schools had the same regression coefficient for somecol . then the coefficient for the yrXsome interaction would be 0. In this case, the difference is significant, indicating that the regression lines are significantly different. So, if we look at the graph of the two regression lines we can see the difference in the slopes of the regression lines (see graph below). Indeed, we can see that the non-year round schools (the solid line) have a smaller slope (1.4) than the slope for the year round schools (7.4). The difference between these slopes is 5.99, the coefficient for yrXsome . 3.7.2 Computing interactions with xi We can use the xi command for doing this kind of analysis as well. Lets start fresh and use the elemapi2 file. We can run a model just like the model we showed above using the xi command. You can compare the results to those above and see that we get the exact same results. The i. yrrndsomecol term creates 3 terms, somecol . Iyrrnd2 an indicator variable for yrrnd representing whether the school is year round and the variable IyrXsome 2 representing the interaction of yrrnd by somecol . As we did above, we can create predicted values and create graphs showing the regression lines for the two types of schools. We omit showing these commands. 3.7.3 Computing interactions with anova We can also run a model just like the model we showed above using the anova command. We include the terms yrrnd somecol and the interaction yrrnrsomecol As we illustrated above, we can compute the predicted values using the predict command and graph the separate regression lines. These commands are omitted. In this section we found that the relationship between somecol and api00 depended on whether the school is a year round school or a non-year round school. For the year round schools, the relationship between somecol and api00 was significantly stronger than for non-year round schools. In general, this type of analysis allows you to test whether the strength of the relationship between two continuous variables varies based on the categorical variable. 3.8 Continuous and Categorical variables, interaction with 123 variable The prior examples showed how to do regressions with a continuous variable and a categorical variable that has 2 levels. These examples will extend this further by using a categorical variable with 3 levels, mealcat . We can use the xi command to run a model with somecol . mealcat and the interaction of these two variables. The interaction now has two terms ( ImeaXsome 2 and ImeaXsome 3 ). To get an overall test of this interaction, we can use the test command. These results indicate that the overall interaction is indeed significant. This means that the regression lines from the 3 groups differ significantly. As we have done before, lets compute the predicted values and make a graph of the predicted values so we can see how the regression lines differ. Since we had three groups, we get three regression lines, one for each category of mealcat . The solid line is for group 1, the dashed line for group 2, and the dotted line is for group 3. Group 1 was the omitted group, therefore the slope of the line for group 1 is the coefficient for somecol which is -.94. Indeed, this line has a downward slope. If we add the coefficient for somecol to the coefficient for ImeaXsome 2 we get the coefficient for group 2, i. e. 3.14 -.94 yields 2.2, the slope for group 2. Indeed, group 2 shows an upward slope. Likewise, if we add the coefficient for somecol to the coefficient for ImeaXsome 3 we get the coefficient for group 3, i. e. 2.6 -.94 yields 1.66, the slope for group 3. So, the slopes for the 3 groups are The test of the coefficient for ImeaXsome 2 tested whether the coefficient for group 2 differed from group 1, and indeed this was significant. Likewise, the test of the coefficient for ImeaXsome 3 tested whether the coefficient for group 3 differed from group 1, and indeed this was significant. What did the test of the coefficient somecol test This coefficient represents the coefficient for group 1, so this tested whether the coefficient for group 1 (-0.94) was significantly different from 0. This is probably a non-interesting test. The comparisons in the above analyses dont seem to be as interesting as comparing group 1 vs. 2 and then comparing group 2 vs. 3. These successive comparisons seem much more interesting. We can do this by making group 2 the omitted group, and then each group would be compared to group 2. As we have done before, we will use the char command to indicate that we want group 2 to be the omitted category and then rerun the regression. Now, the test of ImeaXsome 1 tests whether the coefficient for group 1 differs from group 2, and it does. Then, the test of ImeaXsome 3 tests whether the coefficient for group 3 significantly differs from group 2, and it does not. This makes sense given the graph and given the estimates of the coefficients that we have, that -.94 is significantly different from 2.2 but 2.2 is not significantly different from 1.66. 3.8.2 Using Anova We can perform the same analysis using the anova command, as shown below. The anova command gives us somewhat less flexibility since we cannot choose which group is the omitted group. Because the anova command omits the 3rd category, and the analysis we showed above omitted the second category, the parameter estimates will not be the same. You can compare the results from below with the results above and see that the parameter estimates are not the same. Because group 3 is dropped, that is the reference category and all comparisons are made with group 3. These analyses showed that the relationship between somecol and api00 varied, depending on the level of mealcat . In comparing group 1 with group 2, the coefficient for somecol was significantly different, but there was no difference in the coefficient for somecol in comparing groups 2 and 3. This covered four techniques for analyzing data with categorical variables, 1) manually constructing indicator variables, 2) creating indicator variables using the xi command, 3) coding variables using xi3 . and 4) using the anova command. Each method has its advantages and disadvantages, as described below. Manually constructing indicator variables can be very tedious and even error prone. For very simple models, it is not very difficult to create your own indicator variables, but if you have categorical variables with many levels andor interactions of categorical variables, it can be laborious to manually create indicator variables. However, the advantage is that you can have quite a bit of control over how the variables are created and the terms that are entered into the model. The xi command can really ease the creation of indicator variables, and make it easier to include interactions in your models by allowing you to include interaction terms such as i. progfemale. The xi command also gives you the flexibility to decide which category would be the omitted category (unlike the anova command). The anova command eliminates the need to create indicator variables making it easy to include variables that have lots of categories, and making it easy to create interactions by allowing you to include terms like somecolmealcat . It can be easier to perform tests of simple main effects with the anova command. However, the anova command is not flexible in letting you choose which category is the omitted category (the last category is always the omitted category). As you will see in the next chapter, the regress command includes additional options like the robust option and the cluster option that allow you to perform analyses when you dont exactly meet the assumptions of ordinary least squares regression. In such cases, the regress command offers features not available in the anova command and may be more advantageous to use. See the Stata Topics: Regression page for more information and resources on regression with categorical predictors in Stata. 3.10 Self Assessment 1. Using the elemapi2 data file ( use ats. ucla. edustatstatawebbooksregelemapi2 ) convert the variable ell into 2 categories using the following coding, 0-25 on ell becomes 0, and 26-100 on ell becomes 1. Use this recoded version of ell to predict api00 and interpret the results. 2. Convert the variable ell into 3 categories coding those scoring 0-14 on ell as 1, and those 1541 as 2 and 42100 as 3. Do an analysis predicting api00 from the ell variable converted to a 123 variable. Interpret the results. 3. Do a regression analysis predicting api00 from yrrnd and the ell variable converted to a 01 variable. Then create an interaction term and run the analysis again. Interpret the results of these analyses. 4. Do a regression analysis predicting api00 from ell coded as 01 (from question 1) and somecol . and the interaction of these two variables. Interpret the results, including showing a graph of the results. 5. Use the variable ell converted into 3 categories (from question 2) and predict api00 from ell in 3 categories, from somecol and the interaction. of these two variables. Interpret the results, including showing a graph. Click here for our answers to these self assessment questions. 3.11 For more information

No comments:

Post a Comment