محمد طاهر عرفه قام بنشر يونيو 17, 2020 قام بنشر يونيو 17, 2020 اذا لدينا مجموعة من البيانات و ليكن عددها 394 قراءة مثلا و نود تصنيفها الي مجموعات و مطلوب استنتاج عدد المجموعات و مجال كل منها فان احدى الطرق المفيدة هي طريقة two to the k rule طريقة 2 أس K وفيها نبحث عن أكبر K ممكنة بحيث تكون 2 أس K أقل من عدد القراءات ففي حالة مثالنا هنا 2 أس 8 = 256 (أقل من عدد السجلات الذي هو 394) مقبول و 2 أس 9 = 512 (أكبر من عدد السجلات الذي هو 394) يرفض اذا تكون K = 8 أي أن لدينا 8 مجموعات و الان نريد معرفة نطاق هذه المجموعات الثمانية Interval = (H-L)/ K أي محسب الفرق بين أكبر قراءة و أضغر قراءة ثم نقسمه علي K مثلا لو كانت اكبر قراءة = 900 و اضغر قراءة = 50 فيكون سعة المجموعة = 106.25 على الاقل ، فيتم التقريب الي 110 و بذلك تكون المجموعات الثمانية كما يلي: From To 1 50 160 2 160 270 3 270 380 4 380 490 5 490 600 6 600 710 7 710 820 8 820 930 Clustering-Intervals rule.xlsx 2
Ahmad Aloran قام بنشر يونيو 17, 2020 قام بنشر يونيو 17, 2020 استفسار بخصوص الطريقة المتبعة أعلاه، يظهر في الجدول أعلاه وجود مدى ثابت لدى جميع الفترات، علماً أن المدى من المفترض يشمل النقاط ذات خصائص متشابهة لغاية حصرها ومن ثم دراسة كل مجموعة على حدى. فهل هناك طريقة يتم من خلالها تقسيم البيانات بناءً على شكل نموذجي أو بناءً على الخصائص معينة. نذكر مثال عند وجود مشاريع ذات ميزانية قليلة قد يكون لها نفس الخصائص وبالتالي لها مدى منفرد بقيمته وغير مساوي للمدى للمشاريع ذات الميزانية الأكبر.
محمد طاهر عرفه قام بنشر يونيو 17, 2020 الكاتب قام بنشر يونيو 17, 2020 السلام عليكم هذا الموضوع يختص بالتصنيف CLASSIFICATION و المطلوب تحديد مجموعات التصنيف اما ما تشير اليه فهو يسمي تجميع CLUSTERING و لا يأتي بالبساطة السابقة ـ و انما يتطلب تطبيقات احصائية او تحليل رسومي للارقام و الله اعلم ما سبق مجرد طريقة للتصنيف يرجي مراجعة هذا الموضوع لتوضيح الفرق
الردود الموصى بها
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.