اذا لدينا مجموعة من البيانات و ليكن عددها 394 قراءة مثلا
و نود تصنيفها الي مجموعات و مطلوب استنتاج عدد المجموعات و مجال كل منها
فان احدى الطرق المفيدة هي طريقة two to the k rule
طريقة 2 أس K
وفيها نبحث عن أكبر K ممكنة بحيث تكون 2 أس K أقل من عدد القراءات
ففي حالة مثالنا هنا 2 أس 8 = 256 (أقل من عدد السجلات الذي هو 394) مقبول
و 2 أس 9 = 512 (أكبر من عدد السجلات الذي هو 394) يرفض
اذا تكون K = 8
أي أن لدينا 8 مجموعات
و الان نريد معرفة نطاق هذه المجموعات الثمانية
Interval = (H-L)/ K
أي محسب الفرق بين أكبر قراءة و أضغر قراءة ثم نقسمه علي K
مثلا لو كانت اكبر قراءة = 900
و اضغر قراءة = 50
فيكون سعة المجموعة = 106.25 على الاقل ، فيتم التقريب الي 110
و بذلك تكون المجموعات الثمانية كما يلي:
From
To
1
50
160
2
160
270
3
270
380
4
380
490
5
490
600
6
600
710
7
710
820
8
820
930
Clustering-Intervals rule.xlsx