W analizie skupień wykorzystywanych jest wiele miar podobieństwa, takich jak współczynniki Randa, Jaccarda, Szmigla czy Sokołowskiego. W artykule przedstawiono inną miarę klasyfikacji podziału. Wartość proponowanego wskaźnika S należy do przedziału [0,1], co zależy od liczby identycznych obiektów w grupach porównawczych, a także od liczby grup. Wskaźnik ten można wykorzystać do porównania różnych podziałów, np. różnymi metodami grupowania lub tą samą metodą klasyfikacji, jeśli obserwacje pochodzą z różnych okresów, a także do obliczenia podobieństwa podziału w dwóch różnych zbiorach.
taksonomia, metody grupowania, statystyka matematyczna
Arabie P., Boorman S. A. (1973), Multidimensional scaling of measures of distance between partitions, ,,Journal of Mathematical Psycholog”, No. 10
Chomątowski S., Sokołowski A. (1978), Taksonomia struktur, „Przegląd Statystyczny”, nr 2
Dobosz M. (2004), Wspomagana komputerowo statystyczna analiza wyników badań, Akademicka Oficyna Wydawnicza EXIT, Warszawa
Fowlkes E. B., Mallows C. L. (1983), A Method for Comparing Two Hierarchical Clusterings, ,,Journal of the American Statistical Association”, No. 78
Hubert L. J., Arabie P. (1985), Comparing partitions, ,,Journal of Classification”, No. 1
Jaccard P. (1908), Nouvelles recherches sur la distribution florale, ,,Vaudoise des Sciences Naturelles”, No. 44
Nowak E., (1985), Wskaźnik podobieństwa wyników podziału, „Przegląd Statystyczny”, z. 1
Pal N. R., Biswas J. (1997), Cluster validation using graph theoretic concepts, Pattern Recognition, vol. 30, No. 6
Rand W. M. (1971), Objective Criteria for the Evaluation of Clustering Methods, ,,Journal of the American Statistical Association”, No. 66
Salamaga M. (2008), Badanie podobieństwa struktur portfeli funduszy inwestycyjnych w Polsce w latach 1999—2000. Modelowanie preferencji a ryzyko’07, praca zbiorowa pod red. T. Trzaskalika, Wydawnictwo AE w Katowicach
Sokołowski A. (1995), Percentage Points of the Similarity Measure for Partitions, ,,Statistics in Transition”
Szmigiel Cz. (1976), Wskaźnik zgodności kryteriów podziału, „Przegląd Statystyczny”, nr 4