Сбалансированная кластеризация — это особый случай кластеризации , где, в самом строгом смысле, размеры кластеров ограничены или , где — количество точек, а — количество кластеров. [1] Типичным алгоритмом является сбалансированный алгоритм k-средних , который минимизирует среднеквадратичную ошибку (MSE) . Другой тип сбалансированной кластеризации, называемый кластеризацией на основе баланса, имеет двухцелевую функцию стоимости, которая минимизирует как дисбаланс, так и MSE. Типичными функциями стоимости являются ratio cut [2] и Ncut. [3] Сбалансированную кластеризацию можно использовать, например, в сценариях, когда грузы должны быть доставлены в пункты назначения автомобилями. Тогда предпочтительно, чтобы каждый автомобиль доставлял грузы в равное количество пунктов.
Существуют реализации для сбалансированного k-средних [4] и Ncut [5]
Левин, М. Ш. (2017). «О сбалансированной кластеризации (индексы, модели, примеры)». Журнал коммуникационных технологий и электроники . 62 (12): 1506– 1515. doi :10.1134/S1064226917120105. S2CID 255277095.