Это страница обсуждения для обсуждения улучшений статьи по кластерному анализу . Это не форум для общего обсуждения темы статьи. |
|
Найти источники: Google (книги · новости · ученые · бесплатные изображения · ссылки WP) · FENS · JSTOR · TWL |
Архивы : 1Период автоматического архивирования : 12 месяцев |
Эта статья имеет рейтинг C-класса по шкале оценки контента Википедии . Она представляет интерес для следующих WikiProjects : | ||||||||||||||||||||||||||||||||||||||||||||||||
|
Text has been copied to or from this article; see the list below. The source pages now serve to provide attribution for the content in the destination pages and must not be deleted as long as the copies exist. For attribution and to access older versions of the copied text, please see the history links below.
|
This article is substantially duplicated by a piece in an external publication. Since the external publication copied Wikipedia rather than the reverse, please do not flag this article as a copyright violation of the following source:
|
The content of this article has been derived in whole or part from https://github.com/eXascaleInfolab/clubmark/tree/master/docs. Permission has been received from the copyright holder to release this material under both the Creative Commons Attribution-ShareAlike 3.0 Unported license and the GNU Free Documentation License. You may use either or both licenses. Evidence of this has been confirmed and stored by VRT volunteers, under ticket number 2019021110001288. Also available under Creative Commons Attribution 4.0 and Apache 2.0 This template is used by approved volunteers dealing with the Wikimedia volunteer response team system (VRTS) after receipt of a clear statement of permission at permissions-enwikimedia.org. Do not use this template to claim permission. |
Может ли кто-нибудь сделать infinity-norm ссылкой: infinity-norm
(Статья в настоящее время заблокирована.)
Похоже, эта страница была намеренно испорчена.
Пожалуйста, разблокируйте эту страницу.
Поиск в Google по запросу "V-means clustering" возвращает только эту статью из Википедии. Может ли кто-нибудь дать ссылку на нее?
для будущего использования, это параграф V-means, который был удален
This article possibly contains original research. (October 2007) |
This article contains weasel words: vague phrasing that often accompanies biased or unverifiable information. (March 2009) |
Кластеризация V-средних использует кластерный анализ и непараметрические статистические тесты для ключевых исследователей в сегментах данных, которые могут содержать отдельные однородные подмножества. Методология, принятая кластеризацией V-средних, обходит многие проблемы, которые традиционно осаждают стандартные методы категоризации данных. Во-первых, вместо того, чтобы полагаться на прогнозы аналитиков относительно количества отдельных подмножеств (кластеризация k-средних), кластеризация V-средних генерирует оптимальное по Парето количество подмножеств. Кластеризация V-средних калибруется до используемого уровня достоверности p, посредством чего алгоритм делит данные, а затем рекомбинирует полученные группы до тех пор, пока вероятность того, что любая заданная группа принадлежит к тому же распределению, что и любой из ее соседей, не станет меньше p.
Во-вторых, кластеризация V-средних использует повторные итерации непараметрического теста Колмогорова-Смирнова. Стандартные методы разделения данных на составные части часто запутываются в определениях расстояний (кластеризация по мере расстояния) или в предположениях о нормальности данных (кластеризация с максимизацией ожидания), но непараметрический анализ делает выводы из функций распределения множеств.
В-третьих, метод концептуально прост. Некоторые методы объединяют несколько методов последовательно, чтобы получить более надежные результаты. С практической точки зрения это запутывает смысл результатов и часто приводит к выводам, типичным для «выемки данных».
Я считаю, что в слове «типологический анализ» опечатка; должно быть «топологический».
Объяснение алгоритма нечетких c-средних кажется довольно сложным для понимания, фактический порядок пунктов списка правильный, но то, какой фрагмент следует повторять и когда, вводит в заблуждение.
«Нечеткий алгоритм c-средних во многом похож на алгоритм k-средних:
Кроме того, разве c-средние и k-средние не являются просто разными названиями одного и того же? В таком случае можно ли их изменить, чтобы они были единообразными?
Кластеризация c-means относится только к алгоритму кластеризации нечеткой логики. Можно сказать, что k-means — это конвергенция c-кластеризации с обычной логикой, а не с нечеткой логикой.
Раздел, посвященный кластеризации на основе сетки, не имеет реальных ссылок и плохо описан по сравнению с остальной частью статьи.