Обсуждение пользователя:PockBot

АрхивСтарые темы перемещаются в User:PockBot/Archive после ответа на них.

Категория:Лонг-Бич, Калифорния

Я только что заставил PockBot выполнить запуск по категории: Лонг-Бич, Калифорния ( обсуждение ). Для обоих Лонг-Бич, Калифорния и Сигнал-Хилл, Калифорния , он сказал " еще не классифицировано ", хотя обе статьи имеют рейтинг. Я увидел три или четыре ошибки 404, хотя на странице PockBot было указано, что она работает, когда загрузка Википедии была очень низкой. Это ли причина того, что PockBot не записал классификации для этих страниц? Blank Verse 10:34, 11 января 2007 (UTC) [ ответить ]

Спасибо за ваше сообщение. Похоже, что wikiproject, который оценил эту статью, использует немного другой текстовый формат для вывода своих оценок, поэтому он не сопоставил шаблон в коде бота. Я обновил бот сейчас, чтобы учесть это изменение, и при повторном запуске он должен правильно помечать эти статьи. Ошибки 404 при низкой нагрузке на сервер были бы очень необычными, но бот просто делает запросы, как и вы и я, поэтому если он получил запрос 404, это означает, что была либо проблема с сервером в Википедии (это иногда случается), либо проблема с сетью где-то между Википедией и ботом. Я сам только что получил несколько ошибок Википедии при просмотре, так что на сайте могут быть небольшие проблемы. В качестве отступления отмечу, что вы закомментировали заголовок на странице результатов. Просто из интереса для дальнейшего развития бота, в чем была причина этого? Вызвало ли это вообще проблему в вашем браузере? Это сделано для того, чтобы обеспечить простую сортировку результатов по любому из столбцов. Большое спасибо, и спасибо за использование бота - PocklingtonDan 10:49, 11 января 2007 (UTC) [ ответить ]

Обработка цикла; отчеты потомков Cat; установка ограничений сканирования

Несколько вопросов, которые стоит рассмотреть или прочитать у User:PockBot :

  1. Я считаю, что теперь считается, по крайней мере, неизбежным, что структура системы Cat не должна быть DAG . Возможно ли предоставить краткое изложение реакции бота на полное прохождение цикла?
  2. В какой-то момент система Cat была улучшена для динамического исследования на одной странице потомкового (квази-)дерева Cat. Но может ли PockBot предоставить полезный вывод, отражающий полное потомковое (квази-)дерево, которое он посещает для данного запроса?
  3. Длинное предисловие : AFAI может увидеть, что потребовалось бы значительное расширение системы Cat, если бы она поддерживала алгоритмы путешествий, направленные на включение только того, что я мог бы назвать потомками Cat, основанными на «здравом смысле». (Например, Испания , вероятно, не является потомком Category:Countries , но, несомненно, является потомком, а также потомком, основанным на здравом смысле , потому что это страна . С другой стороны, Category:Spain , безусловно, имеет много статей-потомков, темами которых являются не страны, а скорее аспекты страны Испания: например, Коррида предположительно является потомком, но не основанным на здравом смысле, Category:Countries .
Короткий вопрос : можно ли запретить PockBot следовать членству в Cat, которое включает потомков, не соответствующих здравому смыслу? -- я полагаю, с помощью синтаксиса вроде
Исключить/Включить <Cat>/<Catlist> [Исключить <Cat>/<Catlist>]
и опция «включить родительский элемент, но не включать дочерний элемент», если это не подразумевается в том, что я сказал.

-- Ежиt 23:38, 31 января 2007 (UTC) [ ответить ]

Привет. PockBot работает следующим образом - он извлекает список всех подкаталогов в категории, затем все подкаталоги каждого из этих подкаталогов, затем снова и т. д. Затем он начинает извлекать статьи по иерархической основе (т. е. сначала из главного каталога, затем из подкаталогов, затем из под-подкатегории и т. д.).
PockBot — это бот, и поэтому он глупый. Было бы безнадежно пытаться запрограммировать его на принятие здравых суждений о потомках категории. Я заметил описанный вами феномен, когда подкатегории связаны с их родительским котом, но не с котом родителя этого родителя. Однако в большинстве случаев я обнаружил, что это просто случай неправильной категоризации на каком-то уровне, и что-то, что я затем исправил. В меньшем количестве случаев я обнаружил, что это не неправильная категоризация как таковая , а скорее разные интерпретации того, какой должна быть категория. Например, для категории «Люди» я бы ожидал найти только реальных исторических или современных людей. Однако подкатегории могут содержать мультяшных или вымышленных людей, таких как «Джессика Рэббит» и «Зорро». На самом деле это больше проблема, связанная с тем, что названия категорий слишком расплывчаты, и один человек интерпретирует людей как «реальных людей, живых или мертвых», а другой — как «все, что можно считать человеком, вымышленным или реальным».
В идеальном мире, основываясь на моем опыте работы с PockBot, я бы хотел, чтобы поисковая статья была помещена в одну и только одну иерархическую категорию, и для каждой категории было бы вспомогательное имя или тег, который указывает, какие элементы должны в ней быть. Например, «коррида» НЕ должна быть указана в подкатегории Испании, поскольку ее родитель — страна, она должна быть указана только в категории «спорт» или подобной.
В заключение следует сказать, что PockBot выявляет множество недостатков текущей системы категоризации, но, к сожалению, не имеет способа их обойти.
Будет ли полезно иметь опцию «игнорировать подкатегории и получать только статьи из корневого категорического каталога»?
Спасибо - PocklingtonDan 07:19, 1 февраля 2007 (UTC) [ ответить ]

Люди-кошки

Насколько плохой идеей было бы запустить PockBot против Category:People , в свете

  1. неизвестное количество и размер циклов,
  2. влияние на производительность, учитывая 6-значную шкалу реальных людей, происходящую от категории:Люди ( только категория:Живые люди имеет 152 тыс. записей), и
  3. в чем сложность отсеивания потомков такого масштаба, которые не являются реальными людьми?

-- Ежит

Привет. Это не было бы плохой идеей, хотя и не было бы для тебя особенно полезным - у PockBot есть встроенный код, который отключается после цикла, если номер статьи достиг определенного порога (я думаю, около 2000). Затем он уведомит тебя о статьях, извлеченных на данный момент, и что это представляет собой подмножество всех статей в этой категории. Таким образом, ты увидишь список и статус определенного количества статей, но для категории такого размера далеко не всех. Бот на самом деле предназначен только для использования на небольших, управляемых кошках, чтобы дать указание на статусы статей, которые затем можно будет исследовать или оценить вручную и т. д. - PocklingtonDan 07:04, 1 февраля 2007 (UTC) [ ответить ]

Это автоматизировано для всех операторов ботов.

Пожалуйста, уделите несколько минут и заполните данные для вашего бота на Wikipedia:Bots/Status Спасибо Betacommand ( обсуждениевкладБот ) 19:44, 12 февраля 2007 (UTC) [ ответить ]

Перечисление подкатегорий без статей в них

На WT:UCFD есть план просмотреть все существующие категории пользователей, чтобы обнаружить структурные проблемы и предложить соглашения об именовании. Пользователь:Jc37 вызвался просмотреть каждую категорию пользователей, но их много, поэтому мне интересно, сможет ли бот вроде PockBot пройти по Category:Wikipedians и сбросить все подкатегории в отступный список, не перечисляя отдельные страницы пользователей, которые принадлежат этим подкатегориям. Это единственный бот, который я нашел, который выполняет похожую задачу, но если это слишком отличается от того, что он делает, я спрошу на Wikipedia:Bot requests . – Pomte 17:51, 18 апреля 2007 (UTC) [ ответить ]

PockBot можно было бы легко модифицировать для этого, но у меня нет времени. Я могу предоставить исходный код любому, кто захочет использовать мой код для этого, на bot requests. Привет - PocklingtonDan ( talk ) 15:51, 19 апреля 2007 (UTC) [ ответить ]

не работает

Я пытался использовать PockBot для категорий Категория:Brisbane Broncos и Категория:Brisbane Broncos регбийные игроки, но прошло уже 24 часа, а ничего не появилось. SpecialWindler talk 08:09, 18 июля 2007 (UTC) [ ответить ]

Ошибка?

Здравствуйте, просто хочу сообщить, что я запустил PockBot в категории «Шахматы» и получил следующее сообщение об ошибке:
«Чт 16 авг 11:07:03 2007] PockBot.cgi: не удалось запустить поток: невозможно вызвать метод «find_input» для неопределенного значения в /files/home2/thepaty/cgi-bin/PockBot.cgi, строка 443». SyG 10:24, 16 августа 2007 (UTC) [ ответить ]

Счетчик количества страниц

Я искал инструмент, который мог бы подсчитывать количество страниц в категории. Этот бот, кажется, является возможным источником для этого с небольшими изменениями. Вы бы рассмотрели возможность сделать это? или написать более простого бота, который только подсчитывает страницы? Dbiel ( Talk ) 20:04, 26 сентября 2007 (UTC) [ ответить ]

Бот выключен

Бот выключен — Предыдущий неподписанный комментарий добавлен Rabbit67890 ( обсуждениевклад ) 20:24, 20 февраля 2008 (UTC) [ ответить ]

Взято с "https://en.wikipedia.org/w/index.php?title=User_talk:PockBot&oldid=1141436801"