Часть серии статей о |
Метрики цитирования |
---|
Метрики на уровне автора — это метрики цитирования , которые измеряют библиометрическое влияние отдельных авторов, исследователей, ученых и ученых. Было разработано много метрик, которые учитывают различное количество факторов (от учета только общего количества цитирований до рассмотрения их распределения по статьям или журналам с использованием статистических или графово-теоретических принципов).
Эти количественные сравнения между исследователями в основном проводятся для распределения ресурсов (таких как деньги и академические должности). Однако в академическом мире все еще ведутся споры о том, насколько эффективно метрики на уровне автора выполняют эту задачу. [1] [2] [3]
Метрики на уровне автора отличаются от метрик на уровне журнала , которые пытаются измерить библиометрическое влияние академических журналов, а не отдельных лиц. Однако метрики, изначально разработанные для академических журналов, могут быть представлены на уровне исследователя, например, собственный фактор на уровне автора [4] и импакт-фактор автора. [5]
Имя | Описание |
---|---|
h -индекс | Формально, если f — это функция, которая соответствует количеству цитирований для каждой публикации, h -индекс вычисляется следующим образом. Сначала мы упорядочиваем значения f от наибольшего к наименьшему значению. Затем мы ищем последнюю позицию, в которой f больше или равна позиции (мы называем эту позицию h ). Например, если у нас есть исследователь с 5 публикациями A, B, C, D и E с 10, 8, 5, 4 и 3 цитированиями соответственно, h -индекс равен 4, потому что 4-я публикация имеет 4 цитирования, а 5-я — только 3. Напротив, если те же публикации имеют 25, 8, 5, 3 и 3 цитирования, то индекс равен 3, потому что четвертая статья имеет только 3 цитирования. [1] |
Индивидуальный индекс Хирша | Был предложен индивидуальный h -индекс, нормализованный по числу авторов: , где — число авторов, рассматриваемых в статьях. [6] Было обнаружено, что распределение h -индекса, хотя оно и зависит от области, может быть нормализовано простым масштабирующим множителем. Например, если принять за стандарт h s для биологии, распределение h для математики схлопнется вместе с ним, если этот h умножить на три, то есть математик с h = 3 эквивалентен биологу с h = 9. Этот метод не был легко принят, возможно, из-за его сложности. |
Дробный индекс Хирша | Чтобы избежать стимулирования гиперавторства с более чем 100 соавторами на статью, может быть проще разделить количество цитирований на количество авторов перед заказом статей и получением дробного индекса Хирша , как изначально предлагал Хирш. Этот индекс, также называемый h-frac, не сильно коррелирует с индексом Хирша и в настоящее время коррелирует с научными наградами. [7] |
ч 2 | Были предложены три дополнительных показателя: h 2 lower, h 2 center и h 2 upper, чтобы дать более точное представление о форме распределения. Три показателя h 2 измеряют относительную область в распределении цитирования ученого в области с низким влиянием, h 2 lower, область, охваченную индексом h 2 center , и область из публикаций с самой высокой видимостью, h 2 upper . Ученые с высоким процентом h 2 upper являются перфекционистами, тогда как ученые с высоким процентом h 2 lower являются массовыми производителями. Поскольку эти показатели являются процентами, они предназначены для того, чтобы дать качественное описание в дополнение к количественному индексу h . [8] |
Нормализованный индекс Хирша | Было показано, что индекс h имеет сильную предвзятость по дисциплине. Однако простая нормализация по среднему h ученых в дисциплине d является эффективным способом смягчить эту предвзятость, получив универсальную метрику воздействия, которая позволяет сравнивать ученых из разных дисциплин. [9] |
Собственный фактор на уровне автора | Eigenfactor на уровне автора — это версия Eigenfactor для отдельных авторов. [10] Eigenfactor рассматривает авторов как узлы в сети цитирований. Оценка автора по этой метрике — это его или ее центральность собственного вектора в сети. |
Число Эрдёша | Утверждалось, что «для отдельного исследователя такая мера, как число Эрдёша, фиксирует структурные свойства сети, тогда как индекс Хирша фиксирует цитируемость публикаций. Можно легко убедиться, что ранжирование в сетях соавторства должно учитывать обе меры для создания реалистичного и приемлемого ранжирования». Уже было предложено несколько систем ранжирования авторов, например, алгоритм ранжирования авторов Phys. [11] |
i-10-индекс | Индекс i-10 указывает на количество академических публикаций автора, которые были процитированы не менее чем в 10 источниках. Он был введен в июле 2011 года компанией Google в рамках работы над Google Scholar . [12] |
Оценка РГ | ResearchGate Score или RG Score — это метрика на уровне автора, представленная ResearchGate в 2012 году. [13] По словам генерального директора ResearchGate доктора Иджада Мадиша , «RG Score позволяет получать обратную связь в режиме реального времени от людей, которые имеют значение: самих ученых». [14] Сообщается, что RG Score коррелирует с существующими метриками на уровне автора и имеет нераскрытую методологию расчета. [15] [16] [17] [18] В двух исследованиях сообщается, что RG Score, по-видимому, включает в расчет импакт-факторы журналов . [17] [18] Было обнаружено, что RG Score отрицательно коррелирует с центральностью сети — пользователи, которые наиболее активны на ResearchGate, обычно не имеют высоких RG-баллов. [19] Также было обнаружено, что он сильно положительно коррелирует с рейтингами университетов Quacquarelli Symonds на институциональном уровне, но лишь слабо с рейтингами отдельных авторов Elsevier SciVal. [20] Хотя было обнаружено, что это коррелирует с различными рейтингами университетов, корреляция между этими рейтингами была выше. [15] |
Влияние цитирования, взвешенное по области | Field-weighted Citation Impact (FWCI) — это метрика на уровне автора, введенная и применяемая Scopus SciVal. [21] FWCI равен общему количеству фактически полученных цитирований, деленному на общее количество цитирований, которое можно было бы ожидать на основе среднего значения рассматриваемой области. FWCI, равный 1, означает, что результат соответствует ожидаемому среднему значению в мире. Больше 1 означает, что автор превосходит среднее значение, а меньше 1 означает, что автор отстает. Например, означает на % большую вероятность быть процитированным. [22] [23] |
m -индекс | Индекс m определяется как h / n , где h — индекс h , а n — количество лет, прошедших с момента первой опубликованной статьи ученого; [1] также называется m -частным. [24] [25] |
g -индекс | Для g -индекса , введенного в 2006 году, как наибольшего числа лучших статей, которые получили в совокупности не менее цитирований. [26] |
e -индекс | Индекс e , квадратный корень из избыточных цитирований для набора h за пределами h 2 , дополняет индекс h для игнорируемых цитирований и поэтому особенно полезен для высокоцитируемых ученых и для сравнения с теми, у кого тот же индекс h (группа изо- индекса h ). [27] [28] |
с -индекс | Индекс c учитывает не только цитирования, но и качество цитирований с точки зрения расстояния сотрудничества между цитирующими и цитируемыми авторами. Ученый имеет индекс c n, если n из [его/ее] N цитирований принадлежат авторам, которые находятся на расстоянии сотрудничества не менее n , а остальные ( N − n ) цитирований принадлежат авторам, которые находятся на расстоянии сотрудничества не более n . [29] |
о -индекс | Индекс o соответствует геометрическому среднему индексу h и наиболее цитируемой статье исследователя. [30] |
RA-индекс | Индекс RA обеспечивает улучшение чувствительности индекса h к числу высокоцитируемых статей и имеет много цитируемых и нецитируемых статей под ядром h . Это улучшение может повысить чувствительность измерения индекса h . [31] |
L -индекс | L -индекс объединяет количество цитирований, количество соавторов и возраст публикаций в единое значение, которое не зависит от количества публикаций и удобно варьируется от 0,0 до 9,9. [32] Если c — количество цитирований, a — количество авторов и y — количество лет, L -индекс определяется по формуле: L -индекс автоматически рассчитывается базой данных Exaly. [33] |
s -индекс | Был предложен s - индекс, учитывающий неэнтропийное распределение цитирований, и было показано, что он находится в очень хорошей корреляции с h . [34] |
w -индекс | w -индекс определяется следующим образом: если w статей исследователя имеют по крайней мере цитирований каждая, а другие статьи имеют меньше цитирований, то w -индекс этого исследователя равен w . [35] |
Фактор влияния автора | Фактор влияния автора (AIF) — это фактор влияния, применяемый к авторам. [5] AIF автора в году — это среднее число ссылок, данных статьями, опубликованными в году, на статьи, опубликованные в период лет до года . В отличие от индекса Хирша, AIF способен улавливать тенденции и изменения влияния научных результатов ученых с течением времени, что является растущей мерой, учитывающей весь путь карьеры. |
Существует ряд моделей, предложенных для включения относительного вклада каждого автора в статью, например, путем учета ранга в последовательности авторов. [36] Было предложено обобщение h -индекса и некоторых других индексов, которое дает дополнительную информацию о форме функции цитирования автора (тяжелохвостая, плоская/пиковая и т. д.). [37] Поскольку h -индекс никогда не предназначался для измерения будущего успеха публикации, недавно группа исследователей изучила характеристики, которые являются наиболее предсказательными для будущего h -индекса. Можно попробовать предсказать, используя онлайн-инструмент. [38] Однако более поздняя работа показала, что поскольку h -индекс является кумулятивной мерой, он содержит внутреннюю автокорреляцию, которая привела к значительной переоценке его предсказуемости. Таким образом, истинная предсказуемость будущего h -индекса намного ниже по сравнению с тем, что утверждалось ранее. [39] h - индекс можно синхронизировать для анализа его эволюции в течение карьеры, используя различные временные окна. [40]
Некоторые ученые, такие как физик Хорхе Э. Хирш , восхваляли метрики на уровне автора как «полезный критерий, с помощью которого можно беспристрастно сравнивать разных людей, конкурирующих за один и тот же ресурс, когда важным критерием оценки являются научные достижения». [1] Однако другие члены научного сообщества и даже сам Хирш [41] критиковали их как особенно подверженные обману системы . [2] [3] [42]
Работа в области библиометрии продемонстрировала множество методов манипулирования популярными метриками на уровне автора. Наиболее используемым метрическим индексом Хирша можно манипулировать посредством самоцитирования, [43] [44] [45] и даже сгенерированные компьютером бессмысленные документы могут быть использованы для этой цели, например, с помощью SCIgen . [46] Метриками также можно манипулировать посредством принудительного цитирования , практики, при которой редактор журнала заставляет авторов добавлять ложные ссылки в свои собственные статьи, прежде чем журнал согласится их опубликовать. [47] [48]
Кроме того, если индекс Хирша рассматривается как критерий принятия решений для агентств по финансированию исследований, то теоретико-игровое решение этой конкуренции подразумевает увеличение средней длины списков соавторов . [49] Исследование, анализирующее >120 миллионов статей в конкретной области биологии, показало, что обоснованность мер, основанных на цитировании, ставится под угрозу, а их полезность уменьшается. [50] Как и предсказывает закон Гудхарта , количество публикаций больше не является хорошим показателем из-за более коротких статей и более длинных списков авторов.
Лео Силард , изобретатель ядерной цепной реакции , также высказал критику системы принятия решений о научном финансировании в своей книге «Голос дельфинов и другие истории». [51] Сенатор Дж. Листер Хилл зачитал отрывки из этой критики на слушаниях в сенате в 1962 году по поводу замедления финансируемых правительством исследований рака . [52] Работа Силарда сосредоточена на показателях, замедляющих научный прогресс, а не на конкретных методах игры:
«На самом деле, я думаю, это было бы довольно легко. Вы могли бы создать фонд с ежегодным пожертвованием в тридцать миллионов долларов. Исследователи, которым нужны средства, могли бы подавать заявки на гранты, если бы они могли убедительно изложить свои доводы. Создайте десять комитетов, каждый из которых состоял бы из двенадцати ученых, назначенных для рассмотрения этих заявок. Возьмите самых активных ученых из лаборатории и сделайте их членами этих комитетов. И самых лучших людей в этой области следует назначить председателями с зарплатой в пятьдесят тысяч долларов каждый. Также учредите около двадцати премий по сто тысяч долларов каждая за лучшие научные работы года. Это все, что вам нужно будет сделать. Ваши юристы могли бы легко подготовить устав фонда. На самом деле, любой из законопроектов Национального научного фонда, которые были представлены на Семьдесят девятом и Восьмидесятом Конгрессах, мог бы прекрасно послужить моделью».
«Во-первых, лучших ученых отстранят от лабораторий и заставят работать в комитетах, рассматривающих заявки на финансирование. Во-вторых, научные работники, которым нужны средства, сосредоточатся на проблемах, которые считаются многообещающими и которые наверняка приведут к результатам, пригодным для публикации. В течение нескольких лет может наблюдаться значительный рост научной продукции; но, если следовать очевидному, наука довольно скоро иссякнет. Наука станет чем-то вроде салонной игры. Что-то будет считаться интересным, что-то нет. Появится мода. Те, кто следует моде, получат гранты. Те, кто не будет, не получат, и довольно скоро они научатся следовать моде». [51]
Я предложил индекс Хирша, надеясь, что он станет объективной мерой научных достижений. В общем и целом, я думаю, что так и есть. Но теперь я пришел к убеждению, что он также может потерпеть сокрушительную неудачу и иметь серьезные непреднамеренные негативные последствия. Я могу понять, что чувствовал ученик чародея. (стр. 5)