Индекс Хирша
И́ндекс Хи́рша (h-индекс, англ. h-index, Hirsch index), библиометрический показатель, введённый физиком из Калифорнийского университета (США) Х. Хиршем в 2005 г. Предложен для оценивания учёных (авторов научных статей). Исходное определение (Hirsch. 2005) может быть сформулировано так: индекс Хирша учёного, написавшего N статей, равен h, если каждая из h его публикаций получила не менее h ссылок (цитирований), в то время как каждая из остальных (N − h) публикаций получила не более h ссылок. Данное определение также эквивалентно следующему: индекс Хирша учёного, написавшего N статей, равен h, если существует h его статей, каждая из которых получила не менее h ссылок (цитирований), но не существует (h + 1) статей, каждая из которых получила бы не менее (h + 1) ссылок.
Графическое определение
Распространена графическая иллюстрация определения h-индекса (рисунок). Множество публикаций учёного, упорядоченное по убыванию числа полученных ими ссылок, изображено на графике. По оси абсцисс на рисунке отложен порядковый номер публикации при такой сортировке. По оси ординат – число ссылок (цитирований), которое получила статья с соответствующим номером. Индекс Хирша будет соответствовать максимальному номеру статьи, находящейся не ниже прямой y = x (т. е. расположенной выше или на этой прямой).
Обобщение индекса Хирша и его преимущества
Если задано любое конечное множество из N статей и для каждой статьи известно целое неотрицательное число ссылок (цитирований), которое она получила, то индекс Хирша для этого множества существует и единственен. Поскольку при этом неважно, откуда берётся данное множество статей, введённый изначально для авторов индекс Хирша был распространён на авторские коллективы, организации, страны, научные журналы.
В исходной работе Х. Хирш (Hirsch. 2005) отмечал преимущества введённого им показателя. Как утверждает автор, он лучше следующих показателей: суммарного числа статей учёного, поскольку оно не отражает значимость, влиятельность его работ; суммарного числа полученных учёным ссылок, поскольку оно может быть обусловлено ограниченным числом высокоцитируемых статей или участием учёного во многих соавторских коллаборациях; среднего числа ссылок на статью, поскольку оно также зависимо от одного или нескольких высокоцитируемых «выбросов»; числа «важных статей», получивших больше ссылок, чем некоторое пороговое количество, поскольку значение порога выбирается произвольно; подсчёта ссылок на каждую из нескольких q наиболее цитируемых статей, поскольку это несколько значений, а не единый индикатор и, кроме того, число учитываемых «лучших статей» q снова произвольно.
В целом передовой характер индекса Хирша, по мнению специалистов, состоит в том, что данный показатель стремится одним числом отразить одновременно и продуктивность учёного (число опубликованных статей), и значимость для науки его исследований (число полученных публикациями ссылок). Увеличение публикационной активности без достаточной цитируемости публикуемых работ не приведёт к росту индекса Хирша. И наоборот, получение большого числа цитирований одной-двумя статьями также не повысит показатель серьёзным образом. Например, если учёный написал 50 статей, но при этом каждая из них получила всего по 5 ссылок, индекс Хирша учёного будет равен 5. С другой стороны, если автор написал 5 статей, каждая из которых получила по 50 ссылок, его индекс всё равно будет равен 5. Для достижения высокого значения индекса Хирша необходимо, чтобы автор писал много таких работ, каждая из которых получала бы много цитирований.
Критика и недостатки
С момента выхода работы Х. Хирша (2005) было выявлено значительное число методологических погрешностей h-индекса. Наиболее серьёзными среди них являются следующие.
В исходном определении индекс Хирша не может уменьшаться с течением времени – только расти или оставаться прежним. Это даёт преимущество зрелым учёным над молодыми и, кроме того, не позволяет оценить текущий научный статус автора: учёный может сменить род деятельности или прекратить работу, уйти на пенсию, однако h-индекс его будет оставаться не ниже, чем на пике академической карьеры. Для коррекции специалистами по библиометрии предлагались варианты индекса Хирша, так или иначе вводящие в расчёт время выхода учитываемых публикаций и период их цитирования (The R- and AR-indices ... 2007).
Индекс Хирша не предполагает поправки на дисциплинарную область: сравнение абсолютных значений индекса у учёных, работающих в разных областях науки, невозможно; это не нормализованный по областям науки показатель. Более того, в отличие от, например, импакт-фактора, способ его нормализации не так очевиден.
Индекс Хирша – это целое число, следовательно, он не обладает хорошей «разрешающей способностью», скачкообразно меняясь в течение научной карьеры учёного. Были предложены способы обобщить h-индекс на дробные значения (Ruane. 2008; Guns. 2009), однако они не получили широкого распространения.
В индексе Хирша не учитывается фактическое число ссылок, полученное статьями выше и ниже точки h, – важно только местонахождение этой точки. Если бы каждая из h наиболее цитируемых статей учёного получила многократно больше ссылок или, наоборот, (h + 1)-я статья и последующие вообще не цитировались, на значении h-индекса это бы никак не отразилось.
Для иллюстрации последнего замечания можно рассмотреть гипотетический пример двух учёных, один из которых опубликовал 5 статей, а второй – 50. Все 5 статей первого автора получили по 5 цитирований каждая. Пять статей второго автора получили по 100 ссылок каждая, остальные 45 – по 5 ссылок каждая. В этом случае, при интуитивно понятном неравенстве вклада авторов в науку, их индекс Хирша будет иметь одинаковое значение – 5.
Модификации индекса и трансформация отношения к нему научного сообщества
В первые годы после изобретения индекс Хирша приобрёл большую популярность в сообществе учёных и администраторов науки, стал предметом разносторонних исследований. Интерес подогревался созданной незадолго до этого (2004) базой данных научного цитирования Scopus компании Elsevier, которая внедрила и стала рассчитывать h-индекс в качестве флагманского наукометрического показателя вместо использовавшегося конкурентами импакт-фактора. Многие работы также были посвящены усовершенствованию показателя и созданию различных его модификаций. Среди последних наибольшее распространение получил предложенный в 2006 г. классиком библиометрии Л. Эгге g-индекс, который учитывает сумму всех g наиболее цитируемых статей и меняет критерий на квадратичный (Egghe. 2006). Из остальных попыток развития h-индекса могут быть названы m-индекс (Bornmann. 2008), hα-индекс (Eck. 2008) и близкая пара A/AR-индексов (The R- and AR-indices ... 2007). Наиболее полный и подробный разбор вариаций сделан в работе коллектива авторов «Обзор h-индекса и его альтернативных индексов» (Bihari. 2023).
Позднее, с середины 2010-х гг., в сообществе специалистов по библиометрии и оценке науки рос скепсис относительно возможности использования индекса Хирша в качестве фундаментального, несущего важный смысл показателя. Попытки изобрести библиометрический индикатор, который мог бы характеризовать исследователя или коллектив одним универсальным числом, «скалярная методика», стали уступать место «векторному» подходу, разработке комплекса показателей, дополняющих друг друга и позволяющих количественно оценить различные аспекты научного творчества учёного. Коллективные инициативы по выработке правил проведения количественной оценки научной деятельности, например «Лейденский манифест» (The Leiden Manifesto for research metrics. 2015) или соглашение CoARA (Coalition for Advancing Research Assessment. 2022), в явном виде предостерегают от необдуманного использования индекса Хирша.