1. Индекс цитирования.
  2. Роль научного цитирования.
  3. Источники библиометрических данных: зарубежные продукты и российские перспективы.
  4. Что считается цитированием?
  5. «Классический» (синхронный, Гарфилдовский) импакт-фактор.
  6. «Диахронный» импакт-фактор.
  7. Индекс оперативности.
  8. Коэффициенты самоцитируемости и самоцитирования.

  1. Индекс цитирования —

    принятый в научном мире показатель «значимости» трудов какого-либо ученого и представляет собой число ссылок на публикации ученого в реферируемых научных периодических изданиях. Наличие в научно-образовательных организациях ученых, обладающих высоким индексом, говорит о высокой эффективности и результативности деятельности организации в целом. Во-первых, индекс характеризует степень актуальности и важности проводимых исследований для тех областей знаний, в которых работают конкретные ученые или научные коллективы. Во-вторых, высокий индекс цитирования в определенной степени служит официальным признанием конкретного ученого научным сообществом и подтверждением его приоритета.

    В России индекс цитирования с каждым годом все больше внедряется в сферу науки и образования.

    Сегодня этот показатель активно используется:

    • чиновниками различного уровня для оценки деятельности российских ученых и научно-образовательных организаций в целом;
    • чиновниками при проведении экспертизы заявок на финансирование в рамках федеральных целевых программ и других конкурсов;
    • руководителями научно-образовательных учреждений для аттестации научно-педагогических работников и оценки результативности их научной деятельности;
    • издателями научной литературы и научно-технических периодических изданий для прогнозирования востребованности работ конкретного автора у целевой аудитории.
  2. Роль научного цитирования

    Внимание ученых к исследованию научного цитирования объясняется тем, что это эффективный способ изучить коммуникацию в профессиональном сообществе, дисциплинарную структуру науки, механизмы рождения нового знания. Цитирование предоставляет исследователю хотя и не исчерпывающие, но зато объективные показатели. Неполнота данных цитирования обусловлена тем, что немало идей черпается в неформальном общении ученых, в устных диспутах на конференциях и симпозиумах, наконец, при личном контакте специалистов один на один. Отсюда при библиометрическом и наукометрическом анализе приходится довольствоваться «верхушкой айсберга», работать только с опубликованными трудами и, соответственно, с указанными в них источниками, способствовавшими созданию нового научного материала.

    Другое предположение, из которого исходят исследователи науки при использовании существующих и разработке новых индексов научного цитирования, заключается в том, что наиболее зримо процесс научной коммуникации представлен в журнальных публикациях. Периодические издания известны своей оперативностью в отражении новых научных тенденций. Кроме того, любой монографии, как правило, предшествует ряд публикаций в периодике и, таким образом, использованные ученым или коллективом источники в любом случае «засвечиваются» на журнальном поле. Нельзя отрицать научного вклада устных докладов на конференциях, однако, с одной стороны, неупорядоченность и нерегулярность их опубликования нередко выводят доклады за рамки «публикуемого материала» (или оставляют в разряде «серой литературы»), с другой — по-настоящему важные сообщения, прозвучавшие на научных мероприятиях, с большой вероятностью рано или поздно выливаются опять-таки в журнальную статью.

  3. Источники библиометрических данных: зарубежные продукты и российские перспективы

    Основой для анализа структуры цитирований и определения библиометрических показателей являются так называемые «цитатные» базы данных по периодике, в которых собираются не только библиографические данные о журнальных публикациях (автор, заглавие, наименование журнала, год, том, выпуск, страницы), но и пристатейные списки цитируемой литературы. Это позволяет находить как публикации, цитируемые в некоторой статье, так и публикации, цитирующие эту статью. Таким образом, пользователь может проводить эффективный поиск всей библиографии по интересующему его вопросу. В то же время специальная «надстройка» над такой базой данных, агрегирующая сведения по целым журналам, дает доступ специалистам к библиометрическим показателям периодических изданий. На Западе наиболее известные цитатные базы данных представляет линейка продуктов компании Thomson Scientific (бывший Institute for Scientific Information, ISI) — Science Citation Index, Social Sciences Citation Index и Arts & Humanities Citation Index. Агрегированная журнальная библиометрия предоставляется в специальном продукте Journal Citation Reports (JCR).

    Анализ отечественной науки по зарубежным базам затруднителен и неполноценен. Причин — несколько, но основная заключается в том, что лишь небольшая часть журналов, издаваемых в России, включена в иностранные индексы. Так, в JCR представлено менее 7% российских научных изданий из числа входящих в «список ВАКа». В настоящее время существует отечественная цитатная база данных, созданная в рамках проекта «Разработка системы статистического анализа российской науки на основе данных российского индекса цитирования», инициированного Федеральным агентством по науке и инновациям и ведущегося Научной электронной библиотекой (НЭБ, eLIBRARY.RU). В Российский индекс научного цитирования (РИНЦ) в настоящее время входят цитатные данные по более чем 3500 отечественным научным журналам. Помимо библиографической и цитатной информации в РИНЦ включаются сведения об авторах статей и об организациях, в которых они работают. Это позволяет собирать публикационные и цитатные показатели по целым институтам, ведомствам или регионам. Такого рода объективные статистические сведения, в свою очередь, помогут оценивать деятельность научно-образовательных организаций, научных коллективов и отдельных исследователей, а аналогичные данные по журналам позволят в перспективе построить рейтинги изданий. Однако для корректной оценки российской науки при помощи РИНЦ необходимо не только качественное и обширное наполнение базы, но и применение корректных методик для подсчета и анализа различных библиометрических и наукометрических показателей. Далее представлен краткий обзор мирового опыта в данной области.

  4. Что считается цитированием?

    Начнем с основополагающего определения: (1) Статья А цитирует статью Б, если хотя бы один раз в тексте А имеется ссылка на Б и Б, таким образом, вынесена в А в пристатейный список литературы или фигурирует в постраничной сноске. (2) Журнал J цитирует журнал I столько раз, сколько статей из J цитируют статьи из I. Таким образом, если в тексте одной статьи другая публикация упоминается несколько раз, это считается одним цитированием и в ситуации, отраженной на рис. 1, журнал I получил только 5 цитирований из журнала J.

    Несмотря на то, что в принципе можно посчитать, сколько один журнал цитирует другой вообще, то есть на протяжении всей истории существования обоих изданий, на практике всегда выбирается фиксированный промежуток времени как для цитирующих статей, так и для статей цитируемых. Эти два промежутка могут не совпадать (и, как правило, — при подсчете основных библиометрических показателей — действительно не совпадают). Введем также обозначения различных величин, которые будут использоваться в дальнейшем:
    — CITJ (X, Y) — суммарное число цитирований, полученных в году X теми статьями журнала J, которые вышли в нем в году Y (X ≥ Y). Например, CITJ (2004, 2003) — суммарное число статей, вышедших в 2004 г., которые ссылались на работы, опубликованные в J в 2003 г. Здесь следует сделать оговорку о том, что невозможно посчитать все существующие в мире статьи, которые ссылались на публикации журнала J, вышедшие в течение определенного периода. Поэтому каждая база данных, каждый индекс цитирования ограничиваются некоторым фиксированным массивом журналов, из которого учитывают ссылки на другие публикации. В случае Citation Indexes ISI это «множество журналов, расписываемых ISI», в случае Scopus’а — это «журналы, включенные в базу данных Scopus». Для РИНЦ это также будет множество журналов, расписываемых РИНЦ (то есть все журналы ВАКа, плюс, возможно, дополнительные). Таким образом, в процессе библиометрического исследования мы заранее вводим два типа ограничения: по дате выхода цитируемых и цитирующих статей и по набору журналов, включенных в данное исследование.
    — CITJI(X) — число ссылок, полученных журналом I из журнала J в году X (то есть из статей журнала J, вышедших в году X).
    — PUBJ (X) — суммарное число публикаций, вышедших в журнале J в году X.

  5. «Классический» (синхронный, Гарфилдовский) импакт-фактор

    Классический импакт-фактор, то есть то, что понимают под ним по умолчанию, — это, в строгом определении, «синхронный двухлетний импакт-фактор, без учета текущего года». Именно он вычисляется Институтом научной информации ISI и ежегодно публикуется в базе данных Journal Citation Reports. Именно он в наше время чаще всего фигурирует при сравнении уровня журналов. Классический импакт-фактор журнала J в году Y задается выражением:

    [CITJ (Y, Y-1) + CITJ (Y, Y-2)] / [PUBJ (Y-1) + PUBJ (Y-2)],
    то есть отношением числа появившихся во всем массиве журналов за год Y ссылок на статьи журнала J, вышедшие в годах Y-1 и Y-2, к суммарному числу статей, вышедших в J за тот же период, годы Y-1 и Y-2.

    Схематически это поясняется на рис. 2, а «физический смысл» данной величины таков: импакт-фактор журнала — это среднее число цитирований, которое получают в рассматриваемом году статьи, опубликованные в журнале в течение двух предыдущих лет. Несколько замечаний. В действительности ISI в знаменателе считает не полное число вышедших в свет публикаций, а число тех из них, которые могут быть процитированы (citable items). В них ISI включает собственно исследовательские статьи и научные обзоры, оставляя за скобками редакционные заметки, письма в редакцию, новости, отчеты о конференциях и др. «Текущий» год не включен ISI в расчет данного показателя — ссылки года Y на статьи, опубликованные в том же году, не учитываются. Самоцитирование журнала, то есть ссылки в работах, опубликованных в J, на статьи, вышедшие в том же издании, учитывается при подсчете классического импакт-фактора.

  6. «Диахронный» импакт-фактор

    Диахронный импакт-фактор журнала J в году Y вычисляется по формуле:

    [CITJ(Y+2, Y) + CITJ(Y+1, Y)] / PUBJ (Y),
    то есть задается отношением числа появившихся во всем массиве журналов за годы Y+2 и Y+1 ссылок на статьи журнала J, вышедшие в году Y, к суммарному числу статей, вышедших в J в году Y. Схематически это поясняется на рис. 3.

    Смысл данной величины таков: двух-летний диахронный импакт-фактор журнала — это среднее число цитирований, которое опубликованная в журнале статья получает в течение последующих двух лет. В отличие от синхронного импакт-фактора, диахронный показатель учитывает цитирования, которые получают статьи журнала, вышедшие в фиксированном году. По этой причине такой показатель, как полагают многие исследователи, предпочтительнее. В то же время недостатком диахронного импакт-фактора является невозможность его подсчета для текущих двух лет выпуска журнала: например, чтобы вычислить импакт за 2002 г., необходимо ждать, когда закончится 2004 г. При создании РИНЦ синхронный импакт-фактор для журналов можно рассчитать, имея полные данные по цитированию на массиве всех журналов всего за один год, в то время как для нахождения диахронного показателя необходима информация минимум за два полных года. Ввиду того что в случае синхронного импакт-фактора фиксируется год цитирования и исследуется, какие статьи процитированы из прошлых лет, а в случае диахронного — фиксируется год публикации и подсчитываются будущие цитирования опубликованных в этому году работ, синхронный подход также называют ретроспективным, а диахронный — перспективным.

  7. Индекс оперативности

    Индекс оперативности (immediacy index) вычисляется как отношение числа полученных журналом в некотором году ссылок на статьи, вышедшие в том же самом году, к суммарному числу статей, вышедших за данный год в журнале:

    CITJ(Y, Y) / PUBJ(Y).

    Схематически процесс подсчета индекса проиллюстрирован на рис. 4.

    Индекс оперативности показывает, насколько быстро становятся известны в научном мире статьи, опубликованные в журнале: они должны быть процитированы в том же календарном году. Как отмечалось, «текущий» год не учтен при подсчете синхронного и диахронного импакт — факторов, введенных так, как это сделано выше, — ссылки года Y на статьи, опубликованные в том же году Y, в них не учитываются. «Индекс оперативности», таким образом, восполняет этот пробел, учитывая только такие ссылки. В принципе, ничем не хуже классического импакта был бы показатель

    [CITJ(Y, Y) + CITJ(Y, Y-1) + CITJ(Y, Y-2)] / [PUBJ(Y) + PUBJ(Y-1) + PUBJ(Y-2)],
    уже в самом себе заключающий цитирования, отражаемые индексом оперативности. Таким образом, возможны оба подхода, однако ISI придерживается методики с разделением этих двух показателей — импакт-фактора и индекса оперативности.

  8. Коэффициенты самоцитируемости и самоцитирования

    К основным библиометрическим показателям могут быть также отнесены коэффициенты самоцитируемости и самоцитирования журнала. Первый из них равен отношению числа ссылок в публикациях журнала J на тот же самый журнал J к общему числу цитирований, полученных журналом. Коэффициент самоцитирования равен отношению числа ссылок в публикациях журнала J на тот же самый журнал J к общему числу цитирований, которые были произведены из этого журнала. Иными словами, коэффициент самоцитируемости — это доля во всех полученных цитированиях ссылок журнала на самого себя. Коэффициент самоцитирования — это доля во всех сделанных цитированиях ссылок журнала на самого себя. В обоих случаях, разумеется, ссылки рассматриваются на некотором временнoм интервале. В символьном виде данные показатели, посчитанные для журнала J за год X, будут представлены как

    CITJJ(X) / ΣCITIJ(X) и CITJJ(X) / ΣCITJI(X)
    (сумма в обоих случаях берется по всем I, включая сам J).

    Высокий коэффициент самоцитируемости, по замечанию Р. Руссо, говорит о малой заметности журнала, в то время как высокий коэффициент самоцитирования свидетельствует скорее о замкнутости, изолированности дисциплины, в которой специализируется издание.

    Отметим также, что исследование ISI показывает, что исключение самоцитирования при вычислении импакт-факторов журналов (то есть учет только цитирований, полученных из других изданий) несильно влияет на рейтинг ведущих журналов с большим импактом, хотя на некоторое число менее цитируемых изданий изъятие цитат на самих себя оказывает ощутимое влияние. В целом обнаруживается следующая закономерность: основная масса журналов с высоким коэффициентом самоцитируемости — это малоцитируемые журналы. Таким образом, один из интересных экспериментов, которые можно будет поставить на материале Российского индекса научного цитирования РИНЦ, — это проверка, выполняется ли для российских журналов предсказание, что «любой редактор, поддающийся искушению принудить своих авторов цитировать в статьях собственный журнал, должен быть готов к неудаче». Это означает проверку, действительно ли и для отечественных изданий не наблюдается связи между заметным коэффициентом самоцитируемости и высоким импакт-фактором журнала.

Книги