Первые индексы и ранние метрики

Выше квартилей

«Я часто говорю, что когда вы можете измерить то, о чем говорите, и выразить это в цифрах, вы что-то об этом знаете; но когда вы не можете измерить это, когда вы не можете выразить это в цифрах, ваши знания скудны и неудовлетворительны; это может быть началом знаний, но вы едва ли, по вашим представлениям, продвинулись до стадии науки, о чем бы ни шла речь». (с) Уильям Томпсон, лорд Кельвин [Thomson, 1889].

Сегодня индекс цитирования, разнообразные метрики журналов и продуктивности самих исследователей являются привычными для научной среды в связи с большим объемом данных и необходимостью в них ориентироваться. Однако такое внимание к индексации научных работ не всегда было самоочевидным и появилось в определенный исторический период. В этом посте мы постараемся осветить историю появления метрик, а также периода науки, когда метрики и цитирования еще не были полноценным инструментом и применялись ad hoc.

Как пишет американская исследовательница Белла Вайнберг, самые ранние индексы были составлены преимущественно в области теологии [Weinberg, 1999]. Например, алфавитные списки слов и выражений из еврейской Библии были составлены в X веке, а различные предметные индексы появились во французской литературе в XIII веке [Weinberg, 2000а]. Первый индекс цитат к печатной книге датируется 1511 годом и был написан на иврите [Weinberg, 1997].

Исследователь Фред Шапиро пишет, что историками библиометрии долгое время игнорировался опыт индексации и подсчета цитирований в судебных делах [Shapiro, 1992]. Исследователь отмечает, что единственной формой признания было указание на тот факт, что Ю. Гарфилд при создании Science Citation Index непосредственно опирался на опыт индекса, использовавшегося в правовой сфере.

Шапиро приводит для сравнения два показательных случая. С одной стороны, самой ранней статьей в истории библиометрии, давшей описание литературы с использованием подсчета публикаций по стране и году выпуска, обычно признается статья 1917 года Ф. Д. Коула и Н. Б. Илса об истории компаративной анатомии [Hertzel, 1987]. С другой стороны, известный исследователь библиометрии Алан Причард в качестве первого примера библиометрии приводит подсчет публикаций по химии в 1874 году. Однако обе «точки отсчета» появляются намного позже аналогичного подсчета публикаций в области права, который восходит по крайней мере к началу XIX века.

Дело в том, что правовая область имела большой практический интерес в учете данных. Англо-саксонская правовая система в отличие от романо-германской построена на прецедентном праве, то есть во многом опирается на судебную практику, для успешного использования которой требуется скоординированный и систематичный учет. В связи с этим в юридической области — еще задолго до стремительного роста количества исследовательских публикаций и возникновения такой потребности в науке — были сформированы благоприятные условия для появления систем учета принимаемых судебных решений. Это неудивительно: если в науке публикации и их взаимосвязи являются побочным продуктом исследовательской деятельности, то в юриспруденции публикации и их взаимосвязи составляют суть дисциплины.

Шапиро отмечает, что в целом истоки индексирования цитат можно проследить в практике публикации таблиц судебных дел, на которые ссылались в других решениях, публиковавшихся в этом же томе отчетов. Самая ранняя такая таблица, которую приводит Шапиро в результате «обширного, но не исчерпывающего поиска», содержится в журнале Raymond's Reports от 1743 года. Полноценный индекс цитирования был опубликован в 1860 году, а подсчеты публикаций встречаются в юридических трудах уже в 1817 году.

Неудивительно, что именно в этой области впервые появился один из наиболее известных предшественников современного индекса цитирования — Shepard's Citations. В 1873 году Фрэнк Шепард начал печатать ссылки на дела Верховного суда Иллинойса на клеящейся бумаге, чтобы подписчики могли вклеивать их в свои тома отчетов. Со временем Shepard’s Citations расширился до общенациональной системы переплетенных книг и приложений, содержащих последующие ссылки на судебные решения, уставы и другие правовые источники. Это позволило американским юристам получить удобный доступ к предыдущим судебным решениям и выяснить, был ли тот или иной правовой прецедент впоследствии отменен или изменен (Adair, 1955). Впоследствии в 1953 году бывший вице-президент Shepard's Уильям К. Адэр в письме Юджину Гарфилду предложил использовать принцип цитатника Shepard's в качестве метода индексирования медицинской литературы, что положило начало знаменитому индексу научного цитирования, а также его производным.

К началу XX века экспоненциальный рост количества публикуемой литературы привел к тому, что следить за последними научными достижениями становилось все труднее. Например, в период с 1884 по 1900 год в каталоге было зарегистрировано более 380 000 авторов [Hulme, 1925], а фактическое количество научных работ в период с 1901 по 1910 год увеличилось вдвое [Hutton, 1961].

Пионеры библиометрии использовали аналитические инструменты, которые сегодня могут показаться сравнительно примитивными, т.к. библиометрический анализ часто ограничивался подсчетом цитирований. Например, в 1926 году Альфред Лотка (1880-1949) опубликовал свое фундаментальное исследование частоты публикаций в Chemical Abstracts (1907-1916). Согласно его выводам, число авторов, сделавших n вкладов, составляет примерно 1/n^2 от числа авторов, сделавших один вклад [Lotka, 1926]. В 1927 году Пол Л.К. Гросс и Е.М. Гросс изучили частоту ссылок в журнале Американского химического общества и обнаружили, что хотя на 99 периодических изданий ссылались всего один раз, менее чем на 10 журналов ссылались 15-20 раз [Gross and Gross, 1927].

Д. Смит пишет, что в эпоху до появления информационных технологий, когда библиометрия формировалась как дисциплина, альтернатив было действительно мало [Smith, 2012]. В результате «метод Гросса и Гросса» (ibid) подсчета цитирования неизбежно использовался в течение многих лет, помогая при этом прояснить некоторые внутренние аспекты издательской культуры и распределения журнальных статей. Однако по мере развития информационной науки все более широкое признание и последующее изучение получили ограничения, присущие базовому подсчету цитирования. Например, в 1944 году анализ журналов по физиологии показал, что многие ранее принятые предположения были неверны. Эстель Бродман обнаружила, что ни один журнал не является репрезентативным для всей области и что не ко всем журналам можно применить одинаковые метрики [Brodman, 1944].

Аналитические инструменты библиометрии формировались благодаря ученым из различных областей науки на протяжении столетий. Методы, которые сейчас кажутся малопродуктивными и архаичными, заложили основу возникновения современных расчетов индексов и метрик, об истории и разнообразии которых мы расскажем во второй части этого поста в следующем выпуске рубрики «История наукометрии».

Источники

Thomson W. 1889. Popular lectures and addresses in three volumes. Volume 1 constitution of matter. London (UK): MacMillan and Company. Electrical Units of Measurement. p. 73–74. URL: https://archive.org/details/popularlecturesa01kelvuoft/page/72/mode/2up
Weinberg, BH 1999 Indexes and religion: Reflections on research in the history of indexes. The Indexer 21 3 111–118.
Weinberg, B. H. Who invented the index? — An agenda for research on information access features of Hebrew and Latin manuscripts. 2000а. URL: http://archive.ifla.org/IV/ifla66/papers/081-174e.htm.
Weinberg, BH 1997 The earliest Hebrew citation indexes. Journal of the American Society for Information Science 48 4 318–330.
Weinberg B. H. Book indexes in France Medieval specimens and modern practices //The Indexer: The International Journal of Indexing. – 2000b. – Т. 22. – №. 1. – С. 2-13.
Shapiro F. R. Origins of bibliometrics, citation indexing, and citation analysis: The neglected legal literature //Journal of the American Society for Information Science. – 1992. – Т. 43. – №. 5. – С. 337-339.
Hertzel, D. H. (1987). History of the development of ideas in bibliometrics. In A. Kent (Ed.), Encyclopedia of library and information science: vol. 42 (pp. 144-219). New York: Marcel Dekker.
Adair W. C. Citation indexes for scientific literature? //American Documentation. – 1955. – Т. 6. – №. 1. – С. 31
Hulme E. W. Catalogue of Scientific Papers . Nature 116, 129–130 (1925). https://doi.org/10.1038/116129a0
Hutton R.S. (1961), "1", Journal of Documentation, Vol. 17 No. 1, pp. 3-14. https://doi.org/10.1108/eb026289
Lotka, Alfred J. “The Frequency Distribution of Scientific Productivity.” Journal of the Washington Academy of Sciences16, no. 12 (1926): 317–23. http://www.jstor.org/stable/24529203.
P.L.K. Gross, E.M. Gross, College Libraries and Chemical Education. Science 66, 385 389 (1927). DOI: 10.1126/science.66.1713.385
Brodman E. Choosing physiology journals //Bulletin of the Medical Library Association. – 1944. – Т. 32. – №. 4. – С. 479.
Smith D. R. Impact factors, scientometrics and the history of citation-based research //Scientometrics. – 2012. – Т. 92. – №. 2. – С. 419-427.

Первые индексы и ранние метрики

Report Page