Рус Eng Cn Translate this page:
Please select your language to translate the article


You can just close the window to don't translate
Library
Your profile

Back to contents

Historical informatics
Reference:

The Future of Historians in the “Digital Turn” Circumstances

Nasevich Vyachaslau

PhD in History

historian, archivist

222712, Belarus, Minskaya oblast', g. Dzerzhinsk, ul. Raduzhnaya, 17, kv. 68

v.nosevich@gmail.com
Other publications by this author
 

 

DOI:

10.7256/2585-7797.2019.3.30767

Received:

10-09-2019


Published:

21-11-2019


Abstract: The article focuses on plausible consequences of mass digitization of historical sources and the emergence of new types of sources such as integrated information resources, archives of online publications and big data. It also gives examples of new research methods application which correspond to digital information specifics. The author evaluates the impact of these factors on three groups of persons related to historical science. These are professional historians, specialists who prepare sources for publication and history popularizers. The possible impact of the "digital turn" on the mass audience is addressed as well. To evaluate plausible consequences of ongoing transformations in history the author uses experience of similar changes which characterized transition to mass archaeographic publications of sources. The main conclusion is the inevitable change of emphasis in history that is the reduced role of professional historians and popularizers and the growing importance of specialists who criticize sources and prepare them for publication. Another conclusion is the advent of discussion communities in social networks where members consider direct historical facts and offer their own interpretations ignoring conclusions of professional historians. 


Keywords:

historical source, source study, archeography, digitization, information resource, big data, online publication, paleo-DNA, digital forensics, artificial intelligence

This article written in Russian. You can find original text of the article here .

Будущее профессии историка в условиях «цифрового поворота»

Массовая оцифровка исторических источников началась недавно, но спрогнозировать долгосрочные последствия помогает то, что этот переворот – не первый. Мы знаем, какие изменения в практике работы историка повлек «археографический поворот» и связанная с ним специализация историка-археографа, занимающегося подготовкой источников к публикации в книжных изданиях.

До этого, на раннем этапе развития науки, каждому ученому приходилось быть универсалом. Подобно тому, как первые астрономы сами шлифовали линзы для своих телескопов, сами вели наблюдения и рассчитывали орбиты и сами знакомили общественность с результатами, также и историк должен был находить свидетельства о прошлом, определять степень их достоверности, учиться их понимать и грамотно интерпретировать, а потом предоставлять читателям увлекательное и поучительное повествование. Историк был одновременно и искателем древностей, и палеографом, и переводчиком с исчезнувших языков, и методологом, и популяризатором.

С точки зрения такого универсала археограф выглядел «специалистом наполовину»: он умел выявлять, прочитывать, переводить источники, осуществлять их первичную критику по внешним особенностям, но на этом останавливался. Собственно анализ этих источников, получение на их основе знаний о прошлом и донесение этих знаний до общественности он предоставлял другим.

Это сделало возможным проводить исследования на основе опубликованных источников и означало несомненный шаг вперед: кто-то брал на себя значительную часть рутинной и очень трудоемкой работы, а кто-то мог специализироваться на получении и популяризации знания. Работая с опубликованными материалами, за то же время можно было охватить и осмыслить намного больший их объем. Кругозор исследователя многократно расширялся, и это позволяло рассчитывать на более глубокие и ценные результаты.

Однако в среде профессиональных историков быстро сформировался скептицизм в отношении коллег, пробующих работать исключительно по опубликованным материалам. Степень этого скептицизма соотносилась с тем, какая часть источников по той или иной теме была доступна в публикациях. На первых порах опубликованные источники составляли лишь небольшую часть имеющегося материала по теме возможного исследования. В таких условиях попытка строить выводы только на основе легкодоступной опубликованной части расценивалась как верхоглядство. Чтобы заслужить признание коллег, историк обязан был не только знать все опубликованные источники по теме, но и «нюхнуть архивной пыли» – собственноручно обработать, «ввести в научный оборот» определенное количество неопубликованных.

При этом соотношение трудозатрат на работу с опубликованными источниками и собственноручную обработку архивных определялось интуитивно. По сути, это была сугубо статистическая проблема соотношения выборки и генеральной совокупности. Пока выборка оставалась явно нерепрезентативной, сделанные на ее основе выводы вызывали оправданное недоверие. Применительно к материалам археологических раскопок, из которых публикуются обычно лишь самые яркие или типичные примеры, такая ситуация сохраняется до сих пор. Но применительно к письменным документам она неуклонно менялась. По наиболее актуальным темам круг опубликованных источников уже к середине ХХ в. стал достаточно представительным, а трудозатраты на его расширение оказывались несопоставимыми с приращением нового знания. То, что было уже изучено, перемещалось из научных монографий в учебники, становилось общеизвестным и, следовательно, банальным.

Важно учитывать, что на уровне массового сознания историческое знание сильно отличается от того поиска истины, который мотивирует профессиональных ученых. Очень удачно это сформулировал в одном интервью украинский историк Алексей Толочко: «Зачем мы преподаем историю в школе? Чтобы воспитать гражданина страны, для того, чтобы он знал кто он, откуда он и в какой военкомат являться в случае войны. То есть это чистая, дистиллированная идеология, даже с элементами пропаганды. … Исследовательская история все проверяет, ей недостаточно гордиться красивой историей – она должна знать, что это достоверная, пусть даже и плохая, пусть даже и негодная, пусть даже и постыдная, но это достоверное прошлое, оно действительно произошло. Поэтому между историей, которая написана на школьном учебнике и историей, которая написана на научной монографии практически нет ничего общего» [1].

И тут в среде профессионалов происходило интересное явление: темы, которые благодаря своей общественной востребованности обеспечивались представительными выборками опубликованных источников (в частности, события политической и отчасти военной истории), переставали их интересовать. Более престижно было исследовать «неистоптанные» темы. Беда в том, что они часто представляли меньший интерес для широкой общественности. Интересы исследователей и потенциальных потребителей начали расходиться.

Актуальные для массовой аудитории темы стали достоянием популяризаторов – людей, обычно открыто заявляющих, что не являются историками, но при этом предлагающих собственные интерпретации исторических сюжетов. Как правило, они использовали исключительно опубликованные источники, что стало возможным благодаря их массовой публикации. При этом, не тратя время на выявление и обработку источников, лучшие из популяризаторов (Б.Акунин, А.Буровский, М.Солонин) достигли широты кругозора, вполне сопоставимой с профессионалами, а по уровню писательского мастерства значительно превосходят их.

Таким образом, следствием «археографического поворота» стало разделение людей, так или иначе связанных с исторической наукой, на три группы. Первая (профессиональные историки) сохранила универсализм, самостоятельно обеспечивая весь процесс получения нового знания и именно это считая своей главной целью. Вторая (археографы и источниковеды) сосредоточилась на первичной обработке источников, превращении их в общедоступные. Третья (популяризаторы и авторы учебников) обеспечила широкой аудитории возможность сознавать, «кто ты и откуда и в какой военкомат являться».

Переход к массовой оцифровке источников означает новый уровень их доступности. Это сулит серьезные перемены на всех трех направлениях исторической науки.

Труд профессиональных историков, несомненно, становится более эффективным. В годы, когда я начинал заниматься наукой, едва ли не решающее значение при выборе темы имело то, в каких библиотеках (как правило, в отделах редкой книги) можно найти опубликованные документы, в каких архивах – неопубликованные. Если эти архивы и библиотеки находились в других городах, а тем более в других странах, исследователь оказывался в заведомо проигрышном положении: при прочих равных условиях ему требовалось больше времени и денег, чем тому, кто основывался на компактном корпусе источников, сосредоточенных в легкодоступном хранилище.

Но, даже получив доступ к источникам, исследователь вынужден был тратить уйму времени на кропотливое составление выписок из них. У меня за годы работы скопились десятки килограммов такой «макулатуры», совершенно необходимой на стадии написания собственного текста.

При наличии доступа к оцифрованным источникам эти проблемы исчезают. Исследователь может иметь перед глазами текст документа непосредственно на экране своего компьютера независимо от того, в каком городе или стране этот документ хранится, может вернуться к нему в любой момент. Производительность и качество труда историка в таких условиях резко возрастают.

Роль археографов и источниковедов становится более многогранной. С одной стороны, они по-прежнему публикуют источники «как есть», только уже не в книжном, а в электронном виде. Главным плюсом при этом становится сокращение затрат на типографские расходы и бумагу. С другой стороны, все более важной задачей становится преобразование исходных текстов в структурированные информационные массивы, пригодные для машинной обработки. До массовой оцифровки создание баз данных ограничивалось теми же проблемами, что и работа с нарративами: обрабатывать можно было только те источники, которые лежали перед глазами в виде выписок или печатных изданий. Теперь же можно вводить в базу данные, которые считываешь напрямую со скана. При этом процесс обработки можно распараллелить, подключив ко вводу данных сколь угодно много волонтеров.

А вот что касается популяризаторов, то их ниша в результате «цифрового поворота» сокращается. Онлайновая доступность источников приводит к тому, что они становятся непосредственно доступными для конечного потребителя. Ему больше не нужны посредники, которые бы излагали исторические факты и подсказывали, какие выводы из них можно сделать. Массовые представления о прошлом все больше формируются не учебниками и популярными пересказами, а статьями Википедии. В распоряжении тех, кто желает вникнуть в тему более глубоко, есть блоги и дискуссионные клубы в социальных сетях. Если кто-то ищет конкретный факт, ему быстро укажут соответствующую ссылку на первоисточник. Если интерпретация факта, предложенная учебником или автором соответствующей вики-статьи, кого-то не устраивает, он с легкостью порождает собственные интерпретации, которые в свою очередь подвергаются обсуждению, а то и ожесточенной критике со стороны оппонентов. Знание, которое формируется в этом процессе, не вполне соответствует критериям научного исследования, но главный критерий – присутствие элемента состязательности — при этом сохраняется. Любая ссылка может быть проверена, и каждый вправе сам решать, насколько убедительны предлагаемые интерпретации. В таких условиях общество не только воздействует на ход дискуссий, но и само трансформируется под их воздействием. Впрочем, это имеет и оборотную сторону: темы, не обеспеченные общедоступными онлайн-источниками, перестают существовать для массовой аудитории.

Все, что нужно дискутирующим сообществам – это корпус фактов, которые не просто легко доступны, но и прошли источниковедческую экспертизу со стороны профессиональных историков. Члены этих сообществ не обладают достаточной подготовкой, чтобы самостоятельно проводить критику источников. Но они вполне в состоянии понять, что кто-то из историков обосновал недостоверность одного свидетельства, а другое такую проверку выдержало.

От историков при этом ждут не традиционных исследований, предполагающих сначала выявление и анализ фактов, а затем изложение собственных выводов. Выводы (за недостаточность которых экспертные советы терзают соискателей ученых степеней) как раз наименее интересны нынешнему «конечному потребителю». Чужие выводы имеют ценность только тогда, когда они совпадают с уже сформированными собственными. Зато факты, достоверность которых убедительно обоснована, имеют ценность непреходящую. Их при желании всегда можно переистолковать, но без них конкурентоспособную идею не выдвинешь.

Значит, следует ожидать сокращения ниши не только популяризаторов, но и профессиональных историков. А вот роль публикаторов и источниковедов становится ключевой. Первоисточники, массово выставляемые в открытый доступ в процессе «цифрового поворота», должны сопровождаться квалифицированными, но доступными пониманию непрофессионала источниковедческими комментариями. Для объемных источников нужны своеобразные «навигаторы» – краткий пересказ основных содержательных элементов с указанием, в каком месте источника они находятся.

Еще более востребованным оказывается создание информационных ресурсов, обеспечивающих интеграцию сведений из разных источников. Примером может послужить просопографическая база данных, в идеале содержащая ссылки на оцифрованные документы, в которых упоминается каждая персоналия (базы данных об участниках Первой мировой [2] и Великой Отечественной [3, 4] войн, о жертвах репрессий [5]). Другой пример – это геоинформационная система, в которой содержатся не только координаты населенных пунктов или иных объектов, но и относящиеся к ним исторические сведения из источников, в идеале – также со ссылками на соответствующие страницы. Отдаленным прообразом может послужить разработанная под руководством автора этих строк поисковая система для генеалогов-любителей, в которой сведения о принадлежности белорусских деревень в разные эпохи дополнены фамилиями их обитателей [6].

Что касается научных методов критики источников, то в них «цифровой поворот» принципиальных изменений пока не принес. Если речь идет о традиционных источниках, подвергаемых оцифровке, то для них и ожидать чего-то нового не приходится.

Другое дело – источники, которые иногда называют «цифророжденными», изначально не имеющие бумажных аналогов. Безусловно, для оценки их достоверности требуются новые методы и новые знания. Причина в том, что электронные документы не связаны с конкретным носителем, который сам по себе являлся важным реквизитом. А значит, в них можно вносить изменения, которые впоследствии трудно, если возможно вообще, распознать. Иногда их можно определить при анализе содержания, и в этом «цифровое источниковедение» не отличается от традиционного. Но есть и специфические методы – в частности, основанные на фиксации и последующей проверке хеш-значений файлов, содержащих сами документы, или на обращении к лог-файлам информационных систем. Это уже имеет мало общего с традиционными подходами, и квалификация для этого нужна особая. Скорее это даже не источниковедение, а «цифровая криминалистика». Но повседневной реальностью для историков она станет лишь тогда, когда создающиеся сегодня электронные документы станут объектами исторического изучения. Думается, это время пока не настало.

Но уже сегодня вполне актуальна проблема различения достоверных и «фейковых» сообщений, которыми пестрят интернет-сайты. Ввиду огромных массивов этой новостной и псевдоновостной информации, рассчитывать на профессиональных источниковедов не приходится. Имеется выраженный спрос на программные средства, которые умеют «на лету» распознавать фейки, и можно не сомневаться, что такие средства вскоре станут общедоступными. Они окажутся востребованными как у массовой аудитории, так и у историков будущего, которые будут обращаться к интернет-материалам при анализе сегодняшних событий и процессов.

Отдельный вопрос – это так называемые «большие данные» (big data), т.е. огромные массивы информации, как правило, автоматически накапливаемые информационными системами в процессе выполнения самых разных функций. Их содержание может быть использовано для самых разных, порой неочевидных целей, но сделать это можно только с помощью обучаемых систем искусственного интеллекта. Прочесывая информационные массивы с огромной скоростью, такие системы способны выявлять связи и закономерности, уловить которые при обычном визуальном просмотре невозможно в принципе. Сегодня «большие данные» еще слишком свежи, чтобы представлять интерес для историков. Но если их удастся сохранить, то в будущем они несомненно будут исследоваться и с целью получить новые знания о происходящих сейчас событиях.

Единственный случай, когда работа с «большими данными» актуальна уже сегодня – это результаты секвенирования ДНК, извлеченной из ископаемых останков. Полученные нуклеотидные последовательности – типичный пример «больших данных», для невооруженного сознания они недоступны. Но с помощью компьютерных программ в них выделяются гены и прочие участки, сопоставимые с аналогичными участками в расшифрованных геномах современных людей. На основании их сличения и статистического анализа можно делать выводы о характере и направлениях древних миграций. В частности, с их помощью был легко разрешен длившийся десятилетиями спор об отношениях людей современного вида с неандертальцами. Есть немало других, не менее интересных результатов.

Вокруг этих результатов в считанные годы сформировалось специфическое сообщество, члены которого в той или иной степени владеют методами обработки «больших данных» применительно к ДНК (или хотя бы способны их понимать) и при этом активно интересуются историей. Для этого сообщества также характерен слабый интерес к текстам, публикуемым в научных статьях в разделе «Выводы». Часто такие тексты встречаются откровенно скептически и убедительно критикуются. Гораздо больший интерес представляют «сырые» или «полусырые» данные, предоставление доступа к которым, к счастью, практически сразу стало негласным стандартом научных публикаций. Их исследуют собственными методами и широко интерпретируют.

О перспективности этого направления для истории дописьменных обществ мне довелось писать, когда оно еще только зарождалось [7]. Уже тогда было ясно, что традиционным историкам будет трудно освоить новую реальность. Большинство научных публикаций, в которых на основе анализа палео-ДНК предлагаются выводы исторического характера, появляются в журналах не исторической, а биологической направленности, и в лучшем случае лишь одним из членов авторского коллектива оказывается археолог или историк. Автор этих строк однажды опубликовал в рецензируемом научном издании по археологии статью, освещающую (сугубо на онлайн-источниках) проблему происхождения славян с применением результатов анализа палео-ДНК [8], но другие подобные примеры мне не известны. Единственным примером, когда профессиональные историки пытаются активно участвовать в работе дискуссионного онлайн-сообщества, является междисциплинарный сайт «Генофонд.рф», посвященный вопросам этногенеза и созданный при активном участии археолога Л.С.Клейна. В роли популяризаторов нового знания тоже выступают отнюдь не историки. Наибольшую активность проявляет доктор химических наук А.А.Клёсов, позиционирующий себя в качестве основателя новой научной дисциплины – «ДНК-генеалогии» [9] и редактирующий интернет-издание соответствующей тематики «Переформат.ру» (http://pereformat.ru/). Критику (вполне обоснованную) исторических реконструкций А.А.Клесова выдвигают также не историки, а представители естественных наук, либо члены дискуссионных интернет-сообществ, посвященных данной теме.

Пока сложно сказать, какие еще «большие данные» помимо нуклеотидных последовательностей найдут применение в исторической науке. Возможно, удастся придумать способы оцифровки и формализации массовых материалов археологических раскопок (орнаментов, украшений, орудий, элементов погребальной обрядности и т. п.), которые сделают их доступными для применения искусственного интеллекта. В этом случае можно ожидать прорыва в типологии и выделении археологических культур, которые пока остаются крайне субъективными. Но пока формализация такого рода данных представляется проблематичной.

Наверняка более перспективными в этом плане окажутся изначально «цифророжденные» документы, в том числе тексты интернет-публикаций и онлайновых дискуссий. Сегодня, пока они представляют интерес не для историков, а скорее для политологов и социологов, уже появляются проекты, предусматривающие анализ таких текстов методами искусственного интеллекта. Так, в рамках аналитической программы Министерства обороны США по использованию возможностей больших данных для социальных исследований объявлен тендер на проект, который предусматривает отбор сообщений в социальных сетях Facebook и Twitter от не менее 200 миллионов пользователей из более чем 100 стран на более чем 60 языках, с целью лучшего понимания «коллективного самовыражения». По заявлениям инициаторов проекта, эти данные будут использованы для более глубокого понимания общения между людьми и того, как со временем меняются типовые сценарии обмена мнениями. Подобные проекты, по их мнению, важны для защиты от противников, стремящихся подорвать демократию и посеять раздор в западных обществах [10].

Наверняка одним из главных исторических источников для будущих историков окажутся электронные архивы интернет-публикаций. Наиболее масштабным из них является глобальный проект «Интернет-архив» (https://archive.org/web/) который осуществляет с 1996 г. базирующаяся в Сан-Франциско некоммерческая организация. В настоящее время «Интернет-архив» хранит более 30 тысяч терабайт – или 30 петабайт – архивного контента, который продолжает расти экспоненциально. Уже сегодня огромный массив данных, накопленных в этом веб-архиве, порождает проекты по разработке средств эффективного поиска внутри него. Запущенная в эксплуатацию в 2001 году поисковая система «Машина времени» (Wayback Machine) позволяет найти заархивированные страницы, только если пользователю известны их URL-адреса на момент архивации. В 2017 году Йоркский университет совместно с университетом Ватерлоо получили грант канадского Фонда Эндрю У. Меллона на сумму 611 тыс. канадских долларов на реализацию проекта «Архивы, освобожденные от оков» (Archives Unleashed). Его цель – сделать всю информацию, накопленную в «Интернет-архиве», максимально доступной для ученых и всех тех, кто заинтересован в исследовании недавнего прошлого. Трехлетний проект имеет три основных направления. Во-первых, создается программный инструментарий для применения современных технологий анализа «больших данных» для научного анализа веб-архивов. Во-вторых, инструментальный набор размещается в облачной среде, которая станет единым порталом, через который ученые смогут вводить свои коллекции и выполнить ряд видов анализов одним щелчком мыши. Наконец, организован ряд онлайн-мероприятий, таких как дататоны (datathons) или хакатоны (hackathons) – форумы разработчиков, во время которых специалисты из разных областей разработки программного обеспечения (программисты, дизайнеры, менеджеры) сообща работают над решением какой-либо проблемы. Это позволяет создать сплоченное и устойчивое сообщество пользователей, объединяя вместе членов «ядра» проектной команды с библиотекарями, архивистами и другими заинтересованными исследователями [11].

Не менее интересен проект архивирования публикаций в национальном домене Австралии, осуществляемый Национальной библиотекой этой страны с 2005 года (AWA – Australian Web Archive, https://trove.nla.gov.au/website?q=). Он содержит примерно 9 миллиардов документов общим объёмом около 600 терабайт. Функциональные возможности доступа к веб-архиву были разработаны в течение последних двух лет ИТ-группой Национальной библиотеки во главе с Дэвидом Вонгом. По сравнению с «Машиной времени» на сайте «Интернет-архив» эта поисковая система обладает более широкими функциональными возможностями, поскольку поддерживается полнотекстовой поиск по всем материалам. Пользователи могут находить интересующий их контент с помощью машины поиска в стиле Google [12].

На сайте Библиотеки Конгресса США опубликованы некоторые результаты анализа электронных материалов, накопленных в течение последних двух десятилетий в рамках аналогичной программы веб-архивации. За это время библиотекой были приняты на хранение и сделаны доступными 114 коллекций, посвященных конкретным событиям и темам, включающих более 16 тысяч архивных копий веб-сайтов (именуемых в материале веб-архивами). Объём архивных копий в совокупности составляет почти 1,7 петабайта. Сотрудники библиотеки изучают возможности анализа этого массива (пока на уровне индексных файлов), с помощью предоставляемого компанией Google сервиса MapReduce (набор программных средств для параллельных вычислений над очень большими наборами данных в компьютерных кластерах) [13].

Эти примеры позволяют говорить о появлении принципиально новых видов исторических источников и методов их обработки, которые наряду с оцифровкой традиционных существенно отразятся на профессии историка.

References
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.