Исторические информационные системы: теория и практика - [11]

Шрифт
Интервал

По хронологическим критериям большинство рассматриваемых информационных систем относятся к истории XX в., что связано с доступностью источников этого периода. Ранее, по данным на начало 1990-х годов, отмечалось преобладание ресурсов по истории XIX в., а затем XVII и XVIII вв. [Доорн, 1995].

В целом исторические информационные системы имеют разную временную протяженность – от нескольких месяцев до нескольких веков. Активно развиваются системы, охватывающие до нескольких тысячелетий, в том числе в рамках междисциплинарного направления Big History – истории развития Земли от Большого взрыва до современности. Для таких проектов характерно использование таймлайнов и картографических инструментов (например, как в интерактивном атласе TimeMaps[13], содержащем более 1500 карт по различным периодам и регионам). Значительная хронологическая протяженность присуща и более традиционным коллекциям источников, к которым относится проект Йельского университета Avalon[14], разработанный в 2008 г. и содержащий полные тексты источников в области права, экономики, политики, дипломатии и государственного управления, начиная с 4 тыс. лет до н. э. Наиболее известным в области Big History является одноименный Big History Project[15], разрабатываемый по инициативе Билла Гейтса и рассматривающий почти 14 млн лет истории. Еще один проект Big History – ChronoZoom – совместная разработка Калифорнийского университета в Беркли и Московского государственного университета им. М. В. Ломоносова[16]. Данный проект представляет инструменты для создания собственных ресурсов, их сохранения и репрезентации в рамках единой системы. Для перечисленных примеров и других подобных проектов свойственны сильная образовательная составляющая и наличие методических разработок, адаптирующих использование продукта в учебном процессе.

Классификация по типу исторических источников

Существующие историко-ориентированные информационные системы варьируются по типам исторических источников, использованных в формировании контента. В этом смысле можно говорить о системах, основанных на письменных, статистических, вещественных, изобразительных, аудио-, видео-, мультимедийных, картографических и других источниках, а также на их различных комбинациях. Наиболее часто встречающиеся источники на всем протяжении развития историко-ориентированных информационных систем и баз данных – письменные, что связано как с их преобладанием в общем объеме исторических источников, так и с доступностью технологий для их перевода в цифровой формат. Вместе с тем характер используемых письменных источников и способы их репрезентации в системе существенно изменялись со временем. Историко-ориентированные базы данных конца 1980-х – 1990-х годов основывались преимущественно на массовых, прежде всего формулярных источниках: личных карточках, отчетных делопроизводственных документах, родословных книгах, формулярных списках, информация которых хорошо структурирована и удобным образом укладывается в формат реляционных баз данных.

Поскольку хранение, анализ и описание изображений в оболочке информационной системы гораздо легче текста, в ряде случаев текстовый источник заносится в информационную систему в виде нераспознанного изображения. Такие изображения могут быть сделаны на основе оригинала или копии (факсимильного издания) и представлены следующими форматами: jpeg, gif, pdf, djvu и др. Все чаще встречаются псевдоизображения, представленные в формате pdf, передающие, например, оригинальный шрифт источника, а также нераспознанный или плохо распознанный текст.

С развитием технологий круг источников, для представления информации которых используются информационные системы, расширяется. Одновременно меняется способ репрезентации источников в системе в направлении большей машиночитаемости, а также точности и детальности визуализации. В наибольшей степени это видно на примере письменных и вещественных источников. Применительно к текстовым источникам это может быть обозначено как переход от простой атрибуции к полнотекстовости с сохранением формальных и внешних особенностей документа и возможностью передачи многослойности текста. Сегодня все более характерным при репрезентации текстовых источников в информационной системе становится их представление в виде изображения, метаописания, распознанного и размеченного текста и, если необходимо, транскрипции, перевода[17].

В перспективе следует ожидать изменения способов репрезентации и для других источников, в частности аудио-, видео- и мультимедийных данных, для которых сегодня по-прежнему преобладают атрибутивное описание и наличие соответствующего файла, не предполагающие возможности полнотекстового поиска. Значительным шагом в этом направлении стала разработка инструментария для анализа массивов аудиоданных. Так, в Королевском технологическом институте (Стокгольм, Швеция) разработана программа[18] c открытым кодом для поиска по большим неструктурированным массивам аудиоданных. В ходе тестирования указанного инструментария на оцифрованных аудиоматериалах из архива Института языка и фольклора (Institute for Language and Folklore, ISOF) – а это порядка 13 тыс. часов звучания – была доказана эффективность разработанной методики анализа [Fallgren, Malisz, Edlund, 2018].


Рекомендуем почитать
Климат третьего тысячелетия

Автор рассказывает о колебаниях климата в течение последних двух тысяч лет, о периодах похолодания, сменявшихся тёплыми периодами. Замечательно описание «глобального потепления» первой трети ХХ века, которое в сороковых годах сменилось «глобальным похолоданием». Кроме того, автор делает прогноз, что к концу ХХ века вновь наступит период «глобального потепления» (что мы и наблюдаем сейчас), которое будет примерно таким же, как и глобальное потепление IX–XI веков. И технический прогресс об ужасах которого кричат нынешние «экологи» не окажет на эти процессы никакого влияния.


Сандинистская революция в Никарагуа. Предыстория и последствия

Книга посвящена первой успешной вооруженной революции в Латинской Америке после кубинской – Сандинистской революции в Никарагуа, победившей в июле 1979 года.В книге дан краткий очерк истории Никарагуа, подробно описана борьба генерала Аугусто Сандино против американской оккупации в 1927–1933 годах. Анализируется военная и экономическая политика диктатуры клана Сомосы (1936–1979 годы), позволившая ей так долго и эффективно подавлять народное недовольство. Особое внимание уделяется роли США в укреплении режима Сомосы, а также истории Сандинистского фронта национального освобождения (СФНО) – той силы, которая в итоге смогла победоносно завершить революцию.


Русская Православная Церковь в Среднем Поволжье на рубеже XIX–XX веков

Монография посвящена исследованию положения и деятельности Русской Православной Церкви в Среднем Поволжье в конце XIX – начале XX веков. Подробно рассмотрены структура епархиального управления, особенности социального положения приходского духовенства, система церковно-приходских попечительств и советов. Обозначены и проанализированы основные направления деятельности Церкви в указанный период – политическое, экономическое, просветительское, культурное.Данная работа предназначена для студентов, аспирантов, преподавателей высших учебных заведений, а также для всех читателей, интересующихся отечественной историей и историей Церкви.2-е издание, переработанное и дополненное.


Теоретико-методологические основы формирования полиэтнической культуры младших подростков

В предлагаемой монографии представлены теоретико-методологические основы формирования полиэтнической культуры младших подростков, раскрыты сущность, генезис, идеи, подходы, аспекты понятия «полиэтническая культура», представлена модель формирования полиэтнической культуры младших подростков в процессе усвоения традиций народов Поволжья; теоретическое обоснование педагогических условий формирования полиэтнической культуры школьников.Монография предназначена для учителей, преподавателей и студентов педагогических вузов, слушателей курсов повышения квалификации, аспирантов педагогических специальностей.


Система контроля и её аудит в организации

Рассмотрены теоретические и методические основы организации системы контроля в организации, концепция ее построения и развития на основе интеграции различных видов контрольной деятельности; обоснованы принципы организации контроля путем встраивания в бизнес-процессы с учетом риск ориентированности контроля. Определены сущность контроля и основные виды контрольной деятельности, обоснованы принципы их интеграции на основе адекватности целей контрольной деятельности контролируемого объекта.Может быть рекомендована для использования студентами, магистрантами, менеджерами и специалистами в области внутреннего контроля и аудита.Для студентов вузов, обучающихся по экономическим специальностям, может быть использована магистрантами, аспирантами, менеджерами, специалистами служб внутреннего контроля и аудиторами организаций.


Социальные основания гражданско-правовой ответственности

В монографии из серии «Научная школа: Функции права и проблемы их реализации в правовой системе России» исследованы современные подходы к пониманию социальных оснований гражданско-правовой ответственности.Для научных работников, преподавателей, аспирантов в области современного гражданского права.