Как составить свою базу данных

Человек не приспособлен сохранять в памяти информацию, которую редко использует. Единственный способ свести эти затруднения к минимуму – организовать справочный аппарат, с помощью которого можно быстро найти нужную информацию. Во второй главе мы уже обсуждали возможности поиска информации в книгах и базах данных (БД). Очевидно, что такой поиск, хотя и эффективен, но затруднителен и дорог. Поэтому то, что однажды найдено, важно сохранить! Нужно сделать это так, чтобы можно было легко найти сведения в нужный момент.

Читатели этой книги, за исключением окончивших институт после 1992 года, при обучении «общественным» наукам более или менее тесно соприкоснулись с практикой конспектирования. Конспектирование было главной формой сохранения книжной информации в те времена, когда книг и журналов было мало, они были дороги, а скопировать нужное для себя было невозможно. В СССР конспектирование сохранилось до современности благодаря кафедрам «неестественных» наук, лелеявшим ленинские традиции конспектирования, и вследствие ограничений на использование копировальной техники. Сегодня конспектирование умирает.

Существуют более эффективные способы хранения информации. Эти способы постоянно развиваются. Единого, самого лучшего и подходящего всем рецепта не существует. В зависимости от Ваших потребностей и возможностей способ нужно выбрать самому. Вполне возможно, что с изменением рода занятий, научных интересов, места работы у Вас появится необходимость подойти к организации БД по-новому. Это столь же естественно, как менять обувь. Правда, трудоемкость изменения БД велика, поэтому к изменениям надо подходить, хорошо подумав. Настоящий раздел содержит информацию об основных способах организации БД. Из них Вы сможете сделать выбор. Или учесть какие-то рекомендации в совершенствовании уже имеющейся у Вас БД. По организации собственной БД существует ряд публикаций [51-55], быстро устаревающих. Здесь учтены многие рекомендации, а также собственный опыт автора и его коллег.

Насколько сложная система Вам нужна?

Ваша БД должна быть такой, чтобы удовлетворять Ваши требования, но не превышать Ваших возможностей и желания работать с ней. Для оценки Ваших потребностей и возможностей воспользуйтесь табл. 6.6

Таблица 6.6. Оценка сложности нужной Вам информационной системы

Критерии

Оценки

1

2

3

4

1. Доступность библиотек

Специальная медицинская

общенаучная

Больничная библиотека

библиотеки недоступны

2. Специальность

«узкий» специалист

«широкий» специалист

Специалист-исследователь

исследователь, преподаватель

3. Время, затрачиваемое в работе с БД, мин/неделю

15

30

45

60

4. Объем хранения, единиц

200

500

1000

2000+

5. Частота обращения, раз в неделю

1

2-3

4-6

7+

6. Доля статей в БД, хорошо Вам известных, %

80+

60

40

<40

7. Потребность в перекрестных ссылках, % статей

для отдельных статей

<10

10-20

20+

8. Доступность компьютера

Нет

доступен с трудом или будет доступен

вполне доступен

в личном пользовании

9. Желание работать
с компьютером

Нет

есть

есть и умею

умею и люблю

10. Доступ в Интернет

Есть

Возможен

Возможен

Нет

Итоговая оценка получается усреднением оценок по критериям 1-10

Какой библиотекой Вы пользуетесь? К несчастью, большинство российских читателей не имеют быстрого доступа к сколько-нибудь удовлетворительным медицинским библиотекам. Соответственно, они нуждаются в сложном устройстве личной БД. Если Вы имеете доступ к такой библиотеке, как библиотека клиники Мейо, описанная выше, то Вы, вероятно, вообще не нуждаетесь в своей личной БД, поскольку все можете получить быстро средствами библиотеки.

Как много Ваших интересов должна БД поддерживать? Если Вы исследователь — узкий специалист, то БД может быть относительно простой. Если Ваши интересы широки, межсистемны — сложной. Впрочем, великий Г. Селье писал, что ограниченных областей в науке нет — есть только ограниченные ученые. Поэтому размер вашей БД (картотеки) определяется не широтой Вашей проблемы, а широтой и глубиной Ваших интересов. Во всяком случае, если Вы проводите исследования и пишете статьи (или предполагаете делать это в будущем), создания своей БД не избежать и лучше это сразу сделать хорошо.

Как много времени Вы проводите в работе с Вашей БД? Если Вы много работаете, просматривая БД, разыскивая в ней ссылки, подготавливая статьи и доклады, значит, Вам нужна более совершенная, экономная БД. БД, которой Вы не уделите нужного времени, погибнет. Ее спасение может потребовать еще больших затрат времени. Может быть, у Вас есть возможность поручить заботу о БД помощнику (секретарю, лаборанту, жене, дочери). Все же радикальнее – использовать компьютер.

Как много будет информации в БД? Учтите возможный рост и возможную «прополку». В целом трудности использования БД растут пропорционально не числу ссылок, а пропорциональны квадрату числа ссылок. Поэтому надо с одной стороны сдерживать рост, а с другой — обеспечивать адекватную размерам организацию БД.

Как часто будете обращаться к БД? Чем чаще, тем больше экономии принесет эффективная организация.

Как хорошо Вы знаете содержимое БД? Если пользуетесь часто, то знаете хорошо. Но если знаете хорошо, то БД может быть проще. В небольшой БД все статьи могут быть изученными, значит, система может быть проще. Но может быть, что в Вашем архиве много статей, которые Вы лишь оценили при предварительном изучении. Тогда Вам нужна более сложная и эффективная БД. В известном смысле БД и создается для того, чтобы там хранить многое, что нет нужды держать в памяти. Интересное, но ненужное сегодня, нет нужды запоминать, но поставить карточку в картотеку — естественно.

Как сложна будет классификация в Вашей БД? Чем сложнее, тем больше будет статей, относящихся сразу к 2 и более ячейкам системы. Число таких перекрестных ссылок определяется в основном Вашими интересами. Чем больше перекрестных ссылок, тем больше надо будет работать с БД, чтобы поддерживать ее в рабочем состоянии.

Как доступен Вам компьютер? Мы говорим о персональных компьютерах в силу их большей доступности и удобства использования в этих целях. Конечно, если у Вас есть постоянный доступ к терминалу большой ЭВМ или больничной сети, то это дает не меньшие возможности для организации персональной БД.

Доступен ли Интернет? Если Вы можете всегда обратиться к Medline в Интернете или использовать другие БД, то у Вас нет острой необходимости сохранять множество описаний статей. Вам надо будет лишь систематизировать имеющиеся у Вас копии публикаций. Поэтому постоянный доступ в Интернет позволяет иметь более простую собственную БД. Одновременно, доступ в Интернет возможен лишь при систематическом использовании компьютера. Соответственно, резонно выбрать именно компьютерную организацию персональной БД.

Средний результат Ваших ответов — примерная оценка подходящей для Вас информационной системы. Вам надо взвесить то, что хочется (скорость поиска и уверенность в результатах дает сложная БД) и то, что для этого надо будет делать. Ведь сложная БД требует тратить много времени на работу с ней, в основном на ввод данных и их разметку ключевыми словами и раскладку карточек.

Теперь перейдем от общих вопросов к частным.

Как Вы храните свои материалы?

Делают это по-разному. Одни складывают в стол. Другие завязывают в папку. Третьи укладывают в конверты. Четвертые - записывают в тетрадку. Все это несерьезно. Нужно осознавать, что архив документов со временем приобретает большой объем и должен быть хорошо организован. Лучше всего для этого подходят папки стандартного размера без клапанов с зажимом у корешка. Из них так же легко доставать материалы, как и вкладывать обратно. Скоросшиватели хуже, поскольку и закрепить документ в них сложнее и достать труднее. Зато дешевле. Еще меньше подходят папки с клапанами и завязками — клапаны мешают при обращении к содержимому папки. Их применение оправдано только, если Вы храните отдельные нестандартные листы и фотографии. Да и в этом случае лучше использовать конверты, закрепляемые в скоросшиватель.

Где хранить? Существуют специальные архивные шкафы с выдвижными ящиками и другое удобное оборудование, пока мало доступное (дорогое) в России. Подходящее место хранения — книжный шкаф. Где он должен стоять? Для большинства приемлемым местом является кабинет, поскольку там чаще всего возникает потребность в обращении к архиву и там он хорошо сохраняется. У студентов такой возможности обычно нет. Да и у врачей и ученых не всегда рабочее место может быть таким, чтобы хотелось держать на нем свой драгоценный архив. Поэтому многие держат его дома.

Какой материал Вы храните? Вполне возможно, что Ваш архив многообразен. В нем могут быть книги, рекомендации, приказы, статьи, фирменные аннотации на лекарства и аппараты, карточки пациентов, протоколы экспериментов, письма, отчеты и многое другое. Если это достойно того, чтобы его хранить, то хранить надо как следует. То есть так, чтобы все это можно было использовать.

Для того, чтобы Ваш архив был «живым», его надо поддерживать «тощим» и однородным. Относитесь критически к его содержимому. Помните мудрое правило: если Вы сомневаетесь в нужности документа — выбрасывайте его. По-настоящему нужного Вы так не утратите, а прочее, нужное, в результате станет обозримым и доступным.

Второе правило: то, что можно, нужно разделять. Поэтому отделите все, не относящееся к Вашему «литературному» архиву, например, переписку. Многое из того, о чем будет идти речь, справедливо и для организации архива переписки, протоколов, но мы говорим только о системе хранения литературных материалов.

Эти материалы в основном состоят из книг, журналов и отдельных оттисков и копий (ксерокопий, фотокопий, микрофильмов, микрофиш и т.п.). Хранение книг не вызывает вопросов, во всяком случае, когда речь идет об обычных индивидуальных коллекциях. Хранение целых журналов обсуждалось в разделе 6.4.1. Копии статей следует хранить в папках. Микрофиши целесообразно хранить в тех же папках в подшитых конвертах. Микрофильмы можно хранить таким же образом, но если их у Вас достаточно много, то стоит сделать, если Вы еще не успели этого раньше, коробки для хранения.

Наиболее удобны коробки размером примерно в стандартный лист (А4, 210х297 мм) и высотой примерно в 40 мм. Коробка состоит из корпуса и чуть более широкой крышки с краем высотой 10-20 мм (рис. 6.3). Каждый микрофильм вместе с бумажкой, содержащей описание статьи (например, частью бланка заказа МБА) вкладывается в другую бумажку, кратко подписанную снаружи и сложенную в три раза. Такой пакет с микрофильмом помещается в коробку в алфавитном порядке авторов (впрочем, возможен и просто порядок номеров по очереди поступления, об этом речь ниже). У алфавитного порядка есть важное достоинство — такой архив микрофильмов легкодоступен для поиска «по автору» и независим от других разделов.

Pис. 6.3. Вариант хранения микрофильмов статей

Если у Вас есть большие микрофильмы, например, микрофильмы книг, то их придется хранить в индивидуальном порядке в коробках, как книги — на полках шкафа или в архивном ящике.

Какую классификацию материалов избрать? Речь идет о том, под какими заголовками будут группироваться материалы в Вашем архиве и БД, какими принципами будете Вы руководствоваться в поиске. Вариантов много. В библиотеках пользуются специальными классификациями. Всякий, кто пользовался ими, знает, что переносить их в свою практику вряд ли стоит. Они придуманы для классификации человеческого знания вообще, а не специально для медицины.

Начинающие специалисты обычно используют свою собственную мини-классификацию, похожую на структуру любимого учебника. Некоторым врачам может подойти Международная классификация болезней (МКБ). Но она подойдет не всем, поскольку огромна, ориентирована на заболевания и, например, вопросы организации лабораторного дела ею не предусмотрены. Может быть, Вам, как знатоку своей области, для Ваших целей удастся создать собственную классификацию лучше существующих.

Нередко для врачей самое лучшее — классификация National Library of Medicine (MeSH, см. разд. 2.2). Она включает практически все вопросы, которые затрагиваются медициной, физиологией, биохимией человека. Центральная медицинская библиотека МЗ СССР пыталась создавать свою предметную классификацию. Теперь в ЦМБ и ее изданиях принята рубрикация MeSH. Русскоязычный экземпляр Вы можете купить в ЦМБ МЗ РФ. Но он большой и тяжелый, плохо переведен и устарел. Поэтому лучше по мере необходимости обращаться к бесплатному англоязычному варианту MeSH на каком-нибудь сайте Интернета. Его можно даже получить с сайта бесплатно целиком. Поскольку Ваши интересы могут выходить за пределы MeSH, постольку Вы можете использовать другую классификацию.

Классификация имеет решающее значение для «структурированного» хранения материалов. Чтобы уверенно и быстро их использовать, надо иметь классификацию под руками.

Структурированное хранение документов в архиве

Такое хранение документов предусматривает их размещение в папки в соответствии с определенным заголовком (рубрикой). Папки устанавливают в порядке рубрик и подписывают на корешке. По мере увеличения объема архива из «больших» рубрик могут выделяться новые папки, посвященные частным вопросам. Этот образ действий подходит для тех, кто нуждается в самой простой системе хранения информации (средняя оценка £ 2 по табл. 6.6).

Структурированное хранение материалов может удовлетворить потребности и серьезного ученого. Например, M.M. Wintrobe создал известное руководство «Clinical Hematology» на основе личного архива, построенного с использованием собственной детальной классификации. Его система, созданная в начале тридцатых годов, и детально описанная [54], с сегодняшних позиций предстает очень трудоемкой. Но прекрасный результат показывает, что эффекта можно добиться без компьютера и в сложной системе (со средней оценкой 3-4 по табл. 6.6).

Если структурированный архив превышает 200-300 документов, то становится неизбежным параллельное ведение картотеки. Обычно картотека имеет такой же вид, как каталог в библиотеке. В ней карточки (стандартный размер 76*128 мм) размещают по тематическим разделам. Эти разделы выделяются закладками — карточками большего формата, с фигурными выступами, разного цвета. На них пишут название раздела. Обычно картотека структурированного архива строится по той же схеме, что и сам архив.

Пока архив мал, картотека не очень нужна, но, думая о перспективе, ее надо заводить сразу. Со временем картотека растет и в ней появляется все больше карточек на статьи, которых нет в архиве и карточки на материалы, хранящиеся отдельно от основного архива (микрофильмы, книги). Постепенно нарастает потребность в перекрестных ссылках на одну статью. Тогда нужно оформлять несколько карточек и размещать их в разные разделы. Например, статья о влиянии диабета на исход травмы может быть нужной не только в разделе «травма» но и в разделе «диабет» и в разделе «инфекционные осложнения травмы». Такие карточки-дубли обычно содержат только описание документа (т.е. имена авторов, название статьи и журнала, страниц, на которых опубликована статья) и указание на место хранения оттиска или на место основной карточки с Вашими заметками.

При использовании нескольких экземпляров карточек и при развитой (сложной) структуре картотеки увеличивается потребность в копиях карточек. Поэтому владельцы таких картотек со временем изобрели дополнительные ухищрения. Во-первых, стали использовать карточки на тонкой бумаге — обычные толстые библиографические карточки делают объем картотеки большим. Прочность же бумаги в личной картотеке не столь важна, как для библиотечного каталога. Во-вторых, владельцы таких каталогов используют заранее заготовленные двойные (тройные, четверные) карточки, сложенные по нужному размеру «гармошкой». Запись в библиотеке делают под копирку. Потом карточки разрезают и раскладывают. В шестидесятые годы зарубежные журналы помещали в конце выпуска отрывные карточки из плотной бумаги на статьи. Потом, по мере развития практики личных картотек, стали печатать карточки на тонкой бумаге и даже не в одном, а в 3 экземплярах. Теперь – опять в одном, поскольку стало доступным копирование карточек. Скоро эта практика, видимо, исчезнет, поскольку считается, что получить стандартное описание статьи из Medline доступно всем.

Обычно число разделов картотеки соответствует числу ключевых слов. Ключевые слова на карточке подсказывают, куда положены другие экземпляры, а подчеркнутое слово на данном экземпляре напоминает, из какого раздела он извлечен. Вы всегда вернете его после использования на свое место.

При таком ведении картотеки по мере того, как она развивается, усложняется, для эффективного поиска приходится выделять все новые частные рубрики и использовать все большее число копий карточек. Это ускоряет рост картотеки и затрудняет ее эффективное использование. От этого есть два средства: регулярная работа по поддержанию БД в приемлемом состоянии или переход к компьютерной БД.

Поддерживать хорошее состояние БД на карточках надо регулярной «прополкой» и «разделением». Прополка означает удаление всего устаревшего и ненужного с тем, чтобы сохранить БД в приемлемых объемах. При прополке важно выбрасывать не только ненужные оттиски статей из архива, но и все соответствующие им карточки из БД.

Разделение означает выделение из архива целых разделов, которые в настоящее время не используются Вами. Так бывает у хорошего хозяина, который не решается выбросить старую вещь и относит ее в сарай. Может, через год-другой на что-нибудь пригодится. Подобным образом можно поступить, когда из Вашего внимания выпадает полностью целая область интересов.

Если ваши возможности делать копии с нужных материалов ограничены, то придется делать выписки. Но ни в коем случае в тетради! Обращаться к ним крайне неудобно. Рациональнее выписки на отдельные листы. Их можно хранить так же, как копии документов, т.е. в папках архива и ссылаться на них в карточках. Впрочем, если у Вас многое записано в тетрадях - не беда. Их содержимое можно приемлемо зарегистрировать, но только в «неструктурированном» архиве (см. ниже).

Еще совсем недавно — в шестидесятые-семидесятые годы популярным было иное решение проблемы. Все необходимые выписки стремились занести на карточку. Естественно, она должна была быть большой. Для этого как нельзя более подходили перфокарты с краевой перфорацией (о них речь идет ниже), обычно форматом 148х210 мм. На них достаточно места для записей. Распространение перфокарт было связано также с их использованием в исследованиях для сортировки вручную, без ЭВМ, занесенной на них информации. Все же чаще эти перфокарты использовали просто как крупные библиографические карточки. Теперь единственный в СССР их производитель оказался за границей (в Таллине). Поэтому такого рода картотеки ведут лишь те, кто создал их в прошлом и озаботился своевременно запасом перфокарт.

Там, где копирование доступно, для маленького личного архива используют противоположную модель. Карточки вообще не заводят. А делают со статьи столько копий, сколько надо, и кладут во все необходимые тематические папки. Но это, конечно, крайность (сколько нужно шкафов!). Чаще с нужной статьи делают одну полную копию и еще столько копий титульного листа, сколько надо для перекрестных ссылок в других папках. На этих титульных листах отмечают, в какой папке лежит полная копия. Наверное, и этот способ — излишняя роскошь и применим лишь к небольшому архиву. В большом он неприемлем из-за того, что увеличивает его физический объем.

В целом «структурированное» хранение материалов соответствует ситуации, когда материалов немного, перекрестные ссылки не очень многочисленны, и Вы не пользуетесь компьютером.

Начиная создавать свою БД, думайте о перспективе. Избранная Вами схема БД должна соответствовать завтрашним нуждам, поскольку переделывание потребует много времени. Любой вид БД может быть переведен в наиболее совершенную компьютерную форму, но это большая и неинтересная работа. Если у Вас богатая БД (или Вы планируете ее большой в перспективе), а перекрестные ссылки часты (оценка сложности 3-4 по табл. 6.6), то даже при отсутствии компьютера следует избрать неструктурированное хранение материалов.

Неструктурированное хранение документов в архиве

Такой способ хранения подразумевает подшивание документов по мере поступления в одну папку за другой. Документы последовательно нумеруются. На каждый заводится столько карточек, сколько установлено при чтении ключевых слов и карточки расставляются в картотеку в соответствующие разделы. Каждая карточка несет номер документа.

Этот способ организации БД приживается там, где БД велики и велика потребность в работе с БД. Если же БД разнообразна и имеет сложную структуру, то до компьютерной системы остается сделать только шаг. Если Ваша картотека имеет более 2000 карточек, то этот шаг неизбежен, рано или поздно. Скорее всего, это зависит даже не от Вашей любви к компьютерам, а от их доступности для Вас. Чем раньше Вы перейдете к компьютерной БД, тем легче будет сделать этот шаг. Если у Вас уже есть 2000 карточек, то сам процесс перехода к компьютерной системе потребует много месяцев напряженной работы. Поэтому следует выбирать способ хранения для своей БД исходя из перспективы.

Прежде упомянем еще два варианта «немашинного» ведения БД, в котором документы хранятся без систематизации, а поиск нужного осуществляется по специальным картам.

Унитерм-карты. Это старое предложение M. Taube использовалось в основном для облегчения поиска технической документации. Документы подшивают по мере поступления и нумеруют. В картотеке стоят специальные карты, каждая из которых имеет уникальное название — ключевое слово. Номер документа проставляется в каждую карту, к ключевому слову которой документ имеет отношение. Например, материал о лечении индералом гипертонической болезни в старческом возрасте заносится в карты «индерал», «гипертоническая болезнь», «гериатрия». В дальнейшем при поиске берут карты с ключевыми словами, соответствующими «поисковому образу», например: «индерал», «старческий возраст». На этих двух картах среди прочих будут одинаковые номера — это и есть номера документов, соответствующих «поисковому образу». Этот способ хранения иллюстрирует то, что происходит в компьютерных программах хранения библиографической информации. Там тоже ключевые слова хранятся вместе с номерами документов отдельно от их описаний. Когда Вы даете программе команду <найти публикации «индерал»AND«старческий возраст»>, она сопоставляет списки номеров у этих ключевых слов. Затем предъявляет Вам описания документов, номера которых были записаны под обоими ключевыми словами. Унитерм-карты удобны в случае малой БД. Новая карта появляется лишь если в списке ключевых слов появляется новый термин — значит, сама картотека растет медленно. Недостатком такой БД является относительная трудоемкость заполнения карт при появлении новых документов, необходимость содержать их в строгом порядке в картотеке, сложности «прополки», уязвимость БД. Потеря одной карты означает потерю целого поля информации, соответствующей ключевому слову. Поэтому картотека на унитерм-картах должна иметь страховочный дубликат. Но это резко увеличивает трудоемкость ее ведения.

Перфокарты. Существуют два основных варианта — суперпозиционные и с краевой перфорацией. Суперпозиционные G. Taylor запатентовал еще в 1915 году. В них каждому ключевому слову соответствует карта. На каждой карте размещена одинаковая сетка с номерами документов. Если документ соответствует ключевому слову, то на карте в месте, соответствующем его номеру, пробивается дырка. При поиске документа по поисковому образу берут две или более карт с нужными ключевыми словами и накладывают друг на друга. На просвет видно, какой номер документа «светится» на всех картах. Этот способ применяют иногда в каталогизации технических документов. В медицине, вообще в науке — редко. Из-за трудностей ведения картотеки и ее ограниченности по объему числом цифр, которые можно разместить на карте.

Перфокарты с краевой перфорацией (рeekaboo cards[56-58]) упоминались выше. Такие карты имеют по краям два ряда отверстий (рис. 6.5). Каждому ключевому слову (признаку) соответствует вырезанная наружная перемычка отверстия в крайнем или крайнем и внутреннем ряду (или сочетание нескольких отверстий). Детально разработаны способы кодировки алфавита, годов, ключевых слов. При поиске в колоду перфокарт вводят спицу в соответствующее отверстие и ею поднимают всю колоду. Выпадают карты, соответствующие выбранному признаку, т.е. те, у которых вырезана наружная перемычка отверстия. Удобство состоит не только в быстроте поиска, но и в том, что карты можно хранить в беспорядке. Недостатком такой картотеки является то, что она требует значительных дополнительных усилий для вырезания и физически управляема при объеме менее 5000 карт. Распространение компьютеров сегодня вытеснило перфокарты в этой области.

Прежде рассмотрим, однако, еще два варианта «немашинного» ведения БД, в котором документы хранятся без систематизации, а поиск нужного осуществляется по специальным картам.

Унитерм-карты. Это старое предложение M. Taube использовалось в основном для облегчения поиска технической документации. В медицине — редко. Документы подшивают по мере поступления и нумеруют. В картотеке стоят специальные карты, каждая из которых имеет уникальное название — ключевое слово. Номер документа проставляется в каждую карту, к ключевому слову которой документ имеет отношение. Например, материал о лечении индералом гипертонической болезни в старческом возрасте заносится в карты «индерал», «гипертоническая болезнь», «гериатрия». В дальнейшем при поиске берут карты с ключевыми словами, соответствующими «поисковому образу», например: «индерал», «старческий возраст». На этих двух картах среди прочих будут одинаковые номера — это и есть номера документов, соответствующих «поисковому образу».

Pис. 6.4. Унитерм-карта

Этот способ хранения иллюстрирует то, что происходит в компьютерных программах хранения библиографической информации. Там тоже ключевые слова хранятся вместе с номерами документов отдельно от их описаний. Когда Вы даете программе команду <найти публикации «индерал»AND«старческий возраст»>, она сопоставляет списки номеров у этих ключевых слов. Затем предъявляет Вам описания документов, номера которых были записаны под обоими ключевыми словами. Возможен и поиск «наоборот». Можно искать <«гипертоническая болезнь»NOT«старческий возраст»>, если Вас интересует эта болезнь у молодых. Такому поисковому образу соответствуют документы, содержащиеся в первой карте и не содержащиеся во второй.

Унитерм-карты удобны, но лишь в случае малой БД. Новая карта появляется лишь в том случае, если в списке ключевых слов появляется новый термин — значит, сама картотека растет медленно. Недостатком такой БД является относительная трудоемкость заполнения карт при появлении новых документов, необходимость содержать их в строгом порядке в картотеке, сложности «прополки», уязвимость БД. Потеря одной карты означает потерю целого поля информации, соответствующей ключевому слову. Поэтому картотека на унитерм-картах в идеале должна иметь страховочный дубликат. Но это увеличивает трудоемкость ее ведения почти вдвое.

Перфокарты. Существуют два основных варианта — суперпозиционные и с краевой перфорацией. Суперпозиционные G. Taylor запатентовал еще в 1915 году. В них каждому ключевому слову соответствует карта. На каждой карте размещена одинаковая сетка с номерами документов. Если документ соответствует ключевому слову, то на карте в месте, соответствующем его номеру, пробивается дырка. При поиске документа по поисковому образу берут две или более карт с нужными ключевыми словами и накладывают друг на друга. На просвет видно, какой номер документа «светится» на всех картах. Этот способ применяют иногда в каталогизации технических документов. В медицине, вообще в науке — редко. Из-за трудностей ведения картотеки и ее ограниченности по объему числом цифр, которые можно разместить на карте.

Pис. 6.5. Библиографическая перфокарта

Перфокарты с краевой перфорацией (рeekaboo cards[56-58]) упоминались выше. Такие карты имеют по краям два ряда отверстий (рис. 6.5). Каждому ключевому слову(признаку) соответствует вырезанная наружная перемычка отверстия в крайнем или крайнем и внутреннем ряду. Для кодирования можно применять не одно отверстие, а сочетание нескольких и тогда число возможных комбинаций очень велико. Детально разработаны способы кодировки алфавита, годов, ключевых слов. При поиске в колоду перфокарт вводят спицу в соответствующее отверстие и за нее поднимают всю колоду. Выпадают карты, соответствующие выбранному признаку, т.е. те, у которых вырезана наружная перемычка отверстия. Теперь в найденных картах таким же образом проводят поиск по второму признаку. Удобство состоит не только в быстроте поиска, но и в том, что карты можно хранить в беспорядке. Недостатком такой картотеки является то, что она требует значительных дополнительных усилий для вырезания и физически управляема при объеме менее 5000 карт. Распространение компьютеров и дефицит карт сегодня вытеснили перфокарты в этой области.

Компьютерная организация БД

Для этих целей существуют десятки компьютерных программ, которые могут работать на любых машинах и в любых операционных системах. Наибольшей популярностью для DOS/Windows и Apple пользуются Reference Manager, Papirus, Refsys, Sci-Mate, EndNote, Pro-Cite, Citation, IBID, REF-11, WрCitation (поставщик OBERON: 147 East Oakland Ave., Columbus, OH 43201, USA). Цена этих программ - от $100 до $500.

Есть бесплатные и условно-бесплатные программы (shareware), например, Manage your books’95 (см., например, на сервере http://www.pcworld.com/). Она мила, сделана профессионально под Windows 95, но: имеет ограниченные возможности описания; не является вполне многоязычной и, значит, не может работать хорошо с русским языком. Другая несложная программа - макрос для Word 6 и 7 Reference Database. Он позволяет сохранить до 8000 описаний документов в нескольких вариантах (статья в журнале, книга, раздел в книге) и создавать список литературы для Вашего текста (статьи) в нескольких вариантах оформления, которые Вы можете менять. Reference Database - условно бесплатная программа, которую можно взять, например, на http://www.pcworld.com/. Автор Tal Fuchs (P.O.Box 115 Maale Adummim Israel, Phone: 972-2-5351544, E-Mail: fuchs@kagi.com, http://www.kagi.com/fuchs/). Несколько бесплатных и условно бесплатных программ Вы можете найти на этой Интернет-странице.

Подобную программу можно написать самому, если Вы немного программируете [59,60]. Довольно просто это сделать, используя программы управления БД (dBASE, FoxPro и другие). Ведь библиографическая БД — это всего лишь вариант и не самый сложный. Сам принцип построения программы лежит на поверхности. Применительно к библиографическому описанию печатных изданий большинство программ сохраняют преемственность формата, применявшегося в самых ранних проектах — стандарта MARC-11 библиотеки Конгресса США, Ньюкаслского стандарта. В свою очередь, эти форматы соответствуют традиционному библиографическому описанию. Поэтому к такому описанию нужно лишь добавить средства поиска и сортировки. К сожалению, сделать свою программу так хорошо, как сделаны «фирменные» трудно.

В особенности трудно добиться от «самоделки» доброкачественного поиска Ваших записей в БД и последующего составления списка литературы для Ваших статей (диссертаций, отчетов). Собственно, регистрация найденных статей или поиск нужных статей сегодня стали очень просты и доступны благодаря широкому доступу в Интернет и бесплатному доступу к Medline. Поэтому, если речь идет только о поиске журнальных статей, то, можно сказать, личные архивы и все с ними связанное начинает изживать себя. Это не подходит для России, где в обозримом будущем у врачей не будет свободного доступа к мировой литературе и приходится хранить все добытое трудами. Нельзя избежать создания своей БД, поскольку обычно есть нужда в записи своих комментариев к найденному описанию статьи. Кроме того, не всегда поиск статьи в Medline или другой большой БД приводит к результату быстро. Иногда надо потратить много времени на получение нужного результата, а потом еще часами просматривать огромный список, отделяя «зерна от плевел». Очевидно, что, выбрав таким путем 20 статей из 800, Вы захотите иметь их под руками со своими пометками, со своими ключевыми словами. Все это делает переход к созданию своей компьютерной БД неизбежным.

Особенно важно это для тех, кто сам пишет. Составление списка литературы к настоящей книге с расстановкой ссылок по тексту в нужном оформлении заняло менее 4 минут (процессор Pentium-II, 400MHz, Reference Manager версии 8.5). Всякий, кто неделями составлял списки литературы и сопоставлял номера в тексте с номерами в списке «вручную» оценит такой прогресс.

Научиться работать с библиографическими программами не сложно. Они ориентированы на неподготовленного пользователя. Все программы позволяют проводить поиск по множеству признаков, используя Булевскую логику. Так по-научному называются простые формулы выбора, например: [гипертоническая болезнь]И[индерал]НЕ[японский язык]. Соответственно, отбираются все ссылки, относящиеся к гипертонической болезни и использованию индерала, но не на японском языке. Поэтому, выбирая библиографическую программу, надо ориентироваться на наибольшие возможности, поскольку при постоянной работе к такому инструменту быстро привыкаешь, а инструмент должен быть хорошим.

Следует знать, что не все библиографические программы способны полностью раскрыть свои возможности в «чужой среде». Так WрCitation и первые версии EndNote работали вместе с текстовым процессором WordPerfect, а IBID — c NB (Nota Bene). Большинство библиографических программ хорошо чувствуют себя с популярными текстовыми процессорами – Word и Word Perfect.

Возможности специальных библиографических программ разнообразны и постоянно совершенствуются. В частности, новые программы позволяют хозяину настраивать их под свои требования. Большинство этих программ, сделанных “под Windows”, хуже приспосабливаются к кириллице, но в новых, 32-разрядных версиях эта проблема обычно преодолена. Windows-программы имеют замечательную возможность — они могут интегрироваться в текстовый процессор. В результате становится возможным просто писать текст, и по ходу дела вставлять ссылки на свою БД, не обращаясь к самой программе. Вероятно, наиболее широкие перспективы открывает использование программ PAPYRUS, Reference Manager, EndNote, Pro-Cite.

PAPYRUS принадлежит Research Software Design, адрес: 2718 SW Kelly Street, Suite 181, Portland, OR97201, USA. Каждую из ссылок в БД можно сопровождать заметками и множеством ключевых слов. После того, как вы написали статью, вы запускаете программу, и она автоматически заменяет номера, взятые из БД на номера в создаваемом вновь для статьи списке литературы. При оформлении списка можно использовать десятки заранее заготовленных форматов (стилей). Программа умеет импортировать, т.е. включать ссылки, найденные в других БД (например, Medline). Стоит $99.00.

EndNote имеет аналогичные функции. Существует возможность писать тексты с «гипертекстовыми» ссылками для Интернет. Известным недостатком, который сейчас преодолен, было ненадежное «прикрепление» списка литературы к тексту написанной статьи. В результате при переводе файла статьи из формата одного текстового процессора в другой были возможны потери ссылок. Выпускалась Niles and Associates, Inc., а теперь приборетена Institute for Scientific Information, издающему знаменитый SCI, и стала одним из продуктов ResearchSoft – образованной в 1999 г компании, поддерживающей теперь одновременно три лучших библиографических программы – EndNote, Reference Manager и ProCite.

Reference Manager (RM) хорошо приспособлен для биологов и врачей. Разработан компанией Research Information Services, которая предлагает также подписку на Reference Update(RU) — информационные выпуски по клинической медицине на дискетах.

RM позволяет при записи статьи в свою БД помечать ее любым количеством ключевых слов, фраз и сделать заметки любого размера. Соответственно, потом возможен поиск введенных «единиц хранения» по любому признаку и любой комбинации признаков. Те статьи, которые будут представлены в архиве в «бумажном» виде, можно пометить и потом, когда Вы обратитесь к БД, Вы будете знать, есть ли у Вас копия. Записи можно автоматически проверять на наличие ошибок и на предмет дублирования.

В Вашу БД Вы можете ввести описания документов и комментарии к ним с клавиатуры компьютера или результаты поиска в Medline, BIOSIS, или других БД; можете — с дискет Сurrent Contents или RU, получаемых по подписке; можете — из файла, который записали в библиотеке по результатам поиска на CD. Хорошие программы имеют богатые возможности различать форматы записей из самых разных БД. RM версии 9 имеет встроенные средства поиска в сетевых БД и в электронных каталогах сотен библиотек. Результаты такого поиска сразу оформляются в виде своей БД. В этих записях Вы можете помещать сетевые адреса-ссылки (URL) на любую информацию, например, на белковые или ДНК-структуры. К ним можно будет обратиться, просто щелкнув по ссылке в Вашей записи.

Важным достоинством специальных программ, в том числе RM, является то, что, вводя данные в БД так, как Вам удобно, Вы имеете возможность «на выходе», при печати списка литературы, получить то, что нужно — в алфавитном, хронологическом порядке, с полным или сокращенным описанием, обозначив том так или иначе (T., Том, Vol., V.) и т.д. Если Вы захотите изменить оформление (послать статью в другой журнал), то Вы сможете ее переоформить за минуту-другую.

Библиографические программы не слишком велики по размерам (обычно до 10 Мб) и сохраняют информацию экономно, поэтому они не создадут проблем для Вашего жесткого диска даже если он невелик. Конечно, если Вы будете бездумно выгружать из доступных Вам БД большое число описаний и текстов статей, то Вам не хватит емкости даже самых современных винчестеров.

Стоит Reference Manager в версии 9 для Windows $400 (можно найти со скидками за $200). Адрес: 2355 Camino Vida Roble, Carlsbad, CA 92009-1572, телефон (619) 438-5526; факс (619) 438-5573; http://www.risinc.com/. ProCite (версия 4) стоит $400.

Библиографическими программами не ограничивается список программ, которые полезны при работе с литературой. Есть еще специальные программы поиска литературы на CD и в компьютерных сетях и облегчающие включение таких находок в Вашу БД (BiblioLinks, Internet Enabler, NetCite, BookWhere?Pro). У всех программ есть варианты для использования в локальных сетях многими пользователями. Базу данных RM можно сделать доступной для посетителей на Вашем сайте с помощью добавочной программы Reference Web Poster.Цены на добавочные программы ниже - $90-200. RM9 включает в себя почти все эти возможности.

В заключение нельзя упустить случай напомнить: нужно периодически снимать копию с Вашей БД на дискеты, поскольку Ваши бесценные записи на жестком диске могут быть повреждены.

Кто может Вам помочь?

Большинство специалистов, создающих собственную БД, могут рассчитывать лишь на собственные силы. Боссы могут позволить себе секретаря или библиотекаря, работающего с их личным архивом. Вы, видимо, сможете часть забот делегировать Вашим подчиненным (снятие копий, ввод данных в компьютер). Неплохая идея — привлекать к этому детей. Дело полезное и не слишком сложное для них.

Поддержание архива

Любой архив требует постоянного ухода. Вы должны хорошо знать, что твориться в разных его «углах». Уже с самого «рождения» архива и БД нужно внимательно следить, чтобы они не переполнялись. Самый простой способ переполнить БД — заставлять туда информацию, полученную из других источников, не убедившись, что она действительно нужна. Такое случается не только при пользовании электронными средствами, но и при получении печатных карточек, при вырезании карточек из журналов.

Средство от переполнения — «пропалывание». Обычно это бывает жалко делать. Но надо. Чтоб было легче, можно рекомендовать следующее:

1. Пропалывайте при чтении. Если Вы нашли при работе ссылку, которая очевидно устарела и не нужна — удалите. Не забудьте сразу выбросить упоминание о ней в других местах картотеки, выбросьте и оттиск из папки.

2. Запланируйте ежегодную прополку и внесите ее в Ваш деловой календарь. Конечно, за час-другой Вы с этим делом не справитесь, но в несколько приемов сможете прополоть всю БД.

3. Пропалывайте архив и БД, когда они превышают установленные заранее размеры. Например, если архив не входит в Ваш шкаф. Или если ссылки превышают некоторое установленное количество, например, 20 000.

4. Установите предел длительности хранения. Конечно, какая-то часть «классических» работ будет Вами сохраняться, но таких немного. Их можно даже сразу пометить, чтоб не выбросить случайно. Практичные американцы считают, что за исключением совершенно блестящих статей прочие уже через 1-3 года недостойны храниться в архиве. Если такие статьи сразу пометить, то в электронной БД можно применять автоматическое выбрасывание статей, срок хранения которых истек.

5. Периодически — 1-2 раза в месяц — снимайте на дискеты копию Вашей БД. Еще лучше, если у Вас будет две копии, одна — снимаемая в четный месяц, другая — в нечетный. Впрочем, резервное копирование – дело серьезное и его лучше изучить и спланировать специально, в зависимости от Ваших возможностей и потребностей.


Так получилось, например, у тех, кто в шестидесятые-восьмидесятые годы активно пользовался межбиблиотечным абонементом; тогда этот самый дешевый вид копирования широко использовался для изготовления бесплатно высылаемых копий

 
© 1999 Агатон