Электронная подготовка изданий.
Новосибирская школа программирования. Перекличка времен.

Электронная подготовка изданий.

часть1

Системный анализ и проекты

Годы 1968–70 прошли у Л.Л. Змиевской, А.Ф. Рара и А.А. Берса главным образом «под звездой» Алгола-68, — его изучения, освоения и перевода, включая создание русской версии (что было новинкой), проходившей параллельно с разработкой языка рабочей группой 2.1 ИФИП, в которой активно работал А.П. Ершов.

Уже при издании «Сообщения об Алголе-68» в журнале «Кибернетика» в Киеве (в номерах: 6 , 69г. и 1 , 70г.) мы столкнулись с ужасной бедностью наличной полиграфической технической базы. Чтобы напечатать параллельными текстами английский оригинал и его русский перевод, каждый из которых был сильно структурированным текстом с богатым ассортиментом шрифтовых выделений (6 вариантов начертаний шрифта), пришлось буквально «стать на уши» и лично встревать в ход набора и корректуры.

С теми же проблемами мне пришлось встретиться и через пять лет при издании «Пересмотренного сообщения об Алголе-68», перевод которого я начал в 1973г.

ИФИП предоставила нам готовые фотоформы оригинала описания языка, что позволяло обеспечить безошибочное воспроизведение английской части, но для параллельного издания текстов (билингва с поабзацным соответствием) было необходимо применить те же гарнитуры и начертания шрифтов и в русской части, для чего требовалось шесть различных начертаний трех гарнитур.

Оказалось, что это можно было сделать только в цехе фотонабора Первой Образцовой типографии им. А.А. Жданова в Москве, причем работа по подготовке качественного издания оказалась высшей по категории сложности и потребовала очень много времени. Таким образом, перед нами предстал воочию живой пример трудоемкого ручного использования «системы автоматизированного фотонабора на ЭВМ».

Все это привело к тому, что, взявшись за издание Алгола-68, Первая Образцовая типография им. А.А. Жданова в Москве заказала ВЦ СО АН СССР исследования по автоматизации фотонабора, которыми с 1975 г. и занялись А.А. Берс и (тогда ещё студент) В.В. Медведев. Работа, естественно, началась с системного анализа процессов подготовки изданий, определяющих строение таких систем.

САПФИР ( С истема А втоматизированной П одготовки Ф отонаборных И зданий, обеспечивающая Р едактирование) открыл в моей жизни целую эпоху «электронной подготовки изданий», которая продолжилась до 1990 года.

Результаты этого системного анализа процессов издания и сформированных на его основе гипотез и проектных решений практически осели на полках института в виде внутренних отчетов. Однако, по моему мнению, именно этот системный анализ ряда связанных проблемных областей (включая и собственно системное программирование, как проблемную область) дает наиболее содержательное представление о нашей работе.

Сокращенное изложение материалов, хранящихся в архиве А.П. Ершова:

  • Система САПФИР:
    Берс.А.А. Эскизный проект Системы автоматизированной подготовки фотонаборных изданий, обеспечивающей редактирование, САПФИР. — Новосибирск, отчет ВЦ СО АН СССР, 1976.
    Берс.А.А., Медведев.В.В. Технический проект Системы автоматизированной подготовки фотонаборных изданий, обеспечивающей редактирование, САПФИР. — Новосибирск, отчет ВЦ СО АН СССР, 1977.

  • Проект РУБИН газеты «Правда»:
    Системный анализ производственных процессов по выпуску газеты «Правда», Совместный отчет ВЦ СО АН СССР и Новосибирского филиала ИТМиВТ АН СССР. Н-ск, 1977.
    Берс.А.А. Генеральная схема создания и развития информационно-вычислительной системы РУБИН газеты «Правда». — М. — Н-ск, Издательство «Правда», 1979.

    в дальнейшем выделяется изменением шрифта.

    Прежде чем читать далее, читателю следует сориентироваться в общем контексте состояния дел с ЭВМ того времени. В стране начался серийный выпуск ЕС ЭВМ, главным образом её младших моделей ЕС-1020 и ЕС-1030, а мини-ЭВМ серии СМ только планировались.

    Практически везде машины использовались в режиме пакетной обработки задач. Устройства ввода-вывода — перфокарты и перфоленты, печать через телетайпы и АЦПУ с весьма ограниченным набором символов.

    Следует иметь в виду, что оперативная память была на магнитных сердечниках и маленькой (32 — 128 Кбайт), сменные магнитные диски — 7.5 Мбайт, вся внешняя архивная память — на магнитных лентах. О системах коллективного доступа и диалога с машиной ещё только разговаривали, дисплеи видели воочию единицы.

    Не вредно также помнить, что микропроцессор Intel -8080 был построен в 1974 г., первый персональный компьютер — в 1976 г., а IBM PC XT был выпущен в 1981 г.

    Проект САПФИР

    Исходные положения

    В основу системы были заложены принципы разделения различных сторон работы по подготовке издания между несколькими типами пользователей и отделения собственно текста от его полиграфического исполнения.

    Особо важным представлялось обеспечение комплексного характера полной работы над изданием для всех этапов работ с помощью ЭВМ и накопление в архиве системы не только подготовленных собственно текстов, но и отдельно сформированных способов полиграфического исполнения изданий.

    Характеристическими чертами книги как объекта, которым должна быть подчинена работа системы подготовки изданий с помощью ЭВМ, являются, по нашему мнению, следующие.

    1. Обязательное соответствие и верность оригиналу — это, по-видимому, не требует разъяснений.

    2. Однородность исполнения одинаковых элементов издания — это требование проходит «красной нитью» через все руководящие материалы и методические пособия по редактированию и полиграфическому оформлению книжных изданий.

    Так, например, все абзацные отступы должны иметь один и тот же размер во всей книге, все заголовки рубрик одной ступени должны быть набраны одним шрифтом и одинаково расположены. Для издания в целом — это относится к формату страниц, расположению колонтитулов и колонцифр, организации подписей к иллюстрациям и т.п.; те же требования однородности применяются для многотомных или серийных изданий.

    З. Книга является не только продуктом производства , но и произведением искусства — это относится к каждой книге. Выбор формата и размеров полей полосы, подбор шрифта, размещение иллюстраций и подписей к ним, расположение и способ оформления примечаний, уравновешенность композиции спусков, организация указателей, оглавления, выходных данных и конечно же титульного разворота — все это является предметом заботы и работы не только художественного редактора и художника, но и технического редактора и всех других людей, выпускающих книгу.

    Общие свойства системы подготовки изданий

    Для того чтобы обеспечить реализацию этих черт книжных изданий, удобство пользования и эффективность работы, программная система подготовки изданий с помощью ЭВМ должна обладать следующими свойствами.

    1. Обеспечение комплексного подхода к подготовке издания, который начинается с ввода оригинала в память ЭВМ и завершается выдачей через фотонаборные автоматы полного комплекта форм всех полос книги. Только на этом пути можно обеспечить эффективное использование таких систем и надежность процессов переработки текста.

    Обработка издания в ЭВМ должна включать в себя осуществление всей правки, как представленной издательством, так и вызванной неизбежными ошибками операторов-наборщиков. А также реализацию всех указаний технического и художественного редактора — относящихся и к особенностям текста, например, выделения, набор формул и т.п., и к его расположению на полосах, например, размещение иллюстраций, организация заголовков и т.п.

    2. Возможность легкого внесения изменений в текст и его оформление в течение всего процесса подготовки издания на ЭВМ. Рассматриваемая вместе со способностью программных систем возможность осуществить безошибочную реализацию подстановок в текст на всем его протяжении даже при наличии достаточно сложных контекстных ограничений, управляющих такой подстановкой, — эта возможность обеспечивает накопление улучшений в тексте издания в процессе его подготовки в ЭВМ.

    Вместе с комплексностью и возможностью обеспечить защиту частей текста от непреднамеренного вмешательства и повреждения, которую предоставляют современные системы программирования, это обеспечит качественно новый уровень проведения процессов подготовки изданий.

    3. Необходимо осуществить отделение текста издания от его полиграфического оформления , что обеспечит качественно новый уровень работ по сравнению с существующей технологией.

    4. Накопление в системе общих приемов полиграфического оформления и средств осуществления элементов изданий и возможность использовать их простым указанием на их названия.

    Эти приемы и правила, накопленные за века развития книгоиздания, разбросаны по различным методическим и учебным пособиям по полиграфии или же передаются «из уст в уста» как традиции среди полиграфических и издательских работников. Собрание этих приемов и системная организация их применения позволяет после включения их в библиотеку системы сделать применение весьма сложных способов организации текста доступным даже рядовому пользователю.

    5. Правильное разделение работ , осуществляемых системой между пользователем-человеком и ЭВМ с учетом того, что программы для ЭВМ не могут в ходе своей работы ни опираться на смысл обрабатываемого текста, ни воспринимать художественных образов , задуманных оформителем или художественным редактором.

    Все решения, принимаемые на основе такой информации, должны делаться человеком, сообщающим затем машине, что нужно сделать, поскольку ЭВМ лучше человека приспособлена для выполнения однообразной рутинной технической работы по реализации этих решений.

    Правильный учет указанных факторов позволяет организовать выполнение работ в два этапа — однократное, разовое, принятие решения человеком и систематическое, монотонное осуществление принятого решения с помощью ЭВМ.

    Дело в том, что исправления, вносимые в набор в процессе подготовки издания, делятся на два класса: типографская правка, вызванная расхождением между набором и указаниями поступившего из издательства оригинала, и издательская правка, связанная с изменениями против оригинала, вносимые в корректуры. При этом издательской (в том числе авторской) правкой считаются любые изменения текста, а также изменения в его полиграфическом исполнении (изменение шрифта, переверстка и т.п.). Нормативы устанавливали, что объем издательсой правки не должен был превышать 15% ( а позднее и 10%, и даже 5%) стоимости набора для несложных текстов, и 5% (1%) стоимости набора для текстов повышенной сложности.

    Однако, соответствующие типовые графики не охватывали той части работы по преобразованию текста, которая проводится издательством от поступления авторской рукописи до сдачи издания в набор. А сюда входят: вычитка, научное и литературное редактирование текста, техническое и художественное редактирование и разметка издательского оригинала.

    Из этого видно, что процессы, проводимые в типографии, чередуются с процессами, проводимыми издательством. Причем, являясь процессами внесения изменений в текст, эта работа, с точки зрения выполнения ее в автоматизированной системе с помощью ЭВМ, ничем не отличается от внесения изменений в текст при корректуре набора.

    Существенным здесь является тот факт, что только после набора текст начинает находиться на вещественном носителе , позволяющем аккумулировать в себе улучшения, вносимые в текст.

    Применение ЭВМ дает возможность создать вещественный носитель текста прямым вводом текста авторской рукописи в память машины с возможностью последующего автоматизированного проведения преобразований текста, реализующих желаемые изменения. Это существенно повышает эффективность и надежность внесения возможных изменений и дополнений в текст.

    При этом появляется возможность проведения всех работ по подготовке издания внутри автоматизированной системы, начиная от ввода оригинала в архив системы и кончая выдачей через фотонаборный автомат полного оригинала печатных форм полос издания.

    Другими словами, при применении автоматизированных систем подготовки изданий, чем раньше текст будет введен в память ЭВМ, тем эффективнее и надежнее будут проводиться процессы его обработки и тем быстрее и с меньшими усилиями будет получен искомый результат .

    Отсюда логически следует, что, в принципе, все процессы, связанные с набором и подготовкой оригинала печатных форм, могут быть вынесены за пределы типографий.

    Однако следует заметить, что реализация этого принципа потребует значительной реорганизации существующих производственных отношений, что, конечно, значительно сложнее, чем построить автоматизированную систему подготовки фотонаборных изданий.

    Предлагаемая в САПФИРе технология проведения процессов подготовки текстов не зависела от того, размеченный или не размеченный оригинал будет вводиться в машину и будут ли в процессе правки в текст вноситься изменения по сравнению с оригиналом. Другое дело, что было заранее понятно и объяснялось заказчику: применение этой системы только внутри типографии не позволит полностью использовать заложенные в ней преимущества.

    Разумеется, системный анализ издательско-полиграфической проблемной области включал в себя обзор родственных систем, составленный на основе доступной литературы, которая включает как русские, так и зарубежные книги, научные статьи, программные руководства и технические проспекты по системам управления фотонабором и системам текстового редактирования на ЭВМ. Обзор не затрагивал работ, связанных с ручной подготовкой информации, управляющей фотонабором с помощью специализированных наборно-кодирующих устройств, по которым уже были доступны несколько обзорных статей.

    (В.Г.Богомолов и др. Оборудование для переработки текстовой информации и фотонабора // Полиграфия 2, 1974; также номер журнала Datamation. — Vol .16, N 16. — 1970, целиком был посвящен перспективам развития фотонабора.).

    Обзор

    Следует отметить, что использование отдельных специализированных устройств подготовки перфоленты для управления фотонабором является наиболее распространенным у нас в настоящее время. В связи с этим многие советские статьи в основном посвящены кодированию информации. Поэтому самыми ходовыми терминами, встречающимися в обсуждении фотонабора, являются «полнокодовая» и «неполнокодовая» перфолента. Мы оставили полностью за пределами обзора вопросы кодирования информации внутри систем, поскольку они не являются главными.

    Привлечение информации о программах переработки текста, разработанных для внутреннего употребления в системах программирования для ЭВМ, вызвано тем, что в таких программах наиболее глубоко проработаны наборы операций и способы адресации для текстового редактирования, хотя они и рассчитаны, как правило, на выдачу текста через бедные выводные устройства ЭВМ, совершенно неприемлемые с позиций полиграфического качества. Мы старались ограничиться только сравнением функциональных возможностей соответствующих систем, хотя иногда нам и придется ссылаться на некоторые средства реализации этих возможностей.

    Режимы работы

    С точки зрения режима работы все системы могут быть разделены на два класса: обеспечивающие диалоговой процесс общения и обеспечивающие пакетный режим обработки текста.

    Принципиальная разница в подходе к обработке текста в этих двух режимах состоит в том, что при диалоговом общении команды пользователя выполняются немедленно, и поэтому следующие указания должны задаваться по отношению к уже измененному новому состоянию текста. В то же время при пакетной обработке все указания делаются по отношению к исходному тексту, независимо от того, какие изменения в нем этими указаниями производятся.

    Этот режим работы соответствует привычному для подготовки книжных изданий процессу корректуры. Многие работы по преобразованию текста носят ярко выраженный групповой характер и, следовательно, хорошо подходят для пакетной обработки. В связи с этим в редактор «ТЕКСТ» ВЦ СО АН СССР была введена наряду с диалоговыми средствами, возможность задания пакета указаний на обработку, что оказалось весьма удобным на практике.

    Отметим также, что при наличии дисплеев с ЭЛТ, диалоговый режим упрощает процесс корректуры за счет перехода к неявной адресации по тексту при помощи управления курсором на экране.

    Структура текста

    Большинство программных текстовых редакторов рассматривает текст как составленный из строк с ограниченным числом символов, однако в некоторых из них текст рассматривается как последовательность букв или слов. Более сложное структурирование текста предлагается системой ( A . vanDam , D . E . Rice On-line text editing: a survey // Computing Surveys . — 1971. — Vol . 3, N 3), где введено понятие гипертекста, связывающего отдельные фрагменты текста явными связями. Предложенная в САПФИРе структура текста может рассматриваться как реализация идеи гипертекста в применении к естественней рубрикации издания и выделению блочных текстов.

    Адресация

    Почти все системы обеспечивают нумерацию строк в процессе их ввода с последующей адресацией относительно этих номеров. В некоторых случаях, однако, нумеруются отдельные слова текста. Как правило, допускается относительная адресация указанием сдвига от некоторого номера строки.

    Кроме того, почти все системы позволяют указать место в тексте заданием образца. Наиболее полно эта последняя возможность разработана в языке Снобол. Введенное здесь понятие образца позволяет не только найти вхождение в текст конкретной последовательности символов, но и описать значительно более сложные предикаты над обрабатываемым текстом. Многие из образцов Снобола не могут быть описаны простым перечислением подстрок, так как подстроки, которые им соответствуют, будут зависеть от контекста, и число их не ограничено.

    Многие системы не ограничивались предоставлением пользователю какого-нибудь одного способа адресации, а позволяли ортогонально комбинировать несколько способов. Такой же подход был осуществлен и в САПФИРе, однако он существенно опирался на разделение понятий структуры текста и структуры носителя и независимости собственно текста и его полиграфического оформления.

    Команды редактирования

    Ассортимент команд текстового редактирования в настоящее время можно считать практически установившимся. Разнообразие в списках команд, наблюдаемое в существующих системах, в основном определяется принятыми синтаксическими средствами, структурой текста и способами адресации. Кроме того, многие системы вводят с целью сокращения объема управляющей информации, команды с комбинированными возможностями.

    Основной репертуар включает в себя команды добавления, удаления и замены строк и символов, команды, позволяющие найти или изменить положение текущего указателя, и команды изменения нумерации (адресации) элементов текста. Как правило, наряду с командами, оперирующими со строками, существуют команды внутристрокового редактирования, позволяющие применить те же возможности к отдельным символам. Иногда добавляются команды, позволяющие перенести некоторый фрагмент текста в другое место или заставить некоторый фрагмент быть скопированным сразу в нескольких местах текста.

    Защита и достоверность

    Как правило, обеспечение защиты текста осуществляется использованием средств защиты операционной системы для файлов, содержащих эти тексты. В некоторых случаях (редактор TECO фирмы DEC ) организация работы обеспечивает одновременное существование, по крайней мере, одной предыдущей редакции текста, что позволяет восстановить результаты работы в случае сбоя.

    С целью автоматического исправления ошибок наборщика, в наиболее ответственных случаях применяется двойной ввод информации с распечаткой (или показом на экране) разницы вводимых текстов.

    В связи с тем, что в рассматриваемых системах не проводится разделение текстовой и полиграфической информации, в них нет возможности раздельной защиты каждой из этих составляющих.

    К средствам проверки достоверности текста следует отнести также возможность распечатки всех мест текста, содержащих указанный образец. Эта возможность может быть скомбинирована из предоставляемых средств во многих системах для мини-ЭВМ типа PDP -11.

    Управление выводом

    Почти все системы используют для управления расположением выходного текста специальные последовательности символов, включаемых в нужные места в основной текст. Эти последовательности, называемые форматными командами, или директивами, интерпретируются подпрограммами выдачи текста и переводятся ими либо в последовательности символов выходного текста, либо в команды управления выводными устройствами.

    Разумеется, текстовые редакторы, рассчитанные на распечатку ЭВМ, имеют значительно более бедные возможности. Однако и они позволяют выключать текст в заданный размер, управлять отступами, делать выделения разрядкой и т.п. Возможна организация разбиения текста на страницы, их последовательная нумерация и надпечатка заголовков, однако распределение текста по страницам должно проводиться пользователем. В числе возможностей, ставших стандартными для большинства систем, есть средства табуляции, позволяющие организовывать выходной текст в виде таблиц и выводов.

    Некоторые системы имеют средства для набора многострочных формул. Наиболее разработанное решение этого вопроса дано в работах B.W. Kernigham, L.L.Cherry и в редакторе TROFF J.F.Ossanna. Предложенный в САПФИРе способ набора блочных текстов укладкой является обобщением указанного подхода с учетом разделения текстовой и полиграфической информации.

    Фотонаборное устройство и программное обеспечение фирмы «Интернэшнл График К о » дает возможности для одновременного фотонабора текста и иллюстраций (в том числе полутоновых). Такие же возможности анонсированы в проспекте «Система электронного набора и печати «ВидеоКомп» 70/800».

    Системная организация

    Большинство машинных текстовых редакторов использует возможности операционных систем для организации службы архива.

    Системы управления фотонабором, как правило, обслуживаются мини-машинами и не имеют достаточных емкостей внешней памяти. Вследствие этого, архив таких систем, как правило, накапливается на перфоленте, т. е. отсутствует как оперативно доступный.

    Макротехника

    Использование макровозможностей применяется в большинстве текстовых редакторов, разработанных для использования в системах программного обеспечения ЭВМ. При этом такие макросредства применяются не только для того, чтобы с их помощью вводить новые сложные комбинированные команды, но и используются, чтобы вводить сокращения для часто повторяющихся фрагментов текста, подобные же возможности применяются и в программах управления фотонабором для системы Linotron -505, хотя их применение здесь носит более примитивный характер.

    На самом деле для пользователя существенным является лишь возможность свертывания определенных фрагментов и, что особенно важно, последующего вызова их или их частей по некоторому имени. При этом для него не существенно, будет ли это свертывание реализовано через макротехнику или посредством использования процедурных свойств языков. Заметим также, что макроподстановка дает лишь возможность статического учета ситуаций, в то время как через процедуры можно получить динамическую информацию о текущем положении дел. Максимальное использование макротехники продемонстрировано в текстовом процессоре TRACE.

    В системе САПФИР макротехника широко используется при генерации конкретного экземпляра системы, а также как средство, предоставляемое системному полиграфисту при подготовке процедур реализации форматных директив (фордов) для библиотеки. Во всех остальных случаях для сохранения непрограммистского характера общения пользователей с системой применена прозрачная для него смешанная стратегия вызова наиболее подходящего в данном случае экземпляра требуемой процедуры, заранее запасенного в библиотеке.

    В заключение обзора перечислим те свойства системы САПФИР, для которых не было найдено аналогов в доступной литературе.

    Во-первых, это последовательное проведение разделения собственно текстовой и полиграфической информации.

    Во-вторых, это комплексный подход к подготовке изданий, опирающийся на ввод в первую очередь исходного текста издания для хранения в архиве системы и накопления в нем всех последующих результатов подготовки.

    В-третьих, подход к верстке текста с предварительным расчетом макета издания.

    Системный анализ строения книжных текстов

    Задача системного анализа текстов состояла в определении основных элементов и структур, из которых составлен текст; их внутренних характеристик; взаимных связей; информации, требуемой для их задания; а также информации, с помощью которой определяется их полиграфическое осуществление.

    Кроме того, этот анализ должен был привести к разделению полной информации, требуемой для осуществления некоторого издания, на информацию, описывающую собственно текстовую сторону этого издания (называемую далее всюду просто текстом ), и информацию, задающую способы и особенности полиграфического воплощения (везде далее просто полиграфия ) этого издания.

    Для обоснования как выделяемых элементов и структур текста, так и для отделения текста от полиграфии использовались «мысленные эксперименты» по трансформации оформления и прослеживании при этом, при каких условиях и в какой степени будет оставаться неизменным смысл соответствующего фрагмента текста.

    Понятие «смысла (содержания) текста» не будет формализоваться в каком бы то ни было направлении. Однако, при изложении всегда будет предполагаться, что читатель в состоянии содержательно следовать за ходом рассуждения, чтобы в каждый момент принимать аргументацию, проводимую в данном проекте (или находить в ней ошибки).

    Наименьшим элементом текста является символ. Мы относим к символам все видимые при печати знаки: буквы, цифры, знаки препинания, специальные значки, используемые в различных областях науки и техники, и т.п. Все символы образуют видимый алфавит.

    Определение 1. Прототекстом называется линейная упорядоченная последовательность символов видимого алфавита.

    В данный момент уместно сказать о том, каким образом (вообще говоря, давно изобретенным) предлагается представлять текст, Для этой цели наряду с вышеупомянутым видимым алфавитом предполагается использовать невидимый дополнительный алфавит, символы которого вставляются в нужных местах между символами прототекста таким образом, что получившийся текст удовлетворяет следующему

    Определению 2. Текст есть линейная упорядоченная последовательность символов, принадлежащих объединению видимого и невидимого алфавитов.

    Таким образом, чтобы завершить описание строения текста, нам необходимо будет перечислить состав символов невидимого алфавита.

    Сегодня в гипертекстах это называется тегами (разметкой), причем невидимыми становятся все символы, заключенные в скобки невидимости, для которых используются «<» и «>».

    Информация о полосах

    В соответствии с принятой практикой мы будем рассматривать полосу как основную единицу полиграфии. Очевидно, что вариации размеров полосы (в широких пределах) никак не влияют на содержание. Следовательно, информация о размерах полосы целиком принадлежит к полиграфии.

    Не влияют на смысл текста также нормы и сигнатура (которые зависят от раскладки полос на листе). Информация о них тоже относится к полиграфии.

    Легко представить себе два издания одного и того же текста, отличающиеся тем, что в одном из них нет колонтитулов, а в другом они есть. Конечно, пользоваться вторым из них будет удобнее, но с достаточной для целей нашего анализа уверенностью мы можем отнести к полиграфическому оформлению и колонтитулы. Однако в случае «бегущих» колонтитулов их содержание будет зависеть от текста, попадающего на соответствующую полосу. Этот факт необходимо иметь в виду при рассмотрении связей как элементов внутри текста, которые мы рассмотрим позднее.

    Это же следует учитывать и в связи с отнесением к полиграфии колонцифр, здесь тоже возникают (при ссылках типа «см. стр. ххх») связи как элементы текста.

    Очевидно, что ничего не меняется в содержании и при многоколонном размещении текста на полосе, следовательно, это тоже полиграфия. Вопросы, относящиеся к параллельному набору текстов, например, одного и того же текста на двух или более языках, отложим до обсуждения текстовых связей, поскольку они будут аналогичными как для колонок, так и для параллельного расположения текстов на смежных полосах разворота.

    Точно также, смысл остается независящим от выбора гарнитуры, начертания и кегля основного шрифта, который использован при издании (о выделениях см. ниже), и от принятого интерлиньяжа.

    Мысленные эксперименты по варьированию оформления текста, результатом которых явились приведенные выше утверждения, не были сформулированы явно вследствие их тривиальности. Мы и в дальнейшем будем описывать только те эксперименты, которые требуют детального изложения, а во всех остальных случаях ограничиваться лишь формулировкой результатов.

    Связный текст

    Уже на первый взгляд сразу видно разницу в наборе связного (или линейного) текста и двумерного текста, смысл которого зависит от взаимного расположения его элементов на плоскости страницы. Строение двумерного текста, типичными представителями которого являются формулы и таблицы, рассмотрим позднее, а сейчас разберемся в элементах и структуре линейного текста.

    Поскольку все преобразования текста, не затрагивающие его смысла, должны обеспечивать неизменность порядка расположения входящих в этот текст символов, то инвариантность прототекста является необходимым, но не достаточным условием сохранения смысла при преобразованиях текста. Естественные тексты имеют, на самом деле, более богатую структуру, чем простая линейная последовательность символов.

    Действительно, буквы группируются в слова, слова в предложения, предложения в абзацы, а далее начинается иерархия рубрик текста, которая в разных изданиях имеет разную высоту (глубину) и разные типы организации. Один из возможных примеров:

    том — книга — часть — глава —
    параграф — абзац — предложение — слово — буква

    Рубрикация

    Информация о рубрикации не принадлежит прототексту, но должна принадлежать тексту , так как ее восстановление по прототексту не всегда может быть проведено однозначно, а ее утрата может привести к искажению смысла. Так, например, при не учете границ слова нельзя различить «парафраз» и «пара фраз».

    Аналогично, хотя в типографиях иногда для вгонки или выгонки строки и имеет место создание или уничтожение абзаца, но по своему назначению «каждый абзац должен начинать новую мысль, новую микротему и внутри абзаца не должно быть отклонений от нее» (см. Справочная книга корректора и редактора. — М.: Книга, 1974.)

    Следовательно, деление текста на абзацы (так же как и на предложения) носит смысловой характер и соответствующая информация (не восстанавливаемая автоматически) должна явно сохраняться в составе текста.

    Исходя из приведенного выше анализа рубрикаций, мы включаем в состав невидимого алфавита разделители рубрик различного уровня.

    При этом предполагается, что разделители рубрик, стоящие в тексте, могут быть некоторым образом связаны с указаниями о том, как оформляются рубрики одного и того же уровня (спусковая полоса, способ набора заголовка рубрики, нумерация рубрик), но сама эта информация, которая может варьироваться от издания кизданию, в текст не входит. См. также обсуждение выделений в тексте в связи с оформлением заголовков.

    Состав алфавитов

    Вернемся к рассмотрению видимого и невидимого алфавитов. Вопросы, связанные с определением состава входящих в них символов, зависят от многих факторов, связанных с реализационными аспектами проектирования системы и с составом и характеристиками используемого оборудования. Здесь мы остановимся лишь на тех факторах, которые при этом приходится учитывать.

    1. Большое разнообразие начертаний символов, используемых в книжных изданиях, заведомо превосходит количество разных символов, которые любой фотонаборный автомат (или другое печатающее устройство) может предоставить для одновременного доступа. Это приводит к тому, что все используемые символы видимого алфавита обычно разбиваются на некоторые группы, которые мы, в соответствии со сложившейся практикой, будем называть регистрами (иногда они называются магазинами, рамками и т.п.).

    В связи с тем, что в любой данный момент доступны символы только одного регистра, возникает необходимость во введении в состав невидимого алфавита символов перехода от одного регистра к другому.

    Обычно принято различать два типа переходов с регистра на регистр: запоминаемый переход, действующий на все последующие символы до тех пор, пока не встретится новый запоминаемый переход, и незапоминаемый переход, действие которого распространяется лишь на ограниченное число следующих за ним символов (обычно на один символ).

    2. Ограничения на состав знаков разных регистров сильно зависят (и обычно являются разными) от типа устройства. Это делает необходимыми работы по перекодированию представлений символов при переходе от одного устройства к другому и даже при переходе от одной работы с текстом в системе к другой.

    Так, например, на стандартной входной клавиатуре (типа пишущей машинки) прописные и строчные буквы находятся на разных регистрах, в то время как в магазинах фотонаборных автоматов — на одном и том же. Поэтому выбор внутреннего для системы состава алфавитов (как видимого, так и невидимого) в большой степени будет определяться необходимостью уменьшить работу по перекодировке при переходе от одного уровня в системе к другому.

    3. Еще одним важным фактором, влияющим на состав, а главным образом, на упорядоченность алфавитов, будут операции типа сравнения в процедурах обработки текста. Так, например, для выполнения переносов необходимо легко и эффективно различать гласные и согласные буквы.

    4. Еще одним вопросом, решение которого будет сильно зависеть от выбранных способов реализации и от особенностей процедур обработки текста — это проблема пробела. Суть проблемы в том, помещать ли пробел (а именно, переменный пробел) в состав видимого алфавита или же считать его разделителем слов, входящим в состав невидимого алфавита. Трудности здесь связаны с ограничениями на возможности переноса некоторых сочетаний слов, например, отрезок текста «тов. И.С. Кон» нельзя разбивать переносом.

    Выделения

    Многообразие способов шрифтовых и не шрифтовых выделений в тексте позволяет сразу предположить, что большая часть информации о них относится к полиграфии.

    Действительно, легко представить себе, что в процессе редактирования или вследствие бедности производственных возможностей вместо выделения другой гарнитурой будет использован полужирный прямой, а курсив всюду будет заменен разрядкой. Не знавший первоначальных замыслов автора (если они, вообще, носили столь определенный характер) читатель и не заметит такой замены, поскольку на смысл использования выделений она не повлияет.

    По нашему мнению, текстовой информацией о выделениях служит только сам факт их наличия и то, что внутри одного текста могут быть выделения разных сортов. Вся остальная информация относится к способу реализации выделений и, следовательно, к полиграфии.

    Поэтому для учета выделений в тексте достаточно иметь в составе невидимого алфавита необходимое число сортов парных ограничителей — выделительных скобок, в которые заключаются в тексте выделяемые фрагменты. Впоследствии с каждым сортом этих ограничителей будет связано полиграфическое оформление, принятое для данного выделения в данном конкретном издании.

    Заголовки

    Интересным следствием такого подхода к выделениям является возможность связать соответственно некоторые специально выделенные сорта выделений с разделителями рубрик разного уровня, заключая в выделительные скобки связанный с данным уровнем заголовок соответствующей рубрики. При этом по цепочке:

    уровень_рубрики — тип_выделения — оформление_выделения

    сразу обеспечивается однородность оформления заголовков рубрик одного уровня и сохраняется легкость его изменения.

    Связи в тексте

    До сих пор мы рассматривали только структуру и элементы связного (линейного) текста, который не покрывает, конечно, всего многообразия структур текстов. Во-первых, как уже упоминалось, существуют существенно двумерные тексты, а во-вторых, имеются части текста, связанные с некоторым связным текстом, но лежащие вне него, хотя они и входят вместе с ним в один полный текст.

      Вследствие сказанного мы будем различать следующие типы связей или ссылок:
    • внутритекстовые ссылки, облегчающие установление смысловых связей между удаленными частями текста. Например, «см. стр. ХХХ», «см. раздел 2.1.1.», «как сказано в главе II»;
    • ссылки из линейного текста на примечания к нему;
    • связи с двумерными фрагментами текста: формулами, иллюстрациями и подписями к ним, таблицами и выводами;
    • связи из текста на вспомогательные элементы издания, например, «бегущие» колонтитулы, колонцифры и т.п.;
    • связи из одного текста в другой, например, при параллельном издании одного и того же текста на двух (или более) языках.

    Как и в предыдущих случаях, связи необходимо относить к тексту , а не к полиграфии, включать как элементы невидимого алфавита и различать связи разных типов. Тогда с соответствующим типом связи можно впоследствии сопоставить соответствующий способ его осуществления так же, как это будет делаться для рубрик и выделений.

    При этом связь всегда указывает на требуемое место в тексте , а полиграфическое оформление соответствующей ссылки, например требуемый номер страницы, система может подставлять автоматически.

    Суммируя все вышеизложенное, получаем, что каждый связный текст состоит из прототекста, в нужные места которого вкраплены символы невидимого алфавита, с помощью которых отражается рубрикация текста, использование регистров, выделения и связи как внутри данного текста, так и на другие тексты, сцепленные с данным.

    В тексте полностью отсутствует информация, определяющая его полиграфическое оформление, — она должна задаваться отдельно, тоже невидимыми символами, но другими.

    Само собой разумеется, что текст, на который указывает связь из некоторого связного текста, сам может иметь структуру связного текста или же быть двумерным текстом, к определению структуры последнего мы теперь и перейдем.

    Двумерные тексты

    Для элементов двумерных текстов, которые мы, для краткости, будем называть блоками , необходимо задавать их взаимное расположение по отношению к другим таким же элементам, причем по обоим измерениям. При описании структуры блочных текстов необходимо учитывать следующие обстоятельства.

    1. Практически почти все устройства ввода текста в ЭВМ, кроме так называемых «графических дисплеев», позволяют вводить с клавиатуры только линейный текст. Поэтому указания о двумерности расположения должны быть представлены в этом линейном тексте специальными (невидимыми) символами.

    2. Поскольку различные фотонаборные автоматы обладают разными возможностями в отношении состава выполняемых ими при наборе полосы действий, то описание структуры блочных текстов должно быть независимым от способа ее осуществления. Другими словами, должна быть описана структура соотношений, статически определяющая взаимное расположение блоков, а не программа, динамически описывающая, что будет делать фотонаборный автомат при реализации текста.

    3. С целью отделения собственно текста от его полиграфического оформления, взаимное расположение блоков должно задаваться относительным способом, не опирающимся на их абсолютные размеры, которые должны определяться системой автоматически для выбранных правил набора блоков и реализации соотношений между ними.

    Отделение текста от полиграфии

    Преимущества, которые дает разделение текста и его полиграфического исполнения в системе автоматизированной подготовки изданий, проявляются на всех уровнях процесса подготовки издания:

    • на издательском уровне — возникает возможность легкого, без повторения всех работ по набору и выверке, текста, переиздания книги в другом полиграфическом варианте;
    • на редакторском уровне — отсутствие опасности при смене оформления испортить текст.

    Простота и экономичность получения вариантов освобождает редактора (а также технического и художественного редакторов) от «бремени уже сделанной работы», позволяя им ставить эксперименты для выбора наилучшего способа оформления текста, проверки их путем выдачи пробных страниц через фотонаборный автомат и возможности сравнить варианты перед принятием окончательного решения; на уровне оператора-наборщика — поскольку связь элементов, составляющих текст с их полиграфическим оформлением, устанавливается однажды заранее, то объем набираемой информации значительно уменьшается.

    Справедливость этого положения тем больше, чем сложнее набираемый текст. Особенно большая экономия получается при наборе формул и таблиц, т.е. блочных текстов.

    В общем случае — чем сложнее текст и оформление подготавливаемого издания, тем больше выгоды от применения автоматизированной системы для его обработки.

    Заливка и укладка

    Можно заметить, что способы организации набора линейных текстов и блочных (двумерных) текстов прямо противоположны. Размещение абзацев линейных текстов производится в пределах некоторого, заранее отведенного, места на полосе, и при этом совершенно несущественно, как распределятся части текста по элементам этой полосы (строкам).

    Такой способ набора можно назвать заливкой текста в предназначенное для него место. Разбиение текста на строки производится системой автоматически, различается при наборе на разный формат и для читателя практически совершенно не влияет на смысл текста.

    При блочном наборе распределение частей текста по блокам (в частности, определение того, какой фрагмент текста составит строку) проводится с самого начала. В противоположность предыдущему способу, здесь, однако, заранее не определено, сколько места будет занимать блочный текст после его осуществления.

    Напротив, именно эта информация вычисляется системой автоматически, исходя из распределения текста по элементарным блокам (строкам). Этот способ набора мы будем называть укладкой текста по блокам .

    Любой текст издания можно представить как совокупность линейных и блочных его частей, упорядоченных определенным образом и связанных между собой.

      Отсюда легко следует, что управление расположением этого текста можно обеспечить, используя следующие средства:
    • укладка (для набора блочных текстов);
    • размещение элементов издания непосредственно в терминах фактических размеров полосы, например, постановка иллюстрации, указание величины спуска и т.п.;
    • заливка линейных текстов в оставшееся от применения предыдущего способа место на полосе.

    В совокупности эти три способа решают задачи верстки, используя макет полос как исходное пространство размещения.

    Групповые действия

    Большинство процессов обработки текста носят характер систематического применения однородных указаний во многих местах на протяжении всего или большой части текста. Система предоставляет всем пользователям общие возможности задания такой работы путем однократного описания соответствующих указаний и задания принципа нахождения соответствующих мест в тексте.

      Общая схема организации таких групповых действий следующая:
    • диапазоны (указывающие части текста, внутри которых проводятся преобразования),
    • предикат (посредством которого обнаруживаются необходимые места, например, по образцу или через задание связи),
    • указание (которое необходимо выполнить),
    • возврат (на поиск следующего места).

    Такие групповые действия обеспечивают контекстную замену, поиск всех мест текста, содержащих заданный образец, и снабжение одинаковых элементов текста однородным полиграфическим исполнением.

    Применение системы САПФИР для подготовки изданий создавало для пользователей системы некоторое качественно новое рабочее окружение. Особенности этого рабочего окружения должны были способствовать существенному улучшению производительности труда и создавать дополнительные удобства пользователям, но, с другой стороны, это рабочее окружение предъявляло к пользователю новые дополнительные требования и меняло в некоторых отношениях (по бедности техники) сложившийся стиль редакционно-издательской работы.

    Рабочее окружение и пользователи

    Одним из новых требований, вызываемых рабочим окружением, является использование адресации для указания мест в тексте, подлежащих редактированию (корректуре).

    Другой существенной чертой рабочего окружения является различие между описываемым текстом в том виде, в каком он появится на полосах готового издания, и описывающим его текстом, который видит пользователь в процессе обработки издания на системе и который предъявляется ему в форме главной технической распечатки (ГТР) .

    Существует много причин, вызывающих различие между описываемым и описывавшим текстом, и разница в печатных возможностях устройств ЭВМ и фотонаборных автоматов, будучи существенной, не является определяющей в этом случае.

      Основные причины указанного различия следующие:
    • полиграфические издания используют шрифт с буквами различной ширины, отсутствующий на обычных воспроизводящих устройствах современных ЭВМ;
    • подготовка изданий на разных языках и по всем отраслям человеческой деятельности приводит к применению очень большого числа используемых символов, принадлежащих разным графическим основам (символы, используемые в разных науках, все не европейские алфавиты и т.п.);
    • ограничения стандартных устройств обмена в ЭВМ требуют предварительного описания двухмерных (блочных) текстов с помощью некоторого линейного языка;
    • отделение собственно текста от его конкретного полиграфического оформления, для этого необходимо оставлять в составе собственно текста указания об абстрактных выделениях, уровнях рубрикации и связях, привязывая к ним самостоятельно задаваемые указания о способах оформления соответствующих элементов собственно текста.

    Важной особенностью создаваемого САПФИРом рабочего окружения является безусловная верность выполнения редактирующих указаний пользователя, делающая ненужными процессы сверки выправленного текста. Кроме того, система обеспечивает неизменность частей текста, не затронутых при редактировании.

    В процессе подготовки издания часто возникает необходимость в осуществлении серии однородных действий, применяемых к разным местам текста, определяемых некоторым явно сформулированным условием. Вводимое САПФИРом рабочее окружение позволяет осуществлять такую серию действий, задав ее одним указанием. Исполнение этих действий во всех требуемых местах текста гарантируется системой.

    Рабочее окружение, создаваемое САПФИРом, обеспечивает проверку всей информации, предъявляемой пользователем (как текстовой, так и управляющей), на непротиворечивость и безопасность применения к тексту, обеспечивая тем самым защиту обрабатываемого системой текста от непреднамеренной его порчи пользователем.

    Текст и носитель

    Как и всякий другой вид информации, текстовая информация всегда представлена на каком-нибудь материальном носителе. При этом способ записи в особенности строения носителя привносят дополнительное структурирование информации, накладывающееся на структуру собственно текста.

    В процессе переработки текста в системе она многократно переписывается с одного вида носителя на другой. Сделать невидимыми для пользователя особенности представления информации на разных носителях, а также обеспечить независимость собственной структуры текста — одна из главных задач, возникающих при разработке системы.

    Однако структуры, по крайней мере, двух носителей существенно неустранимы из поля зрения пользователя:

    • во-первых, представление перерабатываемого текста в главной технической распечатке (ГТР), по которой пользователь будет обращаться к тексту при его подготовке;
    • во-вторых, тот вид текста, который он получит по завершении всех процессов его переработки системой, т.е. комплект оригиналов печатных форм издания.

    Знание структурных особенностей первой из упомянутых форм необходимо всем пользователям, а работа в терминах готовых полос может оказаться существенной для художественного (технического) редактора.

    Структура текста. Основными элементами структуры текста в системе САПФИР являются: рубрикация, выделения, связи (например, внутритекстовые ссылки). Рубрикация обеспечивается разделителями и ведется от абзаца вверх (пункт, параграф, глава и т.п.) с последовательной нумерацией уровней рубрик. Такой способ представления рубрикации выбран, поскольку число уровней и стиль рубрикации в разных изданиях могут быть различными и, в отдельных случаях, могут быть вообще отнесены к полиграфическому оформлению, а не к собственно тексту.

    Более мелкие, чем абзацы, части текста (предложения, слова) не обеспечиваются явно структурой собственно текста, поскольку строение текста внутри абзаца совпадает с его же строением, обеспечиваемым структурой носителя.

    В структуру собственно текста включаются только абстрактные выделения, обеспечиваемые нумерованными ограничителями, связи в тексте и из текста также обеспечиваются с помощью ограничителей, принадлежащих к «невидимой части» базового алфавита системы САПФИР.

    Структура носителя. Основной, видимый носитель текста (распечатка) имеет структуру четырехмерного массива позиций.

    Весь текст издания целиком рассматривается в архиве системы как один заказ. Заказ состоит из последовательно расположенных секций (первое измерение) , составленных из последовательности страниц (второе измерение). Каждая страница является последовательностью строк (третье измерение), образованных следующими одна за другой позициями (четвертое измерение).

    Подчеркнем, что понятия строки и страницы принадлежат только структуре носителя и не входят в понятие структуры собственно текста. Важно также понимать, что размещение текста по строкам и страницам ГТР никак не связано с будущим размещением этого текста на полосах издания.

    Адресация. Самая главная проблема, которая должна быть решена при проектировании адресации, — в максимальной степени обеспечить неизменность адресов тех элементов (фрагментов) текста, которые не затрагиваются данной редактирующей операцией. При изменении текста может измениться размещение элементов структуры собственно текста по элементам структуры носителя и, кроме того, могут измениться «расстояния», выражаемые как в элементах структуры собственно текста, так и в элементах структуры носителя.

    Именно из этих соображений структура носителя и способы адресации были выбраны в системе САПФИР таким образом, чтобы обеспечить пользователя отображением текущего состояния текста на основе постраничной замены в распечатке только тех ее страниц, которые были затронуты при редактировании.

    Адресация может базироваться на структуре текста или структуре носителя и в каждом из этих случаев может быть прямой или относительной. Кроме того, возможна адресация по содержанию текста (по образцу). С некоторыми ограничениями указанные выше способы адресации свободно могут комбинироваться друг с другом. Ограничения, накладываемые на адресацию, объясняются, главным образом, необходимостью обеспечить ее эффективную реализацию.

    Секции нумеруются в пределах заказа. Страницы нумеруются в пределах секции, поэтому полный номер страницы имеет вид: номер-секции, номер-страницы , однако при работе в пределах секции номер текущей секции может опускаться по умолчанию.

    Строки последовательно нумеруются в пределах секции независимо от их расположения на той или иной странице. Кроме того, можно пользоваться относительным адресом строки на странице.

    Наличие двух самостоятельных способов адресации для строк создает дополнительные удобства пользователю и позволяет сохранить стабильный номер строки, даже если в процессе редактирования она перемещается с одной страницы распечатки на другую.

    В процессе отдельного сеанса редактирования система следит за тем, содержание каких страниц распечатки изменяется, с тем, чтобы выдать новую распечатку только этих страниц в конце сеанса.

    Вследствие небольшого объема и легкости обозримости строки в целом существует только относительная адресация позиций в строке. Поскольку в пределах абзаца структурирование текста в распечатке совпадает со структурой носителя, абзац состоит из строк, а последние — из позиций, адресация по структуре собственно текста ведется на уровне абзацев и выше.

    Другим способом адресации по тексту является адресация по образцу. Фактически система в этом случае вырабатывает адрес по структуре носителя того места текста, которое буквально совпадает с заданным образцом. Система может обеспечить также поиск и выдачу адресов всех вхождений заданного образца в некоторую часть текста.

    Выбранная система адресации предоставляет пользователю богатые возможности, являясь более мощной, чем системы адресации, допускаемые аналогичными отечественными и зарубежными системами, оставаясь при этом эффективно реализуемой. За исключением поиска по образцу, все способы задания адресов и диапазонов статически приводятся (блоком адресного анализа) к фактически реализованному в системе адресу «секция, номер-строки, позиция».

    Средства текстового редактирования.

    В состав средств редактирования входит описание структуры распечаток, способы адресации и команды.

    В связи с большой важностью обеспечения серийных работ при редактировании текста в общем случае строение команды текстового редактирования имеет следующий вид:

    в ДИАПАЗОНЕ при УСЛОВИИ выполнить ДЕЙСТВИЕ,

    где ДИАПАЗОН указывается парой граничных адресов, УСЛОВИЕ может быть задано образцом, а ДЕЙСТВИЕ выбирается из следующего списка команд текстового редактирования:
    вычеркнуть текст между двумя указанными позициями,
    вставить указанный текст в указанную позицию,
    скопировать указанный текст в указанные места,
    переставить указанные фрагменты текста в указанном порядке,
    перенести указанный фрагмент текста в указанное место,
    сменить нумерацию строк текста,
    уплотнить указанный фрагмент текста за счет неполных строк в абзаце,
    печатать указанную часть текста в указанном стиле.

    Этот список команд может быть в дальнейшем пополнен, в частности, за счет команд, связанных с работой за дисплеем в диалоговом режиме.

    В зависимости от конкретных потребностей не все компоненты структуры команды, названные выше, должны задаваться в каждом отдельном случае. Использование предоставляемых системой средств умолчания, помноженное на разнообразие задания адресации и условий, превращает этот небольшой список в мощный набор средств текстового редактирования, способный удовлетворить самого взыскательного пользователя.

    К средствам редактирования относится также язык описания блочных (двумерных) текстов. Описание семантики этого языка более подробно изложено в работе Берс А.А., Детушев В.А. Управление набором блочных текстов в системе САПФИР.

    В состав основных средств редактирования включены средства свертывания наборов команд, которые могут называться по их имени. Такие макросредства значительно увеличивают изобразительные возможности языка редактирования.

    В состав средств редактирования включены форды, которые могут быть вставлены в текст соответствующими командами. С помощью фордов осуществляется вызов процедур управления расположением и форматом текста, находящихся в системной библиотеке фордов (СБФ). Вызов этих форматных процедур может производиться также неявно через связи, устанавливаемые в спецификации заказа между некоторым типом элементов структуры текста и соответствующей процедурой.

    Вид текста в процессе подготовки

    Организация базового алфавита. Исходя из того, что система будет перерабатывать тексты на многих языках, основной состав алфавита представляет собой объединенный полиграфический алфавит, рассчитанный на обслуживание 124 языков, письменность которых построена на основе латиницы и кириллицы. Этот алфавит, как известно , содержит 450 различных символов. С целью уменьшения числа символов проводится отделение акцентов от основных знаков с тем, чтобы основной регистр базового алфавита укладывался в 192 символа. Оставшиеся символы ( 64) образуют невидимый алфавит и используются для служебных целей и разметки.

    Вследствие этого базовый алфавит включает в себя некоторое число регистров, один из которых занят акцентами, а другие могут содержать символы на других графических основах, математические символы и т.п.

    Переход от одного регистра к другому осуществляется специально выделенным символом невидимого алфавита. Переход к регистру акцентов (своему для каждого основного регистра) управляется другим невидимым специальным символом, область действия которого распространяется на один следующий за ним знак. Вводится специальный (невидимый) знак «лигатура», действующий аналогично акценту, но в пределах одного и того же регистра.

    Введенный механизм регистрового деления алфавита позволяет обеспечить выбор любого символа с требуемой графемой. Отработка перехода с одной гарнитуры на другую, а также управление размерами знаков по кеглю и ширине обеспечивается использованием средств задания выделений в тексте. Принятая регистровая структура организации базового алфавита обладает достаточной для требуемых применений гибкостью и, в то же время, может быть эффективно реализована на машинах ЕС ЭВМ при помощи имеющихся там специальных команд перекодировки.

    Как было сказано, распечатки организованы в пачки страниц, каждая из которых представляет собой соответствующую секцию заказа. Число строк на странице и длина строк определяются режимом работы системы.

    В заголовке каждой страницы печатается информация, позволяющая идентифицировать текст, к которому принадлежит страница (например, обозначение заказа), место данной страницы в этом тексте (например, номер-секции — номер-страницы) и обозначение редакции (например, дату последнего изменения на ней). Кроме того, каждой секции предшествует титульная страница, которая может содержать кроме обозначения заказа и секции служебную информацию о текущем состоянии распечатки данной секции, например: сведения о редакции каждой из страниц секции, использованный режим управления форматом распечатки данной секции и т.п.

    По завершении каждого отдельного сеанса редактирования конкретной секции система определяет, какие из страниц предыдущей распечатки требуют замены, и выдает для них новую распечатку. При этом в случае вставки новых частей текста система заводит новые промежуточные страницы с тем, чтобы по возможности уменьшить число перепечатываемых страниц. Вместе с комплексом заменяемых/добавляемых страниц всегда выдается новый титульный лист секции. Для поддержания распечатки, правильно отражающей текущее состояние текста, пользователь должен произвести замену/вставку полученных страниц в свой комплект распечатки в соответствии с указаниями нового титульного листа.

    При необходимости реорганизация расположения текста в некоторой части или во всей распечатке может производиться как отдельный сеанс редактирования. Эта реорганизация может включать перенумерацию строк, должна применяться не менее чем к секции и во всех случаях делает предыдущую распечатку этой секции недействительной.

    Оригинал-макет

    Для того чтобы иметь возможность проверить результаты работы системы по подготовке изданий без дорогостоящей выдачи всего текста через фотонаборный автомат, предусматривается возможность распечатки оригинал-макета.

    Эта распечатка проводится после отработки фордов и верстки текста и отражает точное распределение текста по строкам и страницам после выключки и с учетом расположения иллюстраций и блочных текстов на полосе. Никакая нетекстовая информация (уже отработанная при верстке-выключке) в оригинал-макете не распечатывается.

    Страницы оригинал-макета содержат в точности то же число строк, что и полосы готового издания.

    Места, занятые иллюстрациями, оставляются в оригинал-макете незапечатанными, и внутри них, при необходимости, можно дать обозначение соответствующей иллюстрации. Оригинал-макет отражает аналогичным образом спуск полос, отбивку рубрик, размещение построчных примечаний и т.п. Система предоставляет также возможность заказать параллельно с оригинал-макетом выдачу отдельных полос издания через фотонаборный автомат.

    Архив и библиотеки

    Архив системы САПФИР предназначен для хранения обрабатываемых текстов, а также ранее отработанных текстов прошедших заказов для обеспечения возможности их переиздания.

      Предусматривается два уровня архива:
    • оперативный архив, в котором хранятся заказы, находящиеся в работе,
    • неоперативный архив прошлых текстов, хранимых с целью переиздания.

    Каталоги обоих уровней постоянно присутствуют в системе. Тексты оперативного архива располагаются, как правило, на магнитных дисках, но, в случае недостатка на них места, могут временно размещаться и на магнитных лентах. Тексты в неоперативном архиве всегда хранятся на магнитных лентах. Перемеще ние текста с одного уровня архива на другой требует отдельной работы, инициируемой оператором системы.

    Библиотеки системы делятся на два класса: библиотеки сокращений и библиотеки форматных директив . Они располагаются на магнитных дисках и всегда доступны обрабатывающим процессорам.

    Организация работы

    Процесс подготовки издания в системе САПФИР складывается из некоторой последовательности сеансов обработки текста. Начальный сеанс состоит во вводе текста и выдаче ГТР. Каждый последующий сеанс включает требуемую заказанную обработку текста из архива с выдачей заменяемых страниц ГТР.

      Сеанс, естественно, разбивается на две части:
    • человеческая работа, состоящая в чтении ГТР и подготовке пакета указаний для системы к набору;
    • машинная работа, состоящая во вводе указаний, в их выполнения и выдаче результатов.

    В результате сеанса в архив помещается измененное состояние обработанного текста. С целью страховки пользователя от его собственных ошибок предыдущая редакция текста тоже хранится в системе и может быть вызвана по особому указанию. Обычно в конце сеанса его результат становится текущей редакцией, а старая предыдущая редакция текста замещается старой текущей редакцией.

    Работы и процессоры

    В ходе сеанса, как правило, выполняется одна или несколько работ. Понятие работы рассматривается с точки зрения пользователя и обозначает некоторый логически замкнутый комплекс действий, используемый для обработки текста или для изменения состояния каких-либо компонент системы. Для каждого вида пользователя определен набор работ, которые может выполнять для него система.

    Структура общения пользователей и обслуживающего персонала с системой САПФИР поддерживает производственный поток информации, обслуживающий основной технологический процесс подготовки издания, и справочный поток, снабжающий пользователей информацией о текущем состоянии системы.

    Оба эти потока замыкаются через пользователей, начинаясь с подготовки данных операторами-наборщиками и завершаясь соответствующими распечатками.

    Такая структура общения с системой выбрана вследствие того, что она инвариантна к выполнению работ в пакетном или диалоговом режиме связи пользователей с системой. Здесь рассматривается стартовый вариант системы, рассчитанный на пакетную работу. Дальнейшее расширение будет обеспечивать возможности диалога, что потребует пополнения этой структуры при ее сохранении добавочным программным обеспечением. При этом правила задания работ останутся для пользователей почти неизменными.

    Основными исполнительными структурными единицами системы, обеспечивающими проведение работ, являются процессоры. При этом процессор может выполнять одну или несколько работ целиком или же одна работа может выполняться нескольким процессорами. Однако соотношение между работами и процессорами не допускает, чтобы часть какой-либо работы выполнялась частью некоторого процессора.

      Процессоры системы делятся на:
    • обрабатывающие процессоры,
    • процессор текстового редактирования,
    • процессор интерпретации фордов,
    • процессор расчета макета,
    • процессор верстки-выключки,
    • процессор составления указателей,
    • процессоры ввода и вывода, процессор распечатки,
    • монитор системы,
    • процессор службы архива и библиотек,
    • процессор подготовки фордов.

    Связи обрабатывающих процессоров показаны на рисунке .

    В системе предусмотрены два уровня архива (оперативный и неоперативный) и два типа библиотек (сокращений и фордов). Работа с архивами и библиотеками осуществляется специальным процессором, называемым процессором службы архива и библиотек.

    Монитор системы является процессором, предназначенным для управления другими процессорами и организации прохождения работ через систему в той степени, в какой это не обеспечивается средствами операционной системы, под управлением которой работает САПФИР.

    В мониторе сконцентрирована вся техническая информация о состоянии находящихся в системе заказов и подробностях запуска других процессоров.

    Монитор взаимодействует с оператором ЭВМ и помогает ему в организации потока заданий при работе системы. Кроме того, при пополнении системы диалоговыми средствами именно на монитор придется организация диалогового режима.

    Процессор и работы текстового редактирования . Строение процессора текстового редактирования учитывает, что указания для редактирования одного и того же текста могут поступать в виде нескольких пакетов команд. Когда реализуется параллельная корректура (приходящая от редактора, автора и т.д.), процессор производит слияние всех указаний и их упорядочение по возрастанию адресов их применения к исходному тексту.

    Пакетный режим осуществления корректирующих указаний предполагает, что вся адресация в них относится к одному и тому же состоянию текста, представленному ГТР.

    Процессор проверяет полученные указания на их синтаксическую правильность, а также на то, чтобы для одного и того же места исходного текста не возникли противоречивые предписания по обработке.

    В процессе анализа формируется финальный пакет указаний, который и будет применен к тексту, если не возникло противоречий. В противном случае выдаются сообщения, и пакет указаний возвращается пользователям на доработку. Исходный текст остается неизмененным. Одновременно с анализом непротиворечивости указаний выделяются образцы, если они имеются, и определяются диапазоны.

    Процессор и работы макетирования. Исходной информацией для составления макета служат: текст после интерпретации в нем фордов, спецификация заказа и таблицы размеров шрифтов, используемых для выбранного в данном издании полиграфического оформления текста. Вся исходная информация берется из архива системы.

    Макет как структура данных состоит из рабочего списка, представляющего собой таблицу, каждый элемент которой соответствует фрагментам текста, расположенным в порядке их следования, а именно: заголовкам рубрик, абзацам, блокам текста.

    В том случае, если блок, такой как формула, расположен внутри текста абзаца, то в рабочем списке заводятся расположенные в их порядке элементы, соответствующие тексту начальной части абзаца, этому блоку и тексту завершающей части абзаца.

    Для тех блоков текста, расположение которых определено нежестко (иллюстрации, примечания), заводится дополнительный список, связанный с основными двусторонними ссылками.

    Каждый элемент основного и дополнительного списков содержит информацию о размерах соответствующего фрагмента текста, задаваемую максимальным и минимальным значениями, которую данный размер может принимать. Кроме того, в состав элемента переносятся все текстовые связи соответствующего фрагмента.

    Таблица полос, получаемая в качестве результата, предназначается для ссылок на элементы рабочего списка, размещаемые на каждой данной полосе в результате макетирования. И, кроме того, для указания координат для расположения соответствующих фрагментов текста на полосе.

    Процессор расчета макета строит основной и дополнительный рабочий списки, исходя из заготовки макета и текста полученных после интерпретации фордов. Для каждого элемента производится расчет размеров соответствующих фрагментов текста с использованием таблиц размеров шрифтов и информации из спецификации заказа.

    Работа по дальнейшему расчету макета может быть факторизована по спусковым полосам. При расчете раскладки текста на полосы заполняется информация в элементах таблицы полос, и проверяются краевые условия, задаваемые технологическими правилами набора. Расчет части абзаца, помещаемой на полосу, производится с точностью до слова, и для каждой половины «разрезанного» абзаца вычисляются граничные значения его размеров.

    Процессор планирует размещение иллюстраций и блоков на полосах по возможности ближе к тому месту текста, где на них имеются ссылки. При этом расчет числа строк в абзацах, для которых нужно сделать оборку, производится через значение занимаемой абзацем площади.

    При обнаружении нарушения краевых условий делается попытка назначить фрагментам текста другие размеры в пределах рассчитанных границ. Этот процесс продолжается до тех пор, пока не будут устранены все неувязки. В случае если процессор исчерпал все заложенные в него возможности, выдается сообщение, запрашивающее указания от технического (художественного) редактора, текущее состояние макета запоминается, и процесс расчета прекращается вплоть до появления указаний. После завершения расчета макета он может быть помещен в архив и/или передан процессору распечатки.

    Заметим, что процессор расчета макета не производит фактического размещения текста на полосах в ходе итерационного процесса расчета, оперируя не с текстом, а только с макетом, объем которого несравненно меньше.

    Процессоры и работы верстки. Верстка производится по макету, который, как и текст для верстки, берется из архива. Для каждой полосы последовательно производится расположение на полосе блоков и расположение текста внутри их. После определения размеров и формы места на полосе, предназначенного для заливки, производится вызов модуля заливки текста, который, при необходимости, в свою очередь, обращается к модулю реализации переносов.

    Поскольку в процессе расчета макета была собрана глобальная информация о тексте и для каждого заливаемого фрагмента текста определены формат строки и число строк, в которое он должен быть залит, модель заливки опирается в ходе работы на вычисленное среднее значение переменного пробела, соответствующее указанным размерам фрагмента. При этом, при обнаружении неувязки, вызванной дискретностью слов при переносах, производится возврат по тексту до места, начиная с которого можно проводить заливку за счет выключающей способности данного отрезка текста, изменив среднее значение переменного пробела.

    Процессор верстки-выключки организован таким образом, чтобы локализовать на компенсационной основе отклонения от ранее рассчитанного макета в пределах минимально возможного числа абзацев.

    По завершении верстки происходит окончательное формирование полос, и текст каждой полосы, представленный в формате выходного интерфейса системы, записывается в архив. При необходимости может быть вызван процессор распечатки для выдачи точного, построчно совпадающего с окончательным текстом издания, оригинал-макета.

    Интерфейсы системы. Для того чтобы сделать работу процессоров системы, не зависящей от специфических особенностей представления символов на устройствах ввода и вывода, а также для того, чтобы обеспечить возможность подключения в дальнейшем новых устройств, предусматриваются специальные средства отделения представлений символов в устройствах от представлений их в системе.

    Для этой цели определяются ограничения на формат представления входной и выходной информации системы, называемые входным и выходным интерфейсами, соответственно.

    Ограничение, определяющее входной интерфейс, заключается в том, что представление текста в его формате рассматривается как линейно упорядоченная последовательность символов базового алфавита (как видимых, так и невидимых) .

    Ограничение, накладываемое на формат представления информации в выходном интерфейсе, состоит в том , что текст представляется линейно упорядоченной последовательностью двухбайтовых полей , первым байтом которого является «представление» символа базового алфавита, а второй байт занят информацией о ширине символа, указанного первым байтом.

    Те поля, второй байт которых указывает на нулевую ширину, служат для размещения в них представлений команд управления соответствующим устройством.

    Ограничение, накладываемое на формат представления информации в файлах неоперативного архива, состоит в том, что текст заказов представляется на магнитной ленте в виде одного последовательно организованного файла с блокированными записями фиксированной длины. Первый блок файла должен содержать информацию о внутреннем строении текста, формат которой будет установлен при программировании. Эта информация должна заканчиваться специальным разделителем.

    Сегодня (декабрь 2004 г.) эти материалы в первую очередь с очевидностью демонстрируют желание дать редакторам возможность работать по-человечески даже на тех аппаратных и технических средствах и пакетных режимах, которые были в наличии. Конечно, дальше опытной эксплуатации пакетная система редактирования на ЕС-1020 в операционной системе ДОС не пошла.

    Однако уже при защите Эскизного проекта системы САПФИР на техническом совете Госкомиздата СССР акад. А.П. Ершова взял за жилетную пуговицу директор издательства ЦК КПСС «Правда» Борис Александрович Фельдман и сказал: «Я хочу, чтобы у нас тоже была такая система. И даже лучше». Так началась другая история — история проекта РУБИН.

    Проект РУБИН

    В конце 1976 г. комбинат «Правда», Вычислительный центр СО АН СССР и Новосибирский филиал ИТМиВТ АН СССР подписали «протокол о научно-техническом сотрудничестве», нацеленном на решение проблемы внедрения средств вычислительной техники для производственных процессов комбината.

    Прежде всего, предусматривалось проведение системного анализа производственной деятельности комбината с позиций информатики и вычислительного дела. При этом имелось в виду, что результаты такого анализа должны будут стать основой для выработки технического задания на проведение проектных и опытно-конструкторских работ.

    Начальный период. Первые контакты, общее ознакомление с комбинатом, выяснение круга вопросов, подлежащих изучению. После обсуждения интересующих «Правду» проблем было решено начать с общего обследования характера редакционно-издательских процессов, принятых в издательстве.

    Эта работа выполнялась в качестве совместного социалистического обязательства ВЦ СO АН СССР и НФ ИТМиВТ АН СССР в честь 60-й годовщины Великой октябрьской социалистической революции, принятого по инициативе лаборатории экспериментальной информатики ВЦ СO АН СССР.

    Подготовка . Выбор главного звена в проблематике, разработка методики системного анализа и ее согласование. Весной 1977 г. в издательство был отправлен нижеследующий документ.

    ПРЕДВАРИТЕЛЬНЫЙ ЗАПРОС НА ИНФОРМАЦИЮ ,
    необходимую для составления плана

    системного анализа комбината «Правда»

    Нижеследующие вопросы относятся к системе работы с информацией, применяемой на «ПРАВДЕ» в настоящее время,

    Предполагается, что ответы на них будут отражать реальное текущее положение дел, безотносительно к каким бы то ни было возможностям или ограничениям предстоящей машинной системы.

    1. Источники информации, их особенности, классификация по значимости, объемы по источникам.
    2. Способы поступления информации. Деление по типу носителя, объемы по каждому типу и другие характеристики.
    3. Схема информационных потоков при поступлении информации. Точки входа. Предварительная реакция, критерии отбора и обработка. Как движется информационный материал. Где накапливается, где корректируется, уточняется, копируется, уничтожается, сортируется, регламентируется, визируется и т.п.?
    4. Хранение информации. Формы хранения, типы и объемы хранилищ. Сроки хранения и от чего они зависят. Надежность хранения.
    5. Отдельные важные факторы классификации информационных материалов. Секретность. Ее типы, способы и формы ее обеспечения. Иноязычная информация, — какие языки, особенности работы с ней. Другие факторы классификации, заслуживающие внимания.
    6. Применение хранимой информации. Цели и смысл ее применения. Время жизни, форма и техника использования. Когда, кем и каким образом используются разные виды информации.
    7. Пользователи информации. Их ранги и права. Частота обращения к архиву по типам пользователей. Цели обращения. Форма вопросов (запросов) и ответов — типовые примеры. Ориентировочное время обслуживания запросов.
    8. Стиль взаимоотношений при передаче информации, степень формализации. Статистика использования по типам материалов, контроль пользования, протоколирование. Форма контроля и его уровни. История пользования, ее анализ (есть ли?), цели и выводы.
    9. Стиль досье «Правды». Круг обязанностей службы досье. Н.Ф. Рогульская, деловая характеристика, примечательные профессиональные и личностные черты. Особенности характера и интеллекта. Особенности других сотрудников службы досье. (Ответы с согласия т. Рогульской)
    10. Некоторый желаемый идеал в текущем контексте сложившихся отношений и техники работы с информацией (может быть несколько разных ответов).
    11. Предвидимые и реальные нарушения в работе системы на данное время. Ранжирование по нежелательности. Последствия. Способы устранения. Терпимые сроки устранения. Меры, принимаемые по поводу нарушений. Реакция и пенальти. Несколько конкретных примеров.
    12. Меры профилактики, применяемые для обеспечения информационной безопасности и системы работы в целом.
    13. ЧП, которые бывали или могут быть. Чего не может (не должно) быть никогда? Что требует обязательной подстраховки?
    14. Оценка существующей системы работы с разных точек зрения.
    15. Степень соответствия возможностей системы работы реальным потребностям.
    16. Какие виды и характеристики информации должны возрасти (уменьшиться), ускориться и т.п.?
    17. Чем хороша существующая система работы? Чем она плоха?
    18. Что хочется улучшить? Почему это трудно сделать?
    19. Раздражающие моменты; терпимые, достаточно хорошие, совсем хорошие (комфортные).
    20. Почему обязательно применение ЭВМ в системе «Правды»?
    21. Отличия редакции «Правды» от других редакций. Связи с другими редакциями газет (по информации), связи с журнальным комплексом.

    Ответы на поставленные вопросы предназначены только для исполнителей и позволят ориентировать предстоящий системный анализ на выяснение (установление) свойств будущей автоматизированной системы.

    Сформулированные вопросы в значительной мере отражают наше текущее представление об источнике вопросов. Поэтому, если авторам ответов этот список вопросов покажется несбалансированным, то они могут дополнительно указать на те или иные факторы, не затронутые нами. Желательно, чтобы недостатки вопросов не повлияли на полноту и качество ответов.

    Ответы желательно получить к концу марта сего года.

    С уважением А.А. Берс, Г.Д. Чинин 07.02.77

    На запрос был получен подробный и благожелательный ответ на 8 страницах и ряд дополнительных материалов. На ряде совместных семинаров ВЦ и НФ ИТМиВТ была выработана методика обследования. Далее выполнение работ проходило по следующим этапам.

    Обследование. Работа выездной бригады совместно с сотрудниками комбината. 6 июня 1977 г. на территорию комбината «Правда» для детального изучения производственных процессов по выработанной методике высадился «десант СО АН СССР» в составе:
    А.А. Берс, заведующий научно-исследовательской группой, ответственный исполнитель от ВЦ СО АН СССР;
    Г.Д. Чинин, главный инженер, ответственный исполнитель от НФ ИТМиВТ АН СССР;
    В.В. Грушецкий, младший научный сотрудник ВЦ СО АН СССР;
    Ю.А. Первин, кандидат тех. наук, старший научный сотрудник ВЦ СО АН СССР;
    П.К. Леонов, начальник лаборатории НФ ИТМиВТ АН СССР;
    Ф.Р. Цанг, начальник лаборатории НФ ИТМиВТ АН СССР.

    Каждый вооружен методикой и следующей инструкцией.

    ПЛАН-ПРОГРАММА

    информационного обследования редакции газеты «Правда»

    1. Знакомство со структурой редакции и процедурами прохождения материалов в номер. Определение отделов и служб, подлежащих обследованию.
    2. Для каждого из отделов:
      1. выяснение объема, характера, форм и сроков поступления входной информации;
      2. выяснение типов, объемов и сроков подготовки выходных материалов;
      3. определение информационных связей с другими отделами и
        объемов соответствующих информационных потоков;
      4. уяснение специфических особенностей подготовки информации;
      5. определение характера разделения работ внутри отдела.
    3. Изучение характера работы и темпов обслуживания в справочно-библиографических отделах: внешнеполитической и внутренней жизни.
    4. Знакомство с организацией справочно-информационных фондов и принципами их классификации.
    5. Наблюдение хода работы в «часы пик».
    6. Выяснение типов и объемов материалов и характера, объемов и срочности запросов.
    7. Определение связей с другими отделами и размеров соответствующих информационных потоков.
    8. Изучение движения материалов и процесса формирования очередных номеров газеты:
      1. объемы материалов от отделов;
      2. путь материала в номер: перепечатка, набор, проверка, визирование и т.п.;
      3. объем переделок по полосам в процессе подготовки номера.
    9. Различие в материалах и объем переделки для двух выпусков одного и того же номера.
    10. О рганизация и характер взаимодействия между редакцией и выпускающей службой в ходе подготовки номера.

    6 июня 1977 г.
    Зав, НИГ ВЦ СО АН СССР А.А.Берс,
    Гл. инженер НФ ИТМиВТ Г.Д. Чинин.

    Мы провели на комбинате пять интенсивно заполненных и очень интересных дней, встречаясь с высококлассными профессионалами, и затем вернулись в Академгородок для обработки материалов обследования, формирования основных гипотез и подготовки текста отчета. Естественно, что этот отчет готовился при большой поддержке и прямом участии сотрудников комбината «Правда», особая благодарность:

    • генеральному директору комбината Борису Александровичу Фельдману — за постановку задачи и постоянный интерес к развитию работ;
    • ответственному секретарю «Правды» Сергею Витальевичу Цукасову и начальнику Технического отдела издательства Владимиру Александровичу Тифенбаху — за чёткую ориентацию в делах комбината и редакции и предоставление режима наибольшего благоприятствования.

    Далее воспроизведено основное содержание отчета о проведенном «Системном анализе производственных процессов по выпуску газеты «Правда». При этом надо, однако, сразу сделать оговорки в отношении широты охвата проблемы. Работа была начата по инициативе издательства в комбинате «Правда», и именно с него началось наше изучение комбината. Разработчики довольно быстро осознали, что комбинат в целом — это огромное всесоюзное объединение, издающее и печатающее практически все виды полиграфической продукции. Он втягивает в свой производственный цикл десятки типографий и корреспондентских отделений страны с разветвленной экспедиционной службой. В связи с этим — здесь потенциально виден очень широкий круг задач на компьютеризацию.

    1. Общие вопросы

    Для того чтобы сохранить принцип системности и не утратить ориентации в этом многообразии, необходимо было выделить стержень производственной деятельности, доступный для целостного охвата, наиболее актуальный для применения вычислительных машин и в то же время находящийся в центре производственной деятельности комбината.

    Таким процессом нам представился выпуск газеты «Правда» и даже не собственно выпуск, имея в виду печатание тиража, рассылку матриц и передачу полос по фототелеграфу, а подготовка номера к выпуску, завершающаяся подписанием контрольного оттиска в печать.

    Совершенно очевидно, что это более частный и достаточно четко выделенный процесс. В стороне остаются выпуск остальных газет, а также журналов и книг, цветная и графическая печать, экспедиция и подписка, административное управление работой комбината и другие более изолированные участки работы.

    В то же время ощущение того, что вся многообразная деятельность комбината, так или иначе, подчинена или сопредельна этой главной задаче, пришло к нам очень быстро, и это чувство со временем только укреплялось.

    Выпуск газеты с жестким суточным циклом, проблема отбора материала, требование абсолютной достоверности, необходимость постоянного ретроспективного анализа и обратной связи через письма читателей — все это делает выпуск процессом, наиболее требовательным к обеспечению эффективности, надежности и достоверности. А стало быть — первым кандидатом на изучение возможностей применения ЭВМ для электронной подготовки изданий.

    Таким образом, редакция газеты «Правда» и ее производственные процессы стали главным объектом системного анализа. Сказанное, однако, не означает, что компоненты процесса, относящиеся к другим подразделениям комбината, остались «за бортом» Наоборот, там, где связь с выпуском газеты носит органический характер — прежде всего набор, верстка и правка, — соответствующие подразделения и процессы изучались со всей возможной тщательностью.

    Основу системного анализа составлял взгляд на выпуск газеты как на процесс переработки информации. По нашему мнению, это делает анализ более объективным, а главное — более соответствующим характеру и целям дальнейшей работы. Указанный подход определил стиль дальнейшего изложения и употребляемую терминологию.

    Материал организован следующим образом. Разделы со второго по четвертый — это систематическое и полное изложение результатов системного анализа. В пятом разделе сжато повторяются и поясняются основные выводы.

    Целостность системного анализа требует лаконичности изложения, мы не тратили бумаги на обоснования там, где суждения опираются на точное знание, и не подыскивали сомнительных доказательств интуитивным соображениям.

    2. Редакция «Правды» как система обработки данных

    Описание реально существующей организации посредством некоторой модельной системы всегда приводит к некоторому упрощению представления ее структуры и функций с риском опустить некоторые даже существенные детали.

    Однако этот риск оправдан, поскольку без проработки такого обобщенного представления, легко можно очутиться в положении, когда «за деревьями леса не видно». Более того, эксплуатируя использованную метафору далее, можно утверждать, что если контуры «леса» очерчены правильно, то в них всегда можно будет найти место, чтобы «обратно посадить» какой-нибудь опущенный сорт «деревьев».

    Это обобщенное представление позволяет явно выделить основные цели деятельности моделируемой организации, ее главные составные части и основные связи между ними.

    Отметим сразу же, что задача описания существующих связей и движения информации между подразделениями редакции значительно упрощается в связи с тем, что этот процесс в большой степени регламентирован и упорядочен.

    Существует утверждённый редколлегией «Порядок выпуска номеров», четкая система планирования газеты для разных временных интервалов и хорошо разделенные функции различных подразделении.

    Основной целью работы редакции является, естественно, выпуск номеров газеты. Именно с точки зрения отношения к этим цели можно провести функциональное разбиение подразделений редакции.

      Мы выделяем следующие типы подразделений.
    1. Тематические отделы, основной функцией которых является подготовка материалов, помещаемых на газетные полосы, — это отделы:
      • партийной жизни, пропаганды марксистско-ленинской теории, промышленно-экономический, сельскохозяйственный, литературы и искусства, культуры и быта, науки, школ и вузов;

      • внутренней информации, военный, прессы, критики и библиографии, фельетонов, местных корреспондентов;

      • международной информации, соцстран, европейских стран, американских стран, стран Азии и Африки;

      • к ним же относятся группы специальных корреспондентов и политических обозревателей, а также, с некоторыми оговорками, и отдел иллюстраций.

    2. Контрольно-справочные отделы, функцией которых является создание и поддержание информационных фондов материалов, предназначенных, как правило, не для помещения на полосу, а в качестве исходной информации для подготовки материалов тематическими отделами. На основе этих фондов контрольно-справочные отделы обеспечивают поиск и подбор информации по запросам, а также проверку фактов в печатаемых «Правдой» материалах: отдел проверки, библиотека, справочно-библиографческий отдел международных отделов.
    3. Отдел писем, стоящий особняком в силу специфичности, как обрабатываемой информации, так и способов работы с ней.
    4. Службы выпуска, обеспечивающие интеграцию всех подготовленных материалов и аккумуляцию всей работы редакции на двенадцати полосах двух ежедневных выпусков газеты.
    5. Редколлегия и секретариат, выполняющие функции планирования, руководства и контроля.

    2. 1. Тематические отделы

    Основная функция тематических отделов — подготовка материалов, помещаемых на полосы газеты. Объем обработки этих текстовых материалов определяется обычным порядком их подготовки,

      состоящим из следующих этапов:
    • написания,
    • перепечатки,
    • вычитки,
    • согласования в отделе,
    • проверки фактов,
    • перепечатки после правки,
    • сдачи в набор,
    • вычитки,
    • проверки и правки после набора,
    • правки и проверки (быть может, неоднократной) в процессе верстки.

    Интегральная оценка объема перерабатываемой информации может быть произведена исходя из объема газеты.

    Шесть полос одного номера имеют объем 170 Кбайт. Учитывая коэффициент зацепления информации в смежных выпусках, равный 1,2 (изменяется около 20% номера), получим общий объем, равный 204 Кбайт в день. По данным наборного цеха фактический объем набираемой информации составляет в среднем 220 Кбайт в день.

    Поскольку перепечатка в отделах при этом не учитывается, то общий объем перерабатываемой тематическими отделами информации можно полагать вдвое большим, т. е. округленно — 0, 5 Мбайт в день.

    В связи с подготовкой публикаций в тематических отделах необходим подбор материалов по темам и запросы этих материалов из информационных Фондов. Часть этих поисковых функций, естественно, выполняется внутри отдела, а другая часть формирует информационные потоки между тематическими и контрольно-справочными отделами (держателями информационных фондов)

    Следующей функцией, выполняемой частично в тематическом отделе, а в основном контрольно-справочными отделами, является проверка фактического содержания публикуемых материалов, написания в них цитат, фамилий, географических названий и т.п.

    Важной функцией тематических отделов, требующей информационной поддержки, является организация обратной связи от предыдущих публикаций с целью поддержания правильных пропорций в отношении охвата регионов страны, баланса критических и позитивных материалов и т.п. С этой целью необходимо иметь возможность оперативно отвечать на запросы: «Что, как и когда «Правда» публиковала по данному вопросу?»

    Предыдущая функция тесно связана с проблемами перспективного и текущего планирования. Эта функция выполняется тематическим отделом совместно с секретариатом и редколлегией. Кроме того, в отделе необходимо отслеживать действенность газетных публикаций, своевременность получения ответов и т.п.

      Подводя итоги, перечислим еще раз функции, которые должны обеспечиваться тематическим отделом:
    • текстовая обработка,
    • поиск и подбор материалов в информационных фондах,
    • проверка фактов и написаний в публикациях,
    • учет предыдущих публикаций «Правды» по данному вопросу,
    • перспективное и текущее планирование,
    • контроль действенности материалов.

    2. 2. Контрольно-справочные отделы

    Основными функциями контрольно-справочных отделов являются проверка публикуемых материалов и выполнение запросов тематических отделов по подбору информации на заданную тему.

    Для того чтобы выполнять указанные функции, контрольно-справочные отделы ведут, пополняют и используют соответствующие информационные фонды. В связи с этим появляются функции по анализу поступающих материалов, их классификации и реферированию, а также поддержанию и изменению используемых классификаторов.

    Общий объем поступающей по разным каналам (ТАСС, советские и иностранные газеты и журналы и т.п.) информации составляет около 3 Мбайт в день. Этот объем составлен из 1500—2000 отдельных материалов, для каждого из которых необходимо составить карточку-реферат. Полагая объем реферата равным в среднем 200 знакам, получим, что примерный объем ежедневно добавляемой справочной информации составляет около 300 Кбайт.

    Эти цифры значительно (в 6–8 раз) варьируются в различных материалах, описывающих задания на разработку информационно-поисковых систем. Это, конечно, не означает изменение объема поступающей информации, просто в разных заданиях считается важным обеспечить обработку разных ее долей.

    Фактически часть объема информационных фондов хранится и поддерживается не в контрольно-справочных, а в тематических отделах в соответствии с их профилем. Иногда такое разделение обуславливается разной степенью секретности материалов.

    Отметим также, что классификаторы, на основе которых организуется структура информационных фондов, не являются постоянными. Разные рубрики в них появляются и исчезают с течением времени.

    Если вернуться теперь назад, к основным функциям контрольно-справочных отделов: выдача информации по запросам и проверка фактов в публикуемых материалах, то можно увидеть, что, хотя обе эти функции опираются на содержание информационных фондов, характер работы с информацией в них существенно различается. Суть этих различий состоит не столько в том, что понятие факта чрезвычайно многообразно и, следовательно, весьма трудно формализуемо, сколько в совсем разной требуемой организации структуры фондов и характеристиках процесса поиска.

    Как было сказано в ходе обследования в отделе проверки: «Фактом является все, что только можно проверить». Такая проверка проводится с использованием разнообразных справочников, картотек, словарей и т.п. Принципы идентификации факта в проверяемом тексте и поиска подтверждающих его материалов практически не сформулированы и существенно опираются на смысл текста.

    Важность обязательности такой проверки объясняется, во-первых, официальным характером публикаций «Правды» и, во-вторых, например, тем, что в некоторых ответственных случаях поздно замеченная опечатка в одной букве приведёт к необходимости заново перепечатывать весь тираж выпуска газеты.

    В связи с проведением корректуры и редактирования, возникающих вследствие проверки, контрольно-справочные отделы тоже выполняют функции обработки текстов. Отметим также, что необходимость в текстовой обработке возникает и при пополнении информационных фондов и составлении рефератов.

    Суммируя, видим, что функциями, обеспечиваемыми контрольно-справочными отделами, являются: загрузка и сопровождение информационных фондов, составление реферативных карточек на входящие в них материалы, поиск и выдача информации по запросам, проверка фактов и написаний в публикациях, текстовая обработка информации.

    2. 3. Отдел писем

    Отдел писем является входом в информационную систему «Правды» в качестве одного из основных информационных потоков. Письма выделены в самостоятельный информационный поток в силу их специфических свойств, существенно выделяющих их среди других видов входной информации. Среди важнейших специфических характеристик этого информационного потока следует отметить:

    • дискретность, порционность информации; порция информации — письмо — служит одновременно как хранимой, так и обрабатываемой единицей информации;
    • относительная равномерность поступления; эта равномерность ощутима не только на значительных промежутках времени — год, квартал, но и на оперативных отрезках — декада, неделя; даже суточные отклонения нельзя считать значительными;
    • увеличенная степень ответственности редакции за каждый информационный объект — письмо; отмечается поступление каждого письма и, вообще говоря, путь прохождения и обработки каждого письма также должен контролироваться;
    • особенности обработки письма; сотрудники отдела имеют дело с нестандартно оформленной и почти всегда рукописной информацией; при первичной обработке письма важно не формализуемое в таких условиях реферирование письма;
    • трудоемкости обработки информации; эта особенность потока писем непосредственно вытекает из отмеченной выше ответственности редакции за письма и специфики их обработки, а также значительного объема обрабатываемой информации;
    • динамичность базы данных; ежедневно система принимает для хранения и обработки значительный объем информации — примерно 1500 писем; одновременно из системы выводится (уничтожается) примерно такое же количество устаревшей информации;
    • относительно несложное формальное описание единицы информации — письма; но важно отметить, что относительная простота идентификации письма сочетается с практически нереализуемым сегодняшними средствами формальным описанием семантики письма;
    • отсутствие пересечений потока писем с другими информационными потоками; выходная информация отдела писем связана с другими отделами и службами; входной же поток полностью автономен.

    Вместе с тем отдел писем обладает и теми общими чертами, которые характерны для большинства других отделов:

    • значительный объем информации (отдел писем «Правды» регистрирует ежегодно 500 000 писем и по статистике последних лет это количество имеет тенденцию к увеличению);
    • оперативность; поступающая в виде писем информация должна быть в тот же день зарегистрирована в отделе;
    • ограничения (контролируемые отделом) на время обработки писем, направленных в другие отделы, и подготовку ответов;
    • достаточно отчетливое (динамическое) разделение на обрабатываемую, или контролируемую, информацию и хранимую информацию; по отделу писем установлены нормы времени на хранение архивных материалов;
    • характерные для многих отделов проблемы хранения больших архивов; и сложность складирования больших бумажных объемов, доступ к которым должен быть легко реализуем в течение всего периода хранения;
    • статистический анализ информации и динамическая рубрикация; в отделе писем эти характеристики особенно актуальны потому, что они непосредственно связаны с оперативной производительной загрузкой персонала отдела.

    2. 4. Редколлегия и секретариат

    Если отвлечься от задач оперативного контроля выпуска газет и чисто административного управления, то рабочие процедуры редколлегии и секретариата регламентированы существенно меньше по сравнению с производственными подразделениями, при этом из постоянных функций редколлегии и секретариата можно выделить следующие:

    • координация работ редакции,
    • перспективное и текущее планирование,
    • контроль действенности публикаций газеты.

    Говоря о взаимодействии редколлегии и секретариата с планируемой информационно-вычислительной системой комбината «Правда», можно считать их источником как регулярных, так и разовых информационно-поисковых предписаний.

    Перечень регулярных запросов должен быть зафиксирован при проектировании, но нужно обязательно сохранить при этом и способность к формулированию разовых запросов и расширению их спектра.

    Очень важным отдельным объектом проектирования для осуществления функций редколлегии и секретариата является подсистема ретроспективного анализа публикаций «Правды».

    3. Требуемые системы обслуживания

    В настоящем разделе рассматриваются свойства и характеристики, которыми должны обладать программные средства для того, чтобы обслуживать функции, выполняемые подразделениями редакции. Эти функции были выделены и описаны в предыдущем разделе.

    Многие из этих средств достаточно хорошо проработаны к настоящему времени в системном программировании. В этом случае кратко характеризуются возможности в отношении интересующих нас функций, и дается ссылка на соответствующую литературу.

    Когда это можно сделать, указывается система, пригодная для использования, или система, которая может послужить прототипом для адаптации ее к условиям работы в информационно-вычислительной системе (ИВС) «Правды». В тех случаях, когда реализация соответствующих функций на современном уровне информатики проработана слабо, мы пытаемся сформулировать основные направления, в которых необходимо инициировать соответствующее исследование.

    3. 1. Система обработки текстов

    Системы текстовой обработки прошли к настоящему времени путь от систем автоматизации набора до систем комплексной подготовки печатных изданий. Основные возможности систем текстовой обработки можно поделить на три группы:

    • возможности правки текста как для редакционных целей, так и в связи с корректурой,
    • возможности снабжения текста дополнительной структурой, осуществляемые с помощью нанесения на него требуемой разми,
    • возможности придания тексту необходимого полиграфического вида.

    Возможности правки текста и его разметки могут осуществляться в настояеткщее время как в режиме диалогового взаимодействия с программной системой, что удобнее всего делать, используя экранные пульты, так и в пакетном режиме, достоинством которого является возможность сохранения привычного стиля правки по печатному тексту.

    Внесение в текст разметки может использоваться как средство «развязывания» собственно текста и его полиграфического исполнения, также для обеспечения защиты и ограничения доступа к отдельным частям текста и для снабжения текста некоторой дополнительной информацией, существенной в процессе его обработки, но «невидимой» при его окончательном воспроизведении.

    К такой информации могут относиться сведения об источниках фактов, ссылки на «хозяина» материалов и т.п.

    В качестве основы текстовой обрабатывающей системы, которую можно использовать для ИВС «Правды» можно указать разрабатываемую в ВЦ СО АН СССР систему САПФИР, в которой заложен принцип отделения собственно текста от его полиграфического исполнения.

    Эта система предусматривает реализацию всех перечисленных выше возможностей, но для включения в ИВС должна быть пополнена средствами составления макета и проведения газетной верстки с помощью графических и текстовых экранных терминалов, а также применением расширенных средств разметки в целях защиты утвержденных частей текста в ходе многократных правок при выпуске номера газеты.

    3.2. Справочная система проверки фактов

    Такой системы еще нет нигде. Вместо этого, поскольку проверку проводить надо, для ее осуществления пытаются использовать информационно-поисковые системы. Вследствие большого объема необходимого для этого информационного фонда, основные характеристики поиска при использовании информационно-поисковой системы (ИПС) для проверки фактов получаются плохими.

    ИПС может предоставить для проверки какого-либо факта лишь целиком документ, который этот факт подтверждает. В результате коэффициент шума при поиске оказывается большим, так как пользователю предъявляется много избыточной для него информации, среди которой он должен сам найти нужную.

    С другой стороны, вследствие необходимости обеспечения полноты поиска по отношению к заданному факту, время ответа системы резко возрастает с увеличением объема ее информационного фонда, а формулирование необходимого поискового предписания оказывается весьма громоздким и длительным.

    Поэтому приемлемым в настоящее время путем применения ИПС для целей проверки фактов представляется факторизация информационных фондов, т.е. разбиение их на тематически сильно связанные отдельные части. Внешние связи между такими частями могут оказываться достаточно слабыми, таким образом, чтобы объем каждой из этих частей по порядку был бы равен 104–105 единицам поиска. Кроме того, для такой системы необходимо использовать специально подобранный язык диалогового формулирования поискового предписания. Эти меры позволили бы временно попользовать какую-либо из существующих поисковых систем в качестве прототипа для адаптации в качестве системы проверки фактов в ИВС «Правды». Это дало бы необходимый резерв времени для научных исследований, направленных на разработку принципов построения тезауруса фактов и языка запросов подлинной справочной системы проверки фактов.

    3.3. Информационно-поисковая система внешней информации

    Если в соответствии с предыдущим считать, что проверка фактов в публикациях будет осуществляться специально предназначенной для этого системой, то работы, которые должны будут обеспечивать в рамках ИВС «Правды» ИПС внешней информации, сводятся к следующим этапам:

    • загрузке и поддержанию информационных фондов,
    • заполнению и поддержанию реферативной части (индекса) системы,
    • обеспечению диалогового формирования поискового предписания,

    т.е. обычным функциям, на которые рассчитаны ИПС. Некоторым дополнительным свойством, которое надо принять в расчет при подборе прототипа для адаптации, является необходимость обеспечения средств модификации классификатора.

    Для ЕС ЭВМ имеются две информационно-поисковые системы «ОКА» (прототип — IMS) и «KAMA» (CICS), которые могут рассматриваться в качестве возможных прототипов для адаптации в ИВС «Правда». Кроме того, в связи с большим объемом требуемых информационных фондов необходимо провести исследования возможности их факторизации.

    ИПС напечатанных в газете материалов

    Как уже говорилось, ежедневный объем двух выпусков «Правды» составляет 204 Кбайт, т. е. 72 Мбайт в год. В связи с очень большой потребностью в создания ИПС, обеспечивающей быстрый доступ к предыдущим публикациям «Правды» и их анализ, а также сравнительно небольшим объемом информационного фонда, имеет смысл построить эту ИПС в качестве действующей модели ИПС внешней информации.

      Такая модельная система обеспечит:
    • удовлетворение первоочередных нужд редакции,
    • разработку и уточнение принципов построения классификатора материалов и способов его модернизации,
    • создание базы для обучения сотрудников редакции и накопления опыта эксплуатации ,
    • проверку принципов построения и удобства использования языка формирования поисковых предписаний.

    3. 4. Система отдела писем

    С точки зрения функций информационного и программного обеспечения, подсистема хранения и обработки писем должна строиться как ИПС с развитыми средствами защиты, самоизмерения, обеспечения надежности и динамики. Этап технического проектирования подсистемы позволит выбрать одну из существующих СУБД («Ока», «Кама», «Набоб», «Банк», «Синбад» и др.) в качестве прототипа и определить степень соответствия этого прототипа условиям эксплуатации его в «Правде». Одновременно с этим будут сформулированы требования к дополнительным, специфическим средствам ИПС хранения и обработки писем.

    3.5. Системы планирования и контроля

    Программные средства, реализующие указанные функции, входят как подсистемы практически в каждую из автоматизированных систем управления, широкая программа создания которых развернута в настоящее время в стране. Поэтому основной задачей здесь будет подбор прототипа и его адаптация к требованиям ИВС «Правды».

    3. 6. Операционные системы ЦКП

    Реальное применение большинства из рассмотренных выше функций потребует использования обеспечивающих их систем в режиме коллективного доступа с достаточно малым временем реакции. Для этого необходимо обеспечить работу этих систем в рамках и под управлением операционной системы центра коллективного пользования (ЦКП).

    Математическое обеспечение типового ЦКП для ЭВМ отечественного производства (в том числе ЕС ЭВМ) разрабатывается в настоящее время в ВЦ СО АН СССР. Одним из основных принципов принятого подхода к архитектуре ЦКП является сочетание централизованных вычислительных мощностей с сетью периферийных центров обработки (ПЦО), предназначенных для локальной работы с информацией. Как будет видно из дальнейшего, такое строение вычислительной сети оказывается весьма подходящим для предлагаемых структуры и организации разработки ИВС «Правды».

    4. Результаты системного анализа

    Здесь формулируются предложения о целях, функциях, составе программного обеспечения и требуемой конфигурации аппаратных средств будущей ИВС «Правды». Эти предложения представлены совокупностью четырех взаимосвязанных гипотез:

    • о целях,
    • о функциях,
    • об оборудовании,
    • об организации разработок.

    Предлагая некоторый принципиальный путь организации ИВС, эти гипотезы носят сугубо предварительный характер.

      Они выдвигаются в настоящее время, для того чтобы:
    • зафиксировать на возможно более ранней стадии общее видение контуров системы в целом;
    • послужить средством закрепления тех впечатлений, которые возникли в ходе обследования и предшествовавших ему контактов с издательством «Правда» и которые впоследствии уже трудно будет восстановить, они будут «забиты» многочисленными деталями, возникающими в ходе проработки;
    • вызвать (спровоцировать) реакцию пользователей и послужить основой для обсуждения, материалы которого смогут стать исходными для подготовки научно-технического задания на систему.

    4.1. Гипотеза о целях

    Главной целью создания ИВС «Правды» является обеспечение всех работ, проводимых в связи с выпуском номеров газеты — основной цели работы редакции.

    Создаваемая система должна быть надежна и удобна в эксплуатации, в максимальной степени соответствовать сложившимся методам работы пользователей и выработанному за многие годы в редакции порядку работы.

    С другой стороны, система должна в наименьшей степени зависеть от содержания работ и специфических «правдистских» процедур с тем, чтобы ее впоследствии можно было перенести для обеспечения работы редакции других газет (и журналов), обслуживаемых издательством «Правда».

    Поскольку основным содержанием редакционно-издательских процессов является переработка текстов, то предлагается (см. гипотезу о функциях), чтобы центральной составляющей ИВС, на которую замыкаются и через которую осуществляются все связи и информационные потоки от других компонент ИВС «Правды», была бы система текстовой обработки.

    Чтобы обеспечить требуемое малое время реакции системы при осуществлении ее функций в режиме коллективного доступа и для согласования системы с принципами организации операционной системы ЦКП, предлагается (см. гипотезу об оборудовании), чтобы аппаратное обеспечение представляло собой сеть малых машин, соединенных с центральным мощным вычислительным комплексом.

    Предполагается (см. гипотезу об организации разработок) такой порядок проведения работ и приобретения оборудования, чтобы обеспечить пользователей системы сначала небольшим, но полезным составом функций, расширяемым и усложняемым впоследствии, по мере поступления оборудования и прогресса в разработке программных систем.

    4. 2. Гипотеза о функциях

      Перечислим ещё раз функциональные системы, входящие в состав ИВС «Правды».
    1. Система обработки текстов, включающая средства
      • редактирования и правки,
      • структурной разметки,
      • полиграфического оформления и верстки.
    2. Информационно-поисковые системы
      • внешней информации,
      • публикаций газеты,
      • обработки писем.
    3. Справочная система проверки фактов.
    4. Система планирования и контроля.
    5. Операционная система ЦКП, обеспечивающая работу всех составляющих ИВС и ее целостность как программного комплекса.

    Однако для того чтобы ИВС «Правды» была бы функционально целостной системой, а не просто набором своих компонент, необходимо выделение его главного функционального компонента, через который бы замыкались все ее информационные потоки.

    В связи с тем, что основная деятельность редакции выражается в форме подготовки текстовых материалов, такой центральной компонентой может быть только система текстовой обработки.

    Дело в том, что основным недостатком «ручного» способа подготовки текстов является необходимость многократной сверки и вычитки текстов в ходе их редактирования. В то же время, при использовании для этой цели ЭВМ, однажды введенный в систему текст материализуется и, следовательно, неизменяем с такой же степенью надежности, как и текст, отлитый в строки на линотипе. С другой стороны, текст в памяти ЭВМ еще полностью свободен от любых особенностей своего полиграфического воплощения (шрифта, формата набора и т.п.).

    Кроме того, находящийся в системе текст может быть снабжен (невидимыми по отношению к его окончательному воплощению) ссылками на источники информации, указаниями о необходимой защите и другой справочной информацией, которую необходимо учитывать в процессе его подготовки, согласования и визирования.

    Система текстовой обработки позволит непосредственно выводить подготовленные тексты и использовать их при сборке (верстке) номера. Система обеспечит полную надежность и неизменность текстов в процессе их обращения внутри нее.

    В связи с этим необходимо осуществлять ввод материалов в систему на возможно более ранней стадии их подготовки и использовать средства текстового редактирования для их правки с самого начала, что значительно повысит удобства работы для большинства сотрудников редакции.

    Отметим также, что в состав работ, обеспечиваемых информационно-поисковыми и планирующими системами, крупной составной частью входит переработка информации в виде текстов и формирование их выходного вида. Текстовое редактирование является также существенной компонентой подготовки информации к включению ее в состав информационных фондов и подготовки карточек-рефератов, образующих поисковый аппарат ИПС.

    Средства разметки системы текстовой обработки позволяют организовать непрерывную связь между функциями, осуществляемыми тематическими, контрольно-справочными отделами и службой выпуска.

    Например, еще в ходе подготовки материала автором (в тематическом отделе), он может заранее выделить те места публикации, которые в случае необходимости при верстке могут быть сокращены в первую (вторую и т.д.) очередь. Более того, он может задать в тексте разные способы выражения отдельных фраз, что поможет сохранить хороший стиль изложения в случае сокращения. Система верстки может автоматически использовать эту разметку, избавляя работников службы выпуска от возможности сделать ошибку, обусловленную недостаточным проникновением в смысл написанного.

    Встроенное в систему текстовой обработки средство обнаружения всех вхождений в текст некоторого образца позволяет обеспечить автоматическую проверку некоторого (не очень большого) множества написаний для ответственных названий, фамилий и т.п.

    С другой стороны, средства разметки могут быть использованы для того, чтобы выделить в текстах утверждения, требующие проверки перед публикацией. Текст с такой пометкой может не пропускаться системой верстки на полосу до тех пор, пока эта разметка не будет снята, что сможет быть сделано только специально уполномоченными на то ответственными работниками. Те же средства разметки смогут обеспечить принятый порядок согласования и визирования публикуемых материалов.

    Другими словами, использование системы обработки текстов как центральной компоненты ИВС «Правды» обеспечит однородность принципов работы с текстами, замкнутость этой работы внутри системы, т.е. в конечном итоге, удобство общения пользователей с системой и их полное освобождение от необходимости знать, как соответствующая работа делается внутри нее.

    4. 3. Гипотеза о реализации отдела писем

    Сложность проектируемой подсистемы и возможности разделения проекта на этапы, имеющие самостоятельное методическое, организационное и экономическое значение, делает целесообразным выделение нескольких очередей реализации.

    Первая очередь автоматизированной подсистемы хранения и обработки писем предполагает разработку системы управления базами данных со всем комплексом управляющих программ. Из перечня проблем первой очереди исключаются лишь неисследованные проблемы использования естественного языка общения пользователя с системой в новой предметной области.

    В таких рамках первой очереди подсистемы остаются проблемы разной степени проработки. В частности, неисследованными являются математическое и техническое обеспечение микрофишной техники в условиях подсистемы писем. С другой стороны, не вызывает сомнений ценность системы, которая берет на себя все функции хранения, обработки, контроля и защиты писем с сохранением бумажного архива отдела. Поэтому и в рамках первой очереди проекта имеет смысл выделить два этапа.

    На первом этапе реализуется система, в которой библиотека писем — часть архива, хранящая тексты писем, — остается на бумажных носителях. При этом можно не менять существующую организацию хранения и, следовательно, временно сохранить годовой срок хранения писем в архиве. Это не скажется на проектируемых размерах базы данных — хранилище паспортов и аннотаций на машинных носителях.

    Поэтому даже на начальном этапе первой очереди подсистемы банк данных будет рассчитан на требуемый объем 1000 Мбайт, что обеспечит хранение паспортов писем и аннотаций в течение 5 лет.

    За время реализации первого этапа будут детально решены методологические вопросы использования аппаратов микрофиширования и визуализации микрофиш, подготовлена техническая база, исследовано и отлажено математическое обеспечение микрофиширования и визуализации.

    Вторая очередь подсистемы. Ко второй очереди подсистемы писем отнесены языковые проблемы системного программирования. Представляет известный научный интерес использование естественного языка общения с машиной в системах подобного размера. Однако еще большее значение имеет скачок в повышении качества управления отделом писем — скачок, который будет обеспечен возможностью оперативного обращения к системе с нерегулярными запросами.

    Вторая очередь подсистемы определяется не временнoй этапностью работ, а содержанием исследований. Не исключается и такая организация разработок, при которой языковые исследования в подсистеме писем могут быть завершены не позднее, а одновременно с разработками первой очереди.

    К задачам второй очереди можно будет отнести организацию поиска писем по содержательным признакам на основе анализа текста аннотации или ее ключевых слов. В реализации первой очереди достаточно ограничиться поиском по кодам признаков, отмечаемых оператором в паспорте письма при его формировании. Такое ограничение позволит построить нетрудоемкую ИПС, удовлетворяющую сегодняшним требованиям отдела писем.

    4.4. Гипотеза об организации разработок

    Период создания больших программных систем измеряется годами, причем в настоящее время хорошо известно, что этот период не поддается существенному уменьшению за счет вовлечения в работу большого числа исполнителей, в силу внутренней сложности программных систем самих по себе.

    С другой стороны, представляется важным, чтобы система как можно раньше начала служить пользователям, выполняя сначала хотя бы ограниченное множество основных своих функций. Для некоторых из них допустимо также осуществление и запуск в действие временно работающих средств, позволяющих выгадать время на разработку окончательного решения.

    Представляется возможным осуществить такую поэтапную процедуру создания и для рассматриваемой информационно-вычислительной системы (ИВС) газеты «Правды».

    Для этого первым этапом должна быть установка в отделах редакции сначала в автономном режиме мини-ЭВМ, которые впоследствии будут играть роль ПЦО (первичного центра обработки, см. гипотезу об оборудовании в 4.5).

    Эти мини-ЭВМ должны быть снабжены программным обеспечением, выполняющим функции текстового редактирования и структурной разметки из системы обработки текстов. С их помощью начнется подготовка, редактирование и правка всех подготавливаемых для публикации материалов в тематических отделах. При этом подготовленный и отработанный в отделе материал передается в набор в виде перфоленты, выдаваемой ЭВМ по команде по завершении его обработки.

    Сам набор и верстка на первом этапе продолжают проводиться по существующей технологии (при помощи управляемых перфолентой линотипов и на талерах).

    Последующая правка набранных материалов может проводиться тоже при помощи мини-ЭВМ отдела, которая выдает в этом случае перфоленту для изготовления новых строк для заборки.

    На этих же мини-ЭВМ устанавливаются подсобные информационные фонды тематических отделов (мини-досье), и на их материале ведется отработка диалоговых процессов формирования поисковых предписаний для ИПС (выработка языка запросов, разработка классификаторов и т.д.).

    Мини-ЭВМ контрольно-справочных отделов используются как для обработки входов в будущие ИПС, так и для подготовки (с помощью средств текстового редактирования) содержания элементов информационных фондов ИПС (карточки-рефераты, загружаемые материалы и т.п.).

    В частности, поскольку подготовленные для публикации материалы газеты «Правда» уже оказываются на машинном носителе, то они используются в этой работе без дополнительной подготовки к вводу.

    На этой стадии обмен информацией между мини-ЭВМ происходит посредством физического переноса машинных носителей (гибких магнитных дисков или кассет с лентой).

    Несколько более мощные мини-ЭВМ службы выпуска, снабженные алфавитными и графическими дисплеями, используются для отработки средств верстки номера по макету и, в частности, для целей пересчета макета, чтобы помочь найти простой и быстрый путь, когда нужно сделать переверстку.

    Следует отметить, что хотя объем программного обеспечения, который нужно выполнить для первого этапа, составляет лишь малую часть общего объема программного хозяйства ИВС, значение этого первого этапа в ходе внедрения системы исключительно велико.

    Дело в том, что для пользователей именно в этот период и возникнет ИВС «Правды», которая существенно затронет способы их работы, стиль подготовки материала и дисциплину взаимодействия отделов редакции.

    Проведение подготовки текстов на ЭВМ потребует перехода от листа бумаги и ручки к необходимости и умению использовать клавиатуры пультов машины и освоение методики правки за экранным пультом.

    Представляется, что такое изменение характера работы будет психологически непростым и потребует определенного времени, чтобы привыкнуть к нему, убедиться в удобстве и облегчении выполнения работы с помощью ЭВМ и научиться эксплуатировать предоставляемые ими возможности.

    В переходный период возможно разделение работы по правке между сотрудником отдела (автором), ведущим правку «по-старому» пером на гранках и оператором («машинисткой»), вводящим ее в ЭВМ. Однако при этом сохранится многоступенчатость работы с текстом и необходимость вычитки текста после исправления, т.е. окажутся неиспользованными именно те возможности и преимущества, которые может обеспечить применение ЭВМ.

    Всё дальнейшее развитие системы уже не будет качественно изменять характер работы для пользователей — просто время от времени они будут узнавать, что множество выполняемых для них услуг системы увеличилось, или замечать, что скорость обслуживания возросла.

    Второй этап связан с запуском центральной машины системы под управлением ОС ЕС и постановкой на неё существующих в составе программного обеспечения ЕС ЭВМ информационно-поисковых систем «ОКА» и/или «KAMA». В это время начинается использование ИПС публикаций «Правды» и одновременно использование её как действующей модели для обработки большой ИПС внешней информации. Мини-ЭВМ контрольно-справочных отделов работают как удаленные абонентские пункты. Одновременно отрабатываются системы отдела писем и планирования.

    На третьем этапе производится интеграция всех ЭВМ в единую систему, работающую под управлением ОС ЦКП. В этот момент прекращается перенос машинных носителей для обмена информацией между ЭВМ, так как все они оказываются связанными в единую сеть.

    В состав программного обеспечения вводится полная система текстовой обработки. Происходит (невидимое пользователю) перераспределение работ по текстовому редактированию между центральной ЭВМ и периферийными машинами.

    Начинает использоваться автоматизированная система верстки номера с выходом на фотонаборный автомат и фотополимерные печатные формы.

    Здесь мы остановимся в изложении данной гипотезы, поскольку дальнейшее развитие системы может идти за счет замены средств, использованных временно, специально разработанными компонентами с улучшенными характеристиками, т.е. обычным для существования программных систем путем.

    Перечислим положительные и отрицательные стороны предлагаемого порядка поэтапной разработки и внедрения системы.

      Достоинства:
    • возможность постепенной закупки и установки оборудования,
    • постепенность обучения пользователей и перехода от старых форм работы к новым,
    • возможность учета опыта эксплуатации в ходе разработки,
    • тесное взаимодействие разработчиков и потребителей в ходе создания системы.
      Недостатки:
    • перманентность процесса обучения, вызываемая последовательным вводом в строй новых функций,
    • потенциальная опасность возникновения психологического сопротивления пользователей, вызванного тем, что временно используемые средства обеспечения некоторых функций могут оказаться менее удобными в работе, чем их последующие специально разработанные варианты,
    • тесная связь разработчиков с потребителем и необходимость постоянного сопровождения системы разработчиком в течение длительного времени.

    Общим основанием наличия этих недостатков является тот известный факт, что всякая сложная программная система «живет лишь постольку, поскольку она изменяется»

    Скоро сказка сказывается, да не скоро дело делается.
    Под лежачий камень вода не течет.
    Пословицы

    4.5. Гипотезы об оборудовании

    Как уже говорилось, все программные составляющие ИВС должны работать под управлением операционной системы в рамках центра коллективного пользования. Известно, что при централизованной организации возникают большие трудности в обеспечении приемлемого времени реакции системы в диалоговом режиме при большом числе пользователей и больших объемах информационных фондов.

    Так, в полностью централизованной системе ИБМ для газеты «Нью-Йорк Таймс» время ответа достигало 15 минут. Другой крайностью в организации структуры системы является распределение всех ее функций между большим числом малых машин.

    В этом случае существенно усложняются вопросы организации и поддержания больших информационных фондов и значительно усложняются программные компоненты, обеспечивающие связь и взаимодействие между отдельными машинами системы, что потребует разработки нового типа операционной системы.

    На самом деле, в число работ, которые должны обеспечиваться ИВС, входят как работы, осуществляющие локальную переработку небольших порций информации, так и работы, связанные с информационными фондами в целом и требующие для своего осуществления больших вычислительных мощностей.

    Можно объединить достоинства обоих рассмотренных выше подходов к архитектуре системы без присущих им недостатков, организовав ее в виде системы периферийных центров обработки (ПЦО), соединенных с мощным центральным вычислителем и большой общей внешней памятью.

      Такой ПЦО, т.е. мини-ЭВМ, может обслуживать один–два тематических отдела, выполняя для них функции:
    • ввода и правки текстовых материалов,
    • осуществления запросов к локальному информационному фонду,
    • текущего планирования работы отдела,
    • контроля действенности публикаций,
    • связи для запросов и справок к центральному информационному фонду,
    • передачи подготовленных отделом материалов в систему, обеспечивающую службу выпуска (для верстки),
    • обеспечения оперативной связи с контрольно-справочными отделами, службой выпуска и другими подразделениями редакции в ходе подготовки номера.

    С другой стороны, такие крупные системы, как ИПС внешней информации и система проверки факсов, а также сводная верстка номера будут использовать, главным образом, вычислительные ресурсы центральной части системы.

    Наиболее вероятным кандидатом для центральной вычислительной машины является одна из старших моделей ЕС ЭВМ. При этом центральная установка может состоять, для обеспечения надежной и бесперебойной работы, из нескольких таких процессоров с подключенной к ним достаточно большой системой внешней памяти на магнитных дисках и магнитных лентах.

    К сожалению, следует заметить, что пригодных для полиграфического применения периферийных устройств и малых машин, которые были бы подходящими для использования в качестве ПЦО, наша промышленность не выпускает. Поэтому для выбора экранных пультов, графических дисплеев, устройств распечатки и мини-ЭВМ приходится обращаться к зарубежным образцам.

    По-видимому, требуемой очень высокой надежности функционирования системы и совершенно обязательных легкости и комфорта общения с ней пользователей можно добиться сочетанием разных машин: применяя отечественную аппаратуру для основных вычислительных мощностей (центральные процессоры, каналы, оперативная и внешняя память и т.д.) и новейшие зарубежные устройства (управляемые микропроцессорами и поэтому весьма гибкие и перенастраиваемые) как периферийные и терминальные.

    Сократ: «Как получается, что ты продаешь больше панцирей, чем другие, хотя делаешь их не более прочными и не более роскошными?»
    Оружейник: «Потому, что я делаю их более пропорциональными».
    Сократ: «Но ведь бывают непропорциональные фигуры. Как можешь ты делать пропорциональные панцири для непропорциональных фигур?»
    Оружейник: «А я их подгоняю. Панцирь по мерке и есть самый пропорциональный».
    Платон Диалоги. T.I

    Грубо говоря, представленный системный анализ состоял из двух этапов: изучение работы комбината и формирование гипотезы об ИВС для газеты «Правда». При этом главным впечатлением на первом этапе было восхищение высокой степенью организации производственных процессов, большой четкостью в разделении функций и ответственностью, строгим регламентом работ, очень высокой индивидуальной квалификацией сотрудников.

    Комбинат успешно и эффективно решал свою задачу — выпуск и распространение ряда главных ежедневных всесоюзных газет, особенно если учесть высокое профессиональное качество газеты, достоверность официального издания и большие дополнительные трудности, связанные с долготной протяженностью территории Советского Союза при западном положении комбината.

    Ощущение того, что при этом совершенстве и слаженности просто негде «воткнуться» с такими радикальными новшествами как ЭВМ и безбумажная обработка текстов, неоднократно приходило к разработчикам анализа и явно обнаруживалось у сотрудников «Правды».

    При более глубоком знакомстве, однако, обе стороны сошлись на том, что эти ощущения не только отражают, и то лишь частично, существующее положение дел, но и формируют психологический барьер, скрывающий серьезные проблемы завтрашнего дня.

    В заключительной части отчета А.П. Ершовым написано:

    Постараемся просуммировать факторы, толкающие на поиск новых форм организации производственных процессов в газетном деле так, как они стали для нас видными в ходе анализа.

    1. Эффективность и слаженность коллектива «Правды» носят в значительной степени уникальный характер, отражающий ее особое положение среди средств массовой информации СССР и достигаемый отбором сотрудников с уровнем квалификации выше среднедостижимого.
    2. Для многих подразделений «Правды» характерен предельный режим работы, изнуряющий сотрудников и не оставляющий места «запасу прочности» или способности к изменениям. Этот предельный режим подтверждается признаками энтропийной эрозии в досье некоторых отделов и информационных фондах, а также наличием некоторого числа в буквальном смысле незаменимых работников, отсутствие которых немедленно сказывается на показателях работы.
    3. В то же время созревает необходимость создания значительного производственного ресурса газеты, вызванного, главным образом, ходом времени, общим научно-техническим прогрессом, количественным и качественным ростом общественно-политических и экономических форм жизни государства и всего мира в целом.
    4. Более конкретно эти веления времени выдвигают следующие задачи (без претензии на упорядочение этих задач по значимости):
      • увеличение объема газеты,
      • увеличение числа и разнообразия выпусков газеты,
      • повышение степени оперативности ряда рубрик,
      • увеличение объема ретроспективной информации в связи с ходом времени,
      • резкое увеличение объема и усложнение текущей информации, относящейся к международной жизни,
      • улучшение деятельности газеты, связанной с письмами читателей,
      • повышение качества и эффективности газеты как источника установочной и аналитической информации,
      • поддержание складывающегося международного уровня полиграфического качества газеты.
    5. Немаловажное значение имеет улучшение экономических показателей выпуска газеты.
    6. Наконец, новые формы работы «Правды» должны стать тиражируемыми, быть образцом или прототипом повышения уровня работы других всесоюзных и республиканских редакций.

    Естественно, что вычислительная техника далеко не всегда является единственным средством решения этих задач, однако вопросы ее применения играют ведущую роль, так как затрагивают основной компонент всей деятельности «Правды» — работу с текстом.

    Если, следуя этому положению, выразить несколько утрированно главную идею авторов анализа, то она состоит в том, что мы с помощью ЭВМ стремимся исключить из производственных процессов по выпуску газеты перо и карандаш как орудие труда газетчика и ношение бумаги как форму информационной связи между сотрудниками и подразделениями.

    Тем самым мы в некотором смысле выдвигаем на первый план не столько установку комплекса некоторого оборудования или создание конкретной информационно-поисковой системы, сколько реализацию некоторой общей формы работы сотрудников в виде машинной обработки текстов, для какой бы цели эта обработка ни применялась. Главное в этом подходе — это материализация текста, ликвидирующая «перевалочные работы» и перепроверки при его транспортировке.

    Другая важная идея, выдвигаемая разработчиками анализа, — это принцип постепенности и движения от периферии к центру в разработке ИВС «Правда».

    Установка терминалов на столы редакционных и издательских работников — уже это достаточно серьезное потрясение сложившихся основ профессиональной работы и трудовых навыков. Во всем остальном система должна быть очень пластична и приспособляема к конкретным нуждам производственных отделов. Она должна быть удобна в работе не когда-нибудь в будущем, а немедленно; не для каких-то гипотетических и специально обученных людей, а для тех, кто работает на комбинате сейчас.

    Внедрение системы достаточно долго не должно нарушать сложившихся организационных форм работы и взаимодействия подразделений. Этой цели отвечает предложение начинать работу с развертывания отдельских подсистем. Залогом же последующей интеграции будет служить закладываемая с самого начала информационная совместимость подсистем и унификация методов обработки текстов.

    Третье существенное положение состоит в выделении среди отдельских подсистем модельной подсистемы, которая, при всей ее ограниченности, будет с технической точки зрения прототипом по всем серьезным компонентам разработки (организация хранения и поиска информации, выбор базовой системы, защита и восстановление после сбоев, язык информационно-поисковых предписаний, программное обеспечение терминального оборудования и т.п.). Возможным кандидатом при разработке такой модели могла бы быть, например, подсистема ретроспективного анализа публикаций «Правды».

    Коснемся, наконец, соотношения предлагаемого подхода с другими известными системами компьютеризации газетной работы. Не затрагивая всех аспектов сопоставления, упомянем лишь о системах «Нью-Йорк Таймс» и об эволюции взгляда на системы в наших глазах, начиная с первых контактов с «Правдой».

    Система ИБМ, предоставляя однородный сервис строго централизованного комплекса и, несмотря на высокий уровень разработки специального программного обеспечения, оказалась неудобной и неэффективной в работе. С нашей точки зрения объективным недостатком подхода была громоздкость базового программного обеспечения, умноженная на перецентрализацию информационных фондов и работы с ними, и все это в сочетании с недостаточным учетом специфики отделов редакции.

    Система фирмы Харрис — полностью децентрализованная — представляет собой другую технологическую крайность. Она, может быть, и пригодна для «Нью-Йорк Таймс», но, по-видимому, неприемлема в условиях «Правды». Отсутствие взаимодействия между отделами, полностью отвечающими за заполнение выделенного «окна», совершенно другие условия композиции и верстки номера (многополосность, большое количество рекламы, значительное число полос с однородной информацией типа объявлений или курсов акций).

    Все эти специфические условия, допускающие интенсивную децентрализацию, не позволяют идти по пути буквального восприятия организации системы фирмы Харрис.

    В первоначальной постановке подача материала о потребностях «Правды», возможно под влиянием переговоров с ИБМ в 1975 г., также отражала тенденцию централизованной обработки информации, поступающей в «Правду».

      В то же время наш системный анализ показал следующее.
    • Отдел в «Правде» является реально действующей операционной единицей и имеет четко очерченный круг вопросов, относящихся к его компетенции.
    • Входная информация, поступающая в «Правду», как правило, имеет конкретного адресата. Централизованная коммутация входных информационных потоков практически отсутствует или носит чисто технический характер. Внутренняя циркуляция информации также обходится в основном без центрального диспетчирования .
    • В настоящее время проблема механизированной обработки входной информации (если исключить процедуры регистрации) не актуальна. Каждый входной материал прочитывается, т.е. опосредствуется неформализуемой интеллектуальной работой сотрудников отделов. Удельный вес информации, поступающей сразу на электронных носителях (телетайп, телеграммы) пока сравнительно невелик.

    Все эти наблюдения позволили сделать принципиальное заключение о том, что проблема помещения на машинные носители и последующей автоматизированной обработки относится не столько к входному информационному потоку, сколько к текстовой продукции отделов «Правда». Именно этим, в первую очередь, объясняется сдвиг в сторону отдельских подсистем.

    В то же время объединяющее начало чувствуется в «Правде», наверное, сильнее, чем в большинстве других газет. В течение ближайших лет ста объединение будет по-прежнему реализовываться, прежде всего, на уровне человеческих отношений.

    Однако уже сейчас создание глобальной системы автоматизации набора и верстки газеты, тесно завязывающей службу выпуска с производственными отделами и печатным цехом, является актуальной технической задачей.

    Со временем появятся «межотдельские» задачи, связанные с перекрестной обработкой разных баз данных. Необходимо также предвидеть и возможность автоматического пополнения информационных фондов «Правды».

    Все эти факторы требуют, наряду с отдельскими подсистемами, сопровождающего развития централизованных систем.

    Высказанные соображения поясняют сущность смешанного подхода к организации информационно-вычислительных работ в «Правде» так, как он описан в отчете.

    По условиям работы проделанный анализ должен стать основой для выработки технического задания на проектирование ИВС «Правда». Надо, однако, заметить, что какой бы решающий характер ни носило сотрудничество авторов «Системного анализа» с правдистами, данный отчет носит характер одностороннего документа. На этом этапе работы авторы анализа еще не могут взять на себя ответственность навязывать свои выводы в качестве единственно правильных.

    Компонент изучения в анализе занимал не меньшую роль, чем выработка рекомендаций, и представление нашего видения «Правды» составляет неотъемлемую часть. Критическая реакция заинтересованной стороны на положения и гипотезы сделанного анализа не менее важна, чем проделанная работа. Есть надежда, что эта попытка отразить «Правду» в зеркале информатики послужит стимулом для такой реакции и создаст предпосылки к выработке достоверного технического задания, удовлетворяющего заказчика и выполнимого для исполнителя.

    часть 2

    Следующая статья сборника

    Из сборника "Новосибирская школа программирования. Перекличка времен". Новосибирск, 2004 г.
    Перепечатываются с разрешения редакции.