|
|
|
|
|
|
|
|
|
ТЕКСТОВЫЕ ПРОЦЕССОРЫ
1. Виды текстов. Все современные вычислительные машины имеют пакеты прикладных программ. На автоматизированных рабочих местах пользователей происходит централизация пакетов и их интеграция. Интеграция ППП требует от пользователя достаточно высокой квалификации. Многие пакеты содержат не только прикладные проги, но и имеют встроенные средства разработки приложений. Изначально все ВМ создавались для автоматизации вычислителей. Однако в настоящее время доля чистых вычислений мала - 9-10%, а остальное время уходит для обработки специфических видов информации. Доля обработки текстов, справок - 20% - для обработки графики. Для обработки специфической информации (текстовой, графической, рисунков, фотографий) современные классические структуры ЭВМ подходят плохо. Только в последних разработках CPU Pentium MMX включены 57 новых команд для обработки специальной информации. Суть команд: большой операцией можно обрабатывать большое количество точек находящихся на экране. Программное обеспечение связанное с обработкой текстов получило название текстовых процессоров. С каждым текстом связаны определенные особенности. Текст - документ. С понятием документа связано 4 аспекта: 1 аспект - содержательный, предполагает ясность и точность изложения, лаконизм достоверность информации, ее полнота, своевременность. 2 аспект - изобразительный (как выглядит документ). Визуальное впечатление от документа, какие средства использованы, шрифт, стиль, рубрикация документа. 3 аспект - операционный (какие средства использованы для подготовки документа) 4 аспект - внутримашинный (способ обработки и хранения). Он показывает, какая память нужна для обработки документа, какие средства должны привлекаться для работы документа. Различают следующие виды документов: 1. Прозаический (от справки) 2. Табличный (символы) 3. Программный текст (для записи различных программ). Исторически этот тип появился первым. Практически любые ППП содержат собственные средства для разработки собственные прог. Например: турбо-паскаль, турбо-си. 4. Поэтический (четверостишья и т.д.) 5. Графический (нет определяющих символов, а поле экрана предоставляется в определенной яркости и цветности). Каждая точка 16 цветов. Наиболее простые текстовые процессоры вместо графики используют псевдографику (для построения таблиц и т.д.). 6. Формульный текст (наличие строк, подстрок). Имеются верхние и нижние индексы. 7. Шаблонный 8. Смешанный (включающий любые сочетания из перечисленных).
2. Классификация текстовых процессоров. В зависимости от используемого программного обеспечения пользователь имеет дело с различными текстовыми редакторами. Все они различаются своими возможностями и используемыми средствами. В порядке нарастания их мощности: 1. Самые простые - встроенный редактор ДОС (F6 + ctrl Z) позволяет работать только с одной строчкой. 2. Встроенный редактор Norton, до 32 кб (позволяет обрабатывать до 20 страниц). 3. Редакторы компьютерных прог (турбо-паскаль, турбо-си). 4. Общепользовательские редакторы (Word, Lexicon, Multedit (только тексты), Wordstar). 5. Редакторы научных документов, использующихся для записи формул Unveditor, Chiwriter, Rt-chk. 6. Редакторы издательских систем. Имеют большой спектр для разработки издательских документов большой сложности (Word (самая маломощная), Page Marker, Ventura Publisher. Размещение текстов по странице - верстка. 7. Корректоры текстов (исправляющие ошибки). Спеллеры - средства для обнаружения ошибок, воспроизведение текста. Orfo. Перекодировщики текстов. В интернете существует 4 различных кодировки текста.
3. Основные операции. Любой текстовый процессор должен содержать следующие процедуры: - процедуры набора и ввода текста - редактирование текста - печати документов - ведение архивов 1 символ - 1 байт 256 различных комбинаций Кроме стандартов имеются символы управляющие печатью. Управляющие символы включают в действие определенные проги. Нажатие на enter, означает то, что в стандартном буфере данных, рассчитанном на 80 символов, закончить заполнение буфера на данной позиции. Содержимое буфера поместить в оперативную память, затем очистить. Буфер и курсор поместить в начало буфера для заполнения.
4. Тенденции развития. 4.1. Понятие гипертекста. В настоящее время большое количество текстовых документов оседает в хранилищах автоматизированных данных, например в интернете. Организация хранилища, выборки и обработки текстовых документов предполагает их формализацию. При этом эта формализация несколько скрыта от пользователя. Формализация в процессе поиска осущест. сл. обр. 1. Выявляются признаки, по которым мы будем осуществлять поиск необходимых документов. В количестве таких документов берутся ключевые слова. Обычно в качестве ключевых слов рассматривают корни основных терминов + суффиксы. Кроме ключевых слов каждая отрасль оперирует ключевыми понятиями. Это группы слов или определенные значения известных слов. Словарь ключевых понятий называется «тезаурус». В пространстве ключевых понятий каждый документ образует своеобразный вектор. Вес каждого понятия определяется частотой его повторения в документе. Для поиска необходимых документов составляется поисковый образ, вектор которого показывает какой документ нам требуется.
Текущая страница: 1
|
|
|
|
|
|
|
|
|
|