next up previous contents
Next: 7.2 Введение Up: 7. Программы преобразования и Previous: 7. Программы преобразования и

7.1 Текст

Под текстом понимается последовательность символов (букв), которые могут перемежаться управляющими символами: символ табуляции <TAB>, символ перехода на новую строку <LF> и т.п. Обычно, текст разделяется на параграфы, фразы (предложения) и слова. Символом отделяющим одно слово от другого чаще является пробел. Как правило, одна фраза отделяется от другой точкой. По умолчанию, абзацы отделяются один от другого пустой строкой.

Текст в файле представляет собой последовательность из одной или многих записей. Не═обязательно, что разделение текста на слова, абзацы и фразы каким-то образом связаны с разбиением текстового файла на═записи. Однако, на практике в качестве символов отделяющих одно слово от═другого используется пробел и символ конца записи <LF>.

Нетрудно догадаться, что в основе большинстава видов человеческой деятельности с использованием компьютера лежит работа с различными видами текста: текстами руководств, описаний, книг, исходными текстами программ, конфигурационными файлами, и т.д.

Текст может быть введ©н или отредактирован с терминала любым текстовым редактром. Текст может быть записан в виде обычного файла на диск или передан по компьютерной сети. Текст может быть проанализирован или преобразован любой программой, предназначенной для преобразования или анализа текста.


next up previous contents
Next: 7.2 Введение Up: 7. Программы преобразования и Previous: 7. Программы преобразования и
Andrei Chevel
Andrei.Chevel@pnpi.spb.ru