Информатика

Урок 7: Обработка текста

Обработка текста

Широкое использование текстовых документов обусловлено большими возможностями современных редакторов, которые позволяют работать со всеми типами объектов, а не только с набором символов. Рисунки, диаграммы, чертежи, списки и таблицы – все это делает рефераты, обзоры, рецензии более красочными и информативными. Но чтобы в полной мере пользоваться всем функционалом Word или других текстовых процессоров, нужно изучать приложение как можно детальнее.

План урока:

Текстовые документы – никаких ограничений

Вставка объектов

Работа с графикой

Гипертекст

Примечания и исправления в текстовых документах

Распознавание данных

 

Текстовые документы – никаких ограничений

Деятельность в текстовых процессорах подразумевает работу с символьной информацией, но не ограничена ею. Возможности этих программ очень широкие, поэтому с их помощью можно красиво оформить приглашение на праздник, романтическое письмо, реферат, дипломную работу, сделать грамоту, бизнес-план, отчет или календарь-планер плюс еще многое другое. Но чтобы при помощи Word выполнять такие задания, следует ближе познакомиться со стилями форматирования и шаблонами редактора.

Форматирование позволяет изменять текст так, как требуют нормы оформления тех или иных документов (деловые или для личного пользования). Можно вручную устанавливать размер или тип шрифта, все отступы и интервалы. Но даже в одном документе придется применить как минимум 3-4 стиля(первый заголовок, текст, подзаголовки, важные участки). Если же файл многостраничный, то понадобится особое форматирование для разных страниц, разделов и оглавления. Для облегчения работы пользователей разработчики текстовых приложений создали шаблонные стили.

 

Стили оформления

Набор команд для форматирования текста, который можно использовать много раз, имеющий свое название есть экспресс-стиль.

1 obrabotka teksta

или

2 obrabotka teksta

Также есть возможность создать свой, личный текстовый стиль.

Условно выделяют 3 типа стилей:

  1. Форматирование символов (текста).
  2. Форматирование абзацев.
  3. Форматирование таблиц.

Все экспресс-стили включают различные комбинации параметров символов, строк, абзацев, страниц и колонтитулов.

Правой клавишей мыши можно применить различные команды и для каждого стиля:

3 obrabotka teksta

Соответственно, пользователь может менять стили на панели, видоизменять каждый стандартный шаблон, давать ему другое имя (например, «Квартальный отчет», «Фирменный стиль» или «Праздничный вариант»). А часто используемые варианты удобно поместить на панель быстрого доступа.

По умолчанию созданный документ оформляется как «Обычный», а заголовки по мере важности – главный (название документа) шаблоном «Заголовок 1», подзаголовок – под номером 2, название внутри раздела – под номером 3. Эти правила действуют для большинства текстовых документов, для научных или учебных работ существуют требования к оформлению, которые руководитель проекта сообщает в момент раздачи заданий.

Назначение библиотеки стилей – быстрое форматирование любой символьной информации в документах Word. Использование разноуровневых заголовков позволяет структурировать текст, выделить иерархию материала, а также быстро сделать оглавление плюс содержание текста.

Даже если материал уже отформатирован, на него можно «наложить» новый стиль, например, преобразовать «Обычный» в научный стиль, который создан пользователем, с учетом требований преподавателя. А чтобы сохранить участок текста как свой собственный шаблон, необходимо выделить подходящий абзац, потом при помощи панели инструментов вкладки «Стили» или при помощи правой кнопки мыши выбрать подходящий пункт:

4 obrabotka teksta

В процессе редактирования или создания шаблонного стиля меняют такие элементы:

  • символы;
  • интервалы, отступы;
  • колонтитулы;
  • ссылки, примечания, закладки;
  • фоны, темы, подложки, цвет букв.

В нижний/верхний колонтитулы вставляют информацию, которая повторяется на каждой странице (название файла, номер и количество страниц, фамилия разработчика, другие данные).

 

Стили изложения текста

Написание диалогов для детской передачи, научной работы или статьи в газету будут кардинально отличаться. Все это обусловлено разностью стилей информации.

Традиционно выделяют такие стили текста:

  1. Научный – оптимален для учебных и научных работ, обучающей литературы, различных типов сочинений. Черты научного стиля текста – лаконичность, информативность, точность, доказуемость, логичность.
  2. Официально-деловой – используется для написание официальных документов. Признаки – лаконичность, однозначность, строгость.
  3. Публицистичный стиль информации – применяется при написании репортажей, очерков, статей, интервью. Характерные черты – эмоциональность, логичность, личная оценка плюс призыв к действию.
  4. Разговорный – используется в обычной жизни. Признаки – экспрессивность, эмоциональность, использование жестов, слов-паразитов, слов сленга.
  5. Художественный – нужен для написания рассказов, повестей или других видов художественной литературы. Черты такого стиля – красочные эпитеты, описания героев, выражение чувств или эмоций, как автора, так действующих персонажей.

Правильный выбор стиля текста подачи информации по типу данных, подходящее оформление документа позволяет создать корректный документ, который соответствует всем требованиям данной документации.

 

Вставка объектов

На листе документа Word могут быть не только буквы или цифры, а также другие объекты: диаграммы,рисунки, фото, списки, таблицы, многое другое.

 

Таблицы и текстовый документ

Таблицы в текстовых документах Word представляют собой сетку. На пересечении строк и столбцов находятся клетки – ячейки. Размеры ячеек, оформление границ, заливку можно менять.

5 obrabotka teksta

Когда сетка будущей таблицы готова, в нее можно вносить информацию. Это могут быть любые символы, цифры или изображения.

Полезно! Форматирование таблицы в текстовом документе подобно работе с таблицами в Excel. Можно делать таблицы с непечатаемыми границами, а для удобства на листе они будут видны в виде светло-серой линии. Если границы таблицы прорисованы линией (черной или цветной), то они будут видны на печати:

6 obrabotka teksta

 

Способы вставки таблицы в Word

Существует множество подходов, как вставить такой объект в текстовые документы. Каждый вариант имеет свои особенности.

Таблицы в текстовый документ можно вставить такими способами:

  • через пункты меню «Вставка», «Таблица», а уже там выбрать нужный вариант (нарисовать, выбрать из сетки или другое):

7 obrabotka teksta

*Детально типы, структуру таблиц и вставку листы Word рассмотрено в 7 уроке 6 класса.

Первый пункт позволяет выделить нужное количество строк, столбцов (ячеек) и получить простую таблицу:

8 obrabotka teksta

Следующий пункт предполагает рисование таблицы при помощи карандаша, рисующего границу, а потом ровные линии (сетку):

9 obrabotka teksta

Такие таблицы позволяют производить необходимые расчеты, использовать функции, вставлять формулы плюс другие возможности Excel сразу в текстовом документе. Это удобно при написании отчетов, необходимости использовать различные математические расчеты.

Еще один способ – выбрать готовую экспресс-таблицу из предложенных вариантов:

10 obrabotka teksta

Далее откроется конструктор таблиц, позволяющий оформлять по выбранному шаблону или при помощи предложенных пунктов меню:

11 obrabotka teksta

Форматирование можно применять как ко всему объекту, так и к первому или последнему столбцу, строке или выбрать чередование. Есть возможность менять тип, цвет линий, заливку, стереть или вручную дорисовать нужные линии.

 

Работа с графикой

Изображения извне можно поместить на листе текстового редактора при помощи копирования и вставки, внедрения или связывания.

Графические изображения, с которыми можно работать в Ворде: сканированные изображения, рисунки, фото. Word поддерживает следующие типы файлов: *.emf, *.gif, *.jpg, *.png, *bmp, *wmf, *.tif, *.eps, *.rle, *.dib.

В лист Ворда вставляют следующие графические объекты:

  • рисунки из других приложений (графических);
  • собственные объекты графики;
  • диаграммы в текстовых документах.

Графические объекты из внешних редакторов можно импортировать, а собственные – создавать сразу при помощи конструктора. Все объекты можно редактировать при помощи встроенных инструментов:

12 obrabotka teksta

Возможности текстового редактора при работе очень большие, поэтому можно вставлять готовую картинку извне или изменять его уже на листе:

13 obrabotka teksta

 

Графические объекты Ворд

Функционал этого редактора включает автофигуры, объекты «Надпись» и «WordArt», а также диаграммы текстового документа.

 

Вставка графики

Чтобы импортировать графический объект на лист, подойдут такие способы:

  • меню «вставка», «рисунок» - позволяют вставлять фотографии, различные рисунки;

14 obrabotka teksta

  • «картинка» - вставка видео-, звуко-, графических или мультимедиа файлов. Сюда входят различные окантовки, необычные и распространенные символы;

15 obrabotka teksta

  • «фигуры» позволяющие рисовать блок-схемы, оформлять дополнительными фигурами текст;

16 obrabotka teksta

  • «смарт-арт», позволяющий красочно оформлять блок-схемы, графически представлять различные типы текста;

17 obrabotka teksta

  • «диаграммы» в огромном ассортименте видов, форм и цветовых расцветок;

18 obrabotka teksta

  • «снимок», обычно это вырезка экрана.

19 obrabotka teksta

Второй способ – копировать графику из папки, где она хранится или из приложения, в котором создавалась, а после вставлять в нужное место на листе.

Рисунок можно перетащить, если удерживать объект и кнопку мыши, дотягивая до конечной точки. Если нажать левую кнопку манипулятора мыши – картинка скопируется, если правую – то команды на выбор (копировать/переносить).

Используя контекстное меню (выделить объект и нажать правую кнопку мыши) можно изменить доступные параметры для данной картинки:

20 obrabotka teksta

 

Вставка диаграмм

Чтобы вставить диаграмму на лист Ворд, нужно обратиться к меню «Вставка» «Диаграмма»:

21 obrabotka teksta

Перебирая предложенные варианты, пользователь может выбрать наиболее лаконичный плюс информативный вариант. Но чтобы работать с этими объектами, должна быть таблица данных, которые будут выражены в графической форме (диаграмме).

22 obrabotka teksta

Дополнительно каждую диаграмму можно видоизменять при помощи конструктора:

23 obrabotka teksta

 

Создание списков

Списки в текстовых документах создаются при помощи меню «Абзац», главной вкладки:

24 obrabotka teksta

Детально способы создания маркированных и нумерованных списков, их особенности, описаны в уроке №6 за 6 класс.

 

Гипертекст

Чтобы связать между собой различные документы, части одного файла, используется гипертекст. Слово со ссылкой на определенное место, выделенное синим цветом с подчеркиванием, называется гиперссылкой.

Ссылка может быть на:

  • файл или веб-страницу;
  • определенное место в любом документе;
  • новый документ;
  • электронную почту.

Для вставки в символ, слово или несколько слов (словосочетание/предложение) гиперссылку, нужно выделить участок, к которому будет привязываться ссылка, выбрать меню «Вставка», «Гиперссылка» или

комбинацию клавиш «Ctrl+K»:

25 obrabotka teksta

А в открывшемся окне указать ссылку на то место, которое связывается:

26 obrabotka teksta

Гиперссылка состоит из:

  1. указателя (слово, символ) ссылки;
  2. адреса, с которым связан указатель.

Чтобы перейти по ссылке, нужно просто нажать на нее или нажать вместе с зажатой кнопкой CTRL:

27 obrabotka teksta

Гиперссылка может связать указатель с:

  1. Файлом, веб-страницей – таким способом удобно указывать источник информации, изображения, если они скачаны с интернета.
  2. Определенное место в файле–возможность соединять пункты оглавления с соответствующими разделами.
  3. Новый документ– способ направить пользователя/читателя на документ другого редактора, например, чтобы на практике испробовать описанное в тексте. Используется при наличии локальной сети или если пользователи работают на одном компьютере.
  4. Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.–позволяет не загромождать документ e-mail и не открывать личные данные не заинтересованным людям. При нажатии на ссылку создать письмо на указанный электронный адрес в почтовом агенте по умолчанию.

Для облегчения поиска система предложит различные варианты на выбор или же можно скопировать адрес, вставить его при помощи нажатых кнопок Shift+Insert, команды контекстного меню «Вставить»:

28 obrabotka teksta

Чтобы осуществлялся переход на определенное место в документе (не обязательно в этом же, можно в любом другом), там нужно создать закладку, присвоив ей уникальное имя.

29 obrabotka teksta

Наглядным примером такой многоуровневой системы со связанными разнотипными документами является справочная система любой программы, где оглавление содержит ссылки на нужные разделы или файлы.

Незаменима технология гипертекста во всемирной паутине, когда на одной веб-странице есть десятки или сотни ссылок на другие страницы, сайты. Ссылка может быть в тексте, рисунке или видео. На этом основан переход на рекламируемые товары или магазины по ссылкам, спрятанным в изображении или описании товаров/услуг.

 

Примечания и исправления в текстовых документах

Возможность вносить изменения в документы, вставлять примечания в текст, совместно работать над одним документом нескольким пользователям – большой плюс для текстового процессора, которым пользуются учащиеся и преподаватели, офисные менеджеры и научные сотрудники.

 

Вставка примечаний

Для того, чтобы работать в подобном режиме, следует воспользоваться меню из ленты «Рецензирование»:

30 obrabotka teksta

Специалист, который проверяет текстовый документ (научный руководитель, редактор или рецензент) может вставлять свои примечания, не меняя сам текст:

31obrabotka teksta

После исправления замечаний или удаления примечаний, форматирование будет восстановлено, а также размер поля справа.

 

Исправления, изменения и возможности режима

Используя меню «Запись исправлений», все пользователи во время коллективной работы над документом увидят сделанные правки, в том числе и исходный документ. Для этого перед внесением изменений в текстовом документе, следует выбрать «Исправления» или нажать комбинацию кнопок (Ctrl+Shift+E):

32 obrabotka teksta

Текст после правки:

33 obrabotka teksta

Все правки и исправления детально фиксируются.

В «Параметрах исправлений» пользователи могут выбрать удобные для них цвета и обозначения или же пользоваться функций по умолчанию:

34 obrabotka teksta

Выбрав пункт меню «Сменить пользователя», участники могут отслеживать, кто именно внес те или иные правки. Исправления в тексте всех пользователей будут разного цвета:

35 obrabotka teksta

Правки могут быть отменены или приняты. Достаточно нажать на описание исправлений, чтобы выпало контекстное меню:

36 obrabotka teksta

Пользователи могут сами выбрать, какие именно исправления им нужно отслеживать:

37 obrabotka teksta

Команда меню «Область проверки» позволяет выбрать вертикальную полосу или горизонтальную:

38 obrabotka teksta

39 obrabotka teksta

Всегда можно посмотреть все версии:

40 obrabotka teksta

Каждую правку можно принять/отменить или сравнить документы до и после:

41 obrabotka teksta

Также можно заблокировать авторов или «Ограничить возможность редактирования»:

42 obrabotka teksta

Работая совместно в он-лайн версии Word, по локальной сети (рабочий документ хранится в одной папке на общем диске), или же редактируя его по очереди, авторы или пользователи могут вносить правки, обсуждать их, оставляя право принятия исправлений автору документа или последней «инстанции», научному руководителю или проверяющему. Это ускоряет создание, согласование финишной версии множества документов.

 

Распознавание данных

Чтобы получить текст или изображение, которые напечатаны, написаны или нарисованы, придется воспользоваться сканером или фотоаппаратом. Сканер позволяет не просто получить информацию в виде картинки, также данные можно «распознать» при помощи специальных программ.

Если же не распознавать данные, то для них не будут доступны функции редактирования или форматирования. Их можно будет изменять только как графические файлы.

Программы, используемые для распознавания графических файлов и преобразование их в текст, называются Optical Character Recognition или OCR. Наиболее популярными являются ABBYY FineReader и CuneiForm. Часто программа идет в комплекте со сканером или МФУ (устройство, соединившее в себе принтер и сканер).

Функции современной программы оптического распознавания символов (OCR):

  • распознание текста, набранного различными типами шрифтов, независимо от качества печати;
  • многоязычность;
  • распознание таблиц с сохранением форматирования;
  • сохранение полученного результата в различных распространенных форматах;
  • проверка правописания;
  • компьютерный перевод и другое.

Чтобы это все выполнить, программа выполняет десятки простейших операций, начиная с распознания структуры данных на сканированном листе (выделение столбцов, колонок, картинок), а заканчивая сравнение каждого символа со своей базой шаблонов, чтобы понять какая это буква или знак. Используется растровый или структурный методы распознания (по совокупности точек или по простейшим элементам-составляющим символа).

Современные распознаватели самообучающиеся, то есть когда пользователь исправляет полученный текст, а его всегда нужно проверять и убирать неточности, программа запоминает правки и вносит дополнения в свой набор шаблонов.

Бесплатные версии имеют минимальный набор функций, несколько популярных языков (например, английский, русский) достаточный для рядового пользователя, компьютерные словари выполняют перевод сканированного текста автоматически (при необходимости).

Платные же версии оснащены огромным набором инструментов, количество распознаваемых языков доходит до 200 (!), включая древние, экзотические, даже языки программирования. Пакетное сканирование, высококачественное распознавание сложных таблиц и форматирования, возможность работать с старинными, пожелтевшими или некачественными документами – далеко не все возможности этих программ.

Интерфейс таких программ очень удобный, интуитивно понятный. Есть упрощенный режим, в котором установленные параметры по умолчанию (самые часто используемые) и профессиональный, когда пользователь выбирает нужные ему критерии (размер страницы, яркость и контрастность, тип изображения, язык).

 

Кодировка символов

Для человека символы выглядят как буквы, цифры или знаки. Для компьютера все они выглядят как совокупность «0» и «1». Нажимая любую клавишу или комбинацию на клавиатуре, пользователь посылает системе сигналы (последовательность электроимпульсов), которые удобно представлять в виде двоичного кода.

Количество возможных комбинаций (N) находится в зависимости 2i, i=N. Таким образом, при кодировании одного символа комбинацией из 8 единиц или нулей, доступно 28=256 комбинаций. Если же используется 16 разрядный код, то комбинаций будет 216=65 536.

43 obrabotka teksta
Источник

Восьмиразрядной системы достаточно, чтобы закодировать все символы клавиатуры на 2 языках (русский алфавит, английский), включая строчные и прописные буквы, все цифры и арифметические знаки, плюс многое другое. Соответствие символов и двоичного кода фиксируется в таблицах кодировки.

По умолчанию, во всех таблицах кодировки 128 кодов соответствуют одинаковым символам:

  • 0-32 коды – символы управления;
  • 33-127 – буквы, цифры, знаки и др.
  • 128-255 – буквы национального алфавита, знаки валют и т.п.

Многие языки могут преобразовываться в разных кодовых таблицах, то есть иметь разный двоичный код.

Существует международный стандарт ASCII (American Standard Code for Information Interchange), которому должны подчиняться все кодировки, независимо от операционной системы или типа компьютера. Перекодировка из двоичных знаков в символы и наоборот выполняют программы конвертеры.

8-разрядные кодировочные таблицы типа Windows, КОИ-8 подходят только для использования не более 2 языков, так как мало комбинаций 0 и 1.

На смену старым таблицам кодировки с ограниченными возможностями пришел новый стандарт Unicode,который уже имеет более 65 тыс. комбинаций.

Первые 128 кодов такие же, как ASCII, остальные соответствуют множеству других языков и разнообразных знаков и обозначений.

Образец кодировки в старой и новой системе:

44 obrabotka teksta

Пример расчета объема памяти для кодировки фразы:

Дано:

Есть фраза из 24 символов, на каждый из них отводится по 2 байта. Сколько займет памяти такой набор?

24*2=48 (байт).

 

ВОПРОСЫ И ЗАДАНИЯ

Вопрос: 1
Посчитайте, сколько памяти займет известная пословица, если каждый символ (включая пробел и знаки препинания) кодируется 1 байтом: Не стыдно не знать, стыдно не учиться.
138 байт
227 байт
332 байт
Ответить
1
Вопрос: 2
Предположим, что существует система кодировки символов при помощи 10 двоичных кодов. Сколько комбинаций «0» и «1» есть в такой системе:
1200
21024
3512
Ответить
2
Вопрос: 3
Письмо, в котором 10 страниц, на каждой из них 60 строк по 75 символов. Кодировка каждого символа – 2 байт. Посчитайте, какой объём памяти занимает такое послание:
110*60*75*2=90 000 байт или 90 Кб
2210*60*75=4 608 000 или 4,6 Мб
360*75*10/2=22 500 или 22,5 Кб
Ответить
1
Вопрос: 4
Определение ячейки в текстовом редакторе:
1то же, что и ячейка в любой другой программе – место пересечения таблиц и строк
2квадрат с данными
3место для хранения чисел
Ответить
1
Вопрос: 5
Может ли указатель содержать более 1 ссылки на определенное место или файл (повышенной сложности). Укажите три варианта ответа (каждый из ответов устно обоснуйте):
1нет, только одну ссылку на одно место
2да, если указатель можно разделить на несколько частей
3в зависимости от того, что является указателем
Ответить
Допущено ошибок:
Оценка:
Подробнее
Ваши ответы:
1 вопрос:

Посчитайте, сколько памяти займет известная пословица, если каждый символ (включая пробел и знаки препинания) кодируется 1 байтом: Не стыдно не знать, стыдно не учиться.
1) 38 байт 2) 27 байт 3) 32 байт
2 вопрос:

Предположим, что существует система кодировки символов при помощи 10 двоичных кодов. Сколько комбинаций «0» и «1» есть в такой системе:
1) 200 2) 1024 3) 512
3 вопрос:

Письмо, в котором 10 страниц, на каждой из них 60 строк по 75 символов. Кодировка каждого символа – 2 байт. Посчитайте, какой объём памяти занимает такое послание:
1) 10*60*75*2=90 000 байт или 90 Кб 2) 210*60*75=4 608 000 или 4,6 Мб 3) 60*75*10/2=22 500 или 22,5 Кб
4 вопрос:

Определение ячейки в текстовом редакторе:
1) то же, что и ячейка в любой другой программе – место пересечения таблиц и строк 2) квадрат с данными 3) место для хранения чисел
5 вопрос:

Может ли указатель содержать более 1 ссылки на определенное место или файл (повышенной сложности). Укажите три варианта ответа (каждый из ответов устно обоснуйте):
1) нет, только одну ссылку на одно место 2) да, если указатель можно разделить на несколько частей 3) в зависимости от того, что является указателем
Посмотреть ответы
Правильные ответы:
1 вопрос: 38 байт
2 вопрос: 1024
3 вопрос: 10*60*75*2=90 000 байт или 90 Кб
4 вопрос: то же, что и ячейка в любой другой программе – место пересечения таблиц и строк
5 вопрос: