Основы информатики. Проблемы работы в Интернет с кириллическими текстами .

Для кириллических текстов в системах DOS и Windows применялись различные системы кодировки. В DOS использовались коды ASCII, которые соответствовали кодовой странице 866, а в системе Windows – кодировка, отвечающая кодовой странице 1251. Поэтому тексты, подготовленные в текстовом редакторе, работающем под управлением DOS, напрямую в Windows не могли быть прочитаны и требовали перекодировки. Тексты, которые были подготовлены редакторами Windows, выглядели абракадаброй, если их пытались прочитать в кодировке DOS. Для устранения этой проблемы были созданы перекодировщики, которые встраивались в некоторые редакторы текстов и обеспечивали перекодировку из DOS в Windows и обратно.

В случае работы с Интернет проблема усугубилась. Это объяснялось тем, что символы кириллицы кодировались третьим способом, с применением кодовой таблицы KOI8. Ее традиционно использовали в компьютерах, которые работали под управлением операционной системы UNIX. Изначально серверы Интернет были построены исключительно на основе UNIX, вследствие чего русскоязычные тексты кодировались только с помощью KOI8. Этим объяснялось то, что в Интернет русскоязычный текст представлял собой абракадабру при воспроизведении в кодировке, отличной от той, в которой он был первоначально создан. Эту проблему можно устранить при работе в WWW с помощью размещенных на экране кнопок, позволяющих повторно вывести страницу документа в другой кодировке.

Трудности с кириллическими текстами возникают и при их сохранении. Это может происходить при дальнейшей автономной (вне Интернет) работе с текстами.

Сохраняют WWW-страницы двумя способами:

1) сохранение в том же формате HTML, в каком он присутствовал в Интернет. В этом случае просматривать и редактировать подобный файл можно, во-первых, теми же программными средствами, которые обеспечивали его просмотр при работе непосредственно в Интернет, а во-вторых, другими специализированными редакторами, ориентированными на работу с форматом HTML;

2) сохранение документа в форме обычного текстового файла. При этом текстовая информация сохраняется без элементов форматирования. Документ запоминается в кодах ASCIL, если он был создан с помощью кодовых страниц 866 или 1251 (в DOS или Windows). Подобный документ можно прочитать и отредактировать как в DOS, так и в Windows, но при его перекодировке в момент загрузки в Word в качестве способа перекодировки необходимо указывать «Только текст», а не «Текст DOS».

Протоколы можно использовать для следующих целей:

1) реализация в глобальной сети указанной системы адресации хостов;

2) организация надежной передачи информации;

3) преобразование и представление в соответствии со способом ее организации.

Основной протокол, используемый при работе в Интернет, – TCP/IP, совмещающий в себе протоколы передачи (TCP) и идентификации хостов (IP). На самом деле работа в сети Интернет при доступе к провайдеру с помощью модема по коммутируемой телефонной линии производится посредством одной из двух модификаций протокола TCP/IP: по протоколу SLIP или РРР (более современный протокол).

Когда пользователь использует только электронную почту, не реализуя все средства Интернет, ему достаточно работать по протоколу UUCP. Это немного дешевле, но возможности пользователя при этом ухудшаются.

Для некоторых информационных служб кроме общесетевых протоколов используются свои протоколы.