No Image

Что такое гипертекстовый документ

0 просмотров
22 января 2020

Гипертекстовый документ. Гипертекст (нелинейный текст) – это организация текстовой информации, при которой текст представляет собой множество фрагментов с явно указанными ассоциативными связями между этими фрагментами. Основная идея гипертекстовых технологий состоит в том, что поиск информации происходит с учетом множества взаимосвязей, имеющихся между документами, а значит более эффективно, чем при традиционных методах поиска.

Формально гипертекст можно представить в виде сети или графа, где узлами являются фрагменты текста, а дуги отображают отношения, связывающие эти фрагменты. Доступ к информации осуществляется не путем последовательного просмотра текста, как в обычных информационно – поисковых системах, а путем движения от одного документа к другому.

Гипертекстовые технологии нашли широкое применение при организации хранения и представления информации в сети Internet. В состав Web системы входит язык гипертекстовой разметки документов HTML

Понятие HTMLНазвание HTML— является сокращением от HyperText Markup Language т. е. "язык гипертекстовой разметки".

Гипертекст (провести опрос)– это форма непоследовательного представления материала, в которой текст документа разбивается на связанные по смыслу блоки. Затем эти блоки связываются между собой с помощью гиперссылок, что позволяет пользователю выбирать необходимый материал любым удобным для него способом.

Разметкойназывается вставка в текст дополнительных служебных символов (например, пометок корректора). Каждый служебный символ в HTML представляет собой команду, которая указывает браузеру как следует отображать текст. Разметка может быть как очень простой, так и чрезвычайно сложной.

HTML является компьютерным языком и как всякий язык обладает собственным синтаксисом, терминологией и правилами, которые необходимо соблюдать, чтобы получить правильные результаты.

Язык HTML – это средство для формирования гипертекстовых документов. Гипертекстовые ссылки встроены в текст документа и хранятся как его часть. Благодаря этому языку можно не только формировать гипертекстовые документы, но и осуществлять связь текста и изображения с документами, расположенными на другом сервере Web.

Принципы гипертекстовой разметки. Структура документов.За основу модели разметки документов в HTML принята тэговая модель. Тэговая модель описывает документ как совокупность контейнеров, каждый из которых начинается и заканчивается тэгами.

Чаще всего НТМL-тэги состоят из начального и конечного компонентов, между которыми размещаются текст и другие элементы документа. Имя конечного тэга идентично имени начального, но перед именем конечного тэга ставится косая черта (/). Конечные тэги никогда не содержат атрибутов. По своему значению тэги близки к понятию скобок "begin/end" в универсальных языках программирования, которые задают области действия имен локальных переменных и т. п. Тэги определяют область действия правил интерпретации текстовых тэгов документа.

При использовании вложенных тэгов в документе следует соблюдать особую аккуратность. Вложенные тэги нужно закрывать, начиная с самого последнего и двигаясь к первому. Некоторые НТМL-тэги не имеют конечного компонента, поскольку они являются автономными элементами. Например, тэг изображения , который служит для вставки в документ графического изображения, конечного компонента не требует. К автономным тэгам также относятся разрыв строки (
), горизонтальная линейка ( ) и тэги, содержащие такую информацию о документе, которая не влияет на его отображаемое содержимое, например тэги и .

Общая схема построения контейнера в формате HTML может быть записана в следующем виде:

Не нашли то, что искали? Воспользуйтесь поиском:

Кроме того, что Интернет предоставляет возможность коммуникации с помощью электронной почты, он также является средством распространения мультимедийных документов, которые называются гипертекстовыми документами и состоят из фрагментов текста, звуковых и видеоданных. Такие документы можно связывать с другими документами.

Гипертекст — это объединение в единое целое самой информации и структуры ее организации. Например, в обычной файловой системе структура файлов представляет собой одно, а содержимое файлов — совсем другое. Если, работая с каким-то файлом, пользователь увидит в нем ссылку на какой-то другой файл, содержащий связанную по смыслу информацию и заинтересуетесь ею, ему придется выйти из файла и с помощью соответствующих программ найти указанный файл, открыть его, и только тогда он найдете заинтересовавшую его информацию. При использовании гипертекста ссылка на другой файл (в том числе и находящийся на другом компьютере) может быть использована для того, чтобы автоматически выдать в сеть запрос на получение из сети этого файла. Ссылка может представлять собой выделенное слово или картинку. Для вызова соответствующей информации достаточно щелкнуть мышью по ней. Под ссылкой "скрываются" адреса ресурсов.

Читайте также:  Телефон определяется как неизвестное устройство

Организация информации в Интернете в таком виде, когда файлы связаны между собой информационными связями в виде гипертекстовых ссылок, называется всемирной паутиной и обозначается WWW (World Wide Web). Важно понять, что под "паутиной" подразумеваются не линии связи, по которым идет сигнал, а связи информационные. Набор файлов на одном сервере, связанных между собой по смыслу и тесно переплетенных между собой гипертекстовыми ссылками называется страницей или сайтом. Например, страница Интернета может содержать информацию о фирме, человеке, футбольной команде, музыкальном ансамбле и т.п. Страница имеет свой "входной" файл — титульный лист (англ. home page – домашняя страница), адрес которого распространяется через каталоги и рекламу в качестве адреса всей страницы. Титульный лист содержит гипертекстовые ссылки на связанные по смыслу остальные составные части страницы, с помощью которых можно легко к ним перейти и найти нужную информацию.

Таким образом, читатель гипертекстового документа имеет возможность изучить связанные с ним документы или следовать за ходом мысли от документа к документу. Поскольку части документов связаны с другими документами, формируется связанная паутина информации. Если поместить документы в компьютерную сеть, то в такой паутине они могут храниться на разных машинах, образуя паутину в пределах сети. Гипертекстовые документы Всемирной паутины называются веб-страницами. Набор тесно связанных страниц, хранящихся в одном месте, называется веб-узлом, или веб-сайтом.

Пакеты программного обеспечения, с помощью которых осуществляется доступ к гипертекстовым документам Интернета, можно разделить на две категории: пакеты, выполняющие функции клиента и выполняющие функции сервера. Пакеты-клиенты хранятся на машине пользователя, достают информацию, затребованную пользователем, и отображают ее на экране компьютера. Именно они обеспечивают пользовательский интерфейс, который позволяет просматривать веб-страницы. Такие пакеты программ называются браузерами, или иногда веб-браузерами. Пакеты, выполняющие функции сервера, хранятся на машине, содержащей документы, которые запрашивают пользователи. Их задачей является обеспечение доступа к документам по требованию клиента. Следовательно, пользователь получает доступ к гипертекстовым документам благодаря браузеру, который находится на его машине. Браузер находит документы, запрашивая их у серверов, разбросанных по всему Интернету.

Гипертекстовые документы напоминают обычные текстовые документы тем, что текст, находящийся в них, закодирован посимвольно в системе кодов ASCII или Unicode. Различие же заключается в том, что гипертекстовый документ также содержит специальные символы, которые называются тегами и описывают, как следует отображать документ на экране компьютера и какие элементы документа являются ссылками на другие документы. Эта система тегов называется языком HTML (Hypertext Markup Language — язык разметки гипертекстовых документов). Таким образом, именно на языке НТМL автор веб-страницы записывает информацию, необходимую браузеру для отображения страницы на экране компьютера и для нахождения документов, связанных с этой страницей.

Рис. 4.3.Веб-страница в виде НТМL-кода.

Запись несложной веб-страницы на языке НТМL представлена на рис. 4.3. Она состоит из двух разделов: заголовка (head) и тела (body). Заголовок содержит предварительную информацию, как например, служебная записка начинается с даты и темы. Тело документа содержит данные, которые нужно отобразить на экране компьютера пользователя. В нашем случае страница состоит просто из сообщения «Му Web Page», которое отображается на экране. (Текст «Му Web Page» описан как заголовок первого уровня с помощью тега h1).[1]

Всемирная паутина — это вольный перевод английского словосочетания World Wide Web, которое обозначается как WWW. Бурное развитие сети Интернет во многом обусловлено появлением новой технологии WWW.

Технология WWW — представляет собой глобальную распределенную информационную гипертекстовую мультимедийную систему. В основу этой технологии положена технология гипертекста. Суть технологии гипертекста состоит в том, что текст структурируется, т.е. в нем выделяются слова — ссылки. При активизации ссылки происходит переход на фрагмент текста, заданный в ссылке.

Читайте также:  Уравнение плоскости по трем точкам через определитель

Гипертекст — документ, содержащий ссылки на другие документы, возможно, находящиеся на других компьютерах сети Интернет. Ссылки в документе обычно выделяются цветом и подчеркиванием. В таком случае о ней говорят "гиперссылка". Гиперссылкой можно считать слово, фразу или графический элемент, если указатель мыши, установленный на этом объекте меняет свое изображение. Гиперссылка — выделенный объект, связанный с другим файлом, реагирующий на щелчок мыши. WWW связывает миллионы гипертекстовых документов, которые в данном случае называются Web — страницами. Web — страница может содержать информацию, представленную в различных формах: текст, таблица, график, анимацию, а также звук и видео. Просмотр Web — страниц осуществляется с помощью специальных программ просмотра — браузеров. Наиболее распространенными являются Internet Explorer и Netscape Navigator.

К 1989 году гипертекст представлял новую, многообещающую технологию, которая имела относительно большое число реализаций с одной стороны, а с другой стороны делались попытки построить формальные модели гипертекстовых систем, которые носили скорее описательный характер и были навеяны успехом реляционного подхода описания данных. Идея Т.Бернерс-Ли заключалась в том, чтобы применить гипертекстовую модель к информационным ресурсам, распределенным в сети, и сделать это максимально простым способом. Он заложил три краеугольных камня системы из четырех существующих ныне, разработав, а позже команда NCSA добавила к этим трем компонентам четвертый:

  • o язык гипертекстовой разметки документов HTML (HyperText Markup Lan-guage);
  • o универсальный способ адресации ресурсов в сети URL (Universal Resource Locator);
  • o протокол обмена гипертекстовой информацией HTTP (HyperText Transfer Protocol).
  • o универсальный интерфейс шлюзов CGI (Common Gateway Interface).

Идея HTML — пример чрезвычайно удачного решения проблемы построения гипертекстовой системы при помощи специального средства управления отображением. На разработку языка гипертекстовой разметки существенное влияние оказали два фактора: исследования в области интерфейсов гипертекстовых систем и желание обеспечить простой и быстрый способ создания гипертекстовой базы данных, распределенной на сети.

В 1989 году активно обсуждалась проблема интерфейса гипертекстовых систем, т.е. способов отображения гипертекстовой информации и навигации в гипертекстовой сети. Значение гипертекстовой технологии сравнивали со значением книгопечатания. Утверждалось, что лист бумаги и компьютерные средства отображения/воспроизведения серьезно отличаются друг от друга, и поэтому форма представления информации тоже должна отличаться. Наиболее эффективной формой организации гипертекста были признаны контекстные гипертекстовые ссылки, а кроме того было признано деление на ссылки, ассоциированные со всем документом в целом и отдельными его частями.

Самым простым способом создания любого документа является его набивка в текстовом редакторе. Обычно гипертекстовые системы имеют специальные программные средства построения гипертекстовых связей. Сами гипертекстовые ссылки хранятся в специальных форматах или даже составляют специальные файлы. Такой подход хорош для локальной системы, но не для распределенной на множестве различных компьютерных платформ. В HTML гипертекстовые ссылки встроены в тело документа и хранятся как его часть. Часто в системах применяют специальные форматы хранения данных для повышения эффективности доступа. В WWW документы — это обычные ASCII- файлы, которые можно подготовить в любом текстовом редакторе. Таким образом, проблема создания гипертекстовой базы данных была решена чрезвычайно просто.

В качестве базы для разработки языка гипертекстовой разметки был выбран SGML (Standard Generalised Markup Language). Следуя академическим традициям, Бернерс-Ли описал HTML в терминах SGML (как описывают язык программирования в терминах формы Бекуса-Наура). Естественно, что в HTML были реализованы все разметки, связанные с выделением параграфов, шрифтов, стилей и т. п., т.к. реализация для NeXT подразумевала графический интерфейс. Важным компонентом языка стало описание встроенных и ассоциированных гипертекстовых ссылок, встроенной графики и обеспечение возможности поиска по ключевым словам. С момента разработки первой версии языка (HTML 1.0) прошло уже пять лет. За это время произошло довольно серьезное развитие языка. Почти вдвое увеличилось число элементов разметки, оформление документов все больше приближается к оформлению качественных печатных изданий, развиваются средства описания не текстовых информационных ресурсов и способы взаимодействия с прикладным программным обеспечением. Совершенствуется механизм разработки типовых стилей. Фактически, в настоящее время HTML развивается в сторону создания стандартного языка разработки интерфейсов как локальных, так и распределенных систем.

Читайте также:  Установка камеры в лифт

Вторым краеугольным камнем WWW стала универсальная форма адресации информационных ресурсов. Universal Resource Identification (URI) представляет собой довольно стройную систему, учитывающую опыт адресации и идентификации e-mail, Gopher, WAIS, telnet, ftp и т. п.

E-mail (Electronic mail) — электронная почта (простонародн. — электронный аналог обычной почты).

Gopher — это интегратор возможностей Internet. Он в удобной форме позволяет пользоваться всеми услугами, предоставляемыми Internet

WAIS — диалоговая система с оконным интерфейсом для поиска данных по ключевым словам в контексте.

telnet имеет и свой собственный набор команд, которые управляют собственно этой программой, т.е. сеансом связи, его параметрами, открытием новых, закрытием и т.д.; эти команды подаются из командного режима telnet, в который можно перейти, нажав так называемую escape-последовательность клавиш, которая вам сообщается при достижении удаленной машины.

ftp (File Transfer Protocol) — протокол передачи файлов — протокол, определяющий правила передачи файлов с одного компьютера на другой. ftp — также название программы из прикладного обеспечения. Использует протокол ftp для того, чтобы пересылать файлы. Но реально из всего, что описано в URI, для организации баз данных в WWW требуется только Universal Resource Locator (URL). Без наличия этой спецификации вся мощь HTML оказалась бы бесполезной. URL используется в гипертекстовых ссылках и обеспечивает доступ к распределенным ресурсам сети. В URL можно адресовать как другие гипертекстовые документы формата HTML, так и ресурсы e-mail, telnet, ftp, Gopher, WAIS, например. Различные интерфейсные программы по разному осуществляют доступ к этим ресурсам. Одни, как например Netscape, сами способны поддерживать взаимодействие по протоколам, отличным от протокола HTTP, базового для WWW, другие, как например Chimera, вызывают для этой цели внешние программы. Однако, даже в первом случае, базовой формой представления отображаемой информации является HTML, а ссылки на другие ресурсы имеют форму URL. Следует отметить, что программы обработки электронной почты в формате MIME также имеют возможность отображать документы, представленные в формате HTML. Для этой цели в MIME зарезервирован тип "text/html".

Третьим в списке стоит протокол обмена данными в World Wide Web — HyperText Transfer Protocol. Данный протокол предназначен для обмена гипертекстовыми документами и учитывает специфику такого обмена. Так в процессе взаимодействия, клиент может получить новый адрес ресурса на сети (relocation), запросить встроенную графику, принять и передать параметры и т. п. Управление в HTTP реализовано в виде ASCII-команд. Реально разработчик гипертекстовой базы данных сталкивается с элементами протокола только при использовании внешних расчетных программ или при доступе к внешним относительно WWW информационным ресурсам, например базам данных.

Последняя составляющая технологии WWW — это уже плод работы группы NCSA — спецификация Common Gateway Interface. CGI была специально разработана для расширения возможностей WWW за счет подключения всевозможного внешнего программного обеспечения. Такой подход логично продолжал принцип публичности и простоты разработки и наращивания возможностей WWW. Если команда CERN предложила простой и быстрый способ разработки баз данных, то NCSA развила этот принцип на разработку программных средств. Надо заметить, что в общедоступной библиотеке CERN были модули, позволяющие программистам подключать свои программы к серверу HTTP, но это требовало использования этой библиотеки. Предложенный и описанный в CGI способ подключения не требовал дополнительных библиотек и буквально ошеломлял своей простотой. Сервер взаимодействовал с программами через стандартные потоки ввода/вывода, что упрощает программирование до предела. При реализации CGI чрезвычайно важное место заняли методы доступа, описанные в HTTP. И хотя реально используются только два из них (GET и POST), опыт развития HTML показывает, что сообщество WWW ждет развития и CGI по мере усложнения задач, в которых будет использоваться WWW-технология.

карманный компьютер защита сеть гипертекстовый

Комментировать
0 просмотров
Комментариев нет, будьте первым кто его оставит

Это интересно
No Image Компьютеры
0 комментариев
No Image Компьютеры
0 комментариев
No Image Компьютеры
0 комментариев
No Image Компьютеры
0 комментариев
Adblock detector