Все о геологии :: на главную страницу! Геовикипедия 
wiki.web.ru 
Поиск  
  Rambler's Top100 Service
 Главная страница  Конференции: Календарь / Материалы  Каталог ссылок    Словарь       Форумы        В помощь студенту     Последние поступления
  Описание принципов гипертекстовой разметки для документов сервера
Введение.
Данный проект направлен на создание единой информационной гипертекстовой системы. Поэтому наиболее предпочтительным является сообщение в гипертекстовом формате HTML . Возможно использование других форматов, поддерживающих внутреннее структурирование сообщения, но для публикации сообщений в форматах, отличных от HTML , требуются дополнительные преобразования, которые могут привести к искажениям в форматировании и внутренней структуре документа. В общем случае, в любом гипертекстовом документе можно выделить <точки входа> и <точки выхода>.
Точки входа в документ - это те места в документе, в которых начинается описание какого-либо термина (определение), диаграммы, факта, события, процесса и т.п. Другими словами, точка входа в документ фиксирует границы логических блоков в пределах документа. С точки зрения пользователя, точка входа - это то место, с которого читатель может начать читать документ, если его интересует не весь документ в целом, а какая-то специфическая проблема. При выделении точек входа рекомендуется пользоваться следующими правилами:

  • Название точки входа должно быть информативным, так как именно по нему будет производиться поиск

  • В тексте, следующем после точки входа, должно идти подробное описание объявленных проблем или понятий.

  • Индексирование производится только по первым 256 символам записи, поэтому все самое главное в названии точки входа нужно писать в первую очередь.

Точки выхода из документа представляют собой тип гипертекстовой навигации. Это выделенные фрагменты текста, нажав на которые пользователь попадает на другие разделы, другие документы, другие сайты и т.д. В существующей системе точки выхода разделяются на внешние (ведущие на другие сайты) и внутренние (ведущие на другие статьи и разделы системы или запускающие поиск). При разметке документов предпочтительней использование внутренних точек выхода, так как всегда возможна быстрая проверка их корректности и переопределения. Ссылки на внешние ресурсы достаточно часто становятся неактуальными и приводят к понижению полезности документа, в которых они встречены. Рекомендуется пользоваться следующими общими правилами для выделения внутренних точек выхода:

  1. Выделять только те словосочетания, автоматический поиск Рамблера по которым может дать хорошие результаты. Лучше всего выделять словосочетания из 2-3 слов, которые однозначно определяют термин или понятие. В некоторых случаях можно выделять и единичное слово, если оно представляет собой специализированный термин, не употребляющийся в других смыслах (например, <синхрофазотрон>)
    Пример: - " пафоса диалога и пафоса монолога "
    Неправильно выделять отдельно слова "пафос", "диалог" и "монолог", поскольку эти слова распространены во многих контекстах.
    Неправильно выделять все предложение целиком, так как поисковая система ничего не найдет (чем длиннее запрос, тем меньше найденных документов).
    Правильно выделить отдельно <пафоса монолога> и <пафоса монолога>. При нажатии на любой из этих выделенных фрагментов текста система будет искать словосочетание, являющееся устойчивым термином, характерным для данной области знания (и скорее всего найдет документ, в котором дается определение и <пафоса монолога> и <пафоса диалога>).
  2. Не перегружать документ лишними точками выхода. Если в документе постоянно повторяется один и тот же термин, не стоит выделять его каждый раз. Надо следить за тем, чтобы один и тот же термин не был выделен дважды на одном экране (приблизительно страница текста).
  3. Ставить точки выхода, там, где у читателя может возникнуть потребность в более подробной информации.
  4. Не ставить точки выхода, если определение этого термина дается рядом в тексте.

Техническое описание.

Точки входа могут быть маркированы в HTML как заголовки и как скрытые точки входа (bookmarks). Выделение заголовков (используются для определения точек входа, соответствующих началам глав, разделов и т.п.):
Для выделения заголовков используются конструкции 
<H2>Text</H2>, <H3>Text</H3>, <H4>Text</H4>
Отдельно отметим, что конструкции <H1>Text</H1>, <H5>Text</H5>, <H6>Text</H6> не используются и при вхождении в систему пропадают.
Если для каких-либо целей требуется сделать короткий заголовок, то содержательная часть заголовка заносится в атрибуты NAME или KEYWORDS
Если для выделения заголовков используются конструкции <strong>text</strong> или <b>text</b>, то необходимо вставлять дополнительно определение точки входа 
<A NAME="text or keywords"> <b>text</b>
Такая же конструкция применяется для выделения скрытых (не видимых читателю) точек входа:
<A NAME="text or keywords"> text </A>
или
<A NAME=""> text </A>
Примечание. Ни в коем случае нельзя одной конструкцией разметки определять и точку входа, и точку выхода (Например, <A HREF="text" NAME="text">)
Примеры правильных заголовков:
<H2>Изучение горных пород и минералов под микроскопом</H2>
<H2 KEYWORDS="Горные породы, поляризационный микроскоп, введение">Введение</H2>
<H3>Заводские марки поляризационных микроскопов</H3>
<H4 NAME="Поляризационный_микроскоп_МИН-10">МИН-10</H4>
<A NAME="Где_найти_запчасти_для_микроскопа_МИН-10"> <b> Запчасти </b>

Примеры неправильных заголовков:
<H2>Введение</H2>
<A NAME="Устройство поляризационного микроскопа"><H3>Устройство поляризационного микроскопа</H3>
<b>Где найти запчасти</b>

Выделение определений.
Определения являются особым типом точки входа, которая используется не только в поиске, но и для составления словаря.
Для выделения определений используется конструкция типа 
<P NAME="word"> Definition </P> 
Чтобы не возникало путаницы, следует избегать употребления в других местах текста конструкции <P NAME=...>
Примечание. Вообще, конструкция < P NAME=...> не используется в современных стандартах HTML, и поэтому она была выбрана нами для специальной дополнительной маркировки определений.

Пример правильного выделения определения:
<P NAME="Солнце">
Солнце - это звезда, как и другие, но только самая близкая к нам.
</P>

Выделение рисунков
Рисунки в сообщениях могут быть значимые (те, которые имеют самостоятельную ценность вне документа) и незначимые (используемые только в данном тексте, например для показа служебных символов или промежуточных формул). Значимые рисунки обязательно должны иметь подпись (комментарий), которая позволит понять смысл рисунка вне контекста сообщения, из которого этот рисунок был взят.
Значимые рисунки должны быть включены в таблицу (горизонтальную или вертикальную), состоящую из 2 ячеек. Рисунок помещается в одну из ячеек этой таблицы, подпись в другую. Все рисунки, вставленные в текст в другом формате, считаются незначимыми.

Пример выделения значимого рисунка
<TABLE>
<TR><TD><IMG SRC =" "></TD></TR>
<TR><TD>Подпись к рисунку</TD></TR>
</TABLE>

Выделение таблиц
Таблицы, как и рисунки, делятся на значимые (те, которые имеют самостоятельную ценность вне документа) и незначимые. Значимые таблицы определяются названием, помещенным в атрибут NAME.
Пример выделения значимой таблицы
<TABLE NAME="сравнительная таблица подвидов кроликов">

</TABLE>

Выделение формул
Формулы, которые нельзя записать с помощью тэгов <SUB> и <SUP>, и математические символы вставляются в текст в нотации TeX. Например, если нужно вставить в текст символ ро, то это выглядит так:
<TEX>$\rho$</TEX>

Если формула является значимой (имеющей самостоятельную ценность вне документа, например фундаментальный закон), то ей присваивается имя, по которому будет производиться ее поиск.

<TEX NAME="Закон Ома">$U=J*R$</TEX>
Примечание. Запрещено употребление символов < и > внутри тэгов <TEX>...</TEX>. Вместо них нужно использовать соответственно команды \lt и \gt .

Внешние гиперссылки.
Для внешних гиперссылок может быть использован следующий синтаксис:
<A HREF="http://www.somewhere.ru/some_path_to_file">
<A HREF="ftp://ftp.somewhere.ru/some_path_to_file">
<A HREF="mailto:somebody@somewhere.ru">
Все остальные аттрибуты гиперссылок, такие как TARGET, onClick, вырезаются обработчиком входящих сообщений, и в системе работать не будут.

Локальные гиперссылки.
Для локальных ссылок (в пределах одного сообщения) используется конструкция:
<A HREF="file_name#reference"> 

Во избежание ошибок следует избегать одинаковых имен файлов и одинаковых имен в конструкциях <A NAME="..."> в пределах одного сообщения.

Разметка внутренних точек выхода.
Гиперссылки на другие сообщения в системе
<A HREF="message://[Автор][Год][Дата][Название статьи]ссылка внутри статьи"> 
Текст 
</A>

или

<A HREF="message://[Message_ID]ссылка внутри статьи>
Текст
</A>

Гиперссылки на определения терминов в словаре
В тексте сообщения можно вставлять гиперссылки на определения
терминов в словаре. Это сделано для того, чтобы избежать загруженности текста избыточными определениями (тем более в том случае, если приходится использовать терминологию из другой предметной области).
Для введения такой ссылки используется конструкция

<A HREF="glossary://[область знания]определяемый_термин">
Необходимый текст
</A>

или

<A HREF="glossary://определяемый_термин"> 
Необходимый текст
</A>

или

<A HREF="glossary://"> определяемый термин</A>

Переопределение ссылки на поисковую систему
Существует возможность автоматически переопределить гиперссылку на поисковую систему. Для этого ссылку надо записать в виде:

<A HREF="search://[область поиска или область знания]поисковое_словосочетание"> Необходимый текст </A>

или

<A HREF="search://[область поиска или область знания]">
поисковое словосочетание </A>
Примечание. Пустые ссылки типа
<A HREF="http://"> Text </A>
также переопределяются на поисковую систему. В качестве поискового словосочетания используется текст, находящийся между открывающим и закрывающим тэгами (В данном случае "Text").

 Контактная информация: team@students.web.ru


Проект осуществляется при поддержке:
Геологического факультета МГУ,
РФФИ
   
TopList Rambler's Top100