3.2. Онлайн-механизмы поиска, хранения и распространения информации

3.2. Онлайн-механизмы поиска, хранения
и распространения информации

Необходимость соответствия уже существующим требованиям по публикации, хранению и доступу граждан к официальной информации, размещаемой территориальным органом на сайте, приводит к информационной перегруженности граждан при работе с официальным сайтом.

Важнейшим функционалом сайта является механизм поиска информации.

Поиск информации (данных) на сайте - это процесс выявления в некотором множестве источников информации (документов, текстов, ссылок, контента) тех из них, которые удовлетворяют определенному условию поиска (запросу), содержат релевантные запросу факты, сведения, данные.

Существует несколько видов поиска:

- полнотекстовый поиск по всему содержимому сайта (документы, вебстраницы и т.д.). Данный вид поиска используют все современные поисковые системы, использующие предварительную индексацию содержимого;

- поиск по метаданным - поиск по некоторым атрибутам содержимого сайта, так называемым реквизитам, например, названию, дате создания, размеру, автору документа, веб-страницы и т.д.;

- поиск изображения, аудиозаписи - поиск по содержанию. В процессе поиска происходит распознание содержимого мультимедийного файла и сравнение с другими файлами. В результате поиска выдаются похожие по содержимому файлы (изображения и т.д.).

По мере накопления информации в базе данных, поддерживающей официальный сайт территориального органа, частого обновления контента (добавления новых разделов) и расширения его навигационных возможностей (увеличение навигационного меню, списков и т.д.), интеграции новых сервисов (форумов, лент новостей, подборок статей), становится актуальным вопрос организации углубленного и всеобъемлющего поиска по сайту, а также поисковой оптимизации информации. Таким образом, можно повысить удобство навигации и использования информации, сохранить существующее и привлечь большее количество пользователей.

На официальных сайтах территориальных органов рекомендуется развивать поисковые сервисы, выдающие полный список результатов по запросам пользователей, включающий поиск по ключевым событиям, связанным с деятельностью органов государственной власти, а также поиск необходимых документов (в большинстве случаев это ведомственные нормативно-правовые акты, отчетная документация, аналитическая и справочная информация). При этом рекомендуется вести учет и предоставлять пользователям статистику наиболее посещаемых разделов сайта, а также хранить и регулярно обновлять набор наиболее часто используемых ссылок в пределах официального сайта территориального органа.

В целях повышения качества предоставления информации на сайтах территориальных органов федеральных органов исполнительной власти целесообразно использовать несколько механизмов (либо их комбинацию):

Самостоятельные поисковые сервисы. Существует ряд возможностей разработки и внедрения самостоятельных поисковых сервисов силами разработчиков и администрации сайта органа государственной власти (например, поиск на сайте Минэкономразвития России) для повышения качества поиска, на которое в основном влияют три фактора:

- полнота поиска - количество страниц и документов, по которым выполняется поиск;

- точность поиска - соответствие результатов поиска по страницам и документам поисковому запросу: учет морфологии, снятие омонимии, учет опечаток, поиск по синонимам и др.;

- ранжирование - порядок сортировки найденных результатов (например, в порядке уменьшения близости поискового запроса результату).

Поисковые сервисы сторонних разработчиков. Ряд поисковых систем (Яндекс, Google, Bing, Yahoo и др.) предоставляют возможность размещения на различных сайтах поисковых сервисов. Основными преимуществами таких сервисов являются:

- поиск с учетом морфологии,

- настройка результатов поиска,

- наличие поисковых подсказок,

- применение различных фильтров,

- высокая скорость индексирования данных на сайте,

- подробная статистика запросов,

- программирование собственных дополнительных настроек (стемматизация - нахождение основы слова по определенному алгоритму, установка собственных морфологических анализаторов, пагинация - разбиение информации на страницы).

В то же время данные сервисы имеют ряд минусов, например:

- поиск не по всем страницам сайта,

- поисковый робот не индексирует страницу сразу после ее появления, следовательно, страница, удовлетворяющая запросу, не появится в выдаче, до тех пор, пока ее не проиндексирует "поисковый робот",

- страница с выдачей может не удовлетворять дизайну, верстке, разметке сайта.

Другим важным аспектом удобства пользования сайтом и поиска информации является использование HTML-дескриптора языка разметки страниц сайтов (тега) - единицы информационно-поискового языка, служащей для описания основного смыслового содержания документа или формулировки запроса при поиске документа (информации) в информационно-поисковой системе.

Использование механизма тегирования позволяет размещать на сайтах визуализированное представление списка категорий (в виде тегов, меток, ярлыков, ключевых слов) в рамках заранее заданной принятой классификации - "облако тегов". Например, для органов государственной власти подобными категориями могут выступать: нормативно-правовые акты, отчетные документы, сфера деятельности органа, официальные комментарии, ключевые события отрасли, руководство. Причем, "облако тегов" визуально изменяется при изменении количества документов и страниц с определенной тематикой. Пример использования "облака тегов" представлен на официальном сайте Открытого Правительства.

По аналогии с "облаком тегов" целесообразно размещать на сайтах "банк" (список) полезных ссылок.

Классификация по разделам. Самый простой способ классификации информации (и самый распространенный) на сайтах, предназначенный для размещения отдельной информации в отдельных разделах сайта без использования поисковой оптимизации, индексирования страниц, тегирования. Подобное разделение информации не позволяет качественно осуществлять поиск, т.к. информация накапливается, по мере поступления информация может затеряться в общем объеме. Подобный механизм целесообразно применять в случае детальной проработки навигации по сайту, когда раздел сайта содержит многоступенчатое деление на подразделы и т.д. В то же время данный способ распределения информации никак не связан с поиском, а в полной мере зависит от структуры сайта, системы управления контентом сайта и пр.

Для более качественного поиска необходимой информации органам государственной власти необходимо внедрять на официальных сайтах самостоятельные поисковые сервисы, которые полностью зависят от структуры сайта, содержащегося контента (одновременно с использованием дескрипторов (тегов)).

Помимо поиска рекомендуется использовать следующие технологические решения:

1. Карта сайта - отражает в отдельном разделе всю структуру разделов сайта и взаимосвязей между ними, по принципу "сайт на ладони". Независимо от выбора способа поиска информации на любом сайте необходимо размещать раздел с "картой сайта" - страница сайта с полным содержанием (оглавлением) сайта, на которой расположен полный список разделов и подразделов с учетом их иерархии, с помощью которого пользователь может понять, где расположена необходимая ему информация (также можно добавлять краткие описания разделов). Одновременно с этим, "карта сайта" один из способов для успешной индексации страниц "поисковыми роботами" поисковых сервисов.

2. Технологии передачи данных, использование различных браузеров должны позволять пользователям работать без ощутимых временных задержек.

3. Дизайн официального сайта территориального органа выполнен в современном стиле и соотнесен с официальным стилем оформления официальных ресурсов Правительства Российской Федерации.

4. Навигация по сайту четко прописана на всех страницах и разделах, должна быть логично сформулирована и понятна пользователям.

5. Информация сформулирована в максимально сжатом, но понятном виде, в стиле получения пользователем большей порции информации при его заинтересованности, выраженной в нажатии на ссылку, раскрывающую детали заявленных информационных концептов. Информация должна быть сформулирована на языке, понятном широкому кругу пользователей, за исключением размещенных официальных документов, бланков и иных результатов деятельности федерального органа исполнительной власти, оформленных в соответствии с законными требованиями к их производству.

6. Публикация любого объема информации сопровождается датой и временем публикации.

7. На сайте используются специальные технологии, обеспечивающие доступ людям с ограниченными возможностями (зрение).

8. Стандартные бланки документов доступны для скачивания в электронном виде.

10. Реализована версия сайта для мобильных приложений (укороченная текстовая версия).

11. На сайте предусмотрена версия на иностранных языках (минимально - на английском языке).

12. Сайт снабжен сервисами по рассылке новостей, подкастами, на которые пользователь может иметь возможность подписаться или отписаться в любой момент.

Дополнительно необходимо формировать электронный архив территориального органа, в котором хранятся все предыдущие версии официального сайта, причем запросы пользователей и все выкладываемые документы должны характеризоваться такими метаданными, как время формирования и их автор.