On-Line Библиотека www.XServer.ru - учебники, книги, статьи, документация, нормативная литература.
       Главная         В избранное         Контакты        Карта сайта   
    Навигация XServer.ru








 

Как найти мамонта?

Engine - machine that converts energy into power or motion
(Oxford Dictionary)

Попробуйте ответить на вопрос "Как поломать Интернет?" Резать кабели? Неэстетично и бесперспективно - их много, лежат они глубоко, да и вся структура Интернета-паутины была рассчитана на противостояние именно такой форме диверсии: разбомбили в одном месте - не беда, найдутся обходные пути. Может, действовать более избирательно - уничтожать Интернет-провайдеров? Вернее, их серверы? Ох и много же хлопот - в одной Америке их тьма, так что максимум, на что может рассчитывать диверсант, так это "выключить" из Интернета одну-две страны. Да и то пока новый провайдер не появится.

А теперь представьте себе, что в один несчастный день (oh, one fucking dayyy...) вы, зайдя в Сеть с целью найти там информацию о... ну, скажем, мамонтах, пытаетесь связаться с вашей любимой поисковой системой и обнаруживаете, что она не работает и "connection refused". Досадно. Тогда вы пытаетесь попробовать другой search engine... тоже неудача. Вы доходите до конца списка (допустим, у вас есть список таких "искалок" - ведь с Netscape home вам также не удалось связаться ;) ), и - безрезультатно. Все ваши двадцать "искалок"... всего лишь двадцать "искалок" не реагируют. Ваши действия? Попробуете линки из bookmarks, из вашей страницы (если есть таковая). Поищете здесь и там. А потом закроете ваш browser и займетесь чем-нибудь другим в надежде, что не сегодня-завтра все пройдет, и вы сможете найти искомых мамонтов. Но и завтра нет поиска, и послезавтра нет... Гениальный, но сумасшедший хакер сумел уничтожить базы данных ведущих search engines мира. Вместе с backup'ом, разумеется, чтобы было веселее. Месяцы работы поисковых роботов. Миллионы связок. Такая диверсия также не была бы фатальна для Интернета, но парализовала бы его надолго. То есть попросту вернула бы его к тем доисторическим временам, когда этих поисковых машин не было. Но ведь тогда и URL'ов было куда меньше. Видимо, после достижения некой "критической массы" узлов поисковая система становится необходимой.

Некоторое время состояние "русскоязычного" отдела Интернета напоминало апокалипсическую ситуацию, описанную выше. Страницы, теоретически доступные для миллионов, существовали в безвестности, вернее, были известны в достаточно узких кругах. Никакого путеводителя не было. Кроме того, кирилличные странички оказались "несъедобным" уловом для большинства поисковых систем, а потому их запоминание и систематизирование оказалось делом невозможным и, видимо, мало кому из создателей этих систем интересным. "They don't care of us", - Майкл Джексон был прав. Такая ситуация вряд ли могла бы устроить российских бизнесменов, для которых Интернет - это прежде всего возможность рекламы. Тем не менее, и сегодня, зайдя в бизнес-отдел Yahoo! и далее "Russia", вы найдете там лишь фирмы, предлагающие "матрешек-бабушек", палехские шкатулки и... искомых мамонтов. Как ни странно: Russian Mammoth Society Ltd...

Через тот же Yahoo! вы сможете найти два "окна из Европы" - Cronyx Online Service и Global Russian Network. И это все, что предлагает человеку, интересующемуся российским рынком, старейший поисковый аппарат Сети? Или я искать не умею? Я поинтересовался у Web-мастера Yahoo!, чем вызвана такая дискриминация, и получил краткий ответ: "Мы индексируем все заявленные сайты". Нет заявок? Так кто кого дискриминировал?

В сложившейся ситуации появление региональной (национальной, языковой) русской поисковой системы было делом времени. Первые каталоги русских связок возникли стихийно - так родилась страница Андрея Ражанского "Russian Yellow Pages":

- ...Поначалу это была лишь коллекция "русских" страничек в Интернете, которую я собрал для самого себя (так сказать, для внутреннего пользования), - говорит Андрей. - После того как некоторые мои друзья тоже стали использовать ее, я решил разослать мою homepage по различным поисковым системам, таким как AltaVista, Yahoo! С тех пор около 4000 человек посещает эту страницу ежемесячно, присылает новые линки и замечания.

Обратите внимание - Андрей не сделал практически ничего для создания базы данных коммерческих предприятий - "клиент" сам пошел, клюнув на удачное название страницы и ее удобный дизайн. Кроме того, страница легко находилась с помощью "конвенциональных" поисковых машин.

- "В Business Connections я не вносил ни одну фирму, - продолжает создатель "Yellow Pages". - В DataBase вы сможете найти только те компании, которые вписали себя туда сами. Business Connections DataBase была создана, потому что очень многие компании просили в своих e-mails ее создать. Я не пытался и не собираюсь искать новые компании по Интернету, потому что мне лично это занятие не интересно". (Из ответов Андрея Ражанского на вопросы ZR.) К слову, он сознательно "декоммерциализировал" страницу, переименовав ее в "Russian World".

Однако тем, кто хотел сделать "настоящий" каталог русских страниц, приходится напрячься для сбора ссылок. Какими же методами пользовались создатели каталогов? Приблизительно теми же. Так, технический директор компании RASER, создавшей поисковый каталог "Паук", Анатолий Ручьев ответил: "База данных собиралась и собирается по заявкам пользователей Интернета на размещение информации и своими силами. Автоматический режим здесь неприменим, т.к. много работы по классификации".

А компания "Демос" предпочла действовать "макро"-способом, видимо, более эффективным и менее хлопотным. "Данный сервер - коллекция баз данных ведущих информационных агентств России. Мы представляем эту информацию только в сети Интернет. Новые имена попадают в него после заключения договора с новым информационным агентством", - написал в ответ Виктор Зеленцов, компания "Демос".

Кроме того, каталог "Демоса" также поддерживает "самообслуживание". В настоящее время он является одним из наиболее популярных российских каталогов - 3000 дневных обращений (данные "Демоса").

Мы поинтересовались у хозяев этих трех каталогов, какими же разделами более всего интересуются посетители. Здесь было практически полное единодушие: "RASER" - Интернет, бизнес; "Demos" - товарный и финансовый рынок. Показателен ответ хозяина "Желтых Страниц". По его словам, русскоязычные посетители больше интересуются культурными разделами, а остальная публика требует "News & Information" и "Business Connection". Фирмачи ищут контакта! Но, с другой стороны, представитель "Демоса" оценил интерес иностранцев к каталогу как "низкий", а живущий в Америке Андрей сказал, что они составляют 25% общего числа посетителей.

Поскольку русский Web слабо представлен в мировых поисковых системах, русские каталоги должны были бы играть роль интерфейса между российским и зарубежным миром. Однако пока этого, похоже, не происходит (по моему скромному мнению, основанному на отзывах как самих держателей каталогов, так и их пользователей). В принципе, англоязычный пользователь скорее предпочтет искать с помощью знакомых ему InfoSeek или Yahoo!, удобных своей древовидной системой классификации. В том, что многие русские узлы остались вне поля зрения этих систем, есть и изрядная "заслуга" российских Web-мастеров. Web-promotion многих сайтов оставляет желать лучшего, зачастую не используются инструкции для поисковых роботов, позволяющие выделить основной контекст-описание страницы.

Тот же Андрей, следящий за русским Интернетом, как и я, со стороны, говорит: "Я постоянно пользуюсь поисковыми системами и считаю, что российский Интернет там представлен крайне слабо. Там преобладают страницы с "русской" тематикой, но не "российского производства". Мне кажется, многие российские Web-мастеры игнорируют такие системы или не предают им никакого значения". Я предвижу реакцию уважаемых Web-мастеров!

Еще одна проблема русской сети - кирилличные тексты. Надо же, родной язык и вдруг - "проблема". На сегодняшний день одна лишь AltaVista поддерживает "кирилличный" поиск - ей просто плевать, на каком языке искать. Но она не поддерживает тематического поиска. Если кто меня разубедит в приведенном мнении - буду благодарен. Все это вынуждает российских программистов искать "домашние" решения этой "домашней" проблемы.

- Людям нравится искать упорядоченно и по-русски, - говорит технический директор компании "RASER". - Так что интерес есть. Я думаю, что скорее русский Интернет пойдет по пути создания собственных поисковых систем, так как, к сожалению, сейчас в России уровень английского языка на WWW очень низок (если не по качеству, то по объему страниц точно).

Ему заочно возражает создатель "Yellow Pages":

- Местные поисковые системы хороши для местного пользования. Если Вы хотите интегрироваться в мировую сеть, надо подключаться к мировым системам. К сожалению, я не видел ни одной настоящей поисковой системы в России.

Ну что ж, есть чем обрадовать Андрея. Есть такая система в России. Я говорю о недавно построенной "Русской Поисковой Машине". Ни один из "рукописных" каталогов не в состоянии охватить весь "русский" сектор Интернета. Фирма "РусИнфОйл" отправила в путешествие по русским страницам поискового робота. Не скрою, лично я был рад этому факту. Я связался с Web-мастером фирмы "РусИнфОйл" Владимиром Губановым и поинтересовался историей происхождения их детища и некоторыми подробностями его работы.

Говорит Владимир Губанов:

- Идея русской поисковой машины родилась давно, но, как обычно, не хватало средств. Наконец представился случай, и система была реализована. Первая проба была проведена в июне этого года. Она дала хорошие результаты, и в конце июля сайт стал доступен пользователям Интернета. Система поиска и индексации основана на известном программном продукте Harvest, созданном в университете Колорадо. Однако, для того чтобы заговорить по-русски, ему пришлось претерпеть немалые изменения. "Русская поисковая машина" работает в режиме мониторинга, раз в месяц обновляя базу данных. Сейчас готовится переход на новый режим. Обновление базы будет зависеть от частоты обновления сайтов, содержащихся в ней. Наибольшее время занял просмотр сайтов и подготовка материала к индексации. Наша направленность очевидно следует из названия. Мы индексируем российские сайты, сайты бывшего Советского Союза, а также русскоязычные и русско-ориентированные сайты в мировом Интернете. У нас существует штат сотрудников, занимающихся просмотром сайтов, приславших заявки на индексирование. На сегодняшний день нас посещает в среднем 11000 пользователей в день. Наши серверы находятся в Нью-Йорке (из соображений лучшего доступа и денег).

Кстати, Владимир утверждает, что доля иностранцев среди пользователей "Русской поисковой машины" достигает 50-60% от общего числа пользователей. Это звучит весьма серьезно и круто.

Мы незамедлительно проверили новую и красивую штуку. В поиске имени небезызвестного в определенных кругах Мирзы Бабаева наши пока проиграли AltaViste; видимо, индексация существующих сайтов еще далека от завершения, а саморекламой Мирза побрезговал. Поиск по слову "бог" принес нам всего 5 попаданий, зато другое русское слово из трех букв собрало урожай из 53 (!) страниц. Вины машины в том, поверьте, нет - проверьте сами.

Безусловно, в данной заметке мы не охватили весь спектр существующих сегодня в России и за ее пределами поисковых каталогов и систем. Я не уверен, что "Русская поисковая машина" в самом деле первая, зато уверен, что она не последняя. Я также не знаю степени полноты каталога "Демоса". Однако можно с уверенностью сказать, что стоит ожидать возрастания конкуренции на фронте охотников за русскими страницами. Ведь чем хорош нынче Интернет для прогнозов: что ни скажешь в сторону увеличения - все сбывается, рынок растет не по дням, а по часам.



Литература по Internet