0. Для чего нужны исследования языковой картины?
Существует крайняя точка зрения, что деление интернет-ресурсов по странам и доменам – вещь выдуманная. Границ в интернете нет, на самом деле все делится только по языкам. Возможно, она сгущает краски, но рациональное зерно в ней есть. Все мы – носители каких-то языков, и чтобы «достучаться» до нас с нами надо говорить на языках, которые нам доступны, как минимум.
Существующая практика продвижения отечественных интернет-ресурсов ограничивается, как правило, одной иноязычной версией – английской. При этом считается, что английским пользуется весь мир, и этого достаточно. Между тем, это не совсем так. Впервые пришлось задуматься об этом, когда пользователи сайта гостиницы, который мы сопровождали, упорно пользовались он-лайновыми переводчиками, в частности переводчиком Гугля, и это отображалось в ссылающихся страницах. Казалось бы, тематика должна быть 100% знакомой любому путешествующему, действие тоже максимально просто: забронировать номер на определенную дату за определенную сумму. Однако пользователи предпочитали читать это на родном языке, а не на английском. Нужно идти им навстречу.
Но стоит принять решение о том, что сайту необходимо иметь больше языковых версий, как немедленно становится вопрос: а каких именно? Можно ли определить хотя бы приоритеты создания немецких, французских, итальянских, испанских страниц, не говоря уже об их целесообразности именно для данной тематики сайта и именно для данной страны.
Еще один вариант задач – выйти на рынок конкретно указанных стран с конкретной продукцией (услугами). Достаточно ли для этого только английской версии? Вопрос на самом деле не столь очевидный. Классическими примерами могут служить Швейцария, Канада, Бельгия, бывшие колониальные страны, которых тоже немало. Даже родина интернета – Калифорния - на поверку оказывается наполовину испаноговорящим штатом. В этот же ряд можно включить и Украину, потому что даже сами украинские интернетчики толком не представляют языковой картины в украинском сегменте Сети. По крайней мере, исследования этого вопроса нам, честно говоря, не встречались.
Объясню на примере. Представьте себе, что западный производитель пластиковых окон пытается выйти на рынки Рунета по запросу “plastic windows”. Много ли трафика он соберет, даже будучи первым во всех поисковых машинах? Между тем, спрос на этот товар, как мы знаем, существует.
Таким образом, существует ряд задач, для решения которых нужно представить себе языковую картину того или иного сегмента Сети. Можно ли это каким-то образом исследовать? В данном докладе мы попытались систематизировать необходимые шаги подобных исследований. А потом применить их для частного случая Уанета.
1. Шаг 1. Определение размера интернет-аудитории страны
Чем больше прошло времени с момента изобретения протокола http, тем этот шаг все менее актуален. Тем не менее, на случай экзотических задач пригодится. Долгое время такой «экзотической задачей» была сама Украина.
Сайт Internet World Stats http://www.internetworldstats.com/stats.htm
Систематизирует данные из различных официальных источников, в частности Нильсен Нет Рейтинг и Международного Телекоммуникационного Союза, о количестве интернет-пользователей в стране, коэффициенте проникновения (процент интернет-пользователей от населения страны) и темпах прироста интернет-аудитории.
У нас есть хорошая возможность сравнивать данные любых сайтов, дающих глобальную статистику, с данными по России и Украине. Не преминем ей воспользоваться.
Для России сайт дает 23.700.000 пользователей (проникновение 16,5%)
Для Украины 5.278.100 (проникновение 11,4%)
Что вобщем-то согласуется с нашими внутренними источниками.
Точность сайт пытается давать просто необыкновенную. Например, для Ватикана указаны 93 пользователя. Интересно, входит ли в это число Папа?
Ну и еще из, казалось бы, неожиданностей, но на самом деле закономерностей. В Италии, например, на 5 миллионов больше пользователей, чем в России. А по размерам на карте и вниманию со стороны украинских вебмастеров и не скажешь.
2. Шаг 2. Определение употребляемых в стране языков
Языковеды насчитывают в мире от 3 до 5 тыс. языков. Не все из них имеют письменность. Понятно, что в интернете представлены только некоторые из них. Тем не менее, кодировки ISO, например, предусматривают использование в компьютере даже мертвых языков. Так что даже для вавилоских глиняных библиотек еще не все потеряно. Возможно, появятся сайты и на древневавилонском. Скептиков отсылаю к сайту одной львовской гостиницы на классической латыни, который появился к визиту Папы Иоанна Павла Второго в Украину. Видимо, все те 93 пользователя из Ватикана в результате остановились именно в этой гостинице. Как ни странно, русских языковых версий, ни у одного львовского отеля, исключая «Днистер», нет. Хотя тут речь идет уже далеко не о 93 пользователях.
Языковая картина мира в 20 столетии филологами достаточно подробно описана. Составлены атласы языков. Можно этим воспользоваться, чтобы не зависеть от отрывочности своих знаний. Ну, вот не помню я, на каких языках говорят в Бельгии, и чьей колонией была Нигерия. Есть достаточно подробные сайты, посвященные этим вопросам. Например:
Сайт «Этнолог» http://www.ethnologue.com/country_index.asp
Снова воспользуемся нашей возможностью проверять достоверность сведений на сведениях об Украине. http://www.ethnologue.com/show_country.asp?name=UA
Помимо правильного распределения языков по регионам, и учета носителей языка «поштучно» по данным переписи, имеется очень важное примечание: Russian is spoken in major urban areas
Именно эти «урбанистические территории» и составляют пока что аудиторию украинских интернет-пользователей. Никаких неожиданностей, вроде, нет. Данным можно доверять и для других стран. Но возникает вопрос, насколько широко используются локальные языки в интернете, а не в оффлайне. Поэтому,
3. Шаг 3. Определение того, употребим ли язык в интернете
Легче всего это сделать непосредственно на Google.
На https://services.google.com/tcbin/tc.py?cmd=status указан статус работ по переводу интерфейса и служебных сообщений Гугля на локальные языки.
Поскольку, перевод осуществляется волонтерами, становится более-менее ясным, употребим ли язык в интернете. Абхазский, например, выполнен на 2%. А албанский на 99%. Украинский перевод выполнен на 100%, русский на 98%. В общем, есть опасность того, что там, где встречаются два локальных языка, мы неверно истолкуем преобладание одного из них. Поэтому,
4. Шаг 4. Определение количества документов на разных языках, проиндексированных поисковыми системами в региональном домене
Самое интересное, на мой взгляд. Используем для этого все тот же Google и его региональные домены.
Катерина Кирсанова в статье "Сравнительная характеристика известных поисковых систем" (сборник докладов конференции «Поисковая оптимизация и продвижение сайтов 2005») оценивала величину индекса различных SE на основании количества результатов, которые SE возвращает по запросу "and". Действительно, трудно представить себе связный английский текст без этого союза.
Но подобные запросы можно использовать и для определения количества проиндексированных страниц на других языках. Если совместить это с возможностью региональных серверов Гугля выдавать"страницы из...(Канады, Германии, Украины)", можно оценить количество страниц на разных языках внутри какого-либо регионального домена.
Для примера возьмем канадский Гугль, где языковая картина заведомо неясна и интересна. Испанским языком пришлось пожертвовать, потому что предлог совпадает с "е-коммерцией" и прочими е-, а Y тоже возвращает документы на английском.
Итак, для Канады получается такая картина (в правом столбике количество документов, которые вернул поисковик по запросам «и»)
Наверное, это и есть объективная картина распространенности того или иного языка в региональном домене с поправкой на непроиндексированную поисковиком часть Сети.
Кстати, интересный аргумент против сайта на украинском языке, рассчитанного на интернет-активность диаспорных украинцев Канады, который мог бы всерьез рассматриваться, если бы мы ориентировались на общепринятые стереотипы, а не на сухую статистику. Видимо, канадские украинцы давно настолько адаптировались, что не ощущают потребности в сайтах на украинском, чего не скажешь о русских эмигрантах «новой волны».
Интересно проверить подобную методику на Украинском сегменте, но это будет сделано несколько позже в отдельной главке.
Реклама: return_links();
?>
на сайте МНЕТС - снять офис или переговорную комнату на время
на сайте МУС ЛТД - проектная документация, проектирование зданий, гарантия качества
|