Пользователям Google в РФ теперь стало проще изучать связи между объектами - разработчик
6 декабря 2012 года
Российским пользователям поисковой системы Google теперь станет проще прослеживать и изучать связи между объектами из реального мира после запуска в России инструмента Knowledge Graph, заявил в интервью руководитель команды качества поиска в российском представительстве Google Ринат Сафин.
В среду поисковая система Google запустила в России инструмент для семантического поиска Knowledge Graph ("Сеть знаний"), позволяющий получить непосредственно в поисковой выдаче информацию об объекте поиска и связанных с ним фактах. Например, при запросе "озеро Байкал" пользователь увидит не только ссылки на ресурсы о Байкале, но и краткую справку об этом озере, связанных с ним достопримечательностях, прогнозе погоды и прочем.
"У нас есть связи между разными объектами, и эти связи составляют большую ценность. Вы можете легко переключаться между тем, что вас интересует. И каждый раз, когда вы выбираете что-то новое, мы вам показываем обычные результаты поиска, и вы можете почитать поподробнее", - заявил Сафин.
По его словам, интерфейс "Сети знаний" позволяет лучше визуализировать связи между различными объектами, что упрощает пользователям процесс исследования новых вещей.
"Допустим, вы собрались в отпуск в Венецию. Мы показываем какую-то краткую выжимку, которая будет полезна. Мы показываем карту, плюс к этому мы показываем достопримечательности", - рассказал Сафин.
При этом пользователь может посмотреть справочную информацию по каждой из достопримечательностей - адрес, интересные факты, расписание мероприятий (если речь идет, например, о театре).
ОДИН ИЗ МНОГИХ
Свои разработки в области семантического поиска - когда пользователю дается готовый ответ на его запрос - ведут и российские поисковики (и "Яндекс", и Mail.Ru). По словам Сафина, именно наличие связей между объектами является одним из ключевых отличий Google.
"То, что нас отличает от большинства других систем, - мы знаем связи между разными сущностями. Если вы ищете какой-то фильм, то мы вам покажем список актеров. И вы можете посмотреть, в каких фильмах снимался каждый актер", - рассказал Сафин.
Также он отметил, что еще одним отличием инструмента Google является его масштаб - система уже содержит более 570 миллионов объектов и несколько десятков миллиардов связей между ними.
Как рассказал представитель Google, поисковик берет данные об объектах из разных открытых источников, основным из которых является база данных Freebase.
"И, естественно, мы используем "Википедию", в том числе и ее локальную версию. Есть еще интересная штука - база данных ЦРУ про разные страны и города, про их население, площадь и другие подобные факты. Она открытая, во всеобщем доступе", - заявил Сафин. Также Google использует собственные внутренние источники - например, данные из своего картографического сервиса.
При этом в справку об объекте попадает только та информация, в которой Google не сомневается. Если информация об определенном факте противоречит друг другу, то подобные данные не включаются в справочную информацию.
"Естественно, ошибки встречаются везде. Мы стараемся использовать разные источники данных, чтобы проверять какие-то факты. Либо мы даем отсылку к конкретному источнику, откуда мы берем эту информацию", - отмечает Сафин.
ЧТО ПОКАЗЫВАТЬ?
"Сеть знаний" будет доступна как тем, кто пользуется Google с десктопов, так и владельцам смартфонов и планшетов. При этом для мобильных устройств интерфейс будет несколько отличаться - пользователи будут видеть краткую справку, которую при желании можно будет развернуть.
"Мы учитываем, что экран маленький, поэтому показываем только самую-самую краткую выжимку, она занимает мало место. Да, мы стараемся не загромождать экран лишней информацией", - отмечает Сафин.
При этом существуют проблема релевантности справочной информации к запросу. Например, при запросе "королев" пользователь может искать информацию как о человеке, так и о городе. Как рассказал Сафин, данная проблема решается путем изучения частоты пользовательских запросов - приоритет имеет тот объект, о котором чаще спрашивают.
"Одна из интерпретаций более важная, чем другая, поэтому мы показываем одну большую карточку и одну поменьше. Иногда бывает, что бывает несколько равнозначных интерпретаций, и тогда будут маленькие карточки", - отмечает Сафин.
Google активно использует и информацию из своей социальной сети Google+. Так, если у какой-то знаменитости есть аккаунт в соцсети, и Google уверен, что это ее аккаунт, то в информации о человеке будут отображаться его сообщения в Google+. Также в справочных данных могут появляться отзывы пользователей Google+ о различных заведениях - например, ресторанах.
Кроме того, данные из Google+ учитываются и для определения релевантности той или иной информации.
"Если вы зайдете в свой аккаунт, и мы будем знать, что вы - это вы, а человек, которого вы ищете, - ваш друг, то персонализированные результаты также могут включать информацию про него. Это может происходить в большей или меньшей степени, в зависимости от запроса, но мы эту информацию учитываем", - отмечает Сафин.
ТРУДНОСТИ ПЕРЕВОДА
Поисковый инструмент Knowledge Graph был запущен для англоязычных пользователей в США в мае этого года. Как заявил Сафин, задержка российского запуска была связана, в частности, с тем, что необходимо было понять, как понятия и объекты называются на разных языках.
"Большая часть информация, которая содержалась в "Сети знаний", была на английском языке. И мы довольно много вложили в то, чтобы научить систему тому, как что называется по-русски и на других языках тоже", - отметил Сафин.
Кроме того, в задачи локализации "Сети знаний" в России входило исследование того, что чаще интересует пользователей, поскольку от этого зависела релевантность справочной информации.
Трудности возникли и с русификацией интерфейса. "Например, для того, чтобы показывать полезную информацию на английском языке, не так важно знать пол человека. А когда начинаешь банально пытаться тот же самый интерфейс перевести на русский или немецкий, оказывается, что в зависимости от того, какого пола человек, у вас будет разная форма слова", - рассказал Сафин.
Также в работу по локализации "Сети знаний" вошло пополнение системы данными, которые имеют смысл в каждой конкретной стране, отметил представитель Google.
Поисковый сервис Google является крупнейшим в мире, однако в России он уступает поисковику "Яндекс", занимая порядка 26% российского поискового рынка.