10.07.2013 |
Расширенная база данных адресных объектов |
На сервисе «Охотник за адресами» внедрена расширенная база адресных объектов РФ.
До настоящего момента в качестве основы сервис использовал адресные данные классификатора КЛАДР с небольшими добавлениями, которые мы вносили по мере общения с нашими пользователями.
В течение нескольких месяцев мы вели разработку технологий для расширения возможностей КЛАДР на основе дополнительных источников адресных данных.
К настоящему моменту эта работа завершена, в результате чего мы получили новую базу адресных объектов, вместе с которой мы выпустили новую версию нашего сервиса.
Новая адресная база веб-сервиса «Охотник за адресами» содержит примерно на 7% больше информации в сравнении с актуальной версией КЛАДР.
Это, в свою очередь, позволяет обрабатывать адресные данные с более высоким качеством.
Более точные данные, отражающие прирост числа наименований адресных объектов в новой адресной базе в сравнении с наименованиями актуальной версии КЛАДР, приведены на рисунке.
Эта диаграмма позволяет оценивать процентный прирост адресных данных в нашей базе по адресным объектам разных уровней административно-территориального деления.
Так, для улиц прирост составляет 8%, а для населенных пунктов – 9%.
Для прочих адресных объектов, не являющихся улицами или населенными пунктами, количество наименований в нашей базе превышает аналогичное количество в КЛАДР примерно на 5%.
Возможности новой адресной базы автоматически стали доступны в текущей версии сервиса «Охотник за адресами» для всех наших партнеров, работающих по тарифному плану «Экспертный».
Более подробно с описанием тарифа можно ознакомиться по следующей ссылке: http://ahunter.ru/site/price.
Также соответствующие преимущества получили наши пользователи, использующие возможности веб-сервиса через API, предоставляемые командой VERIFY.
01.02.2013 |
Навигатор по адресным объектам РФ |
В рамках сервиса «Охотник за адресами» добавлена возможность интеллектуальной навигации по адресному хранилищу.
Навигатор доступен по адресу http://ahunter.ru/site/demo/navigate.
Основное назначение навигатора – дать альтернативную возможность простым пользователям узнавать правильную форму написания почтового адреса.
Вместе с правильным адресом пользователь узнает и его почтовый индекс.
Возможность узнать индекс и привести почтовый адрес к стандартному виду существовала в нашем сервисе и ранее,
для этого нужно было вводить фрагменты интересующего адреса в поисковой форме, например, здесь.
Навигатор в данном случае повторяет эту возможность, избавляя от необходимости вообще что-либо вводить вручную.
Простейший сценарий его использования состоит в последовательном спуске по иерархии адресных уровней, начиная от региона, которому принадлежит искомый адрес, и заканчивая улицей конкретного населенного пункта или города.
Для ускорения навигации можно осуществлять фильтрацию иерархии адресных объектов, выводимых навигатором.
Для этого необходимо ввести часть искомого адреса в поисковой форме.
Можно вводить как полный искомый адрес, так и какой-то его небольшой фрагмент, например, название улицы или даже часть ее названия.
В этом случае навигатор будет отображать только ту часть иерархии адресных объектов, в которой существуют адреса, соответствующие введенному поисковому запросу.
Данная возможность является уникальной в своем роде. Ее можно рассматривать как поиск адресов, соответствующих введенному запросу,
при этом результат поиска отображается не в виде традиционного списка найденных адресов, а в виде иерархии,
по которой можно осуществлять полноценную навигацию.
При этом сам поиск можно начинать не обязательно с корня иерархии, предварительно можно выполнить спуск, например, в интересующий регион.
Для иллюстрации этой возможности предложим, что нам нужно выяснить, в каких населенных пунктах и городах Краснодарского края присутствует улица «60 лет ВЛКСМ».
Для решения данной задачи достаточно осуществить первичную навигацию на выбранный регион (в данном случае, это Краснодарский край).
После чего ввести в поисковую форму название искомой улицы «60 лет ВЛКСМ».
Результат поиска будет выглядеть, как показано на рисунке.
Как видно из иллюстрации, искомая улица присутствует в городе Сочи, а также в некоторых населенных пунктах районов Белореченский и Каневской.
Чтобы узнать, каким именно населенным пунктам принадлежит данная улица, достаточно продолжить навигацию в одном из двух найденных районов.
При этом будут отображаться только те населенные пункты, в которых существуют введенная уровнем выше улица.
После завершения спуска по иерархии полный правильный адрес, по которому осуществлен спуск, вместе с почтовым индексом будет отображен в блоке «Маршрут навигации».
Если полученный правильный адрес нужно сообщить кому-то, достаточно скопировать полный URL страницы с результатом навигации и отправить его получателю, например, по электронной почте.
В приведенном примере URL будет иметь вид http://ahunter.ru/site/demo/navigate?code=23c7s8.
Получив данный URL, адресат всегда сможет просмотреть его в браузере.
12.07.2012 |
Внедрение системы очистки контактных данных в ОАО «Ростелеком» |
Информационная система по распознаванию и исправлению контактных данных («Охотник за адресами») внедрена в ИТ-инфраструктуре компании ОАО «Ростелеком».
Внедренное решение ориентировано на обработку неструктурированных почтовых адресов абонентов ОАО «Ростелеком».
В рамках такой обработки выполняется чистка почтовых адресов, включающая распознавание адресных полей, исправление ошибок в них и приведение адресов к стандартной форме.
Предусмотрена работа системы как в режиме on-line сервиса, так и в режиме пакетной чистки отложенных массивов с адресными данными.
Оба режима реализуются в рамках одного серверного процесса.
В режиме on-line система получает запросы на обработку через специальный программный интерфейс (API), основанный на передаче XML документов посредством протокола HTTP.
Отправителями запросов являются внутренние бизнес-процессы ОАО «Ростелеком».
Для пакетной чистки отложенных массивов разработано специализированное веб-приложение.
Данное приложение построено на основе стандартного веб-интерфейса сервиса «Охотник за адресами», в рамках которого выполнены доработки, позволяющие адаптировать его под работу в рамках внутренней инфраструктуры.
Приложение позволяет пользователям внутренней сети ОАО «Ростелеком» запускать на сервере пакетную обработку посредством обычных веб-браузеров.
Внедренное решение запущено на 64-битной платформе Red Hat.
06.02.2012 |
«Охотник за адресами» 1.4 |
Версия 1.4 сервиса «Охотник за адресами» запущена в режиме on-line. В рамках данной версии выполнены работы по наращиванию возможностей распознавателя, а также по увеличению его быстродействия.
Из наиболее интересных нововведений отметим следующие.
-
Введена полноценная работа с устаревшими адресными объектами, подвергшимися сложному переподчинению.
Это в первую очередь касается населенных пунктов, которые вместе со всеми своими улицами вошли в состав крупных городов.
Например, поселок городского типа Врангель Приморского края вошел в состав города Находки.
Как такового поселка в настоящее время не существует. Тем не менее, в нашей работе мы часто сталкиваемся с адресами, ссылающимися на улицы этого уже не существующего поселка.
Предыдущие версии нашего сервиса объявляли такие адреса не существующими и отбрасывали их при обработке.
В новой версии «Охотник за адресами» корректно преобразует такие объекты в актуальные адреса.
Например, введя в разделе «Анализ адреса» нашего сервиса строку «Врангель ул. Морская», теперь можно получить адрес, в котором данная улица является частью города Находки.
-
В режиме «Анализ адреса» добавлена возможность просмотреть все улицы городов и населенных пунктов.
Ранее такая возможность не предоставлялась для городов, а для населенных пунктов можно было получить список входящих в них улиц только в ограниченных случаях.
Сейчас информацию по всем улицам города или населенного пункта можно получить, введя его название и название соответствующего региона в поисковой строке сервиса.
Например, для получения всех улиц города Находки достаточно ввести строку «Приморский край, Находка».
Более того, можно получить все улицы, принадлежавшие ранее поселку Врангель и в настоящее время вошедшие в состав города Находки.
Для этого достаточно ввести запрос «Приморский край, Врангель».
-
Введена возможность исправления сложных орфографических ошибок, вносящих большие многобуквенные искажения в оригинальные названия адресных объектов.
Для этих целей мы проанализировали большие массивы адресов наших партнеров, на основе которых составили базу данных сложных искажений.
Используя данную базу, мы сформировали расширяемый набор правил, позволяющий выполнять сложные многобуквенные преобразования одних слов в другие. В дальнейшем мы будем наращивать данный набор правил, по мере накопления статистики сложных орфографических ошибок.
-
Оптимизирована работа партнерского раздела. Данный раздел позволяет обрабатывать реестры почтовых адресов любого объема.
Мы провели ряд экспериментов по обработке реестров сверхбольшого размера, содержащих суммарно порядка 1 млн. записей.
В рамках данной работы была выполнена оптимизация веб-сервиса, позволяющая комфортно работать пользователям при таких нагрузках.
|
Последние события
26.09.2024 Внедрили подсказки по паспортным данным
20.07.2024 Обработали в облаке более 2 млрд. данных
09.04.2024 Добавили на Ахантере подсказки по реквизитам банков
01.02.2024 Внедрили кадастровые номера квартир, домов и участков
09.01.2024 Добавили координаты адресов для новых регионов
11.07.2023 Внедрили гео-кодер для адресов Казахстана
Архив событий
17.10.2022 Разработали новые ИИ-инструменты для обновления гео-кодера.
01.09.2022 Запустили на Ахантере сервис поиска по ФИАС-guid.
01.08.2022 Добавили проверку квартир в Ахантере при стандартизации адреса.
01.07.2022 Включили Ахантер в реестр отечественного ПО.
11.02.2022 Разработали новый язык правил извлечения из текстов.
Страницы:
1
2
3
вперед »
|