25.10.2011 |
Наши нестандартные веб-проекты |
Выполнены работы над двумя независимыми веб-проектами: веб-архив видеоматериалов и социальная сеть для членов ЖСК.
Основное назначение веб-архива – создание сайтов класса видео-хостинга с централизованным управлением видеоматериалами. Отличительной особенностью такого рода сайтов в сравнении с известными крупными видео-ресурсами является ограниченность вычислительных возможностей хостинга. Вместе с тем современные тенденции в области видео-порталов таковы, что требуется обеспечивать кроссплатформенное воспроизведение видеоматериалов, в том числе на мобильных устройствах, не поддерживающих технологию Adobe® Flash® Player.
В нашем решении кроссплатформенность воспроизведения видеоматериалов реализована прозрачно как для администратора сайта, так и для его посетителей. Переключение между технологиями воспроизведения видео Adobe® Flash® Player или HTML5 выполняется незаметно для пользователя в зависимости от типа браузера и типа пользовательского устройства. Обычно при решении данной задачи для каждого видеоматериала на видео-хостинге создается несколько его версий с использованием разных видео-форматов. Это достаточно нерациональное и громоздкое решение, поскольку, с одной стороны, требуется контролировать все версии каждого видео-файла, что создает дополнительные неудобства администратору, а с другой стороны, увеличивается в несколько раз объем хранимых данных. Новизна нашей разработки заключается в том, что для хранения используется один единственный формат, при этом обеспечивается воспроизведение как посредством технологии Flash, так и посредством HTML5.
Дополнительно мы добились сохранения кроссплатформенности нашего решения при внедрении видеоматериалов на произвольные сайты. Созданный нами специализированный код для вставки видео позволяет внедрять видеоматериалы на внешние веб-страницы (например, блоги или статьи веб-порталов) с сохранением возможности воспроизведения внедренного видео на любой платформе без необходимости вносить изменения в заголовки и скрипты самой страницы.
Наше решение успешно апробировано при разработке видео-архива synergyteam.tv, содержащего материалы, освещающие события спортивной жизни российской парусной команды «Синергия».
При разработке социальной сети для членов ЖСК, мы решали задачу создания информационного портала, который могли бы наполнять материалами и управлять ими все члены ЖСК. По своей сути, созданный сайт является коллективным блогом, где все зарегистрированные пользователи могут публиковать статьи в предопределенных разделах сайта, а также вести обсуждения этих статей, оставляя комментарии к ним.
Основная проблема, с которой мы столкнулись в данном проекте, связана с разграничением прав доступа. Разграничение необходимо, поскольку на сайте кроме материалов пользователей также выкладываются материалы, имеющие официальный характер: контактные данные членов правления, устав и пр. Во избежание случайной или умышленной публикации недостоверной информации в официальных разделах сайта, нами была разработана и внедрена политика безопасности, учитывающая разделение прав между обычными пользователями и пользователями, входящими в состав правления и несущими дополнительную ответственность за достоверность официальной информации сайта.
Наше решение успешно апробировано при разработке веб-сайта zkubanskiy.ru, являющегося площадкой для обсуждения актуальных вопросов членами ЖСК «Кубанский».
25.08.2011 |
«Охотник за адресами» 1.3 |
Закончена разработка новой версии сервиса «Охотник за адресами». Обновление получило номер 1.3. Относительно предыдущей версии был полностью переработан механизм распознавания почтовых адресов, учитывающий двухлетний опыт использования сервиса нашими партнерами. В новой версии мы уделили особое внимание минимизации количества неточных исправлений почтовых адресов.
Специфика работы нашего сервиса такова, что, с одной стороны, на вход поступают нечеткие данные, содержащие ошибочную и неполную адресную информацию, которая зачастую весьма отличается от эталонных записей классификатора адресов России, а с другой стороны, сам классификатор адресов не является полным. При отсутствии в классификаторе искомой записи в общем случае можно сделать два альтернативных заключения: либо исходный обрабатываемый адрес записан с сильными искажениями, либо его действительно нет в классификаторе адресов. В первом случае необходимо делать множество гипотез об искажениях исходной информации, а во втором случае достаточно просто откинуть адрес.
Первый путь может привести к тому, что построенные гипотезы об искажениях дадут результат распознавания адреса, который на самом деле изначально не предполагался человеком. Такие распознавания мы называем неточными, а адреса, на которых выполняется распознавание - спорными. Вероятность откинуть спорный адрес и вероятность распознать его неточно зависят от возможностей модели, лежащей в основе распознавания. В нашем случае модель распознанного адреса представлена многомерным вектором признаков, каждый из которых количественно отражает то или иное свойство распознаваемого почтового адреса. К таким признакам, например, относится степень подобия распознанных полей адреса эталонным названиям, степень структурного соответствия исходной строки с адресом одному из типовых предопределенных шаблонов, количество слов в исходной строке записанных с ошибкой, общее количество слов, задействованных при распознавании и т.д. Чем больше в модели задействовано таких признаков, тем точнее можно отразить результат распознавания в численном виде, и, как следствие, точнее принять решение о том, нужно ли откидывать спорный адрес.
При разработке новой версии нашего сервиса, мы расширили набор признаков модели распознавания так, чтобы в процессе распознавания относительно спорных адресов как можно чаще принимались правильные решения об отбрасывании или исправлении. Кроме расширения модели распознавания, нам также потребовалось выполнить ее тренировку, которая заключается в определении поведения распознавателя на тех или иных спорных адресах.
Мы также основательно проработали вопрос быстродействия новой версии сервиса, так, чтобы расширение модели распознавания не сильно снизило время обработки, в некоторых случаях нам даже удалось увеличить быстродействие сервиса в полтора раза.
23.06.2011 |
Распознавание и проверка телефонных номеров |
На сервисе «Охотник за адресами» добавлена возможность распознавать и проверять на существование телефонные номера. При этом проверяются как стационарные номера телефонов, так и мобильные номера, принадлежащие операторам сотовой связи.
Для успешно распознанных стационарных номеров сервис выдает информацию о географической принадлежности номера с точностью до населенного пункта или города, а также информацию о наименовании оператора связи, за которым закреплен данный номер. Для мобильных номеров имеется возможность узнать наименование оператора сотовой связи, а также определить географическую принадлежность с точностью до региона, в котором зарегистрирован данный номер. За основу для этих целей взята открытая информация Россвязи.
Проверить телефонный номер можно в разделе «Анализ адреса» сервиса. Для этого достаточно ввести полный (с учетом кода зоны) или частично заполненный телефонный номер. Также здесь существует возможность совместной проверки телефонного номера и почтового адреса. Эта возможность весьма полезна в случае, когда полный номер не известен. В этом случае достаточно ввести известную часть номера и почтовый адрес, соответствующий ему. Порядок следования двух этих блоков информации не имеет значения, оба они будут успешно обработаны. В результате наш сервис выполнит распознавание адреса и телефонного номера, а также восстановит недостающую информацию как адреса, так и телефона.
|
Последние события
26.09.2024 Внедрили подсказки по паспортным данным
20.07.2024 Обработали в облаке более 2 млрд. данных
09.04.2024 Добавили на Ахантере подсказки по реквизитам банков
01.02.2024 Внедрили кадастровые номера квартир, домов и участков
09.01.2024 Добавили координаты адресов для новых регионов
11.07.2023 Внедрили гео-кодер для адресов Казахстана
Архив событий
07.08.2019 На ahunter.ru внедрили распознаватель городских районов и повысили точность и полноту обработки почтовых адресов.
16.05.2019 Улучшили распознавании пола по ФИО с помощью машинного обучения на ahunter.ru
Страницы:
« назад
4
5
6
вперед »
|