Страницы новостей: 1 2 3 4 вперед »
10.02.2020

Приняли участие в "Качестве данных 2020"

5 февраля в Москве прошла конференция «Качество данных 2020», посвящённая вопросам управления и оценки качества данных. Организатором выступило издательство «Открытые системы». Доклады охватили множество отраслей, имеющих дело с корпоративными, персональными, нормативно-справочными данными, а также данными промышленного производства.

На этой конференции мы представили доклад, в котором рассказали о методах искусственного интеллекта, которые мы используем внутри компании при очистке эталонных справочников и подготовке их к боевому применению в наших инструментах по стандартизации клиентских контактных данных.

Особенность подхода, который был нами изложен, заключается в том, что для обеспечения качественной работы Ахантера - нашего основного ИИ-продукта по стандартизации и исправлению клиентских данных - необходимы качественные справочные данные. Для их получения в свою очередь нам приходится разрабатывать отдельные внутренние ИИ-решения, которые остаются за кадром работы основного продукта, но без которых работа самого Ахантера оказывается невозможна.

Мы подробно рассказали про методы машинного обучения, с помощью которых из сырых и грязных данных, добываемых из открытых источников, мы формируем эталонные справочники. Разобрали этот подход на примере извлечения данных из Википедии, ЕГРЮЛ и ФИАС. Описали полный жизненный цикл наших ИИ-решений, начиная от выбора модели и разметки обучающей выборки, и заканчивая применением обученной модели к реальным данным.

Подробно рассмотрели задачу поиска дублей, а также задачу поиска аномальных записей в эталонных справочниках. В обоих случаях рассказали, как мы для этих целей используем машинное обучение, какие признаковые модели применяем и как осуществляем подготовку обучающих выборок.

Ознакомиться с программой конферении и затронутыми темами можно по следующей ссылке. Презентации докладов доступны здесь.

Страницы новостей: 1 2 3 4 вперед »

Последние события

10.02.2020 Рассказали на конференции Качество данных 2020 про использование ИИ в нашей повседневной работе.

07.08.2019 На ahunter.ru внедрили распознаватель городских районов и повысили точность и полноту обработки почтовых адресов.

16.05.2019 Улучшили распознавании пола по ФИО с помощью машинного обучения на ahunter.ru

Архив событий

25.07.2016 Внедрили поддержку кодов ОКАТО, ОКТМО и ФИАС на ahunter.ru.

15.06.2016 Обогатили базу GPS-координат и телефонных номеров.

30.05.2016 Разработали решение DebtorCleanse по стандартизации и унификации контактных данных должников.

11.03.2016 Закончили разрабатывать Lingalign - решение для перевода и интернационализации проектов и веб-сайтов.

10.02.2016 Открыли регистрацию пользователей на сервисе ahunter.ru.

20.01.2016 Добавили возможности транслитерации и перевода адресов в ahunter.ru.

Страницы: 1 2 3 вперед »