Страницы новостей: 1 2 3 4 вперед »
10.02.2020

Приняли участие в "Качестве данных 2020"

5 февраля в Москве прошла конференция «Качество данных 2020», посвящённая вопросам управления и оценки качества данных. Организатором выступило издательство «Открытые системы». Доклады охватили множество отраслей, имеющих дело с корпоративными, персональными, нормативно-справочными данными, а также данными промышленного производства.

На этой конференции мы представили доклад, в котором рассказали о методах искусственного интеллекта, которые мы используем внутри компании при очистке эталонных справочников и подготовке их к боевому применению в наших инструментах по стандартизации клиентских контактных данных.

Особенность подхода, который был нами изложен, заключается в том, что для обеспечения качественной работы Ахантера - нашего основного ИИ-продукта по стандартизации и исправлению клиентских данных - необходимы качественные справочные данные. Для их получения в свою очередь нам приходится разрабатывать отдельные внутренние ИИ-решения, которые остаются за кадром работы основного продукта, но без которых работа самого Ахантера оказывается невозможна.

Мы подробно рассказали про методы машинного обучения, с помощью которых из сырых и грязных данных, добываемых из открытых источников, мы формируем эталонные справочники. Разобрали этот подход на примере извлечения данных из Википедии, ЕГРЮЛ и ФИАС. Описали полный жизненный цикл наших ИИ-решений, начиная от выбора модели и разметки обучающей выборки, и заканчивая применением обученной модели к реальным данным.

Подробно рассмотрели задачу поиска дублей, а также задачу поиска аномальных записей в эталонных справочниках. В обоих случаях рассказали, как мы для этих целей используем машинное обучение, какие признаковые модели применяем и как осуществляем подготовку обучающих выборок.

Ознакомиться с программой конферении и затронутыми темами можно по следующей ссылке. Презентации докладов доступны здесь.

Страницы новостей: 1 2 3 4 вперед »

Последние события

10.02.2020 Рассказали на конференции Качество данных 2020 про использование ИИ в нашей повседневной работе.

07.08.2019 На ahunter.ru внедрили распознаватель городских районов и повысили точность и полноту обработки почтовых адресов.

16.05.2019 Улучшили распознавании пола по ФИО с помощью машинного обучения на ahunter.ru

Архив событий

19.12.2017 Обновили структуру классификатора адресов РФ.

21.09.2017 Внедрили машинное обучение в детекторе ФИО.

20.06.2017 Переделали геокодер и внедрили новую версию на ahunter.ru.

27.01.2017 Запустили в боевом режиме ahunter.ru версии 3.0.

30.11.2016 Запустили в режиме апробации репликацию данных между серверами Ахантера.

Страницы: 1 2 3 вперед »