Происхождение и становление R&D направления

  • Большинство сотрудников нашей компании являются выпускниками Московского государственного технического университета имени Н.Э. Баумана (МГТУ им. Н.Э. Баумана): www.bmstu.ru.

    Это определяет методологию и принципы, используемые нами в ходе научно-исследовательской работы. При решении сложных задач мы используем системный подход, ищем точные и обоснованные решения.

  • Достижения и результаты нашего R&D направления мы публикуем в журналах и обсуждаем на научно-технических конференциях.

    Например, мы часто делаем доклады на конференции "Электронные библиотеки: Перспективные Методы и Технологии, Электронные коллекции", в трудах которой опубликованы многие результаты нашей работы: www.rcdl.ru

  • В рамках R&D мы решаем весьма разнообразные задачи, однако акцент мы делаем на проблемах, связанных с обработкой текстовой информации.

    Особую роль в этом направлении играет задача извлечения информации. Подробно об этой задаче можно прочитать здесь http://en.wikipedia.org/wiki/Information_extraction или здесь http://ru.wikipedia.org/wiki/Извлечение_информации.

    Большое влияние на наше понимание проблемы извлечения информации из неструктурированных текстов и подходов к ее решению оказали работы профессора Массачусетского университета Эндрю Маккалума (Andrew McCallum). Большинство его публикаций на эту тему доступно на его домашней странице: http://www.cs.umass.edu/~mccallum/

  • Мы глубоко убеждены, что решение многих задач должно выполняться с применением машинного обучения.

    Машинное обучение помогает формулировать правила поведения компьютерной системы на основе закономерностей, определяемых инженером не в явной форме, а на основе примеров. Необходимые критерии формулируются автоматическим в ходе анализа системой обучающих примеров. При разработке систем извлечения информации мы активно используем методы машинного обучени.

    Кроме общепринятых моделей и методов, применяемых на практике в рамках машинного обучения, на становление нашей методологии в этом направлении большое влияние оказали работы доктора Эдинбургского университета Чарльза Саттона (Charles Sutton) Большинство его публикаций на тему статистического машинного обучения для задачи извлечения информации из текстов доступно на его домашней странице здесь: http://homepages.inf.ed.ac.uk/csutton/

Последние события

27.01.2017 Запустили в боевом режиме ahunter.ru версии 3.0.

30.11.2016 Запустили в режиме апробации репликацию данных между серверами Ахантера.

Архив событий

29.11.2014 Разработали геокодер для адресов РФ. Внедрили геокодер на сервисе ahunter.ru.

11.08.2014 В рамках R&D направления разработали систему распознавания пола персоны по анализу текста ее биографии.

04.06.2014 Внедрили комплексное решение по стандартизации адресных данных ahunterES в связке с ahunterPro в ОАО Банк "Центр-инвест".

09.04.2014 Внедрили серверное решение по стандартизации клиентских данных ahunterES в ЗАО "Русский Стандарт Страхование".

17.03.2014 Расширили API у продуктов ahunter. Теперь можно обрабатывать пакеты комплексных контактных записей из нескольких адресов и телефонов.

18.02.2014 Выпустили версию 1.7 системы "Охотник за адресами". Сервис ahunter.ru также перевели на новую версию. Система стала работать быстрее в полтора раза.

15.01.2014 Завершили государственный проект по обогащению КЛАДР и ФИАС на основе данных, представленных в кадастре недвижимости.

Страницы: 1 2 3 вперед »