Готовим промышленную модель для голосового ассистента вместе с Huawei
Разработка моделей машинного обучения для голосовых ассистентов — дело реально сложное. Нужно учесть много всякого: и детально сформулировать требования (чтобы не пытаться собрать звездолёт, который никогда не взлетит), и доставать откуда-то большие объёмы качественных репрезентативных данных, ну и, естественно, обучать на этих данных сетки, которые должны работать не только круто, но и быстро. Вместе с моей коллегой из московского Huawei Noah's Ark Ириной Пионтковской мы сделали доклад на OpenTalks.ai, в котором рассказали про наш совместный проект по этой теме. Про успехи слушать интересно, но куда интереснее (и приятнее!) слушать про то, как кто-то другой наступает на грабли. Несмотря на то, что всё в итоге получилось хорошо, граблями по лбу мы тоже получили достаточное число раз, чтобы этим опытом захотелось поделиться:)
Разумеется до и после нашего доклада мы с коллегами послушали другие выступления, посвящённые NLP (это автоматическая обработка текстов, если кто не в курсе). Обзорные рассказы крутых спикеров были, конечно, немного скучноваты (тут нет претензий, это вполне естественно, конференция всё-таки больше не научная, а бизнесовая, специалисту сложно услышать тут что-то принципиально новое). Прикладные кейсы, как и всегда на таких мероприятиях, лично у меня вызывают смешанные чувства. С одной стороны, круто, что бизнес активно интересуется технологиями анализа текстов и пытается с их помощью автоматизировать свои процессы. А с другой — ну уж очень много хайпа и рассказов про "искуственный интеллект", за которым почти наверняка стоит простая сетка или вообще линейный классификатор (в отдельных случаях себя прекрасно показывает, как я его называю, Regex-Based-AI:). С другой стороны, больше хайпа — больше внимания, больше внимания — больше рынок, больше рынок — больше новых исследований и классных инструментов. Так что может оно и к лучшему.

В общем, про эту тему сказано достаточно, пора идти делать новые проекты, истории которых я и мои коллеги с удовольствием расскажут вам на других (уже не столь далёких:) конференциях.


Мурат Апишев.