28.10.2019
NLP в юридической отрасли
Автоматизация юридической деятельности, или LegalTech, стала одним из первых применений NLP еще в ХХ веке.
Технологии в сфере права, или легалтех (от англ. LegalTech; также можно встретить термин LawTech) — сравнительно новое для России направление. Оно объединяет методы автоматизации различных юридическо-правовых задач: составления типовых договоров, правового анализа дел на основании сложившейся судебной практики, персонализированного консультирования.
Юридическая практика в целом построена на анализе текста для контрактов, патентов или счетов, поэтому, неудивительно, что ключевую роль в LegalTech играет NLP. Университет Альберты в Канаде уже шесть лет проводит соревнование по извлечению информации из юридических текстов под названием COLIEE (Competition on Legal Information Extraction/Entailment); одна из прорывных статей по итогам последнего соревнования посвящена использованию в этой задаче BERT и BM25. В 2019 г. при конференции ICAIL прошел третий воркшоп по анализу семантики в праве, ASAIL (Automated Semantic Analysis of Information in Legal Text), а также первый воркшоп по Natural Legal Language Processing (NLLP) при конференции NAACL.

История LegalTech началась в США с появлением компании LexisNexis в 1977 г., однако серьезное развитие этой индустрии пришлось на 2000-е гг., когда документацию начали переводить в цифровой формат, а электронная почта стала основным видом коммуникации в большинстве компаний. Значительным толчком к развитию LegalTech послужил кризис 2008 г., в результате которого резко выросла нагрузка на юридические фирмы и в то же время появилась потребность снизить расходы на обработку документов.

Текущий объем рынка LegalTech оценивается в $450 млрд в США и в $2 млрд в России; инвестиции в эту отрасль стабильно увеличиваются из года в год. Стоит отметить, что в отличие от EdTech и FinTech, индустрия LegalTech прежде всего ориентирована на национальные рынки из-за специфики правовых систем в разных государствах. Как следствие, LegalTech опережает «соседние» отрасли по количеству компаний. В 2016 г. канадский медиахолдинг «Thomson Reuters» составил карту LegalTech-стартапов на основе базы данных Discover Legal Technology Стэнфордского университета. С тех пор такой формат набрал популярность, и стали появляться аналогичные региональные карты; многие из них собраны на сайте Legalpioneer, посвященном инновациям в правовой сфере. Карты российского рынка правовых технологий составляли, например, Центр юридических технологий Фонда «Сколково» и PwC. Помимо многочисленных LegalTech-стартапов, существуют инструменты и библиотеки для работы с юридическими документами с открытым исходным кодом; краткий список можно найти, например, здесь.


Профессор австралийского Университета Маккуори Роберт Дейл выделяет пять основных применений NLP в LegalTech.

  1. Правовые исследования (legal research): поиск информации, релевантной для вынесения решения по какому-либо правовому вопросу.
  2. Электронное расследование (electronic discovery, e-discovery): определение релевантности документов для дела.
  3. Экспертиза договоров (contract review): автоматическая проверка и оценка трудовых контрактов, NDA, договоров купли-продажи и т.д.
  4. Автоматизация подготовки документации (document automation): составление и автозаполнение типовых юридических документов.
  5. Правовая помощь (legal advice): персонализированное консультирование по юридическим вопросам.
Создание чат-ботов и виртуальных ассистентов в правовой сфере не отличается от аналогичной задачи в сфере финансов, о которой мы уже писали, поэтому рассмотрим подробно только первые четыре пункта из этого списка.
Правовые исследования

Вынесение решения по любому правовому вопросу, например, предсказание исхода судебного процесса или экспертная оценка договора, требует предварительного исследования соответствующих положений закона, судебных решений и прецедентов из юридической практики. Вышеупомянутая компания LexisNexis начала с создания полнотекстового поиска по локальным законам двух штатов США, а сейчас имеет ~30Тб данных. Другие крупнейшие игроки на мировом рынке правовых баз данных — Westlaw Edge, Wolters Kluwer и Bloomberg Law.

Казалось бы, эта ниша давно занята, однако продолжают появляться новые стартапы, фокусирующиеся на правовом поиске. Так, в 2013 г. были основаны CaseText и CaseMine, которые позволяют загружать в качестве поискового запроса целые отрывки текста и осуществляют т.н. документо-ориентированный поиск, извлекая из запроса широкий контекст. Компании Ross Intelligence и vLex делают упор на другую популярную технологию и предоставляют клиентам поисковую систему, понимающую запросы на естественном языке.
Электронное расследование

Электронное расследование в юриспруденции — это сбор и анализ цифровой информации, релевантной для конкретного судебного процесса. Современным юристам часто приходится иметь дело с тысячами файлов, и главная задача здесь — понять, что из этого относится к делу, а что — нет. Такой анализ практически невозможно провести вручную, поэтому необходимо прибегать к технологиям выделения ключевых слов, извлечения фактов и суммаризации. Такую категоризацию документов в юридической практике принято называть «автоматизированным анализом» (technology-assisted review, TAR) или — если речь об использовании ML-алгоритмов классификации — предиктивным кодированием (predictive coding).

Самый распространенный подход к решению данной задачи — использование небольшого набора размеченных документов для дообучения классификатора; его до сих пор применяют, например, компании Everlaw и Relativity. Однако, крупнейшие игроки на рынке электронного расследования, Exterro и DISCO, позволяют своим клиентам обойтись без предразмеченных данных благодаря технологиям глубокого обучения. Интересное решение предлагает компания SDL, известная своими переводческими продуктами: Multilingual eDiscovery Solution расширяет область поиска за счет автоматического перевода документов на иностранных языках, которые также могут быть важны для дела.
Экспертиза договоров

Одна из распространенных задач в юридической практике — проверка и оценка договоров, когда специалист помогает клиенту убедиться в адекватности документа или добиться лучших условий. Если в случае с частными клиентами юристы имеют дело с относительно короткими и простыми договорами аренды или NDA, то когда дело доходит до правовой поддержки бизнеса, контракты часто исчисляются сотнями страниц.

Автоматизированная экспертиза обычно заключается в разбиении документа на разделы и сверке этих разделов с некоторыми стандартами. Например, в любом трудовом договоре обязательно должны быть указаны права и обязанности сторон, размер оплаты труда и условия расторжения договора, а также контактные данные сторон. Как и в случае с двумя предыдущими задачами, если первые подходы основывались на извлечении ключевых слов и различных эвристиках, то в современных решениях используются технологии машинного обучения.

Тройку лидеров в автоматическом анализе договоров составляют Kira Systems, Seal Software и LawGeex, но с ними отлично сосуществуют небольшие стартапы, специализирующиеся на конкретных типах документов. Например, Leverton работает с документацией по недвижимости на 20 языках, а стартап Luminance в первую очередь ориентирован на бизнес-процессы слияния и поглощения (M&A, mergers and acquisitions). Многие компании, занимающиеся анализом текста в целом, разрабатывают специальные решения для правовой сферы — например, ABBYY Text Analytics for Contracts, Ayfie Contract Analysis или OpenText Perceptiv.
Автоматизация подготовки документов

Задача автоматической подготовки типовых документов обычно состоит из двух этапов:

  1. получение необходимых данных от пользователя (либо через заполнение электронных форм, либо через диалог с чат-ботом);

  2. заполнение слотов в шаблоне нужного документа (например, NDA).

Самый известный продукт в этой категории — Contract Express от «Thomson Reuters», помогающий уменьшить количество рутинной работы в юридических фирмах. Некоторые компании, наоборот, ориентируются на индивидуальных пользователей — например, Rocket Lawyer и Neota Logic.
LegalTech в России

Несмотря на то, что объем российского рынка правовых технологий примерно в 225 раз меньше, чем в США, и потенциал его монетизации, по мнению LegalTech-экспертов, все еще достаточно низок, в России появляются интересные стартапы.

Например, вдохновленная американским опытом Platforma открывает для российских клиентов совершенно новую область инвестирования в судебные процессы. Система проводит правовую экспертизу иска, анализирует материалы дела и помогает истцам найти средства на оплату адвоката и других судебных издержек, а инвесторам — получить процент прибыли в случае, если истец выиграет дело.

Другой пример успешного российского LegalTech-стартапа — работающий с 2013 г. сервис «Онлайн Патент», который полностью автоматизирует все основные задачи, связанные с регистрацией патентов и товарных знаков.

Но основоположником и самым крупным представителем LegalTech в России, пожалуй, можно назвать Pravo Tech. Эта «юридическая экосистема» включает в себя «Картотеку арбитражных дел», сервис «Мой арбитр», а также две линейки продуктов для упрощения работы юридических фирм:

  1. Casebook, Caselook и Case.pro (правовые исследования);

  2. Doc.one, File.one и Form.one (автоматизация подготовки документов и правовая помощь).

Признаком развития сферы правовых технологий в России можно считать и то, что по этой теме проводятся регулярные конференции — например, Skolkovo LegalTech и Moscow Legal Tech. Кроме того, объединение Moscow Legal Hackers в 2017 г. организовало первый в России LegalTech-хакатон, а в 2018 г. команда Legal Geek, крупнейшего LegalTech-сообщества в мире, провела конференцию в Москве.

Оксана Дереза