9 апреля 2026 года в Высшей школе экономики прошла конференция «Вышка. Цифра. Право», связанная с вопросами цифровых технологий в юриспруденции, legaltech. Она получилась интересной, подбор спикеров - на высоком уровне! Список всех участников и темы их докладов можно найти по той же ссылке. Я же, в свою очередь, в этом посте поделюсь заметками, записанными по ходу докладов. Старался записывать дословно, поэтому местами текст - от первого лица (без цитат, т.к. почти весь он - цитаты). Записи распределял по разделам уже сам, поэтому каждый раздел ниже - это совокупность отрывков из разных докладов. Не привожу авторов цитат (за исключением последнего раздела), т.к. ряд цитат позволяет определить тематику доклада (и следовательно, автора), а по ряду других цитат не факт, что их авторы хотели бы прямо ассоциировать себя с ними. Как автор поста, здесь не даю каких-либо оценочных суждений относительно изложенных ниже комментариев или цитат. Естественно, изложенное ниже - это далеко не всё, что звучало и обсуждалось там, моя выборка субъективна, но всё и не пересказать.

Итак, поехали! Что же прозвучало на конференции:

Стартапы и legaltech в России

Карта российских legaltech-проектов - legaltechmap.ru (11 категорий). Вместе с Яндексом готовим к реализации доп. функционал - ИИ-ассистент для подбора legaltech-продукта.
Крупные вендоры на legaltech-рынке занимают сейчас доминирующее положение. У молодых команд активность очень высока, делают интересные решения.
Среди юридических команд взрывной рост питч-сессий. Среди юристов тотально побеждает вайбкодинг. Правило здорового тона для текущих юристов - кое-что накодить себе быстренько, для текущих решений. Их MVP уже может конкурировать с текущими решениями крупных игроков.
Делая свой продукт, мы забирали из [альтернативы] самое важное и ценное, и добавляли то, чего в нем не хватает. Надо не забывать, что популярные [на сегодня] мессенджеры - не первые.
Discovery - первая сущность продукта. Нужно подтвердить проблему и только потом создавать продукт. Как сейчас клиенты решают свою боль? Позволяют ли альтернативы её решать? Если да, придется бороться с альтернативами. Если клиенты до сих пор используют excel, есть шанс помочь им с решением. Когда будете питчить продукт, сможете убедить инвестора данными, собранными на этапе discovery (и сравнив с вашими результатами).
Типичные ошибки: (1) влюбиться в решение, не проверив проблему, (2) сразу строить настоящий продукт (а не итерациями: без MVP и наращиванием функционала), (3) считать стартап одной фичей, а не системой, (4) игнорировать скорость обучения команды.
Трезвой головой надо оценивать перспективу стартапа, несмотря на то, что в него влюбляемся мы. Принимать решения, двигать проект дальше или нет.
Найти хорошего IT-партнера сложно. Некоторые проводят порядка 30 встреч. См. про иск ivideon.

Сбор данных, парсинг

(Не)прозрачная лицензионная политика источников данных - допускается ли парсинг ресурса? Серая это зона или чёрная? Спор Thomson Reuters (для маленького стартапа такое убийственно).
Парсинг - это хорошо для MVP, но этот способ нестабилен. Для работы вдолгую нужно покупать данные. У клиентов возникают вопросы о законности этих данных (владелец данных может обратиться с иском, т.к. может быть нагрузка на сервер, что-то ещё).
Одна из проблем: историческое положение отдельных агрегаторов.
Есть проблема с достоверностью данных, когда покупаешь данные у посредника, т.к. они не отвечают за достоверность, прямо про это сообщают.
Порой проблема источников данных (информационных систем) - сопротивление тех, кто должен наполнять их данными (т.к. системами неудобно пользоваться).

ROSS и Westlaw, Давид и Голиаф

ROSS, Westlaw и борьба за рынок правовых баз данных.

Denis DorotenkoDenis Dorotenko

Кстати, про кейс Thomson Reuters я ранее писал здесь.

Госорганы, регулирование ИИ

Проблема - зачастую в отсутствии ресурсов в государственных органах на раскрытие информации. Позиция органа - нужно минимум 20-30 обращений про то, что надо, чтобы внутри выделили бюджет [на добавление функционала].
Государство начинает закрывать данные. В ЕГРЮЛ уже нет части данных.
Государство хочет брать деньги за доступ к данным.
Существует система межведомственного электронного взаимодействия (СМЭВ) - к ней уже подключаются компании, но доступ сильно ограничен (нужно доказать свой законный интерес), получить одобрение специальной правительственной комиссии, службы безопасности.
Проект закона о государственном регулировании ИИ: пока не знаем, что хотим, мечемся между национальным ИИ и прочим ИИ; это дадим, это не дадим. Похоже, мы получим европеизированную китайскую модель (т.е. защищаем тех, кто умеет данные производить, но данные принадлежат государству).

Данные судов, анализ судебной практики

Россия в плане доступа к данным судов - на лучших позициях по сравнению со странами Европы (пример - в Германии меньше 3% судебной практики в открытом доступе).
Что у нас сейчас: судебная практика есть, но использовать её нельзя. По 262-ФЗ судебная практика должна публиковаться. Но для ИИ она почти неприменима. ИИ - это как скорая помощь, но которая стоит в пробке, т.к. судебные данные не структурированы.
Вся информация судов в открытом доступе публикуется в разных форматах - но не тех, в которых нужны для оперативной обработки (в законе нет требований о публикации в машиночитаемом виде).
Клиентом kad.arbitr.ru изначально было общество. А клиентом ГАС Правосудие были именно суды (не юристы, не legaltech).
Судебные споры - хорошее направление для MVP, продукта: там проще всего оценить результат, ощутить экономическую эффективность.
Сейчас все пытаются с помощью нейросеток читать судебную практику (для предиктивной аналитики).

Технические аспекты

Прототипирование на сегодня кардинально поменялось. Полгода назад у меня был строгий негатив к нему (т.к. много надо потратить времени и сил, чтобы его исправить). Но сегодня мы прививаем культуру вайбкодинга команде разработки (наша оценка +30% эффективности у них). Сегодня идея воплощается в прототип буквально за часы. Выигрывает уже тот, кто умеет грамотно сформулировать идею, понимает, чего хочет (а собрать прототип - это дело техники).
Мы взялись за разработку мультиагентной системы симуляции судебных споров. Подключали API Гаранта, но она не подошла по качеству ответов, т.к. работала по ключевым словам. Брались за API Gemini, Chatgpt, но лучше обучить свою модель (в т.ч. из-за законодательства). Сделали свою модель на базе спарсенных документов.
Мы пошли дальше ИИ-ассистента: человек загружает материалы дела >> выбираете участников (судья, истец, ответчик, иные роли) >> начинается автоматическое заседание >> в конце получаете результаты. Результат - это стенограмма (что говорили друг другу ИИ-агенты независимо друг от друга). Клиенты (из страховых компаний) довольны результатом. Получаете стресс-тест своей позиции, чужой позиции, аргументы сторон.
Самая главная проблема - потеря контекста (даже у Claude), особенно в документах на 50+ страниц. Есть RAG retrieval, что позволяет не терять контекст. В RAG ищется документы по 10-15 страниц, у нас не чанкинг. Чанкинг у нас в обычном ИИ-консультанте. При чанкинге теряется информация.
Мы не отправляем данные в другие LLM, технически можем это подтвердить. Поэтому мы предлагаем им анонимизировать данные у нас, и они работают в своих личных кабинетах (у нас).
Мы концентрируем внимание на то, что можно измерить. Цель - создать младшего юриста, сильного аналитика. Первые результаты: обработка 1000 стр. - за 7 минут, точность 85-90%. Если ассистент не может дать ответ, то он сообщает об этом.
Проблемы в реализации: либо моделей нет, либо они дорогие (токены), либо это зарубежные (а нельзя отправлять из-за закона), либо нужна дорогая информация. Нужно найти workaround’ы этой истории. Сделать продукт - это не равно вайбкодингу.
Начали тестирование сначала на open source. Получили неплохую точность, но долго по времени. Размечено более 1000 различных документов. Предобработка 1000 страниц (небольшое арбитражное дело) занимало 101 минуту. Мы не могли сделать это на российских провайдерах услуг. На Azure и Amazon это можно сделать.
Разметкой данных занимались айтишники + юристы. Основной расход денег - на разметку. 10-20% разметки было вручную (не смогли с помощью технологий).
Как боремся с галлюцинациями: ни одна нода не делает свои собственные рассуждения об ответе. Делают рассуждения, что можно сделать (получить, найти) и суммаризируют, что надо сделать.

Информационная безопасность

Многие делают стартап, идут в рынок, подключают внешнюю API-шку, не думают про информационную безопасность.
Вайбкодинг - прекрасный инструмент, но это суперопасный инструмент. В неумелых руках может привести к катастрофе (с т. зр. ИБ). Это как новая отрасль с огромными рисками. Мы стараемся выделять отдельные песочницы, закрытые контуры.

Про деньги в legaltech

Деньги на разработку - свои, из основного бизнеса. Кто тестирует нашу нейросеть (клиенты) - крупный агропром России, адвокаты, юристы как b2b сегмент - это помогло нам с деньгами.
Сейчас тренд: микропродукты покупаются в т.ч. крупными корпорациями (они просты к внедрению, можно купить сразу команду, которая будет развивать внутри).
Когда мы проводим custdev с клиентом, то глава юрдепартамента делится планами на год (что болит, с чем тяжело). За какой результат готовы платить клиенты? Тяжело на стадии входа в продукт понять, готов ли он платить здесь или сейчас.

Про фейлы

Провал - это часть процесса, не катастрофа. Это проработка гипотез. Провалиться за неделю - это нормально.
Мы пытались сделать проект в интерактивном режиме через анкетирование, попадет ли сделка пользователя под санкции (и что надо учесть). У нас большая база по контрсанкционному регулированию. Пробовали алгоритмами, ИИ, сделали прототип, но по факту продукт оказался никому не нужен (очень невысокий спрос). Поэтому продукт закрыли.
Основные причины отказа (в сотрудничестве, инвестициях) - неуверенность в продукте, отсутствует аналитика, отсутствие у команды доли в стартапе. Всего 1 % инвесторов дошли до сделок в компаниях.

Про реализацию идей

Сергей Полянин: призываю вас всех воплощать ваши идеи в жизнь.
Алексей Юхнин (завершая меоприятие): надеюсь, сегодняшние стартапы станут бигтехом, а карта legaltech России наполнятся 200-300 новых продуктов в следующем году. Спасибо всем!

Действительно, организаторам и участникам спасибо!
Ждём новостей, событий, прецедентов.