Задача 1. Сегментация/разметка судебных решений
Задача: Разработать сервис (нейросеть, бот, скрипт), который бы мог выделять из судебного решения следующую информацию и размечать массив решений.
- категория правонарушения (митинг, высказывание, пост, плакат)
- деятельность/профессия подсудимого (учитель, рабочий, журналист)
- название социальной сети, в которой было выявлено правонарушение (телеграм, вконтакте, одноклассники)
- был ли факт доноса.
Источники: Судебные решения по дискредитации по 20.3.3, в перспективе любые судебные решения по статьям 20.2, 20.2.2, 20.3.3 КОАП.
Зачем это нужно:
1. Анализ тенденций изменения работы правоохранительных органов, например вручную по ключевым словам ищут или уже используются автоматические инструменты поиска в соц.сетях, которые приведут к массовым вменениям статьи.
2. Отслеживание изменений форм протеста и как следствие своевременное реагирование: рассказы-предупреждения в карточках, разработки новых адвокатских стратегий.
3. Анализ социально демографической картины протестов.
4. Предоставление детализированных данных для международных институтов
Конечный продукт:
Хотелось бы получить какой-то интерфейс, которым можно было бы пользоваться людям без специальных программистских навыков. В качестве докрутки до готового продукта можно подумать, чтоб мы могли сами ставить задачу, например найти в протоколах:
- возраст, наличие инвалидности, другие социально-демографические характеристики подсудимого
- были ли даны признательные показания
- подразделения силовых органов, участвующие в ведении дела
и загружать массив для обучения, а сервис выдавал бы результат.
Корпус решений для разметки — это текстовые судебные решения, в первую очередь по статье 20.3.3 КОАП, но хотелось бы и по другим статьям тоже размечать (и мы имеем возможность выгрузить судебные решения по ним).
Финальный инструмент — скорее всего должен выглядеть как запускаемый скрипт, тк помимо уже выгруженных судебных решений, мы каждый месяц (или по запросу) получаем новые тексты.
И результат — это таблица состоящая из текста судебного решения, какой-то id этого текста и разметка.
Задача 2. Автоматический поиск информации на сайтах судов по преследованию за антивоенную позицию по неочевидным статьям УК РФ
Задача: найти решения судов, в которых упоминаются ключевые слова (например, Украина и война), но не по «классическим» статьям: 207.3, 280.3, 280.4.
Источники: сайты судов.
Зачем это нужно:
1. Дополнение статистики политически мотивированных уголовных дел.
2. Статистика и исследования по тенденциям репрессивного законодательства.
3. Предоставление информации для международных исследований и адвокации.
Конечный продукт:
Таблица судебных решений с информацией с сайта суда: подсудимый, номер дела, суд, город, регион, вынесенное решение, вмененная статья, тест судебного протокола.
Задача 3. Исследование цифровых доносов
Задача: написать веб-скрепер, собрать данные для изучения и/или изучить цифровые сервисы, принимающие доносы (например, Опер пишет или приём жалоб от школьников из Лиги Безопасного Интернета). При этом интерес представляет:
- Какая госструктура или сторонняя организация занимается приёмом жалоб
- Кто целевая аудитория сервиса, как и где сервис её находит (например, в соцсетях, через СМИ, спам-рассылку и тп)
- Какие происходят интеракции между автором жалобы/доноса и принимающей стороной
- Что известно об уже существующих кейсах жалоб/доносов, поданных через такие сервисы (заведены ли дела, по каким статьям, есть ли тексты “успешных” доносов и т.п.)
Источники. Предполагается работа с открытыми источниками (OSINT), например:
- Поиск по публикациям в профильных СМИ
- Скрепинг данных соцсетей (например, telegram и vk)
- Поиск по судебным решениям
Зачем это нужно. С помощью решения этой задачи можно будет мониторить такие интересные вещи:
- Как и за счет каких механизмов государство привлекает частных лиц (и организации) к реализации политических репрессий, в каких отношениях они находятся
- Насколько масштабна и продуктивна эта квазигосударственная машина (в тч интересно, насколько государство сохраняет монополию на “правоприменение”)
- Какие граждане находятся в группе риска попасть под репрессии в связи с доносами и в связи с какими статьями; есть ли какие-то механизмы защиты
- Как развивается написание доносов как феномен, какие неизученные элементы приносит цифровизация (которой не было во времена СССР, доносы во время которого изучены)
Конечный продукт. Могут быть разные варианты:
- Скрипт-скрепер, который собирает и обновляет таблицу (таблицы) с данными и метаданными сервисов – в идеале, чтобы мы могли его периодически дообучать и перезапускать, чтобы смотреть лонгитюды
- Исследование или расследование работы различных ботов или их категорий, отвечающее на вопросы выше, например – с помощью собственных интеракций с сервисами, их организаторами и пользователями
Задача 4. Политические преследования мусульман в России
Задача: есть несколько разрозненных и разноформатных данных (новости ОВД-Инфо, список политзаключенных Мемориала и т.д.), которые так или иначе связаны с темой, кажется полезным их систематизировать и представить в удобном для исследователей, аналитиков и других пользователей виде (датасет, инфографика, аналитический текст и т.д.)
Источники: Новости ОВД-Инфо (есть таблица со скаченными новостями, подходящими к теме по тэгам), список политзаключенных Мемориала.
Зачем это нужно: в соответствии со списком политзаключенных Мемориала, мусульмане являются одной из наиболее преследуемых групп (даже во время полномасштабной войны и возросших репрессий. кажется, что изучение этого феномена позволит лучше понять как работает репрессивный аппарат, какие колониальные и расистские подходы при этом применяются, как связано ограничение свободы религии и ассоциаций с нарастающим авторитарным давлением. кроме того, тема кажется мало изученной и мало обсуждаемой. отчасти эта проблема может решиться с появлением более систематизированных данных (как минимум тех, что уже есть в доступе, но разрозненны и неудобны для изучения конкретной темы).
Конечный продукт:
Датасет, инфографика, аналитический доклад.
Задача 5. База профайлов российских судей
Цель проекта — изучить аффилированность российских судей с другими decision-maker’ами (чиновниками, влиятельными персонами) и собрать базу данных судебных решений, в особенности, по политическим делам.
В дальнейшем база может стать полезным источником данных для расследовательских проектов, а также инструментом для адвокатов и правозащитников. В частности, c ее помощью можно зафиксировать систематические нарушения и донести их до международного сообщества для последующего включения в ограничительные списки.
Как выбрать челлендж
Эти задачи и идеи предложены одним из партнёров хакатона. Если вы хотите взять в качестве задачи на хакатон один из предложенных челленджей, укажите его название в заявке при регистрации или после регистрации в чате с организаторами. Вы можете выбрать челлендж в любое время до хакатона.