Трек 3. Государственные репрессии

Задача 1. Сегментация/разметка судебных решений

Задача: Разработать сервис (нейросеть, бот, скрипт), который бы мог выделять из судебного решения следующую информацию и размечать массив решений.

  • категория правонарушения (митинг, высказывание, пост, плакат)
  • деятельность/профессия подсудимого (учитель, рабочий, журналист)
  • название социальной сети, в которой было выявлено правонарушение (телеграм, вконтакте, одноклассники)
  • был ли факт доноса.

Источники: Судебные решения по дискредитации по 20.3.3, в перспективе любые судебные решения по статьям 20.2, 20.2.2, 20.3.3 КОАП.

Зачем это нужно:

1. Анализ тенденций изменения работы правоохранительных органов, например вручную по ключевым словам ищут или уже используются автоматические инструменты поиска в соц.сетях, которые приведут к массовым вменениям статьи.

2. Отслеживание изменений форм протеста и как следствие своевременное реагирование: рассказы-предупреждения в карточках, разработки новых адвокатских стратегий.

3. Анализ социально демографической картины протестов.

4. Предоставление детализированных данных для международных институтов 

Конечный продукт:

Хотелось бы получить какой-то интерфейс, которым можно было бы пользоваться людям без специальных программистских навыков. В качестве докрутки до готового продукта можно подумать, чтоб мы могли сами ставить задачу, например найти в протоколах:

  • возраст, наличие инвалидности, другие социально-демографические характеристики подсудимого
  • были ли даны признательные показания
  • подразделения силовых органов, участвующие в ведении дела

и загружать массив для обучения, а сервис выдавал бы результат.

Корпус решений для разметки — это текстовые судебные решения, в первую очередь по статье 20.3.3 КОАП, но хотелось бы и по другим статьям тоже размечать (и мы имеем возможность выгрузить судебные решения по ним).

Финальный инструмент — скорее всего должен выглядеть как запускаемый скрипт, тк помимо уже выгруженных судебных решений, мы каждый месяц (или по запросу) получаем новые тексты.

И результат — это таблица состоящая из текста судебного решения, какой-то id этого текста и разметка. 

Задача 2. Автоматический поиск информации на сайтах судов по преследованию за антивоенную позицию по неочевидным статьям УК РФ

Задача: найти решения судов, в которых упоминаются ключевые слова (например, Украина и война), но не по «классическим» статьям: 207.3, 280.3, 280.4.

Источники: сайты судов.

Зачем это нужно

1. Дополнение статистики политически мотивированных уголовных дел.

2. Статистика и исследования по тенденциям репрессивного законодательства.

3. Предоставление информации для международных исследований и адвокации.

Конечный продукт:

Таблица судебных решений с информацией с сайта суда: подсудимый, номер дела, суд, город, регион, вынесенное решение, вмененная статья, тест судебного протокола.

Задача 3. Исследование цифровых доносов

Задача: написать веб-скрепер, собрать данные для изучения и/или изучить цифровые сервисы, принимающие доносы (например, Опер пишет или приём жалоб от школьников из Лиги Безопасного Интернета). При этом интерес представляет:

  • Какая госструктура или сторонняя организация занимается приёмом жалоб
  • Кто целевая аудитория сервиса, как и где сервис её находит (например, в соцсетях, через СМИ, спам-рассылку и тп)
  • Какие происходят интеракции между автором жалобы/доноса и принимающей стороной
  • Что известно об уже существующих кейсах жалоб/доносов, поданных через такие сервисы (заведены ли дела, по каким статьям, есть ли тексты “успешных” доносов и т.п.)

Источники. Предполагается работа с открытыми источниками (OSINT), например:

  • Поиск по публикациям в профильных СМИ
  • Скрепинг данных соцсетей (например, telegram и vk)
  • Поиск по судебным решениям

Зачем это нужно. С помощью решения этой задачи можно будет мониторить такие интересные вещи:

  • Как и за счет каких механизмов государство привлекает частных лиц (и организации) к реализации политических репрессий, в каких отношениях они находятся
  • Насколько масштабна и продуктивна эта квазигосударственная машина (в тч интересно, насколько государство сохраняет монополию на “правоприменение”)
  • Какие граждане находятся в группе риска попасть под репрессии в связи с доносами и в связи с какими статьями; есть ли какие-то механизмы защиты
  • Как развивается написание доносов как феномен, какие неизученные элементы приносит цифровизация (которой не было во времена СССР, доносы во время которого изучены)

Конечный продукт. Могут быть разные варианты:

  • Скрипт-скрепер, который собирает и обновляет таблицу (таблицы) с данными и метаданными сервисов – в идеале, чтобы мы могли его периодически дообучать и перезапускать, чтобы смотреть лонгитюды
  • Исследование или расследование работы различных ботов или их категорий, отвечающее на вопросы выше, например – с помощью собственных интеракций с сервисами, их организаторами и пользователями

Задача 4. Политические преследования мусульман в России

Задача: есть несколько разрозненных и разноформатных данных (новости ОВД-Инфо, список политзаключенных Мемориала и т.д.), которые так или иначе связаны с темой, кажется полезным их систематизировать и представить в удобном для исследователей, аналитиков и других пользователей виде (датасет, инфографика, аналитический текст и т.д.)

Источники:  Новости ОВД-Инфо (есть таблица со скаченными новостями, подходящими к теме по тэгам), список политзаключенных Мемориала

Зачем это нужно: в соответствии со списком политзаключенных Мемориала, мусульмане являются одной из наиболее преследуемых групп (даже во время полномасштабной войны и возросших репрессий. кажется, что изучение этого феномена позволит лучше понять как работает репрессивный аппарат, какие колониальные и расистские подходы при этом применяются, как связано ограничение свободы религии и ассоциаций с нарастающим авторитарным давлением. кроме того, тема кажется мало изученной и мало обсуждаемой. отчасти эта проблема может решиться с появлением более систематизированных данных (как минимум тех, что уже есть в доступе, но разрозненны и неудобны для изучения конкретной темы).

Конечный продукт:

Датасет, инфографика, аналитический доклад.

Задача 5. База профайлов российских судей

Цель проекта — изучить аффилированность российских судей с другими decision-maker’ами (чиновниками, влиятельными персонами) и собрать базу данных судебных решений, в особенности, по политическим делам. 

В дальнейшем база может стать полезным источником данных для расследовательских проектов, а также инструментом для адвокатов и правозащитников. В частности, c ее помощью можно зафиксировать систематические нарушения и донести их до международного сообщества для последующего включения в ограничительные списки.

Как выбрать челлендж

Эти задачи и идеи предложены одним из партнёров хакатона. Если вы хотите взять в качестве задачи на хакатон один из предложенных челленджей, укажите его название в заявке при регистрации или после регистрации в чате с организаторами. Вы можете выбрать челлендж в любое время до хакатона.

ПРИГЛАШАЕМ ДАТА-АНАЛИТИКОВ, ИССЛЕДОВАТЕЛЕЙ, ЖУРНАЛИСТОВ, ПРОГРАММИСТОВ, ДИЗАЙНЕРОВ

Включайтесь в работу команд или соберите свою под задачи хакатона