В мае 2026 года на конференции LREC в Пальма-де-Майорке были подведены итоги международного соревнования QIAS 2026, посвящённого оценке способности искусственного интеллекта решать задачи исламского наследственного права. Участие в нём приняли 16 команд из разных стран, а результаты показали, что даже самые современные языковые модели испытывают серьёзные трудности с этой областью.
Наследственное право в исламе — одна из самых сложных и детально разработанных областей шариата. Ещё в VII веке Коран установил чёткие правила распределения имущества умершего, закрепив доли за определёнными категориями родственников: супругами, детьми, родителями. Однако с течением времени эти правила обрастали дополнительными уровнями сложности: появились механизмы пропорционального уменьшения долей («awl) при нехватке имущества, возврат остатка (radd), а также сложные правила блокировки (hajb), когда одни наследники полностью исключают других из числа получателей. Для человека, не имеющего специального образования, разобраться в этом практически невозможно, а ошибка в расчётах может привести к многолетним судебным тяжбам и разрушению семейных отношений.
Именно эту задачу и поставили перед искусственным интеллектом организаторы соревнования QIAS 2026. В отличие от типичных тестов на знание фактов, здесь требовалось не просто дать правильный ответ, а провести полный, многоступенчатый расчёт «от и до» — от выявления наследников по описанию на естественном языке до назначения каждому из них точной доли. Даже небольшая ошибка на любом из этапов делала результат недействительным. Для проверки систем организаторы использовали бенчмарк MAWARITH (от арабского «маварис» — наследство), содержащий 12 500 реальных и учебных примеров наследственных дел на арабском языке, а оценивание проводилось по специально разработанной многоступенчатой метрике MIR-E, которая позволяла увидеть, на каком именно этапе модель ошибается. Это важно не только с академической, но и с практической точки зрения — умные системы в будущем могли бы помочь судьям, адвокатам и простым мусульманам проверять расчёты наследства, но пока до этого далеко.
Участники использовали совершенно разные подходы: одни полагались на сложные текстовые подсказки (промпты), другие подключали внешние базы знаний через механизм дополненного поиска (RAG), третьи дообучали модели на юридических текстах. Победителем стала команда CVPD, использовавшая гибридную систему с RAG и добившаяся результата 0.935 по метрике MIR-E. Второе место заняла команда Simplicity с двухэтапным нейро-символическим пайплайном (0.931), а третье — команда KMS с продвинутыми методами промптинга (0.916).
Однако главный вывод соревнования, пожалуй, не в том, кто победил, а в том, насколько сложной оказалась задача для всех участников. Даже лучшие модели ошибались на этапах, требующих точной юридической интерпретации — например, когда нужно было определить, является ли конкретный родственник наследником или его исключает более близкий родственник. Кроме того, выявился значительный разрыв между коммерческими моделями (Gemini, GPT) и открытыми (Qwen, LLaMA, Fanar): коммерческие системы показали гораздо более высокую стабильность при соблюдении правил и выполнении последовательных рассуждений. Тем не менее, есть и обнадёживающий результат: команда QU-NLP (Катарский университет) продемонстрировала, что даже небольшие открытые модели можно доработать до уровня, сопоставимого с коммерческими системами, путём многоэтапной тонкой настройки на специфических юридических данных.
Актуальность этого соревнования выходит далеко за пределы чисто технической задачи. Во-первых, в исламских странах наследственные дела составляют значительную часть судебной нагрузки, и любая технология, способная помочь в их решении, имеет огромное социальное значение. Во-вторых, это пример того, как искусственный интеллект может работать в областях, где сочетаются строгая логика (математические расчёты долей), правовые нормы и культурно-религиозные контексты. Наконец, это важный тест для самих языковых моделей: если они не справляются с такой структурированной задачей, значит ли это, что их «рассуждения» по-прежнему поверхностны и не достигают уровня, необходимого для принятия серьёзных решений в реальной жизни? Ответ на этот вопрос QIAS 2026, к сожалению, дать пока не смогло — но оно показало, куда нужно двигаться дальше.
Информационное агенство IslamNews.Ru
Войти с помощью: