Перейти к:
Большие данные и персональные данные: правовая природа и вопросы регулирования
https://doi.org/10.38044/2686-9136-2024-5-2-40-52
Аннотация
В условиях активного развития цифровых технологий правовое регулирование больших данных (Big Data) и проблемы признания их в качестве объекта гражданского оборота приобретают как теоретическую, так и практическую актуальность. Особую значимость приобретает соотношение больших данных с персональными данными, что порождает необходимость балансирования частных и публичных интересов. Целью данного исследования является проведение комплексного анализа правовой природы больших данных, их соотношения с персональными данными, а также выявление путей совершенствования правовой базы в данной сфере. Исследование направлено на определение возможных подходов к установлению правового режима больших данных, учет особенностей оборота персональных данных как составляющей Big Data и разработку механизмов защиты прав граждан. С опорой на сравнительно-правовой метод авторы уделили особое внимание изучению отечественного и зарубежного законодательства, научных позиций по вопросам правового регулирования больших данных и персональных данных. В результате проведенного исследования установлено, что большие данные имеют неоднородную структуру и включают не только информацию, но и технические устройства, программное обеспечение, обеспечивающие сбор, обработку и анализ данных. Результаты обработки больших данных представляют собой имущественный интерес для субъектов гражданского оборота и могут быть предметом гражданско-правовых договоров. Авторы полагают, что в настоящее время существует конфликт между развитием технологий больших данных и действующим законодательством о персональных данных, что требует создания нового правового механизма для их регулирования. Для успешного внедрения технологий больших данных необходимо обеспечить баланс между защитой персональных данных и возможностями их использования для аналитических целей. В статье подчеркивается необходимость создания нового правового механизма для регулирования больших данных с учетом их специфики и обеспечения баланса между защитой персональных данных и потребностями бизнеса в использовании таких данных для аналитических целей.
Ключевые слова
Активное развитие цифровой среды предоставляет человеку возможность использовать огромные массивы информации из различных источников. Одним из атрибутов цифровой трансформации стали сквозные технологии, среди которых вызывает отдельный интерес такой сложный объект, как Big Data — большие данные. Исходя из названия этого явления, предполагается, что речь идет об очень больших объемах информации, которая не может обрабатываться традиционными способами и храниться в обычных базах данных.
Наблюдается усиление внимания к анализу больших данных со стороны участников гражданского оборота с целью прогнозирования спроса и предложения, выбора варианта поведения и сохранения конкурентоспособного преимущества. В частности, путем извлечения необходимых решений из проанализированных массивов данных они корректируют ожидания и строят планы. Анализ больших данных позволяет получить ответ о привлекательности и качестве продукции, запросах потребителей, нарушении прав на результаты интеллектуальной деятельности и др.
Участники гражданского оборота заинтересованы в анализе больших данных и понимают их имущественную ценность. В связи с этим возникает вопрос, в чем же сущность Big Data и каков их правовой режим.
Как известно, из-за быстрого темпа технологического прогресса законодателям всё сложнее следить за изменениями в общественных отношениях и реагировать на них вовремя.
В законодательных актах отсутствует стандартное определение категории Big Data, или «большие данные», но понятие обработки таких данных раскрывается в Стратегии развития информационного общества в Российской Федерации на 2017–2030 годы, утвержденной Указом Президента Российской Федерации от 9 мая 2017 г. № 203. Согласно данному документу обработка больших объемов данных представляет собой совокупность подходов, инструментов и методов автоматической обработки структурированной и неструктурированной информации, поступающей из большого количества различных, в том числе разрозненных или слабосвязанных, источников информации, в объемах, которые невозможно обработать вручную за разумное время.
Тем не менее толкование понятия больших данных было дано в приказе Росстата от 31 июля 2024 г. № 332: структурированные и неструктурированные массивы информации, которые характеризуются значительным объемом и высокой скоростью обновления (в том числе в режиме реального времени) данных, что требует специальных инструментов и методов работы с ними (например, машинного обучения, data и text mining и т.п.)1.
В Модельном законе о цифровом здравоохранении, который принят 14 апреля 2023 г. в г. Санкт-Петербурге, раскрывается понятие больших данных в сфере медицины. Так, под большими (медицинскими) данными понимаются наборы (медицинских) данных, которые классифицируются в первую очередь по характеристикам объема, разнообразия, скорости и (или) изменчивости и при этом для эффективного хранения, анализа, обработки либо иного управления требуют применения специальной расширенной (масштабируемой) информационной технологии в здравоохранении или информационно-коммуникационной технологии (макротехнологии)2.
Таким образом, все имеющиеся разрозненные определения сущности больших данных сходятся в наличии у этих данных нескольких параметров, так называемых 4V: большой объем (volume); разнообразие (variety); высокая скорость изменения (velocity); точность (veracity) (VCIOM, 2015, p. 156). Для осуществления обработки больших данных создаются особые распределенные системы хранения данных, которые позволяют использовать внешнее файловое пространство системы хранения для обработки данных на устройствах, входящих в вычислительный кластер. Большие данные активно используются предпринимателями для анализа покупательской способности, прогнозирования и аудиторской деятельности. В настоящее время активное внимание таким данным уделяет и государство.
Следовательно, Big Data представляют собой данные, как структурированные, так и неструктурированные, поступающие из множества разнообразных источников. По мнению М. А. Рожковой, большие данные включают все возможные виды данных: Big Data — это непрерывно поступающий из разных источников поток огромных объемов разнообразной информации (различных сведений и данных), которые объединяются с уже накопленным колоссальным массивом информации (Rozhkova, 2020, p. 46).
Соглашаясь с тем, что большие данные — это все-таки информация, которая находится в структурированном или неструктурированном виде, необходимо определить в этом потоке данные, являющиеся интересными для субъектов гражданских правоотношений.
Итак, неструктурированные данные, являясь условным понятием, включают в себя необработанные массивы информации общедоступного характера, не отвечающие требованиям конкретности и определенности, которые не могут быть обработаны стандартными базами данных или в системе управления базами данных. Для гражданского оборота интерес представляют структурированные данные, которые обработаны, конкретны, обособлены и представляют имущественный интерес.
Соответственно, составляющие виды информации, формирующие большие данные, могут иметь коммерческую ценность, а могут не обладать таким признаком. В свою очередь, создаваться большие данные могут субъектами гражданского права как в рамках трудовой деятельности (например, базы данных о сотрудниках), так и в личных целях (например, информация из аккаунтов в социальных сетях) или техническими устройствами (например, данные геолокации, данные счетчиков, сенсоров). Как указывали М. А. Рожкова и В. Н. Глонина, технические источники (интернет вещей, промышленный интернет, искусственный интеллект и машинное обучение) создают 90% информации, составляющей большие данные, а социальные источники — лишь 10% (Rozhkova & Glonina, 2020, p. 276).
Разнообразие составляющей Big Data информации не позволяет говорить о едином правовом режиме данного цифрового актива. На это обстоятельство указывалось в специальной литературе. Так, М. А. Рожкова считает невыполнимой задачей разработку специального правового режима Big Data, указывая на наличие градации в представленных в его составе данных (Rozhkova, 2020, p. 47). В силу неоднородности сущности больших данных не сформировалось однозначной позиции и о их правовом режиме.
Тем не менее в науке предложены следующие варианты определения правовой природы и правового режима регулирования больших данных.
1. Одни ученые предлагают рассматривать правовую природу больших данных через призму результатов интеллектуальной деятельности. Так, А. П. Сергеев и Т. А. Терещенко, сравнивая имеющиеся в гражданском законодательстве результаты интеллектуальной деятельности и приравненные к ним объекты, приходят к выводу, что большие данные не являются традиционным объектом интеллектуальной собственности (Sergeev & Tereshchenko, 2018, p. 121). По мнению И. З. Аюшеевой, сбалансированной является позиция, согласно которой большие данные будут признаны в качестве самостоятельно вида сложных объектов интеллектуальных прав (Ayusheyeva, 2023, p. 130). Безусловно, среди большого массива информации могут находиться и объекты, которые являются результатами творческой деятельности, но распространять на весь объем такой информации режим результатов интеллектуальной деятельности неправильно, поскольку природа данных, составляющих Big Data, неоднородна. Вместе с тем сбор, анализ и обработка Big Data могут осуществляться с помощью средств и методов, которые являются результатами интеллектуальной деятельности.
2. Другие специалисты, отмечая неоднородность структуры больших данных, предлагают рассматривать их как комплекс. Так, Л. Ю. Василевская считает, что Big Data являются единым неделимым объектом, идеальным по своей природе, существующим в цифровой форме, в структуре которого выделяются такие элементы, как технологии искусственного интеллекта, программы для ЭВМ (объекты авторского права), программное обеспечение и алгоритмы (ноу-хау), технические решения (изобретения как объекты патентного права), цифровая структурированная информация и др. (Vasilevskaya, 2024, p. 13). При этом она оставляет перечень структурных элементов открытым. А. М. Лаптева, относя большие данные к цифровым активам, склоняется к применению к данному явлению также конструкции имущественного комплекса, который может состоять из 1) информации из «сырых данных» (необработанных данных) и результатов обработки (которые могут быть в том числе в овеществленной форме); 2) имущественных прав (например, исключительных прав на результаты интеллектуальной деятельности, программы для электронных вычислительных машин (программы для ЭВМ), базы данных) (Lapteva, 2019, p. 100–101). Безусловно, такая позиция близка к правовой природе Big Data.
3. Третья позиция сводится к пониманию больших данных в качестве информационной услуги по сбору, обработке, аналитике и визуализации больших массивов данных с целью получения необходимой информации и знаний. Множество компаний в сфере информационных технологий и консалтинга предлагают услуги по сбору, анализу и обработке данных, их очистке и структурированию, применению алгоритмов машинного обучения и анализа, интерпретации результатов и предоставлению рекомендаций3. В данном случае не сами Big Data являются предметом договора, а результат их обработки, т.е. очищенные, структурированные данные, полученные при помощи интеллектуальных способностей специалистов, воздействующих на большие массивы информационных потоков, интересны для участников гражданского оборота.
Анализ представленных позиций показывает, что большие данные нельзя рассматривать как единый объект правового регулирования. Это сложное явление, включающее различные виды информации, каждый из которых может иметь свой правовой режим.
Текущая дискуссия о правовой природе больших данных не привела к формированию единой правовой позиции. Это связано с несколькими факторами: комплексной структурой больших данных, широкой интерпретацией их сущности, которая включает не только информационную составляющую, но и техническую инфраструктуру — оборудование и программные решения, необходимые для обработки и анализа масштабных информационных массивов.
При анализе правового регулирования больших данных и персональных данных необходимо четко разграничивать эти категории. Если правовой режим персональных данных определен законодательством и имеет ясную структуру регулирования, то большие данные представляют собой более широкое явление, включающее различные виды информации с разным правовым режимом. При этом персональные данные могут быть частью больших данных, но не наоборот. Такое разграничение важно для правильного применения соответствующих правовых норм и механизмов защиты прав субъектов.
При рассмотрении проблемы больших данных следует учитывать два момента: во-первых, большие данные — это информация, которая получена для анализа и обработки или получена в результате анализа и обработки с помощью технических устройств и программного обеспечения; во-вторых, это технологии обработки больших данных. Именно «невозможность существования Big Data без своего материального носителя — компьютерного устройства с соответствующим программным обеспечением (совокупностью определенных программ) и искусственным интеллектом (новым инновационным продуктом интеллектуальной деятельности)» (Vasilevskaya, 2024, p. 13) позволила обозначать термином «большие данные» не только объект — информацию, но и методы и способы воздействия на объект. На данный момент сложно говорить о правовом режиме больших данных, поскольку большие массивы разнородной информации не являются обособленными и однородными; за исключением отдельных составляющих, программные инструменты, используемые для обработки и анализа информации, являются результатами интеллектуальной деятельности. На данный момент нет необходимости определять правовой инструментарий, который позволит достичь правовых целей регулирования и социально значимого результата всего комплекса больших данных, соответственно, неактуален вопрос о защите прав на такой многоаспектный объект. В свою очередь, представляет интерес установление правового режима с учетом его специфики для каждого отдельного элемента, составляющего большие данные.
Другой момент, на который стоит обратить внимание, — то, что результат сбора, анализа и обработки больших данных представляет имущественный интерес для субъектов гражданского оборота и может быть предметом гражданско-правовых договоров, в связи с чем в науке аргументируется необходимость конкретно-определенной регламентации договорных условий и ограничений деятельности по сбору, обработке, использованию данных (Antipova, 2021, p. 157).
Естественно, использование технологии больших данных не должно нарушать имеющиеся режимы по защите прав субъектов правоотношений, и в фокусе правового регулирования должно быть обеспечение баланса интересов участников правоотношений.
Актуальной проблемой является достаточная и необходимая модель регулирования отношений, связанных с большими данными, которые могут содержать в себе и персональные данные граждан. В силу того, что одной из составляющих больших данных являются персональные данные физических лиц, для которых законодательство установило режим ограниченного доступа, состав Big Data разнороден, соответственно, включает в себя объекты с различным режимом правового регулирования. Но наиболее урегулированной составляющей больших данных являются именно персональные данные, к обработке которых законодательство предъявляет особые требования.
В современной российской правовой системе «персональные данные» представляют собой сложную и многогранную правовую категорию, имеющую принципиальное значение для защиты прав и свобод граждан. Правовая природа персональных данных определяется комплексом нормативно-правовых актов, среди которых ключевую роль играет Федеральный закон «О персональных данных»4.
Юридическая сущность персональных данных заключается в их особом статусе как информации, напрямую связанной с конкретным физическим лицом и требующей специального правового режима обработки и защиты. Принципиальными характеристиками персональных данных являются:
1) индивидуализация субъекта, возможность прямой или косвенной идентификации личности;
2) строго целевой характер сбора и обработки информации;
3) необходимость получения согласия субъекта на обработку персональных данных.
Правовой режим персональных данных предусматривает жесткие требования к их сбору, хранению, передаче и уничтожению. Операторы персональных данных несут полную юридическую ответственность за нарушение установленного порядка, включая административную и уголовную ответственность.
Важным аспектом правовой природы персональных данных является их деление на общедоступные и конфиденциальные, что определяет различные режимы правовой защиты. Особо чувствительные категории персональных данных, такие как биометрические или данные о состоянии здоровья, имеют максимально строгий режим правовой охраны. Так, согласно п. 3 ст. 3 Федерального закона «О персональных данных» под обработкой персональных данных понимается любое действие или совокупность таких действий, которые совершаются как с использованием средств автоматизации, так и без их использования, включая сбор, запись, систематизацию, хранение, уточнение (обновление, изменение), извлечение, использование, передачу (распространение, предоставление, доступ), обезличивание, блокирование, удаление, уничтожение персональных данных. Исходя из этого определения можно сделать вывод о том, что любое действие с персональными данными будет являться их обработкой.
Каким образом законодательство Российской Федерации регулирует оборот персональных данных в контексте использования технологий больших данных, которые позволяют обрабатывать и анализировать информацию не только о производственных процессах, но и о физических лицах (субъектах персональных данных)?
При анализе условий обработки персональных данных следует уделить особое внимание принципам законности, ограничения цели обработки и минимизации обрабатываемых данных в свете использования технологий больших данных. Данные принципы выбраны исходя из следующих оснований: при обработке особых категорий персональных данных возникает вопрос законности обработки таких данных, соответствия целей сбора таких данных целям обработки, минимизации персональных данных, в том числе возможности их обезличивания при осуществлении обработки. Кроме того, предлагается рассмотреть возможность принятия решений на основании исключительно автоматизированной обработки персональных данных с использованием технологии больших данных.
Согласно ст. 5 Федерального закона «О персональных данных» содержание и объем обрабатываемых персональных данных должны соответствовать заявленным целям обработки, а также обрабатываемые персональные данные не должны быть избыточными по отношению к заявленным целям их обработки.
На аналогичных положениях базируется правовая база о персональных данных некоторых зарубежных стран и их объединений. Например, в ст. 5 Регламента № 2016/679 «О защите физических лиц при обработке персональных данных и о свободном обращении таких данных, а также об отмене Директивы 95/46/ЕС» закреплено, что персональные данные должны собираться для конкретных, отчетливых и законных целей и не обрабатываться в последующем несовместимым с этими целями образом5.
Для обеспечения принципа прозрачности обработки персональных данных в контексте больших данных оператор или контроллер должен обеспечить ясное и понятное предоставление информации субъектам о целях обработки их данных. Это предполагает разработку и документирование политики обработки персональных данных и согласий с учетом требований законодательства. Осуществление контроля над данными способствует взаимному доверию между оператором и субъектом, а также позволяет субъекту сохранять осведомленность и управление своими данными, включая обработку больших объемов информации.
Тем не менее технологии машинного обучения зачастую выходят за пределы одной поставленной цели обработки, в связи с чем оператор каждый раз при обнаружении в рамках своих систем больших данных новых целей и способов обработки должен уведомлять субъектов персональных данных об изменениях.
Если процесс обработки персональных данных не будет проводиться со строгим соблюдением установленных целей и методов, это может привести к нарушению требований законности обработки и привлечению к ответственности согласно отечественному и европейскому (в случае, если в массив больших данных попали персональные данные граждан Европы) законодательству. При изменении целей обработки необходимо учитывать также категорию обрабатываемых данных, поскольку законом запрещено использование персональных данных для других целей, не предусмотренных на начальном этапе и не совместимых с изначальной целью. Действительно, существуют определенные исключения и цели обработки персональных данных, которые могут быть рассмотрены как совместимые с первоначальной целью сбора данных: публичные интересы, научные или исторические исследования и статистические цели.
Впрочем, операторы должны строго следовать законодательству о персональных данных и соблюдать принципы обработки данных, такие как прозрачность, аккуратность и надежность. Лазейки в регулировании обработки больших данных не должны использоваться для обхода закона или нарушения прав граждан. Если оператор планирует использовать персональные данные для целей, не указанных в изначальном согласии субъекта данных, необходимо провести анализ совместимости новых целей с целями первоначальной обработки. В случае сомнений или разногласий рекомендуется получить согласие субъекта данных на новую цель обработки. В целом необходимо тщательно и ответственно подходить к обработке персональных данных, соблюдая законы и права граждан на защиту их личной информации.
Такое исключение сделано, например, для обработки персональных данных, касающихся состояния здоровья, полученных в результате обезличивания персональных данных, которое допускается в целях повышения эффективности государственного или муниципального управления, а также в иных целях, предусмотренных федеральными законами от 24 апреля 2020 г. № 123-ФЗ6 и от 31 июля 2020 г. № 58-ФЗ7, в порядке и на условиях, которые установлены указанными федеральными законами. Однако речь идет об обезличенных данных, таким образом, обработка персональных данных в рамках получения статистических данных без обезличивания запрещена.
Следует отметить, что использование больших данных для юридически значимых решений требует особой осторожности. Важно понимать, что обработка данных с целью статистического анализа и использование их для принятия решений, например в сфере таргетированной рекламы, имеют различные правовые последствия. Поэтому необходимо учитывать этот нюанс при использовании больших данных для конкретных целей. Например, в Федеральном законе «О персональных данных» прямо запрещено использование персональных данных в целях продвижения товаров, работ, услуг на рынке путем осуществления прямых контактов с потенциальным потребителем с помощью средств связи, а также в целях политической агитации без предварительного согласия на такую обработку.
Одним из важных принципов целевого ограничения является обязанность оператора не допускать объединения баз данных, содержащих персональные данные, обработка которых осуществляется в целях, несовместимых между собой. Более того, согласно ст. 25 Регламента № 2016/679 и ст. 18.1 Федерального закона «О персональных данных», оператор должен применять соответствующие технические и организационные меры для обеспечения этого. В рамках больших данных, представляющих собой не структурированную в привычном понимании базу данных, такое практически невозможно и как минимум экономически нецелесообразно.
С учетом принципа минимизации данных оператор должен обрабатывать только те данные, которые необходимы и достаточны для достижения обозначенных целей. Исходя из прямого указания Федерального закона «О персональных данных», обрабатываемые персональные данные не должны быть избыточными по отношению к заявленным целям их обработки. Сбор персональных данных должен быть ограничен конкретным объемом сведений, который необходим для достижения заявленных целей обработки. С учетом данного принципа недопустимо собирать сведения в большем объеме в надежде, что эти данные когда-нибудь пригодятся. Возникает правовая коллизия между принципом больших данных и принципом минимизации персональных данных. Данное несоответствие неоднократно отмечали исследователи, например С. В. Соловкин (Solovkin, 2023, p. 97) и О. Л. Алферов (Alferov, 2023, p. 169), поскольку сама основа больших данных заключается в сборе как можно большего количества персональных данных за единицу времени.
Кроме того, возникают вопросы относительно принципа минимизации хранения информации в связи с постоянным развитием технологий обработки данных. Возможность альтернативного анализа уже собранных данных подразумевает необходимость их долгосрочного хранения оператором. Механизм исключения обработки данных для статистических целей ограничивает применение данного принципа в контексте больших данных. Рекомендуется изменение правового регулирования использования принципа минимизации данных в отношении больших данных, включая регулирование отдельных аспектов обработки персональных данных, входящих в состав больших данных.
Основной принцип, отраженный в ст. 6 Федерального закона «О персональных данных», — это наличие правового основания для обработки персональных данных: либо личное согласие, либо законное основание для обработки без наличия согласия на обработку. В случае с технологиями больших данных получение согласия на обработку у каждого субъекта персональных данных затруднительно. В соответствии со ст. 9 Федерального закона «О персональных данных» согласие должно содержать большой перечень реквизитов и должно быть дано в форме отдельного документа, а не в качестве, например, приложения к договору, что усложняет обработку информации с помощью больших данных.
Эксплуатация больших данных может привести к тому, что результаты анализа данных будут содержать категории персональной информации, которые ранее не рассматривались как таковые. Например, анализ списка покупок может раскрывать информацию о здоровье человека, что подпадает под специальную категорию персональных данных. Технологии больших данных обладают свойством сглаживать различия между разными категориями персональных данных. С учетом этой особенности необходимо пересмотреть правовое регулирование для сбалансированного учета интересов предпринимателей, обрабатывающих большие данные, и общественных интересов защиты персональных данных различных категорий.
В связи с тем, что в системах обработки больших данных накапливается значительный объем информации о гражданине, важно определить правовой режим такой информации и механизмы защиты прав субъектов персональных данных. Персональные данные, являясь нематериальным благом, не могут быть объектом права собственности согласно доктрине российского гражданского права. Вместо этого следует говорить о комплексе прав субъекта персональных данных на защиту и контроль за их обработкой, а также об обязанностях операторов по обеспечению их безопасности. При этом результаты обработки и анализа персональных данных могут представлять коммерческую ценность для операторов таких систем, что создает необходимость поиска баланса между правами субъектов персональных данных и интересами операторов.
В данной ситуации практически неизбежен конфликт частноправовых интересов граждан и правовых интересов операторов и заказчиков такой обработки. Наиболее эффективным средством минимизации подобных рисков, как справедливо отмечается в научной литературе, является право во всех проявлениях. В этой связи видится необходимым создание правовых и технических условий для обеспечения защиты персональных данных граждан, передаваемых и обрабатываемых в массивах Big Data.
Еще одна проблема, на которую хотелось бы обратить внимание, — это автоматическое принятие решений исключительно с помощью результата обработки больших данных: довольно сложно соблюсти требования законодательства о персональных данных в рамках использования машинного обучения с целью последующего автоматизированного принятия решений. Коллизия заключается в необходимости получить согласие на принятие решений на основе анализа персональных данных наряду с необходимостью разъяснить субъектам процедуру принятия таких решений, что создает предпосылки для нарушения операторами законодательства. Коммерческая тайна процесса принятия решений, основанного на алгоритмах машинного обучения, затрудняет его объяснение, что может привести к нарушению требований о прозрачности и информировании. Кроме того, отсутствие понимания принципов работы машинного обучения среди сотрудников усугубляет ситуацию и усложняет выполнение законных требований. В результате возникают серьезные риски для развития применения больших данных в различных сферах экономики. В текущей ситуации указанная норма неэффективна, что приводит к тому, что используемые современные технологии обработки больших данных сталкиваются с проблемой необходимости соблюдения законодательства о персональных данных. На сегодняшний день, с одной стороны, нарушение правил обработки персональных данных может привести к серьезным штрафам для организаций. С другой стороны, аналитики и исследователи нуждаются в доступе к большому объему данных для проведения анализа и выявления закономерностей.
Особого внимания заслуживает эволюция правового регулирования обезличенных данных в российском законодательстве. С 1 сентября 2025 г. вступает в силу Федеральный закон «О внесении изменений в Федеральный закон “О персональных данных” и Федеральный закон “О проведении эксперимента по установлению специального регулирования в целях создания необходимых условий для разработки и внедрения технологий искусственного интеллекта в субъекте Российской Федерации — городе федерального значения Москве и внесении изменений в статьи 6 и 10 Федерального закона ‘О персональных данных’”»8, основной целью которого являются уменьшение объема оборота обрабатываемых персональных данных и повышение их защищенности при осуществлении обработки данных с использованием новых технологий, а также регулирования оборота больших объемов данных.
Указанный Закон вносит значительные корректировки в понимание и регулирование обезличенных данных, что напрямую влияет на использование технологий больших данных. Ключевым изменением становится новый подход к определению обезличенных данных и требованиям к процессу обезличивания. Законодатель уточняет, что обезличенные персональные данные — это информация, которая получена в результате обезличивания персональных данных и не позволяет без использования дополнительной информации определить принадлежность персональных данных конкретному субъекту персональных данных. Это определение существенно влияет на возможности использования больших данных в аналитических целях.
Важным нововведением является детальная регламентация обезличивания данных. Это создает новые правовые рамки для операторов больших данных, которым необходимо будет адаптировать свои процессы под новые требования. Текущая методика обезличивания персональных данных, утвержденная приказом Роскомнадзора, требует переосмысления в контексте современных технологий обработки данных9. Существующие методы (метод введения идентификаторов, метод изменения состава или семантики, метод декомпозиции, метод перемешивания) не всегда эффективны при работе с большими данными, особенно когда речь идет о машинном обучении и использовании искусственного интеллекта. В связи с этим особое значение приобретают разрабатываемые подзаконные акты, которые должны детализировать требования Закона. В частности, ожидается принятие нормативных актов, определяющих технические требования к процессу обезличивания персональных данных, а также методы контроля эффективности обезличивания.
Для нахождения баланса между обеспечением защищенности персональных данных и потребностями аналитиков необходимо разработать и применять гибкие и сбалансированные правила и механизмы регулирования. Законодателям следует учитывать не только потребности компаний и организаций в обработке данных, но и защиту прав и интересов граждан. Правоприменителям же необходимо контролировать соблюдение законодательства и в случае нарушений принимать соответствующие меры.
В контексте развития правового регулирования больших данных необходимо обратить внимание на несколько ключевых аспектов современного нормотворчества и правоприменения. Проект федерального закона «О промышленных данных» представляет особый интерес, поскольку вводит новую категорию данных и механизмы их регулирования. Законопроект направлен на установление правового режима промышленных данных, определение прав и обязанностей субъектов, участвующих в их обороте. Это создает дополнительный уровень сложности в разграничении различных категорий данных и их правовых режимов.
Отдельного внимания заслуживает вопрос о достаточности положений ГК РФ в части регулирования баз данных применительно к массивам больших данных. Действующие нормы гл. 71 ГК РФ, регулирующие права на базы данных, не в полной мере учитывают специфику больших данных. В частности, критерий творческого характера подбора и организации материалов, необходимый для предоставления авторско-правовой охраны, плохо применим к автоматически генерируемым массивам данных и использованию технологий искусственного интеллекта. Помимо этого, существующие нормы не учитывают динамический характер больших данных и особенности их автоматизированной обработки.
Таким образом, для эффективной работы в области обработки больших данных необходимо учитывать и соблюдать требования законодательства о персональных данных, обеспечивая защиту данных граждан и одновременно возможность использования данных для целей аналитики и исследований.
1. Приказ Росстата «Об утверждении форм федерального статистического наблюдения для организации федерального статистического наблюдения за деятельностью в сфере образования, науки и инноваций» от 31 июля 2024 г. № 332 (ред. от 30.01.2025).
2. Модельный закон о цифровом здравоохранении — участников СНГ, принят 14 апреля 2023 г. в г. Санкт-Петербурге Постановлением 55-2 на 55-м пленарном заседании Межпарламентской ассамблеи государств — участников СНГ). https://iacis.ru/mod_file/p_file/1126
3. См., например, услуги по обработке данных (https://www.webformat.ru/services/bigdata/).
4. Федеральный закон «О персональных данных» от 27 июля 2006 г. № 152-ФЗ. СЗ РФ, 31.07.2006. № 31 (ч. I). Cт. 3451.
5. Regulation 2016/679, of the European Parliament and of the Council of 27 April 2016 on the Protection of Natural Persons with Regard to The Processing of Personal Data and On the Free Movement of Such Data, And Repealing Directive 95/46/EC (General Data Protection Regulation), 2016 OJ (L 119).
6. Федеральный закон «О проведении эксперимента по установлению специального регулирования в целях создания необходимых условий для разработки и внедрения технологий искусственного интеллекта в субъекте Российской Федерации — городе федерального значения Москве и внесении изменений в статьи 6 и 10 Федерального закона «О персональных данных» от 24 апреля 2020 г. № 123-ФЗ. СЗ РФ, 27.04.2020, № 17, ст. 2701.
7. Федеральный закон «Об экспериментальных правовых режимах в сфере цифровых инноваций в Российской Федерации» от 31 июля 2020 г. № 258-ФЗ. СЗ РФ, 03.08.2020, № 31 (часть I), ст. 5017.
8. Федеральный закон «О внесении изменений в Федеральный закон “О персональных данных” и Федеральный закон “О проведении эксперимента по установлению специального регулирования в целях создания необходимых условий для разработки и внедрения технологий искусственного интеллекта в субъекте Российской Федерации — городе федерального значения Москве и внесении изменений в статьи 6 и 10 Федерального закона ‘О персональных данных’”» от 8 августа 2024 г. № 233-ФЗ. СЗ РФ, 12.08.2024, № 33 (Часть I), ст. 4929.
9. Методические рекомендации по применению приказа Роскомнадзора от 5 сентября 2013 г. № 996 «Об утверждении требований и методов по обезличиванию персональных данных» (утв. Роскомнадзором 13 декабря 2013 г.).
Список литературы
1. Alferov, O. L. (2023). Bol’shiye dannye v yuridicheskoy deyatel’nosti [Big data in legal practice]. Sotsial’nyye i gumanitarnyye nauki. Otechestvennaya i zarubezhnaya literatura. Ser. 4, Gosudarstvo i pravo [Social Sciences and Humanities. Domestic and Foreign Literature. Series 4: State and Law], (3). 165–176. https://10.31249/iajpravo/2023.03.14
2. Antipova, K. G. (2021). Sposoby opredeleniya bol’shikh dannykh: Rossiyskiy i zarubezhnyy opyt [Methods of big data definition: russian and foreign experience]. Yuridicheskiye issledovaniya [Legal Studies], (9), 143–157. https://10.25136/2409-7136.2021.9.3659
3. Ayusheva, I. Z. (2023). Bol’shiye dannyye: problemy opredeleniya grazhdansko-pravovogo rezhima [Big data: problems of defining the civil law regime]. Lex Russica, 77(10), 125–134. https://doi.org/10.17803/17295920.2023.203.10.125-134
4. Vasilevskaya, L. Yu. (2024). Big data v mekhanizme formirovaniya osnovnykh napravleniy natsional’nogo proyekta “Ekonomika dannykh”: vzglyad tsivilista na problemu [Big Data in the mechanism of the formation of main directions of the “Data Economy” national project: A civilist’s view of the problem]. Lex Russica, 77(1), 9–21. https://doi.org/10.17803/1729-5920.2024.206.1.009-021
5. VCIOM. (2015). V mezhdunarodnaya sotsiologicheskoy Grushinskoy konferentsii “Bol’shaya Sotsiologiya: Rasshireniye prostranstva dannykh” Izbrannyye tezisy k sektsii Sotsiologiya i Big Data [V international sociological conference “Big Sociology: Expansion of Data Space” Selected abstracts for the Sociology and Big Data section]. Monitoring obshchestvennogo mneniya: ekonomicheskiye i sotsial’nyye peremeny [Monitoring of Public Opinion: Economic and Social Changes], (3), 138–154. https://www.monitoringjournal.ru/index.php/monitoring/article/view/1217
6. Lapteva, A. M. (2019). Pravovoy rezhim tsifrovykh aktivov (na primere Big Data) [Legal regime of the digital assets (on example of Big Data)]. Zhurnal rossiyskogo prava [Journal of Russian Law], (4), 93–104.
7. Rozhkova, M. A. (2020). Imushchestvennye prava na novye nematerial’nye ob”ekty v sisteme absolyutnykh prav [Property rights to new intangible objects in the system of absolute rights]. In M. A. Rozhkova (Ed.), Pravo cifrovoj ekonomiki—2020: Ezhegodnik-antologiya [Law of the Digital Economy—2020: A Yearbook-Anthology] (pp. 5–78). Statut.
8. Rozhkova, M. A., & Glonina, V. N. (2020). Personal’nyye i nepersonal’nyye dannyye v sostave bol’shikh dannykh [Personal and non-personal data as part of big data]. In M. A. Rozhkova (Ed.), Pravo tsifrovoy ekonomiki — 2020 (16) (pp. 271–298). Statut.
9. Sergeev, A. P., & Tereshchenko, T. A. (2018). Bol’shiye dannye: v poiskakh mesta v sisteme grazhdanskogo prava [Big data: In search of a place in the civil law system]. Zakon, (11), 106–123.
10. Solovkin, S. V. (2023). Avtomatizirovannyy sbor dannykh o cheloveke: neyavnyye printsipy pravovogo regulirovaniya [Automated collection of data on a person: Implicit principles of legal regulation]. Courier of Kutafin Moscow State Law University (MSAL), (2), 90–100. https://doi.org/10.17803/2311-5998.2023.102.2.090-100
Об авторах
С. Н. ТагаеваРоссия
доктор юридических наук, профессор, профессор кафедры гражданского и предпринимательского права
420012, Казань, ул. Муштари, 11–13
Э. М. Гатиятуллина
Россия
аспирант кафедры гражданского и предпринимательского права; заместитель руководителя Правового департамента
420012, Казань, ул. Муштари, 11–13
119607, Москва, ул. Удальцова, 85