Все это — онлайн, с заботой о вас и по отличным ценам.
Общедоступная информация в Интернет. (что это такое? )
Интересует вопрос легальности деятельности по автоматизированному сбору данных с веб-сайтов. Хотелось бы верно понимать законы.
Непонятно как понимать пункт 4, статьи 7 закона об информации: "Информация, размещаемая ее обладателями в сети "Интернет" в формате, допускающем автоматизированную обработку без предварительных изменений человеком в целях повторного ее использования, является общедоступной информацией, размещаемой в форме открытых данных."
Мне непонятно что это за формат такой, допускающий автоматизированную обработку? (чисто технически собрать данные можно из какого угодно формата в автоматическом режиме и полностью автоматически их переработать).
Мне непонятно к чему относятся предварительные изменения человеком? Исключительно к собираемой информации? - да её в принципе никогда не нужно вручную изменять. Как понимать фразу "без предварительных изменений человеком в целях повторного ее использования"?
99% информации находящейся в интернете, даже под различными защитами, доступны чисто технически к полностью автоматизированному сбору без какой либо ручной обработки. Но зачем-то же приписали в закон эти слова, значит какой-то смысл они все же несут. Я не понимаю какой.
ВЫШЕ ОСНОВНОЙ СМЫСЛ МОЕГО ВОПРОСА.
НИЖЕ ОТДЕЛЬНЫЕ МОМЕНТЫ.
Ниже примеры, хотелось бы понять, что из нижеперечисленного (и почему) исключает общедоступность информации на основе пункта 4, статьи 7 закона об информации.
а) На вебсайте имеется страница с правилами пользования, на которой написано что запрещен автоматизированный сбор. При этом чисто технически автоматизированный сбор возможен.
б) На вебсайте имеется файл robots.txt в котором в общепринятом в среде поисковых роботов формате запрещен сбор данных.
в) На вебсайте имеется защита от сбора данных, которую можно проанализировать в ручном режиме, и создать автоматизированное средство для обхода этой защиты, в итоге скачать всю имеющуюся на сайте информацию через созданное специально для этого сайта автоматизированное средство.
г) На страницах вебсайта располагаются зашифрованные email-адреса, при этом алгоритм шифровки слаб, и могут быть созданы автоматизированные средства для дешифровки.
д) На вебсайте имеется модуль защиты от сбора данных, который обходится в два этапа. На первом этапе запускается обычный браузер, затем в ручном режиме в программу вносятся параметры из браузера, после чего программа с внесенными в неё настройками собирает с сайта в автоматическом режиме десятки тысяч страниц.
е) Информация находящаяся под логин-паролем. При этом логин-пароль получить можно в ручном режиме, а затем введя в специальное программное обеспечение собрать с сайта всю информацию доступную только зарегистрированным пользователям в полностью автоматическом режиме.
ж) Автоматизированное использование сервисов по разгадыванию каптч. При этом в самих сервисах работают в ручном режиме живые люди. Однако сама собираемая информация не изменяется этими людьми
- Вот примеры, вот вопросы. Хотелось бы получить как информацию по примерам, так и в целом понять.
Я подумал.. Наверное копирование информации из сети Интернет даже соответствующей критериям пункта 4, статьи 7 закона об информации, посредству создания и использования средств обхода защиты информации от копирования все равно является составом 273 ук рф. несмотря на выполнение критериев общедоступности согласно п4 ст7. ?
Здравствуйте, Александр!
Все, что Вы написали в вопросе — это конечно хорошо. Но Вы упускаете самое главное:
Интересует вопрос легальности деятельности по автоматизированному сбору данных с веб-сайтов. Хотелось бы верно понимать законы.
Каких данных? Какой информации? Нужно знать определённее.
Здравствуйте!
Я подозреваю что разгадка лежит в пункте 4, статьи 7 закона об информации.
Вы правильно подозреваете.
Статья 7. Общедоступная информация
1. К общедоступной информации относятся общеизвестные сведения и иная информация, доступ к которой не ограничен.
2. Общедоступная информация может использоваться любыми лицами по их усмотрению при соблюдении установленных федеральными законами ограничений в отношении распространения такой информации.
3. Обладатель информации, ставшей общедоступной по его решению, вправе требовать от лиц, распространяющих такую информацию, указывать себя в качестве источника такой информации.
4. Информация, размещаемая ее обладателями в сети «Интернет» в формате, допускающем автоматизированную обработку без предварительных изменений человеком в целях повторного ее использования, является общедоступной информацией, размещаемой в форме открытых данных.
Суть открытых данных сводится не столько к обеспечению возможности ознакомления с информацией, создаваемой государственными органами (поскольку предполагается, что это уже обеспечено предыдущими поколениями законов), сколько к обеспечению возможности ее последующего использования заинтересованными лицами, посредством ее анализа, визуализации, создания приложений с ее использованием.
В соответствии с ч. 4 ст. 7 Закона информация, размещаемая ее обладателями в сети Интернет в формате, допускающем автоматизированную обработку без предварительных изменений человеком в целях повторного ее использования, является общедоступной информацией, размещаемой в форме открытых данных. Как видно из указанной нормы, информация приобретает статус открытых данных при соблюдении нескольких условий:
1) такая информация должна быть размещена ее обладателем, в качестве которого выступает соответствующее публично-правовое образование, от имени которого принимается решение об отнесении информации к категории открытых данных соответствующим государственным или муниципальным органом власти в установленном порядке (Постановление Правительства РФ от 10 июля 2013 г. N 583
2) информация должна быть размещена в формате, допускающем ее последующую обработку без вмешательства человека (например: CSV, XML, JSON, ODS и др.). Данное условие связано с тем, что концепция «открытых данных» неразрывно связана с обеспечением совместимости таких данных с различными информационными системами для целей их последующего использования самими различными способами. В этой связи если данные размещены в форме отсканированного, но не распознанного документа, их дальнейшее использование существенно затруднено, поскольку для преобразования их в структурированный вид необходимо вмешательство человека в той или иной форме, следовательно, размещение такого документа не будет являться «открытыми данными».
Перечни информации, которые подлежат размещению в форме открытых данных, утверждены распоряжением Правительства РФ от 10 июля 2013 г. N 1187-р «О Перечнях информации о деятельности государственных органов, органов местного самоуправления, размещаемой в сети Интернет в форме открытых данных». К такой информации относятся, в частности: план проведения проверок юридических лиц и индивидуальных предпринимателей на очередной год; результаты плановых и внеплановых проверок, проведенных федеральным органом исполнительной власти и его территориальными органами в пределах их полномочий; статистическая информация, сформированная федеральным органом исполнительной власти в соответствии с федеральным планом статистических работ, а также статистическая информация по результатам проведенных плановых и внеплановых проверок; реестры лицензий на конкретные виды деятельности, лицензирование которых осуществляется федеральными органами исполнительной власти.
Конкретный состав предусмотренных данным перечнем сведений определяется в соответствии с Методическими рекомендациями, утвержденными Правительственной комиссией по координации деятельности открытого правительства
ч. 4 ст. 7 Закона ничего не говорит об отсутствии юридических ограничений на последующее использование информации в форме открытых данных, в то время как большинство дефиниций открытых данных упоминают данный признак открытых данных в числе конститутивного. В качестве исключения возможно возложение обязанности указания источника информации и (или) распространения такой информации на аналогичных условия
Итог: С другой стороны, систематическое толкование положений ст. 7 Закона позволяет восполнить данный пробел. Поскольку открытые данные выступают в качестве разновидности общедоступной информации, то к ним применимы положения ч. 2 ст. 7 Закона, в соответствии с которой каждое лицо может использовать такую информацию по своему усмотрению. На свободный и бесплатный характер использования открытых данных указывается и в Методических рекомендациях по публикации открытых данных.
2. Общедоступная информация может использоваться любыми лицами по их усмотрению при соблюдении установленных федеральными законами ограничений в отношении распространения такой информации.
«Комментарий к Федеральному закону от 27 июля 2006 г. N 149-ФЗ „Об информации, информационных технологиях и защите информации“
(постатейный)
(Савельев А.И.)
(»Статут", 2015)
С условиями как-то неясно...
1) Какие-то очень серьезные ограничения на лицо, размещающее информацию. И процедуру отнесения к открытым данным. Уверен в интернете мало кто этим занимается, а стало быть почти никакую информацию размещенную в интернете нельзя отнести к открытой?. Однако поисковые системы записывают себе в кеш все что находят. В то же время в самом пункте статьи говорится лишь об обладателе информации, без дополнительных условий.
Если я посчитаю, что информация размещена в интернете её обладателем (что по общей логике естественно), а выяснится что на самом деле она была размещена не обладателем, а кем-то другим (о чем я не знал), то какие это сулит последствия в плане 273 ук рф, если я создам технические средства для её автоматического копирования и сруктурирования?
2) Не совсем понятно толкование "информация должна быть размещена в формате, допускающем ее последующую обработку без вмешательства человека". Что имеется ввиду под словом "допускающем" - значение "предназаначенное", или значение "технически возможно"? Дело в том, что обычный веб документ, он не предназначен для последующей автоматической обработки, однако технически обработать его возможно, что в частности делают поисковые системы. То же относится и к данным в других форматах (xlsx, word, pdf, прочие), и даже приведенный пример с распознаванием отсканированных документов так же может быть проведен полностью автоматически без участия человека, и даже структурирование информации об изображениях те же поисковые системы (яндекс, гугл - сервис поиск по картинке) проводят в полностью автоматическом режиме.
Любые данные, любая информация размещенные в сети интернет.
Я ниже описал пункт закона, верное понимание которого меня интересует. Он вроде бы не накладывает ограничений на тип данных и тип информации.
А ещё ниже примеры ситуаций, и вопрос в том, как они влияют на применимость этого закона.
Мне нужно какое-то более-менее общее правовое обоснование, а не конкретика под тип данных. Поисковые роботы как-то не особо разбираются в типах данных и информации для кэширования. Я подозреваю что разгадка лежит в пункте 4, статьи 7 закона об информации.
Информации расположенной на веб сайтах в сети Интернет, в любых форматах. Данные любые расположенные на веб сайтах в интернете. Я полагаю что копирование и обработка всех этих данных в автоматическом режиме легальна, потому как иначе деятельность поисковых роботов была бы вне закона. Но я бы хотел понять чем эта легальность обоснована, и где границы между легальным и нелегальным.