Все это — онлайн, с заботой о вас и по отличным ценам.
Можно ли собирать тексты статей с сайтов СМИ?
Про обработку текстов статей, размещённых на сайтах СМИ.
1. Есть сайт Lenta.ru, раздел с правилами использования материалов https://lenta.ru/info/. Есть ли у нас право автоматизированно скачать все статьи с сайта и разместить их в публичном доступе в машиночитаемом виде https://github.com/yutkin/Lenta.Ru-News-Dataset? Такое ресурс нужен программистам и учёным для исследования естественного русского языка.
2. Распространяется ли ответ на другие сайты СМИ: https://ria.ru/, https://arzamas.academy/, https://www.fontanka.ru/, https://www.interfax.ru/, https://www.kp.ru/? Как понять можно собрать с сайта тексты статей или нет?
3. Есть у нас право выкладывать в открытый доступ результаты обработки текстов статей? Не исходные тексты, а отдельные предложения, разбитые на слова, с пометками где существительное, где глагол.
4. Есть ли право у юридических лиц использовать такие ресурсы в коммерческих целях? Речь не идёт о создании зеркала Lenta.ru с копией материалов. По текстам статей мы учимся находить упоминания людей, их должности, продаём алгоритм и результаты его работы.
Александр, добрый день! Вопросы материального ущерба, причиненного работником регулируются гл. 39 Трудового кодекса РФ
В частности согласно ст. 239 ТК РФ работник несет перед работодателем ответственность за прямой ущерб под которым понимается реальное уменьшение наличного имущества работодателя или ухудшение состояния указанного имущества (в том числе имущества третьих лиц, находящегося у работодателя, если работодатель несет ответственность за сохранность этого имущества), а также необходимость для работодателя произвести затраты либо излишние выплаты на приобретение, восстановление имущества либо на возмещение ущерба, причиненного работником третьим лицам.
при этом ответственность работника ограничена пределами его среднего месячного заработка. Условия трудового договора не могут ухудшать положение работника, т.е. даже если в трудовом договоре будет прописаны иные условия в случае судебного спора суд будет руководствоваться ТК РФ а не условиями такого договора. При этом это если речь идет о трудовом договоре. В Вашем случае не исключено, что с Вами будут например пытаться заключить не трудовой а гражданско-правовой договор, и тут уже размер ущерба может не ограничиваться пределами среднемесячного заработка. В этом случае чтобы его уменьшить в суде нужно будет доказывать именно факт наличия трудовых отношений между вами и работодателем
Александр, добрый день! В данном случае можно говорить об использовании произведений (статей) без согласия правообладателя. В частности согласно ст. 1270 ГК РФ
способы использования произведений без согласия право обладателей и выплаты вознаграждения но с обязательным указанием автора и источника определены ст. 1274 ГК РФ и предусматривают в том числе
1) цитирование в оригинале и в переводе в научных, полемических, критических, информационных,учебных целях, в целях раскрытия творческого замысла автора правомерно обнародованных произведений в объеме, оправданном целью цитирования, включая воспроизведение отрывков из газетных и журнальных статей в форме обзоров печати;
при этом сами по себе сообщения о событиях и фактах, имеющие исключительно информационный характер (сообщения о новостях дня, программы телепередач, расписания движения транспортных средств и тому подобное). в силу ст. 1259 ГК РФ не являются объектами авторского права
Таким образом полное копирование статей в том числе для целей машинного обучения можно рассматривать как нарушение исключительных прав авторов указанных статей. Что касается
тут нарушения уже нет поскольку такие действия подпадают под исключения, определенные ст. 1274 ГК РФ
Тут собственно все упирается в то, копируется ли материал на Ваш сайт или нет. Во втором случае оснований говорить о нарушении прав на произведения нет. За первый ответ попавший сюда случайно и не имеющий отношения к Вашему вопросу конечно приношу извинения.
Какой именно исключение? Читаю http://www.consultant.ru/document/cons_doc_LAW_64629/84bbd636598a59112a4fe972432343dd4f51da1d/ не могу найти, это не цитирование, не иллюстрация.
По сути речь о таком же полном архиве как в п.1 и п.2 только тексты не сырые, а разбиты на предложения, слова, указаны части речи, падежи.