Парсинг сайтов позволяет извлекать с них практически любую информацию – от показаний счётчиков до картинок и прочего контента, в том числе текстового. На этой основе построено даже немало так называемых автонаполняемых сайтов, особенно новостных. Но законно ли использовать парсинг, и не последует ли за этим какое-нибудь наказание?

На самом деле это не простой вопрос, и здесь есть тонкая грань, с одной стороны которого всё чисто и законно, а с другой может прилететь немалый штраф и судебное дело. Попробуем разобраться, в каких случаях парсинг использовать можно, а в каких лучше от этого воздержаться.

Законно ли использовать парсинг сайтов?

Для каких целей использовать парсинг сайтов нельзя

Есть законы, охраняющие авторское право. В каждой стране они разные, но суть одна – использовать авторский контент можно только с разрешения правообладателя. Если он не разрешил, а контент взяли и выложили на другом сайте, то за это могут запросто привлечь к ответственности. В лучшем случае попросят удалить, но могут и подать в суд, а там уже и миллионы долларов компенсации могут взыскать.

Поэтому не стоит использовать парсинг именно для автоматического копирования чужих материалов. Так, Фейсбук неоднократно подавал в суд и выигрывал по этому поводу. Например, когда агрегатор социальных сетей Power.com с помощью парсинга размещал у себя посты с Фейсбука, последний выиграл суд и получил компенсацию. И это далеко не единственный случай. В последнее время борьба с такими нарушениями сильно обострилась, а суды всегда встают на сторону авторов.

Технически очень просто и быстро даже с минимальными знаниями можно создать так называемый автонаполняемый сайт. Встроенный простой парсер на таком сайте периодически сканирует ленты RSS других сайтов и копирует контент себе. Так обычно делают новостные сайты, которые очень быстро копируют новости с других новостных ресурсов, как только они публикуются. Это незаконно – само событие не обладает авторским правом, но им обладает автор, который написал об этом событии. Крупные ресурсы имеют в штате людей, которые отыскивают копии и юристов, которые вполне смогут грамотно подвести нарушителя под статью.

Учтите, что в России законы по отношению к парсерам не такие жёсткие, как в некоторых других странах. Но и они достаточно чёткие.

Запрещено использовать парсер, если это повлечёт:

  1. Нарушение авторских прав.
  2. Неправомерный доступ к охраняемой информации (например, личным данным).
  3. Сбор данных, представляющих государственную или коммерческую тайну.
  4. Ограничение конкуренции.

То есть парсер всё-таки использовать можно, но только если не нарушать указанные пункты.

Когда парсер использовать можно

Если информация на сайте находится в свободном доступе, и её может просмотреть любой посетитель, то её может использовать и парсер. Другое дело, как её использовать.

Например, для того же автонаполняемого новостного сайта со встроенным парсером не стоит просто публиковать собранную информацию, так как это просто копипаст и грубое нарушение авторских прав. А вот если парсер просто отслеживает новости, а статьи о них пишутся самостоятельно, это уже вполне невинно.

Также парсер можно использовать для сбора информации и анализа сайтов конкурентов в определённой тематике. Эти сведения не будут публиковаться, а служат только для разработки собственной стратегии продвижения. Ничьи права при этом не нарушаются.

Использовать парсер можно, если:

  1. Собираемая информация находится в свободном доступе и не относится к категории защищаемых законом – почта, телефоны, переписка и прочие личные данные.
  2. Сбор происходит законным способом, без взлома закрытых частей сайта.
  3. Работа сайта при этом не нарушается.
  4. Конкуренция от работы парсера не страдает.

Поясним пункт 3 и 4. Работу сайта можно нарушить, если парсер сканирует сайт очень быстро, создавая большую нагрузку на сервер. Из-за этого сайт может медленно загружаться или вообще отключиться на какое-то время. Это тоже повод для судебного иска.

Также можно нанести вред конкуренту, нарушая работу его сайту периодически или постоянно, как в предыдущем случае, и это уже попадает под пункт 4. Также можно создавать на конкурентном сайте большую фиктивную посещаемость, вызывая большую нагрузку на сервер. К тому же, это легко выявляют поисковики и понижают позиции ресурса. Так делать нельзя, это незаконные методы.

Поэтому, если вы собираетесь воспользоваться парсингом, то в принципе это не запрещено и вполне возможно. Но подумайте, законны ли методы и цели, которые вы преследуете. Если закон не нарушается, и никто от этого не пострадает, то можно воспользоваться этим методом сбора информации.

Рубрики: Блог