
El web scraping es una técnica informática que permite la extracción automatizada de información de páginas web. De esta definición se desprenden claramente las serias dudas que esta técnica suscita desde el punto de vista del derecho de la propiedad intelectual y de otras ramas jurídicas. Ahora bien, no en todos los casos su utilización implica la infracción de los derechos reconocidos en la Ley de Propiedad Intelectual (LPI). Por este motivo es necesario precisar los límites que deben respetarse en su ejercicio, especialmente si tenemos en cuenta que el web scraping puede ser de gran utilidad para numerosas aplicaciones perfectamente legítimas.
La primera precisión que debe hacerse a este respecto es que para que el web scraping sea legal no debe recaer sobre obras o prestaciones protegidas por el derecho de autor (obras cinematográficas o literarias, fotografías…) si no se tiene autorización de los respectivos titulares de derechos. No es legalmente posible extraer mediante este procedimiento tales obras y prestaciones sin el consentimiento de sus respectivos titulares pues se estaría vulnerando, al menos, el derecho de reproducción sobre ellas que ostentan los citados titulares. Tampoco es posible la extracción no consentida de elementos protegidos por otros derechos, como el derecho a la propia imagen (recogido en la Ley Orgánica 1/1982, de 5 de mayo, de protección civil del derecho al honor, a la intimidad personal y familiar y a la propia imagen).
Igualmente podrá ser ilícito el web scraping cuando afecte a datos personales, es decir, toda información sobre una persona física identificada o identificable. La extracción de estos datos constituye un tratamiento que únicamente será lícito si se verifica alguna de las condiciones del artículo 6 del Reglamento General de Protección de Datos (RGPD).
Ahora bien, no toda la información de interés está sujeta a derechos de autor o derechos de imagen, o afecta a datos personales; y, en principio, esta información no sujeta a derechos anteriores sí podría ser objeto de un web scraping legal. Sin embargo, aquí debemos recordar que una recopilación de información puede estar protegida por el derecho de la propiedad intelectual, aunque la información recopilada en sí misma no esté amparada por ningún derecho previo, si dicha recopilación constituye una base de datos protegida por nuestra LPI.
En este artículo nos centraremos esencialmente en las implicaciones que el web scraping puede tener, en primer lugar, desde la perspectiva del derecho a la propiedad intelectual; y, en segundo lugar, con relación a los términos y condiciones de uso de la web scrapeada.
¿Qué es una base de datos?
Una base de datos es, ante todo, una recopilación de elementos. Estos elementos pueden consistir en obras o prestaciones protegibles, pero también en otros elementos no protegidos por derechos anteriores. Así, por ejemplo, una base de datos puede recopilar traducciones de palabras (como en un diccionario o un traductor), o datos sobre restaurantes u hoteles (nombre, dirección, precio, ubicación, etcétera).
Un requisito para que podamos hablar de base de datos es que los elementos recopilados han de ser independientes entre sí. Esto significa, por un lado, que cada uno de estos elementos ha de conservar su sentido y significado aisladamente de los demás, ha de ser comprensible por sí mismo; y, por otro lado, que si uno de los referidos elementos fuera suprimido la base de datos continuaría siendo funcional y útil al fin para el que fue diseñada.
Además, a efectos de aplicación de la protección conferida por nuestra LPI que a continuación veremos, los elementos recopilados han de ser preexistentes a la base de datos. Este es un aspecto crucial, pues no habrá base de datos (ni, en consecuencia, ningún derecho que impida el web scraping) si en lugar de recogerse elementos ya existentes estos son creados ex novo. Así lo estableció el Tribunal Supremo en el caso Ryanair (STS 572/2012 de 9 de octubre), en el que entendió que la página web de esta conocida compañía aérea no merecía la protección propia de una base de datos, pues en ella no se recopilaban datos sobre horarios de vuelo, sino que dicha información era generada por la propia página web sobre la base de una serie de parámetros. Es un matiz de gran importancia: si la información previamente existente es recopilada, estamos ante una base de datos en términos de nuestra LPI; si lo que se hace es crear nueva información para después mostrarla en una página web, no habrá base de datos.
Finalmente, los datos recopilados han de estar ordenados sistemática y metódicamente, de manera que se facilite al acceso individual a ellos.
Así pues, si nos encontramos ante una recopilación de elementos, independientes entre sí, preexistentes, ordenados e individualmente accesibles estaremos ante una base de datos protegible por el derecho de la propiedad intelectual. Cabe ahora preguntarse en qué consiste exactamente dicha protección.
¿Cómo se protegen las bases de datos?
La LPI contempla dos vías distintas para la protección de las bases de datos.
En primer lugar, cuando la selección o la disposición de sus elementos son originales, la base de datos será en sí misma una obra protegible por el derecho de autor (artículo 12 LPI). Es indiferente que los elementos recopilados sean o no originales, lo importante es que la selección y la disposición de esos elementos sí lo sea. Entonces podremos decir que dicha recopilación de elementos constituye una colección, protegible en virtud del citado artículo 12 LPI.
Pero ¿cuándo puede considerarse que la selección y disposición de los elementos de una base de datos es original? El Tribunal de Justicia de la Unión Europea ha declarado que la base de datos será original “cuando, mediante la selección o la disposición de los datos que contiene, su autor expresa su capacidad creativa de manera original tomando elecciones libres y creativas e imprime así su toque personal” y, en cambio, no habrá originalidad “cuando la constitución de la base de datos es dictada por consideraciones técnicas” (STJUE de 1 de marzo de 2012, C‑604/10).
Por tanto, no toda forma de selección o disposición ordenada de los elementos de una base datos es original. La originalidad requiere la adopción de decisiones libres que no vengan impuestas por exigencias técnicas. Será necesario poder señalar algún rasgo propio de esta selección o disposición de los datos que la diferencie de otras selecciones o disposiciones ordinarias en bases de datos similares.
Ahora bien, puede ocurrir que la forma de seleccionar y disponer los elementos de una base de datos no haya sido particularmente original, pero que se haya afrontado una importante inversión para realizarla. En este caso la LPI no deja desprotegido al inversor, sino que contempla en su favor el derecho sui generis sobre las bases de datos (art. 133 LPI). En este caso ya no es necesario que la base de datos sea original, sino que basta que se haya realizado una inversión sustancial para la obtención, verificación o presentación de los contenidos.
En este sentido, debe recordarse que la base de datos recopila elementos preexistentes. Por tanto, para que la inversión realizada permita justificar la existencia del derecho sui generis es necesario que dicha inversión se haya llevado a cabo precisamente para la obtención, verificación o presentación de contenidos ya existentes, nunca para su creación desde cero.
Por último, debe tenerse en cuenta, no obstante la existencia de dos vías distintas de protección, que ambas vías pueden ser acumulables. Es decir, si la selección y disposición de los elementos de una base de datos es original y, al mismo tiempo, se ha realizado una inversión significativa en la obtención, la verificación o la presentación de sus contenidos, dicha base de datos estará amparada tanto por el derecho de autor como por el derecho sui generis.
Pero ¿qué ocurre cuando ninguna de las vías de protección es aplicable? Si una página web no es una base de datos protegible por el derecho de autor o por el derecho sui generis, ¿es siempre posible hacer web scraping? Existe otra posible barrera: los Términos y Condiciones (T&C) de la página web.
Los Términos y Condiciones
El titular de una web que quiera impedir que sea objeto de web scraping puede incluir en sus T&C la prohibición expresa de realizarlo, de manera que si a pesar de ello un tercero realizara dicha actividad podría incurrir (eventualmente) en la correspondiente responsabilidad contractual.
Sin embargo, la antes citada sentencia del Tribunal Supremo, en el caso Ryanair vs Atrápalo, introdujo algunas dudas a este respecto. Y es que el Tribunal Supremo entendió en este caso que los T&C de Ryanair no eran aplicables.
El Alto Tribunal sostuvo que los T&C son un contrato que regulan una concreta situación jurídica, en este caso la contratación de vuelos por Internet. Sin embargo, la actividad de Atrápalo (el web scraping) era completamente distinta al objeto de los T&C (la contratación de pasajes de avión). De hecho, el web scraping no sólo no era el objeto del contrato, sino que estaba expresamente prohibido por él. Por ello el Tribunal Supremo no lo consideró aplicable y, en consecuencia, no apreció la existencia de incumplimiento contractual alguno.
Así pues, en el caso comentado la existencia de una prohibición expresa del web scraping en la página web de Ryanair resultó inútil para impedir (o sancionar) la práctica de esta actividad. No obstante, no debemos precipitarnos en creer que los T&C, a la vista de la citada sentencia, carecen de toda utilidad para impedir el web scraping. Hay que ver caso por caso.
Imaginemos, por ejemplo, que se tratara de una página web en la que, a diferencia de lo que ocurría en el sitio de Ryanair, no pudiera contratarse ningún servicio, sino que simplemente ofreciera información. Podría tratarse, tal vez, de una página web en la que pudieran consultarse los nombres, reseñas y datos de contacto de restaurantes (incluido su teléfono y correo electrónico), pero que no permitiera realizar directamente, a través de la propia web de consulta, reservas. En este caso no podría decirse que los T&C regularan la contratación de un servicio; por el contrario, dichos T&C serían un contrato que disciplinaría simplemente la navegación por dicho sitio web. Y en este sentido, podría, quizá, ser defendible que regularan dicha navegación prohibiendo el web scraping, con lo que su práctica, tal vez, podría considerarse una infracción contractual.
Este ejemplo evidencia la existencia de una amplia casuística, en la práctica, por lo que se refiere al web scraping; pero, de momento, pocas resoluciones judiciales que hayan abordado el tema. Por ello, si se tienen dudas al respecto, lo mejor es consultar con un profesional. En Bamboo.legal somos especialistas en propiedad intelectual y podemos resolver tus consultas.
[Artículo escrito por Luis Mª Benito Cerezo]
Tengo una web con un directorio de empresas . En el nombre de la empresa en algunos casos pongo palabras propias para favorecer posición en google.
En otros apartados de la BD inserto web de la empresa añadiendo frases o páginas a mi manera .
Y otros campos que se ve claramente el plagio.
Me han copiado la Base de datos mediante scrapping y lo publican en otra web.
¿ estaría protegido por la LPI ?
¿ que posibilidades de éxito tendría ante una demanda ?
Gracias
Buenos días, Pablo,
Necesitaríamos ver tu web y la web ajena. Puedes escribirnos a info@bamboo.legal con más detalles sobre el caso.
Muchas gracias.
Un saludo
Buen dia,
consulta es legal hacer web scraping a un sitio web de ecommerce? extraer nombres de sus productos y precios.
Quedo atento, gracias.
Hola, Juan,
Necesitaríamos tener más detalles sobre el caso para poder dar una valoración fundada, previa propuesta de servicios. Puedes escribirnos a info@bamboo.legal.
Como guía, puede servirte lo explicado en el artículo.
Un saludo