Experto de Semalt cuenta cómo se legalizó el raspado de datos web con una decisión judicial

Si bien puede ser ilegal extraer datos de sitios web sin el permiso explícito de los propietarios del sitio, un juez ha dictaminado recientemente lo contrario en ciertas circunstancias. hiQ Labs presentó recientemente una demanda contra LinkedIn por evitar que extraigan datos de las páginas de LinkedIn.

Para la mayoría de las personas, fue un shock grosero que se le dijo a LinkedIn que diera a la startup acceso gratuito a sus páginas web. hiQ usó sus algoritmos para detectar cuándo un usuario de LinkedIn está buscando trabajo en función de los cambios que el usuario realiza en su perfil público.

Los algoritmos se ejecutan en datos extraídos de las páginas web de LinkedIn. Como se esperaba, a LinkedIn no le gustó y se implementaron contramedidas para evitar que hiQ extraiga más datos. Además de las barreras técnicas que se establecieron, también se emitieron advertencias legales fuertemente redactadas.

La startup no tuvo más remedio que abordar el problema legalmente. hiQ tuvo que buscar una reparación legal. La compañía quería que se ordenara a LinkedIn eliminar sus barreras técnicas. hiQ también quería legalizar su proceso de extracción de datos en LinkedIn.

Afortunadamente para la startup, obtuvo lo que quería. El fallo fue a favor de hiQ. LinkedIn recibió la orden de eliminar todas las contramedidas que impiden que hiQ raspe sus páginas web (LinkedIn) y también le dé a hiQ mano libre ya que el acto es totalmente legal. El juez basó su decisión en el hecho de que lo que hiQ quiere obtener son datos que se han exhibido para la vista del público.

El juez no solo ordenó al acusado que elimine todos los mecanismos preventivos establecidos contra hiQ, sino que también ordenó que el acusado desista de tales actos en el futuro.

Promoción de datos web abiertos

Si bien el fallo sigue siendo un mandato temporal, es alentador escuchar que la ley respalda los datos web abiertos y el libre acceso a la información en Internet, ya que este fallo lo confirma. Incluso si la decisión final llega a favorecer al acusado, este hecho ya se ha establecido.

El juez promovió esta política al cerrar virtualmente todos los argumentos de LinkedIn. Mientras que LinkedIn intentó establecer que el demandante estaba violando su privacidad, el juez lo respondió con el hecho de que el acusado también está vendiendo los datos.

Cuando el argumento no aguantó, el acusado también declaró que la ley de hiQ violaba gravemente la Ley de Abuso y Fraude Informático (CFAA) porque la startup accedió a sus servidores para recolectar datos ilegalmente. Nuevamente, el argumento fue perforado. Fue rechazado porque hiQ solo estaba raspando contenido en páginas públicas no protegidas.

El juez hizo una analogía del caso como alguien que entra a una tienda abierta durante el horario comercial. No se puede decir que tal persona está invadiendo. Entonces, hiQ no estaba traspasando. Curiosamente, el juez fue más allá al explicar por qué su fallo es de interés público.

En pocas palabras, el tribunal aceptó que es de interés público permitir que los datos sean rastreados, extraídos y analizados. Por lo tanto, será una política perjudicial alentar la colocación de barreras para el libre flujo de información.

Lo que debes aprender del fallo

Si bien es posible que no tenga razones para extraer datos directamente de LinkedIn, debe aprender de la decisión. Es mejor jugar con seguridad leyendo y respetando el archivo robots.txt de todos los sitios web. Recuerde, el fallo sigue siendo un mandato temporal. Eventualmente podría ir a favor de LinkedIn.

Si bien la decisión puede no afectarlo directamente, se alegra de que un tribunal federal defienda la política de mantener la web abierta al público. Por lo tanto, la información debe estar disponible y accesible para aquellos que puedan buscarla y hacer un buen uso de ella.

Los datos web son extremadamente útiles para todos, especialmente analistas de medios, desarrolladores, científicos de datos y algunos otros profesionales. Como tal, el fallo es un hecho bienvenido.

send email