Expert společnosti Semalt říká, jak byla data ze škrabání webových dat legalizována soudním rozhodnutím

I když může být nezákonné stírat data z webových stránek bez výslovného souhlasu majitelů těchto stránek, soudce nedávno za určitých okolností rozhodl jinak. Společnost hiQ Labs nedávno podala proti společnosti LinkedIn žalobu za to, že jim zabránila v extrahování dat ze stránek LinkedIn.

Pro většinu lidí to bylo hrubým šokem, o kterém bylo LinkedIn řečeno, aby umožnilo spuštění bezplatný přístup ke svým webovým stránkám. hiQ použil své algoritmy ke zjištění, kdy uživatel LinkedIn hledá práci na základě změn, které uživatel provede ve svém veřejném profilu.

Algoritmy běží na datech extrahovaných z webových stránek LinkedIn. Jak se očekávalo, LinkedIn se to nelíbilo a byla zavedena protiopatření, která brání hiQ v další extrakci dat. Kromě technických překážek, které byly zavedeny, byla vydána také silně formulovaná právní varování.

Spouštění nemělo na vybranou, než začít problém legálně. Společnost hiQ musela hledat právní nápravu. Společnost chtěla, aby LinkedIn nařídil odstranit technické překážky. Společnost hiQ také chtěla, aby byl proces extrakce dat na LinkedIn legalizován.

Naštěstí pro spuštění, to, co chtěl. Rozhodnutí bylo pro hiQ. LinkedIn bylo nařízeno odstranit všechna protiopatření bránící hiQ ze seškrabávání jeho (LinkedIn) webových stránek a také dát hiQ volnou ruku, protože zákon je zcela legální. Soudce závisel na tom, že hiQ chce škrábat data, která byla zobrazena pro veřejnost.

Soudce nařídil nejen žalovanému, aby odstranil veškerý preventivní mechanismus zavedený proti hiQ, ale také nařídil, aby se žalovaný v budoucnu od takových činů vzdal.

Propagace otevřených webových dat

Přestože je rozhodnutí stále dočasným soudním příkazem, je potěšující slyšet, že zákon podporuje otevřená webová data a volný přístup k informacím na internetu, jak toto rozhodnutí potvrzuje. I když konečné rozhodnutí zvýhodňuje žalovaného, tato skutečnost již byla prokázána.

Soudce prosazoval tuto politiku tím, že zrušil prakticky všechny argumenty LinkedIn. Zatímco se LinkedIn snažil prokázat, že žalobce porušil své soukromí, soudce proti tomu tvrdil, že žalovaná data rovněž prodává.

Když argument neobdržel vodu, žalovaný rovněž uvedl, že akt hiQ byl v hrubém porušení zákona o počítačových podvodech a zneužívání (CFAA), protože spuštění spustilo přístup ke svým serverům a nezákonně shromažďovalo data. Tento argument byl znovu propíchnut. Bylo odmítnuto z důvodu, že hiQ pouze škrábal obsah na veřejných, nechráněných stránkách.

Soudce případ analogizoval jako někdo, kdo v pracovní době chodil do otevřeného obchodu. Nelze říci, že taková osoba přestupuje. Takže hiQ nepřekonalo. Je zajímavé, že soudce šel dále vysvětlit, proč je jeho rozhodnutí ve veřejném zájmu.

Stručně řečeno, soud připustil, že je ve veřejném zájmu, aby bylo možné údaje procházet, extrahovat a analyzovat. Bude tedy škodlivou politikou podporovat umístění překážek volného toku informací.

Co byste se měli poučit z vládnutí

I když možná nemáte důvody extrahovat data přímo z LinkedIn, měli byste se poučit z rozhodnutí. Je lepší hrát bezpečně čtením a respektováním souboru robots.txt na všech webových stránkách. Pamatujte, že rozhodnutí je stále dočasným soudním příkazem. Nakonec by to mohlo být ve prospěch LinkedIn.

I když rozhodnutí vás nemusí přímo ovlivnit, je potěšující, že federální soud prosazuje politiku udržování webu otevřeného pro veřejnost. Informace by tedy měly být dostupné a přístupné těm, kteří je mohou vyhledávat a dobře je využívat.

Webová data jsou velmi užitečná pro všechny, zejména pro analytiky médií, vývojáře, vědce v oblasti dat a některé další profesionály. Rozhodnutí je proto vítaným vývojem.