Semalt: kraapige ükskõik millist veebilehte ühe hiireklõpsuga

WebHarvy on üks parimaid andmete kraapimise ja veebi indekseerimise tööriistu võrgus. Seda kasutatakse paljude saitide piltide, URL-ide, teksti ja meilide kraapimiseks. WebHarvy abil saate oma veebisisu salvestada erinevates vormingutes ja kasulikke andmeid saab vaid mõne hiireklõpsuga eraldada.

Kraapige mitmesuguseid saite:

WebHarvy abil saate hõlpsalt kraapida URL-e, e-posti aadresse, pilte, video- ja helifaile ning veebilehtede teksti. Selle konfiguratsioonirežiimis peate lihtsalt viima hiirekursori üle lehe ja andmed kraabitakse automaatselt. Samuti võite esile tõsta teabe, mida soovite kraapida, ja WebHarvy hakkab oma funktsiooni koheselt täitma. Kui andmed on kaevandatud, tõstetakse need esile kollase taustaga ja saate kontrollida nende kvaliteeti. Hämmastav, et WebHarvy parandab kõik failides olevad pisivigad ja kuvab lõpliku tulemuse aknas Capture. Kui andmeid pole kollase taustaga esile tõstetud, peaksite heade tulemuste saamiseks muutma tööriista sätteid ja taaskäivitama selle kohe.

Tuvastage sarnased andmeelemendid:

WebHarvy abil saate tuvastada sarnased andmeelemendid ja vabaneda madala kvaliteediga sisust. Näiteks kui te oleksite mõnda konkreetset lehte varem kraapinud ja selle unustanud, ei kaevanda WebHarvy samalt lehelt andmeid ja säästab teie aega ja energiat. Selle asemel pääsete juurde andmetele WebHarvy andmebaasis ja saate need kohe oma kõvakettale alla laadida. Samamoodi saate selle tööriista abil lehelt rohkem andmeelemente jäädvustada ja korraga teha mitu kraapimisülesannet.

Kraapige pilte WebHarvy abil:

Seadistamise ajal, kui klõpsame PNG- või JPG-faili, hakkab WebHarvy seda kohe kraapima. Kui pilt on ekstraheeritud, laaditakse see automaatselt teie kõvakettale alla või salvestatakse WebHarvy andmebaasi võrguühenduseta kasutamiseks. Selle teenuse abil saate kraapida korraga kuni 100 pildifaili ja PDF-dokumenti. Suvandit „Pildista pilt” saab kasutada ka HTML-dokumentide kraapimiseks ja pildi URL-i kiireks saamiseks võite kasutada tavalisi avaldisi.

Kraapige HTML-dokumente:

WebHarvy abil saate HTML-dokumente kraapida vaid mõne hiireklõpsuga. Selleks tuleks valida suvand 'Hüüa HTML' ja klõpsata aktiveerimise aknas nuppu 'Veel suvandeid'. Siin kuvatakse teie valitud elemendi HTML-kood. Klõpsake nuppu „Hüüa HTML” ja jäädvustage valitud elemendi HTML.

Osuta ja klõpsa liides:

WebHarvy on kõige paremini tuntud point-and-click-liidese tõttu. Andmete kraapimise ajal ei pea te koode ega skripte kirjutama. Selle asemel võite WebHarvy abil liikuda erinevatel veebilehtedel ja kraapida ühe hiireklõpsuga nii palju lehti kui soovite. WebHarvy tuvastab automaatselt andmemustrid ja annab täpsed ja usaldusväärsed tulemused. Teabe saate salvestada XML-, CSV-, JSON- ja TSV-vormingus. Võite oma veebilehti isegi anonüümselt kraapida ja takistada WebHarvyl oma IP-aadressi blokeerida.