Hogyan lehet törölni a szöveget bármelyik módszer Antiplagiat bypass

előző ◈ a következő

Ways, hogy megkerülje a csekket egyediségét a szöveget, hogy „bypass antiplagiat” - elég sokat. A hálózat hiánya módszer leírását és weboldalak, hogy ilyen szöveget feldolgozó, mint szolgáltatás.

Ezen a területen is van, állandóan valami újat, mert a rendszer ellenőrzi az időt valahogy megtanulják felismerni az egyik vagy a másik módszer. Az az érzésem, azok, akik jönnek ki új trükköket - megy néhány lépést előre, így a helyzet mindig egy kicsit a javára, akik ellenőrizze ...

Egy nap, gondolkodtam rajta, én is, mint Archimedes, visszapattant a számítógép körül sír „Eureka!”. Nem tudom, először azt gondolta, hogy mielőtt e vagy sem, de az utat, hogy törölje a szöveget a megkerülő technikákat, valamint az összes, még azok is, akik még nem találták - volt, mint az összes tökéletes, egyszerű a határértéket.

Felvázoltam során gondolatait.

Az összes jelenleg létező módon körül antiplagiat csökkent három területen

Mi a közös között mindhárom területen?

Egy általános -, hogy a szöveg nem változik, az emberi olvasó. Ahhoz azonban, hogy ez a gép, hogy egy másik szöveget rovására e, vagy egyéb eszközök alkalmazásával, valahogy elrejtve a szem az emberi olvasó.

És ez ad nekünk?

Ez egyszerű, nem? Ha vesszük a feldolgozott szöveg, hogy valaki az egyik azt diktálja, és más újra pick, megkapjuk a nyers szöveget, nem igaz? Ez így van, csak ez túl nehéz.

És mi történik, ha Ön és a nyomtatott szöveg fájlból, amely felhasználja az egyik vagy másik megoldás? Én már kísérletezett, és arra a következtetésre jutott, hogy ezt a következtetést: semmi. Vagyis, ha a papírra nyomtatás mi érdekli csak akkor jelenik meg a szöveg, anélkül, hogy ott „láthatatlan karakterek” és a „rejtett szöveget”. Ha nyomtatni, majd felismerni azt, akkor egy egyszerű szöveges! Igen, ez igaz, de ez még mindig túl bonyolult.

És mi történik, ha a szöveg nem nyomtat, és az export PDF közvetlenül a Word, vagy egy harmadik féltől származó szoftver (PDF Creator vagy a Bullzip PDF nyomtató). Az ötlet a második - több megbízható, de a kísérletek azt mutatták, hogy legalábbis egyelőre - minden ugyanaz, mint a convert szöveget PDF, a tendencia folytatódik - mi látható volt - még látható, és ami el volt rejtve - rejtett (a néhány kivételtől eltekintve, erről a végén). Ha veszel egy PDF-fájl és raspoznatego bármilyen program, például ABBY FineReader, megkapjuk a nyers szöveget! És igen, ez nem nehéz.

Miért működik?

Minden elhárítási azon a tényen alapul, hogy látjuk az egyik, valójában a szöveges fájl valahogy rejtve tovább. Export PDF és OCR lehetővé teszi számunkra, sőt, külön, amit látunk a többi „csínját-bínját”. Nos, nézd ezt a szöveget egyik vagy másik rendszer ellenőrzi, látni fogjuk, az igazi eredményt.

Egy kis finomságok

Meg kell jegyezni, hogy a leírt módszer nem ad közvetlen választ arra a kérdésre, hogy sok embert érdekel - akár a megjelölt szöveg bejárás technikák? Közvetve (de néha - nagyon szépen), hogy azokat, azt jelezheti, egy másik alak a egyediségét ugyanazt a szöveget előtt és után a felismerés. Azonban, ha azt látja, hogy felismerni és után a százalékos egyediségét ugyanaz maradt, hogy nem ad arra nézve, hogy nem volt kijátszására technikákat. Talán ellenőrző rendszer egyszerűen nem találja a tartozás, amely valójában. Ez akkor történhet meg a különböző okok miatt, kezdve azzal a nyilvánvaló: a szöveg, ott volt valami kölcsönkért egyszerűen nem a nyilvánosság és az adatbázis-ellenőrző rendszerek ... és befejezve olyan egzotikus esetben, ha a szöveg -, hogy ez a hálózat, a keresők, de miért -Ez teljesen figyelmen kívül hagyja az egyik vagy másik rendszer. Ez is előfordul, de ez a téma egy másik cikk.

vizsgálati módszerek

Nézzük meg, hogyan működik. Okozása vizsgálat azt javasoljuk, hogy használja a „Anti-plágium”, mégis használják gyakrabban. Mindenesetre, én meg kell határozni - a beállított tevékenységeket kell elvégezni a „kísérleti” fájl nem attól függ, hol és hogyan fognak ellenőrizni őket később.

Aztán minden nagyon egyszerű:

Nos, most itt az ideje, hogy teher ami a „Anti-plágium”:

Hogyan lehet törölni a szöveget bármelyik módszer Antiplagiat bypass

Az ellenőrzés eredményét a vizsgálati minta az „Anti-plágium” rendszer

Összefoglalva azt szeretném hozzátenni, hogy hosszú ideig - körülbelül egy év - kísérletezik a felismerés és az azt követő ellenőrzés a szövegeket. Határozottan azt mondhatjuk, hogy a „becsületes” szöveg, ez az eljárás nem károsítja, ez okozza az eltérést az eredmény az eredeti minta 1-3%. Tehát ismétlem, hogy mindegy a megoldás már használt - elismerés megmutatja nekünk az igazi értékelését a szövegben.

Egy kicsit több finomságok, vagy mi a teendő, ha a szöveg rosszul felismert

Igen, továbbra is figyelemmel kell kísérniük az OCR minőségére. Csak kétszer, de szembesültem azzal a ténnyel, hogy a PDF-fájlokat kell ismerni egy csomó hibát, és furcsa módon. Biztos vagyok benne, hogy ez összefügg a módszerek befolyásoló egyediségét. Bíró magadnak - ha csinálsz egy tisztességes betűméret, térköz a betűk, és felismeri a szöveget a PDF-, még nyomtatás (vagyis a szempontból FineReader - szinte „ideális szöveg”), és el kell ismerni a hibákat ... Mi mást ez hatással lehet, különösen ha figyelembe vesszük azt a tényt, hogy más szövegeket helyesen felismerte?

Szembesülve az első alkalom, hogy elég hosszú nyugtalan vele, amíg meg nem kapta az ötletet, hogy konvertálja a szöveget újra - PDF többoldalas TIFF, mely valójában a kép - kommunikáció a forrás szöveget, és ólálkodó benne semmi trükk maradt.

Régebben Ghostscript:

ghostscipt -o file.tiff -sDEVICE = tiffgray -r720x720 -g6120x7920 -sCompression = LZW file.pdf

Használhatja bármilyen másik átalakító, amíg ez lehetővé teszi, hogy helyezze értékének DPI. Ezzel lehet kísérletezni, akkor elég nagynak kell lennie - az érzésem, 500 - 700. Az egyik lehetőség, hogy úgy tűnt, legjobb Ghostscripttel már megállapított a fenti sort.

Mindezek után manipulációk felismerték „nagy siker”. Többoldalas TIFF, akkor csak a „takarmány” FineReader'u, tudja, hogyan kell dolgozni őket tökéletesen.

ahelyett, hogy a következtetés

Egyrészt úgy tűnik, elég - tudjuk, az igazi értékelését a szöveget, nem mindegy, hogy valami, vagy nem? A másik - nem ritka szöveget, amelyben egyrészt vannak olyan módszerek, másrészt - a tisztítás után még adnak jó eredményt.

Csak „Anti-plágium”, és így lesz kölcsön, nincs további feldolgozás fájlokat. Nézz magad. És mivel kész, tettünk egy nagy munka, talán valaki hasznos élmény, de a személyzet a rendszer „Anti-plagizálás” (nem vagyok az egyik) nem ül még, és így kialakítsák a rendszert, amelyben a munka néha vannak hibák .

Köszönöm a kedves szavakat. Egyetértek azzal, hogy az „Anti-plagizálás” biztosan nem áll még, és már érzékeli kellően nagyszámú mindenféle „trükkök”, de nem volt remény. Csak azért, mert a mesterséges növekedése egyediségét a szöveg - a nagy üzlet (nem hiszem - a kereső írja be a „emelése egyediségét a szöveg”). Az emberek pénzt, és mint tudjuk élni akar -, hogy tudja, hogyan kell forogni.

Most az összes szöveg ellenőrzött kötelezően desztillált egy PDF, majd felismerni. Miért hogy PDF? Mivel ez a méret megfelel két követelmény. 1 - ez mentheti szöveget közvetlenül a Word, és 2 - egyszerűen „feed” FineReader'u. Felesleges szöveg mentése PDF, mint olyan, semmi nem változik. Fontos felismerni a szöveg - elveszi a látható „podnagotnuyu”, azaz akkor biztos lehet benne, hogy ellenőrizze, hogy pontosan mi látható a képernyőn.

Ezen túlmenően, a szöveg fut keresztül több rendszer, legalább ez „Anti-plagizálás” és «ETXT Antiplagiat” valami más. By the way, a két rendszer ritkán ugyanazt az eredményt, ez érdekes, nem? És néha adnak az ellenkezője. Van egy hálózat szövegek „Anti-plágium” nem látni, csak egy üres. Még akartam írni egy cikket róla, de van néhány igazán dühös, úgyhogy még nem írt.

Egyrészt - igen, a viszontbiztosítás. Igen, bocs, aranyér. De könnyebb, mint későbbi cikkben retragirovat 🙂

előző ◈ a következő