Mi lemmatization, panda szövegírás
Lemmatization - az átalakulás szó a lemma, azaz az eredeti szótárban formában. Például:
Amikor lemmatization a beszéd alakítjuk ezen elv szerint:
1. főnév - egyes szám, alanyeset.
2. A melléknév - egyes szám, férfias, alanyeset.
3. Az ige - főnévi igenév (infinitive).
Mi a lemmatization?
Először is, lemmatization segítségével keresők. Ez segít abban, hogy gyorsítsa fel az indexelést és a lekérdezés feldolgozása és relevanciájának növelése a kiadására. Keresők átnyomjuk minden oldalon az algoritmus-lemmatizer tartani az adatbázist egy kompakt és felhasználóbarát keresési forma.
Lekérdezések is áthaladnak a lemmatization. Nem számít, milyen a felhasználó beírja a „autót venni”, vagy „vesz egy autót” - a kereső átalakítja a beszédet Lemma ( „buy autó”), és megmutatja az eredmény ugyanaz.
Egy másik alkalmazás lemmatization - egyediség ellenőrzése. Ez úgy történik, mint ez:
- A forráskód alá lemmatization.
- A program veszi a fordulatot a szöveg több lemma egy sorban (ez a sorozat az úgynevezett „zsindely”, és a legtöbb áll 3 szó).
- A program megkeresi a zsindely más szövegekben (ami korábban is lemmatizirovanny).
- Ha egyezést talál, akkor a fragmentum tekinthető „nem egyedi”.
Lemmatization használat és a SEO-optimalizálók teszik ki a szemantikai mag (CR). Ez a technológia teszi lehetővé:
1. Vegye ismétlődések kéréseket. Például: „veszek egy autót Moszkva” és a „vesz egy autót Moszkva” - ez valójában egy és ugyanaz lekérdezést.
2. Klaszterek. Azáltal, hogy a legfontosabb, hogy az eredeti formájában könnyebb rendezni téma.
3. gyorsan értékelje a népszerűsége különösen kéri.
És egy másik alkalmazás lemmatization - programozás és webfejlesztés. A programozók használják ezt a technológiát, hogy saját adatbázisából keresők vagy a helyszínen.
Találtam egy hibát? Kérjük, válassza ki azt az egeret, és nyomja meg a bal Ctrl + Enter.