Vizsgálata az élő adás Yandex van-e értelme, hogy elemezzük és, hogy tartalmaz egy
A kísérlet célja az volt írva többszálú elemzőt, és maradt egy hétig egyedül dolgozni. Egy héttel később, 414 GB információt talált és 4460619547 a szerveren. Vidáman dörzsölte tollak, a szakértők elkezdték eltávolítani másolatok tömb kifejezéseket. És mi a meglepetés, amikor eltávolítása után ismétli a tömbben marad csak 15.068.199 egyedi kifejezések - valóban jelentéktelen összeg, mint az eredeti kötetet.
Így elmondható, hogy a gyakorlatban elemzés a webcast nem ad statisztikailag szignifikáns eredményeket - ezen a héten érkezett 8000000 kifejezések, az év ki fog derülni, a legjobb 300-350.000.000, ami nem jelentős mennyiségű szempontjából kortárs adatbázis-kulcs a piaci igényekhez.
Vessünk egy közelebbi pillantást, amit már kapott eredményeként elemzés héten.
- elemzés a folyamok száma - 10
- az arány kézhezvételét kulcsszavak - mintegy 10 ezer másodpercenként
- Felvétel végeztük 70 fájlok, szöveges fájlok (7 napon át 10 stream):
- fájl mérete 1,6 GB, 8,8 GB
- A számos kulcsfontosságú mondatok során nyert elemzés - 4460619547
- A számos kulcsfontosságú mondatok eltávolítása után ismétli - 15068199
A mintavételi frekvencia szó, kivéve a szakszervezetek és prepositions acélból (tartalmaz használati gyakoriság, idő):
Önmagában az élő közvetítés is megtalálható kérdések kitalálni - úgy tűnik, ez a szám a találat a keresési eredmények az adott lekérdezés. Optimalizálókkal megszerzésében érdekelt ez a paraméter is eltarthat közvetlen éter - ellentétben a szokásos kérdés, nincs captcha és elemzési fordul szinte ingyen.