Yandex „nyitott minden catboost (és ez nem a tömítés)
„Yandex” vezetett be a moszkvai sajtótájékoztatóján egy új módszert a gépi tanulás CatBoost. Szerint a fejlesztők, már a tesztelési időszakban az új módszer kimutatta fölénye használják a cég Matriksnet, és fokozatosan cserélje ki az összes termék
CatBoost opensorsnym lett az első gépi tanulás módszer eredetileg tartozik. A "Yandex" állítás, hogy a fő érték - egy non-profit. „Fektetése CatBoost Könyvtár nyílt hozzáférésű, szeretnénk hozzájárulni a fejlesztési gépi tanulás” - mondta a fejét menedzsment a gépi intelligencia és kutatási „Yandex” Mikhail Bilenko.
Amellett, hogy a kérelmek számos projektben „Yandex” ( „Zen”, „időjárás”, „dugót”, a keresés és egyéb), CatBoost kell alkalmazni a külső - azaz valamennyi kapcsolódó projektek gépi tanulás.
Machine Learning Library CatBoost lefektetett a nyílt hozzáférés GitHub nyílt (legnyitottabb lehetséges) Apache licenc. Itt található CatBoost Viewer megjelenítő program.
Honnan lehet tudni, a fejét a gépi tanulás rendszerek „Yandex” Anna Veronica darling, CatBoost már tesztelték az Európai Nukleáris Kutatási Központ (CERN). Ott azt használják, hogy összekapcsolják nyert adatokat különböző részein LHCb detektor.
Bent a „Yandex” egy új módszert vizsgáltuk különböző szolgáltatások: arra használják, hogy javítsa keresési eredmények rangsorolása szalag ajánlások „Yandeks.Dzen” kiszámítása az időjárás-előrejelzés a „Meteum” technológia. Mindezekben az esetekben CatBoost mutatott jobb Matriksneta (ezt a módszert alkalmazzák a jelenlegi „Yandex” termékek pillanatnyilag).
Amint azt a fejlesztők, amikor megkérdezték TechFusion.ru további CatBoost is fel lehet használni más szolgáltatások „Yandex”. Fokozatosan ki kell cserélni az elődje - Matrikcnet.
Ahogy Matriksnet, CatBoost használ mechanizmus a gradiens növelése. amely alkalmas dolgozó heterogén adatok. De ha Matriksnet oktatási modell numerikus adatok CatBoost figyelembe veszi a nem numerikus, például felhőtípus vagy típusú épületek. Korábban ezeket az adatokat kellett fordítani a számok nyelvén, amely megváltoztatja jellegét és hatását a modell pontosságát. Most már lehet használni az eredeti formájában, magyarázta a „Yandex”. By the way, a nevét egy új módszer a gépi tanulás megkapta a kategorikus fellendítése.
Amint azt a tesztek. CatBoost ad egy jobb minőségű oktatás, mint más módszerek dolgozó heterogén adatok. Ezt fel lehet használni a különböző területeken: orvostudomány, a pénzügyi ágazat és mások.