Mindkettővel együtt dolgozik

Vastag Lorrie. Két hétig csöpögök google, Yandex. Volt néhány példa, de alapvetően csak lejátszási vagy felvételi program. Különösen a qt.
És igen, nekem van egy tiszteletreméltó kérdésem arról, hogy hogyan tehetsz valami olyat, amit nem tudsz. Mivel a Google-on vagy a Yandex-ben egyértelműen meg kell fogalmaznod a kérdésedet. de attól a ténytől, hogy nem tudom, milyen hang, nem tudom felvenni.
A C ++ kéréseken a hanggal végzett munka üres fórumokat ad a válaszok nélkül. kérésre qt hanggal dolgozik, megadja a játékosok sötétségét zenehallgatáshoz.
Ha ilyen Google-varázsló vagy, akkor segíts nekem egy lekérdezést, amelyben magam beillesztem.

Vastag Lorrie. És igen, nem tudod, hogyan működnek a Google keresőrobotjai, mi a keresés, és honnan származnak helyek és információk, vagy figyelmen kívül hagyta a kérdésemet. Ezekkel a "kérdésekkel", amelyek a kérdésemben szerepelnek, nem lehet a szükséges információkat megkapni a keresésből.

Ha nem bánod, hogy egy programot több sorba írj!
ifstream fájl ("C: \\ ok.wav", ios :: begios :: in ios :: bináris); // például.
A hangfájl megnyitása (nem tudom, melyik formátum jobb a képek kezdetéhez, ez a bmp, amellyel könnyebben dolgozhat) az Ön által választott. Kimeneti tartalmakat a konzolhoz és mentse el. Nincs szükség a fájllal kapcsolatos hibák feldolgozására.
Küldhetsz értem, ha ezt értelmetlenül értem =)

"de mi hangzik, mint"

A "matematikai" értelemben? A forma amplitúdója (t) = f (t) :-)

"Standard" nézet?
- Vegyük ezt a szegmensünket (például - 1 perc)
- osztják véges számú pillanattal. t_i = (1 / f) * i, ahol t_i az ith idő, i a szám, f a mintavételezési sebesség
- az amplitúdóértékeket ezen időpontokban tároljuk (amplitude_i = amplitúdó (t_i))
- és természetesen - ezeket az értékeket n-bites számként ábrázoljuk (a 24 bites példán).

"Hangsáv bekapcsolása ütemtervbe"
És attól függően, hogy mi. Ha beszélni ostsilogrammy - egyszerűen yuzaem amplitúdó értékeket (jó, talán - mi vonatkozik néhány egyszerű funkciót a nekik lineáris logaritmikus értékek, például, lépni.). Legalábbis el lehet képzelni, mint egy spektrogram (amely gyakran használatos). Röviden - osztva időközönként, amelyek mindegyike - leír egy külön funkció, és azt bemutatja, például összegeként szinuszgörbe (férfi Fourier Transform).

"tiszta"
Ismét - EMNIP, elsősorban dolgozó amplitúdókkal (shareware - vychiaem zajos amplitúdójú jelet (t) + zaj (t) a zaj komponens (t)) vagy tartomány (Igen hagyományosan - tekinthető tartományban, majd alábecsülni / túlértékelt része frekvenciák (azaz a azaz a megfelelő szinuszos együtthatókat)), és ismét hangot generált. De - már az egész téma köré húzza, ezért először elsajátítanám az üzenet első részét.

"próbálja megtanítani a neurális hálózatot, hogy felismerjen néhány szót"
Ismét - egy egész külön terület. Nem tudom, hogy amit most yuzayut megközelítéseket - de anélkül, keres, tettem egy hasonló (bár egy ilyen hálózat egyértelműen szükség van dohera adatok képzés, azt szinte nem használ speciális tudást a problémát):
- bemutatta a rekordot spektrogram programkészleteként
- a megfelelő egyedi hangokra osztotta őket
- táplált adatjelölt rács

"RGB"
Nem mindig, egyébként. Van mindenféle CMYK és cucc. De, amennyire én tudom, az egyik programban szereplő értékeket a másikhoz lehet vinni, igen.

Kapcsolódó cikkek