szöveg

szöveg

Icon-leírás szöveges fájlt CSV -data

Text fájl - egy számítógépes fájlt. szöveget tartalmazó adatok. Szöveges fájlokat ellenzik bináris (binary) fájlokat. amely adatokat tartalmaz, amelyek célja nem értelmezhető, mivel a szöveg (például fájlok szöveget tartalmazó kódolt vagy tömörített formában, vagy tároló nincs szöveg, hang, kép vagy egyéb adat).

Ezzel szemben a „szöveges adatok” ( „text formátumú adat”), az adatok tájékoztató jellegűek, a tartalom, a „szöveges fájl” kifejezés a fájlt, és úgy írja le, mint egy tartály, amely tartja az adatokat.

A szövegfájl tartalmazza egy karaktersorozat (főleg a karaktereket. Tartozik ez vagy az a sor karakter). Ezek a szimbólumok általában csoportosítva sorokban (Engl. Lines, sorok). A modern rendszerek húr tagolt elválasztott sorokban. Ezt használták a múltban, mint tároló sorok például a nyilvántartások állandó vagy változó hosszúságú (cm. Lyukkártya). Előfordul, hogy a végén a szöveges fájl (különösen, ha a fájlrendszer nem tárol információt fájlméret) is jelzi, egy vagy több speciális karakterek, más néven a fájl vége jel.

Előnyök és hátrányok

  • Nagyobb alacsony információk entrópia tömörítetlen szöveges fájlokat - ezeket a fájlokat több helyet, mint a minimálisan szükséges. Bár ez a redundancia és meghatározza fokozott ellenállás hiba az adatátviteli csatornák és az adatok vételére a médiában. így például, a mágneses szalagot.
  • Egyes műveletek szöveges fájlokat hatástalanok. Például, ha a fájlt, hogy megfeleljen a szám, egy számítógépes rendszer kezdete előtt műveletek velük kell majd lefordítani a belső méret, egy viszonylag bonyolult eljárással átalakítása; go 1000-edik sort kell olvasni vonalak 999 fut rá; nehéz helyettesíteni egy húr egy másik, és így tovább. d. Ezért, amikor dolgozik nagy mennyiségű adat szöveges fájl csak köztes formátum, amely az átjárhatóságot.

Formátum alapján szöveges fájlok

Egyszerűsége miatt, szöveges fájlok gyakran tárolására használt szolgáltatásra vonatkozó információkat (pl naplók): mivel a hozzáadás művelet végén a szöveges fájl, az új adatok nem igényel jelentős számítástechnikai erőforrásokat, tekintet nélkül a meglévő fájl méretét és típusát hozzá szöveges adatok, vezető szöveges log fájlokat általában akkor fordul elő, hatékonyan és átláthatóan a felhasználó, és más alkalmazások (akár elfogy a lemezterület).

A szöveges formátumban az alapja sok a több speciális formátumok (pl .ini. SGML. HTML. XML. TeX. Forrás programozási nyelven). Ezek közül néhány formátumok bizonyos kombinációja szimbólum használható, mint egy olyan jelölést a szöveget. Ebben az esetben a fájl tárolja a formázott szöveget, amelyben karakter tovább kell részletezni betűtípus, stílus, méret, és így tovább. N. (például Rich Text Format. HTML).

Bővítése fájlnevek

A DOS és a Windows fájlok egyszerű szöveges, általánosan használt .txt kiterjesztést. A szöveg azonban lehet egy fájl bármilyen más bővítmény vagy anélkül. Például forráskód általában tárolja kiterjesztésű fájlokat, a programozási nyelv. amelyen írva a program (.bas. .pas. .c).

Rich Text Format (Text Format) általában tárolja kiterjesztésű fájlok megfelelő formátumú vagy jelölőnyelv - .rtf. .htm. .html.

8 bites szöveg

Történelmileg, kódolására szöveges fájlok használt 7-bites ASCII karakterkészlet. valamint 8 bites ASCII EBCDIC és a különböző kiterjesztések. A 8-bites kódot oldalak szokás használni az első felében a kód táblázat szimbólumok megfelelő ASCII.

Az előnye, hogy a 8-bites ábrázolása a szöveg egy szoftver egyszerű és sorrendjétől függetlenül probléma bájt vagy a hossza a gépi szó a különböző platformokon. Hátránya - számos különböző szabványok, ami ahhoz vezethet, hogy inkompatibilitás.

Unicode-fájlokat

A használata a Unicode-fájlokat, miközben alapvetően megoldja „a problémát a kódolás”, és egységesíti a használata vezérlő karakterek, de megteremti a saját problémáit. A legtöbb modern rendszerek, oszthatatlan egysége információt az adatfolyam egy byte (8 bit). amely megköveteli néhány kódoló egyik jelképe ki Unicode. Mivel a megoldásokat alkalmaznak kölcsönösen inkompatibilis rendszer UTF-8 és UTF-két változatban 16 (UTF-16LE és UTF-16BE ellentétes bájtsorrend). Néha az a fájl elején hozzá egy speciális karaktert marker (U + FEFF [1]), amely lehetővé teszi, hogy felismerje a formátum kifejezetten. UTF-8 az az előnye, visszafelé kompatibilitást ASCII, de a szövegszerkesztő szoftver UTF-8 karakter méretű bonyolult instabil. Szintén a Unicode különbözik még felesleges. helyett 8 bit.

vezérlő karakterek

A különböző operációs rendszerek betartani a benyújtás újsor és a fájl végén. UNIX soremelés áll egy LF (0xA kód) a Mac OS (de nem az OS X) - jelképe a CR (0xD kód), és a DOS és Windows újsor nem kódolt szekvencia két karakter: CR és LF.

Az ilyen ellentmondás által diktált elveket írógép: mozgatni egy új vonal, szükséges, hogy visszatérjen a kocsi elején a sor (kocsi vissza), majd forgassa el a dobot egy sorban (line feed). Amikor nyomtatni egy nyomtatót, amely egy másik szimbólummal elkülönülve (például, hogy kiemelje a sorban, kifakult kétszer, vagy lapozzon a dobot egy pár sort), de a szöveges fájlokat nincs szükség.

Kapcsolódó cikkek