Kọmputa, Alaye ọna ẹrọ
Aiyipada "Unicode": ti ohun kikọ silẹ ifaminsi bošewa
Gbogbo Internet olumulo ni ohun igbiyanju lati ṣeto soke ọkan tabi awọn miiran ti awọn oniwe-iṣẹ ni o kere lẹẹkan ri loju iboju kọ ni Latin awọn lẹta ọrọ "Unicode." Kí ni o, ti o yoo kọ nipa kika yi article.
definition
Aiyipada "Unicode" - kikọ aiyipada bošewa. O ti a dabaa nipa Unicode Inc. ti kii-èrè agbari ni 1991. Awọn bošewa ti a ṣe lati mu jọ awọn ti ṣee ṣe nọmba ti o yatọ si orisi ti ohun kikọ ni a iwe. Page, eyi ti a mulẹ lori ilana rẹ, le ni awọn lẹta ati awọn ohun kikọ lati yatọ si awọn ede (lati Russian to Korean) ati mathematiki ami. Ni idi eyi, gbogbo awọn ti awọn ohun kikọ ninu awọn ohun kikọ silẹ ṣeto ti wa ni han lai eyikeyi isoro.
Awọn idi fun awọn ẹda ti
Lọgan lori akoko kan, gun ṣaaju ki awọn hihan ti a nikan eto "Unicode" aiyipada ti yan da lori awọn lọrun ti onkowe ti awọn iwe. Fun idi eyi, igba lati ka a iwe, o je pataki lati lo o yatọ si tabili. Nigba miran o jẹ pataki lati se ni igba pupọ, eyi ti gidigidi complicates awọn aye ti awọn apapọ olumulo. Bi tẹlẹ darukọ, awọn ojutu si isoro yi ni 1991 ti a pe lati Unicode Inc. a àgbájọ èrè kọ lati pese titun kan Iru ti ohun kikọ silẹ aiyipada. O ti a še lati darapo igba atijọ ati ki o kan orisirisi ti awọn ajohunše. "Unicode" - ẹya aiyipada ti ozvolila se aseyori awọn unthinkable ni akoko: lati ṣẹda a ọpa ti o atilẹyin kan tobi nọmba ti ohun kikọ. Awọn esi koja ọpọlọpọ awọn ireti - nibẹ wà awọn iwe aṣẹ nigbakannaa ti o ni awọn mejeeji English ati Russian ọrọ, Latin, ati mathematiki expressions.
Ṣugbọn awọn ẹda kan ti a ti iṣọkan ifaminsi bere nipa awọn ye lati yanju nọmba kan ti isoro ti o ti arisen nitori awọn tobi orisirisi ti awọn ajohunše tẹlẹ ti wa tẹlẹ ni ti akoko. Awọn wọpọ awọn ti wọn:
- Elvish kikọ, tabi "gibberish";
- awọn idiwọn ti awọn ti ohun kikọ silẹ ṣeto;
- isoro pada codings;
- font išẹpo.
Kekere itan excursus
Fojuinu wipe àgbàlá 80th. Computer hardware ni ko ki wọpọ ati ki o ni kan fọọmu ti o yatọ lati loni. Nigba ti kọọkan OS jẹ oto ati dà gbogbo iyaragaga ká pato aini. Nilo fun awọn paṣipaarọ ti alaye ti wa ni iyipada sinu ẹya afikun rework ohun gbogbo. Gbiyanju lati ka a iwe da nipa miran ọna eto, igba han a ajeji ti ṣeto ti ohun kikọ, ati awọn ere bẹrẹ pẹlu awọn aiyipada. O ko ni nigbagbogbo se o ni kiakia, ki o si ma pataki iwe Kò lati si ni osu mefa, ati paapa nigbamii. Eniyan ti o nigbagbogbo paṣipaarọ alaye, ṣẹda fun ara wọn a iyipada tabili. Ati ki o si sise lori wọn han ẹya awon apejuwe: ye lati ṣẹda wọn ni meji awọn itọnisọna, "lati mi ninu rẹ" pada ati siwaju. Ṣe banal ayida iširo ẹrọ ko le, fun awọn ti o ni ọtun iwe ti awọn orisun, ati osi - awọn esi, sugbon ko idakeji. Ti o ba ri ye lati lo eyikeyi pataki ohun kikọ ninu awọn iwe, ti won ni lati wa ni fi kun akọkọ, ati ki o si miran, ati lati se alaye si awọn alabaṣepọ ohun ti o nilo lati ṣe sí àwọn ohun kikọ ma ko di a "gibberish." Ki o si jẹ ki ká ko gbagbe wipe fun gbogbo aiyipada ni lati se agbekale tabi se ara wọn nkọwe, eyi ti yori si awọn ẹda ti kan tobi nọmba ti onka ni OS.
Fojuinu siwaju pe awọn nkọwe lori iwe, o yoo ri 10 ege ti aami Times New Roman pẹlu kan kekere akọsilẹ: nitori UTF-8, UTF-16, ANSI, UCS-2. Bayi o ni oye wipe awọn idagbasoke ti gbogbo awọn ajohunše je dandan?
"The atele baba awọn creators ti"
Awọn origins ti awọn ẹda ti Unicode lati wa ni ri ni 1987 nigbati Dzho Bekker lati Xerox, pẹlú pẹlu Lee Collins ati Samisi Davis lati Apple bẹrẹ iwadi ni awọn aaye ti ilowo ẹda kan ti a gbogbo ohun kikọ silẹ ṣeto. Ni Oṣù 1988, Dzho Bekker atejade a osere si imọran fun awọn ẹda ti 16-bit olona-lingual okeere ifaminsi eto.
A diẹ osu nigbamii Unicode ṣiṣẹ ẹgbẹ ti a ti fẹ lati ni Ken Whistler ati Mike Kernegana lati RLG, Glenn Rayt of Sun Microsystems ati awọn orisirisi miiran ojogbon, eyi ti laaye lati pari awọn alakoko Ibiyi ti a wọpọ ifaminsi bošewa.
gbogbo apejuwe
The Unicode da lori awọn Erongba ti awọn aami. Labẹ yi definition ntokasi si ohun áljẹbrà lasan ti o wa ni kan pato fọọmu ti kikọ ki o si tipasẹ a grapheme (wọn "sisunmu"). Kọọkan ohun kikọ ti ni a fun ni "Unicode" oto koodu ini si kan pato kuro bošewa. Eg grapheme B jẹ tun ni English ki o si Russian alphabets, sugbon o ni ibamu si Unicode 2 yatọ si ohun kikọ. Wọn ti wa ni koko ọrọ si iyipada si lowercase, t. E., Kọọkan ti awọn ti apejuwe awọn bọtini database, kan ti ṣeto ti ini ati awọn kikun orukọ.
Anfani ti Unicode
Lati miiran contemporaries fifi koodu "Unicode" Nibẹ ni a awqn iṣura ti ami fun "ìsekóòdù" ohun kikọ. Awọn o daju wipe rẹ predecessors ní 8 die, ti o ti ni atilẹyin nipasẹ 28 ohun kikọ, ṣugbọn awọn titun oniru wà tẹlẹ 216 ohun kikọ, ti o wà kan omiran igbese siwaju. Eleyi laaye aiyipada fere gbogbo awọn telẹ ati ki o wọpọ alphabets.
Pẹlu awọn dide ti "Unicode" ko to gun nilo lati lo kan iyipada tabili: bi a nikan boṣewa o kan negated awọn nilo fun wọn. Bákan náà, nwọn ti rì sinu igbagbe, ati "gibberish" - a nikan boṣewa mu wọn soro, bi daradara bi ofin jade ni ye lati ṣẹda àdáwòkọ nkọwe.
idagbasoke ti Unicode
Dajudaju, itesiwaju ni ko ni ibi, ati niwon akọkọ igbejade ti koja fun 25 years. Sibẹsibẹ, charset "Unicode" stubbornly ntọju awọn oniwe-ipo ninu aye. Ni ọpọlọpọ awọn ọna yi ti a ti ṣe ṣee ṣe ọpẹ si ni otitọ wipe o ti di rorun lati se ati ki o ti tan, a mọ Difelopa ti kikan (san) ati ìmọ orisun software.
A ko yẹ ki o gbagbo wipe loni ti a ba ri kanna koodu "Unicode" bi awọn mẹẹdogun ti a orundun seyin. Ni akoko, ti o ti rọpo nipa version 5.h.h, ati awọn nọmba ti se amin aami ti pọ to 231. Lori awọn seese ti lilo kan ti o tobi ala iṣmiṣ kọ lati tun ṣetọju support fun Unicode-16 (aiyipada, ibi ti awọn ti o pọju iye ti won lopin nọmba 216). Niwon awọn oniwe-ibẹrẹ ati ki o to to version 2.0.0 "The Unicode Standard" ti pọ awọn nọmba ti ohun kikọ ti o to wa fere ni 2 igba. anfani ati tesiwaju idagbasoke ni odun to nbo. Fun version 4.0.0 tẹlẹ nibẹ ni a nilo lati mu awọn bošewa ara, ati awọn ti o ti a ṣe. Bi awọn kan abajade, "Unicode" ti ri awọn fọọmu ninu eyi ti a ti mo o loni.
Kini ohun miiran ni ni Unicode?
Ni afikun si awọn tiwa ni, nigbagbogbo imudojuiwọn pẹlu awọn nọmba ti ohun kikọ, "Unicode" -Encoding ọrọ alaye jẹ miiran wulo aami. Eleyi jẹ awọn bẹ-ti a npe ni normalization. Dipo ju yi lọ nipasẹ gbogbo iwe ti ohun kikọ silẹ nipa kikọ silẹ, ati aropo awọn aami ti awọn ikowe tabili, lo ọkan ninu awọn ti wa tẹlẹ normalization aligoridimu. Ki ni o?
Dipo ti jafara awọn oro ti awọn kọmputa lori kan deede ayẹwo ti kanna kikọ silẹ, eyi ti o le jẹ iru ni orisirisi awọn alphabets, lilo pataki kan alugoridimu. O faye gba o lati ṣe kan iru aami lọtọ iwe jade tabili ati ki o waye tẹlẹ fun wọn pe, ko lori ati lori lẹẹkansi lati akole gbogbo awọn data.
Iru aligoridimu ti wa ni idagbasoke ati ki o muse mẹrin. Kọọkan iyipada gba ibi nipa muna definite opo, yatọ si lati awọn miiran, ki lati pe eyikeyi ọkan ninu wọn ni ko ni julọ daradara ṣee ṣe. Kọọkan apẹrẹ fun pato aini, ti a ifibọ ati ki o lo ni ifijišẹ.
itankale bošewa
Ni awọn 25 years ti awọn oniwe-itan aiyipada "Unicode" Mo ti gba jasi julọ ni ibigbogbo ni agbaye. Labẹ yi boṣewa ti wa ni titunse bi eto ati ayelujara-iwe ayelujara. Ibú ohun elo le fihan pe Unicode bayi lo nipa diẹ ẹ sii ju 60% ti Internet oro.
Bayi, o mọ, nigbati awọn "Unicode" boṣewa han. Ohun ti o jẹ, o tun mọ ki o si ni anfani lati riri ni kikun lami ti awọn kiikan, ṣe nipa ẹgbẹ kan ti awọn amoye Unicode Inc. Die e sii ju 25 ọdun sẹyin.
Similar articles
Trending Now