CyfrifiaduronTechnoleg gwybodaeth

Amgodio unicode: safon amgodio cymeriad

Fe wnaeth pob defnyddiwr o'r Rhyngrwyd wrth geisio ffurfweddu un o'i swyddogaethau ei hun hyd yn oed unwaith y gwelodd y gair "Unicode" a ysgrifennwyd mewn llythyrau Lladin . Beth ydyw, byddwch yn dysgu trwy ddarllen yr erthygl hon.

Diffiniad

Mae'r amgodio Unicode yn safon amgodio cymeriad. Cynigiwyd gan y sefydliad di-elw Unicode Inc. Yn 1991. Mae'r safon wedi'i chynllunio i gyfuno cymaint o wahanol fathau o symbolau â phosibl mewn un ddogfen. Gall y dudalen, a grëir ar ei sail, gynnwys llythyrau a hieroglyffau o wahanol ieithoedd (o Rwsia i Corea) ac arwyddion mathemategol. Fodd bynnag, dangosir pob cymeriad yn yr amgodio hwn heb broblemau.

Y rhesymau dros greu

Unwaith, cyn i'r system Unicode ymddangos, dewiswyd yr amgodio yn seiliedig ar ddewisiadau awdur y ddogfen. Am y rheswm hwn, yn aml i ddarllen un ddogfen, bu'n rhaid i chi ddefnyddio tablau gwahanol. Weithiau roedd yn rhaid ei wneud sawl gwaith, a oedd yn gymhleth yn sylweddol i fywyd defnyddiwr cyffredin. Fel y crybwyllwyd eisoes, cynigiwyd yr ateb i'r broblem hon yn 1991 gan y sefydliad di-elw Unicode Inc., a oedd yn cynnig math newydd o amgodio cymeriad. Fe'i galwwyd arno i gyfuno safonau moesol sydd wedi darfod ac yn amrywiol. "Unicode" - amgodio, a oedd yn gallu cyflawni'r annisgwyliadwy ar yr adeg honno: creu offeryn sy'n cefnogi nifer fawr o gymeriadau. Roedd y canlyniad yn rhagori ar lawer o ddisgwyliadau - roedd dogfennau'n ymddangos bod testun Saesneg a Rwsia, ymadroddion Lladin a mathemategol yn yr un pryd.

Ond cynyddwyd codiad unedig gan yr angen i ddatrys nifer o broblemau a gododd oherwydd yr amrywiaeth enfawr o safonau a oedd eisoes yn bodoli ar y pryd. Y rhai mwyaf cyffredin yw:

  • Llythyrau Elven, neu "krakozyabry";
  • Set cymeriad cyfyngedig;
  • Problem trosi amgodio;
  • Dyblygu ffontiau.

Digresiad hanesyddol byr

Dychmygwch fod yr iard yn 80au. Nid yw technoleg gyfrifiadurol mor gyffredin ac mae'n edrych yn wahanol i heddiw. Ar yr adeg honno, mae pob AO yn ei ffordd ei hun yn unigryw ac wedi ei gwblhau gan bob brwdfrydig ar gyfer anghenion penodol. Mae'r angen am gyfnewid gwybodaeth yn troi'n adolygiad ychwanegol o bopeth yn y byd. Mae ceisio darllen dogfen a grëwyd o dan AO arall yn aml yn dangos set annerbyniol o gymeriadau ar y sgrin, a gemau gydag amgodio yn dechrau. Nid yw bob amser yn bosibl gwneud hyn yn gyflym, ac weithiau gellir agor y ddogfen ofynnol mewn hanner blwyddyn, neu hyd yn oed yn ddiweddarach. Mae pobl sy'n aml yn cyfnewid gwybodaeth yn creu tablau trosi drostynt eu hunain. Ac yma mae gwaith arnynt yn datgelu manylion diddorol: mae angen eu creu mewn dwy gyfeiriad: "oddi wrth fy nghefn chi" ac yn ôl. Er mwyn gwrthdroi cyfrifiadau na all y peiriant, ar ei gyfer yn y golofn dde, cod ffynhonnell, ac yn y golofn chwith - canlyniad, ond mewn unrhyw ffordd i'r gwrthwyneb. Pe bai angen defnyddio unrhyw gymeriadau arbennig yn y ddogfen, roedd angen eu hychwanegu'n gyntaf, ac yna eglurodd i'r partner yr hyn yr oedd angen iddo ei wneud fel na fyddai'r cymeriadau hyn yn troi'n "karkozyabry." A pheidiwch ag anghofio bod rhaid i ni ddatblygu neu weithredu ein ffontiau ein hunain ar gyfer pob amgodiad, a arweiniodd at greu nifer fawr o ddyblygiadau yn yr AO.

Dychmygwch hefyd ar y dudalen ffont y gwelwch 10 darn o Times New Roman yn union yr un fath â nodiadau bach: ar gyfer UTF-8, UTF-16, ANSI, UCS-2. Nawr a ydych chi'n deall bod datblygu safon gyffredinol yn angenrheidrwydd brys?

"Dadau-crewyr"

Dylid chwilio am darddiad creu Unicode yn 1987, pan ddechreuodd Joe Becker o Xerox, ynghyd â Lee Collins a Mark Davis o Apple, ymchwil i greu set gymeriad cyffredinol yn ymarferol. Ym mis Awst 1988, cyhoeddodd Joe Becker gynnig drafft ar gyfer creu system gôdio amlieithog rhyngwladol 16-bit.

Ychydig fisoedd yn ddiweddarach, ehangwyd y gweithgor Unicode i gynnwys Ken Whistler a Mike Kernegan o RLG, Glenn Wright o Sun Microsystems a sawl arbenigwr arall, a oedd yn caniatáu cwblhau'r gwaith ar ffurfiad rhagarweiniol o safon codio unedig.

Disgrifiad cyffredinol

Mae unicode wedi'i seilio ar gysyniad symbol. Drwy'r diffiniad hwn, rydym yn golygu ffenomen haniaethol sy'n bodoli mewn ffurf goncrid o ysgrifennu ac fe'i gwireddir trwy graphemes (ei "bortreadau"). Mae pob cymeriad wedi'i osod yn Unicode gan god unigryw sy'n perthyn i bloc penodol o'r safon. Er enghraifft, mae grapheme B mewn albablau Saesneg a Rwsia, ond yn Unicode mae'n cyfateb i 2 gymeriad gwahanol. Maent yn cael eu trosi i lythyr isaf, hynny yw, mae pob un ohonynt yn cael ei ddisgrifio gan allwedd cronfa ddata, set o eiddo, ac enw llawn.

Manteision Unicode

O gyfoeswyr eraill, nodweddwyd codiad Unicode gan warchodfa enfawr o gymeriadau ar gyfer cymeriadau "amgryptio". Y ffaith yw bod gan ei ragflaenwyr 8 bit, hynny yw, roeddent yn cefnogi 28 o gymeriadau, ond roedd gan y datblygiad newydd 216 o gymeriadau, a oedd yn gam mawr ymlaen. Caniataodd hyn amgodio bron yr holl albabau presennol a dosbarthwyd.

Gyda dyfodiad Unicode, nid oedd angen defnyddio tablau trosi: fel un safon, dim ond ei angen oedd yn nullio. Yn yr un modd, "krakozyabry" - roedd y safon sengl yn eu gwneud yn amhosib, yn ogystal â chael gwared ar yr angen i greu ffontiau dyblyg.

Datblygiad unicode

Wrth gwrs, nid yw'r cynnydd yn dal i fod yn dal i fod, ac mae 25 mlynedd wedi mynd heibio ers y cyflwyniad cyntaf. Fodd bynnag, mae amgodio Unicode yn cynnal ei sefyllfa yn y byd yn ystyfnig. Mewn sawl ffordd, daeth hyn yn bosibl oherwydd y ffaith ei fod yn cael ei weithredu a'i lledaenu'n hawdd, gan ei fod yn cael ei gydnabod gan ddatblygwyr meddalwedd perchnogol (cyflogedig) a ffynhonnell agored.

Ar yr un pryd, ni ddylem dybio bod gennym heddiw yr un amgodiad Unicode ers chwarter canrif yn ôl. Ar hyn o bryd, newidiodd ei fersiwn i 5.x.x, a chynyddodd nifer y cymeriadau amgodio i 231. O'r posibilrwydd o ddefnyddio stoc fwy o gymeriadau, gwrthododd dal i gynnal cefnogaeth ar gyfer Unicode-16 (amgodio lle roedd yr uchafswm yn gyfyngedig i 216). Ers ei sefydlu ac hyd at fersiwn 2.0.0, mae "Unicode-standard" wedi cynyddu nifer y cymeriadau y mae'n eu cynnwys, bron i 2 waith. Parhaodd twf cyfleoedd yn ystod y blynyddoedd canlynol. I fersiwn 4.0.0, roedd angen cynyddu'r safon ei hun yn barod, a wnaed. O ganlyniad, mae Unicode wedi caffael y ffurflen yr ydym yn ei wybod heddiw.

Beth arall sydd yn Unicode?

Yn ogystal â'r nifer enfawr o gynyddol o gymeriadau, mae un -codio gwybodaeth destunol yn un nodwedd fwy defnyddiol. Yr ydym yn sôn am y normalization a elwir yn hyn. Yn hytrach na sgrolio drwy'r symbol dogfen gyfan yn ôl cymeriad ac yn disodli'r eiconau cyfatebol o'r bwrdd cyfatebol, defnyddir un o'r algorithmau normaleiddio presennol. Beth ydym ni'n ei olygu?

Yn hytrach na gwario adnoddau cyfrifiadurol ar wirio yn rheolaidd yr un symbol, a all fod yn debyg mewn gwahanol alfablau, defnyddir algorithm arbennig. Mae'n eich galluogi i gymryd cymeriadau tebyg mewn graff ar wahân o'r tabl chwilio a chyfeirio atynt eisoes, ac nid gwirio'r holl ddata dro ar ôl tro.

Mae pedair algorithm o'r fath wedi eu datblygu a'u gweithredu. Ym mhob un ohonynt, mae'r trawsnewid yn digwydd yn unol ag egwyddor a ddiffiniwyd yn llym, sy'n wahanol i'r lleill, felly nid yw'n bosibl enwi un o'r rhai mwyaf effeithiol. Datblygwyd pob un ar gyfer anghenion penodol, ei gyflwyno a'i ddefnyddio'n llwyddiannus.

Lledaeniad y safon

Am 25 mlynedd o'i hanes, mae'n debyg y bydd amgodio Unicode wedi derbyn y dosbarthiad mwyaf yn y byd. O dan y safon hon, mae rhaglenni a thudalennau gwe hefyd wedi'u haddasu. Gellir dweud ehangder y cais gan y ffaith bod Unicode heddiw yn defnyddio mwy na 60% o adnoddau Rhyngrwyd.

Nawr rydych chi'n gwybod pryd ymddangosodd y safon "Unicode". Beth ydyw, rydych hefyd yn gwybod a bydd yn gallu gwerthfawrogi gwerth cyfan y dyfais a wnaed gan grŵp o arbenigwyr o Unicode Inc. Dros 25 mlynedd yn ôl.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 cy.birmiss.com. Theme powered by WordPress.