Unicode: Bak gardinen
Unicode -konsortiet feiret 25 -årsjubileum i fjor. Sannheten er at til tross for alt arbeidet Unicode gjør for å sikre tekst fra språk rundt om i verden – de fleste av oss kjenner Unicode som gruppen som godkjenner nye emojier.
Det som kanskje ikke er så tydelig, er hvorfor et stort konsortium er nødvendig, eller den skjulte kompleksiteten til Unicode. Eller hvordan oppkast emojiene som er vist i XCKD -tegneserien ovenfor, er allerede ansett som «gyldige (men ikke anbefalt)».
Mark Davi den.
Davis bemerker at emojier utgjør bare en brøkdel av det totale antallet tegn i Unicode -standarden. Du kan knapt lage dem i dette diagrammet:
Karakterer alene forteller ikke halve historien. En rekke glyfer må kombinere når de vises i visse ordrer eller kombinasjoner.
En kombinasjon som vil være kjent for mange er hvordan emoji -hudtoner implementeres.
Disse fungerer ved å oppdage når en modifiserende karakter vises etter menneskelig emoji, for eksempel 👧 jente. Disse kombinerer på støttede plattformer for å vise en enkelt emoji:
En mer komplisert implementering innebærer å bli med to eller flere emojier sammen i det som kalles en emoji ZWJ -sekvens.
Disse brukes til å lage yrker som 👩⚖ 👩⚖ kvinnedommer. Denne emojiene er opprettet ved hjelp av 👩 👩 👩 👩 👩 👩 👩 👩 ⚖ ⚖ balanse skala emojier i rekkefølge.
En «ZWJ» (null bredde -snekker) karakter står mellom disse to emojiene, og er et usynlig lim som blir med flere emojier i en (der de støttes).
Andre typer ZWJ -sekvenser viser en eksisterende emoji som 🕵 Detektiv med et kjønnssymbol ♀ kvinnelig tegn lagt til etter det.
Denne typen ZWJ -sekvens brukes vanligvis hvis en emoji allerede eksisterer. For eksempel: løper, surfer eller mange av gestene.
Og ja, du kan kombinere modifikatorer og ZWJ -er for å lage en lengre sekvens.
Unicode kontrollerer ikke ZWJ -sekvenser på samme måte som nye emojier som krever sitt eget kodepunkt.
Unicode anbefalte sekvenser som bør støttes for konsistens på tvers av plattformer. Imidlertid står leverandører fritt til å kombinere alle emojier med andre, slik de synes passer.
Microsoft har seks ninja -katter tilgjengelig i Windows som ikke er en del av Unicodes anbefalte liste. 🐱 Katt ansikt og 🚀 rakett er kombinert på Windows 10 for å vise en emoji for 🐱🚀 astro katt.
Astro Cat er gyldig (som den bruker en riktig sekvensstruktur), men anbefales ikke som andre yrker og kjønn.
XKCD antydet at oppkast skulle være en modifiserende karakter for å lage en «oppkast cowboy».
Davis påpeker at 🤠 Cowboy Hat Face allerede kunne kombineres med 🤮 ansiktsoppkast for å lage en gyldig ZWJ -sekvens:
Andre sekvenstyper finnes for emoji, inkludert flaggsekvenser, tag -sekvenser og nøkkelkapsekvenser. Du bør sjekke ut hele settet med lysbilder for å se disse mer detaljert.
Til slutt, en titt på (Current, 2017) tidslinjen for hvordan en ny emoji er født:
🚨 Oppdater april 2020: Den nåværende tidslinjen for hvordan en ny emoji er skapt har blitt betydelig påvirket av Covid-19-pandemien. Du kan lese mer om den reviderte planen for 2020 og utover her.
Selvfølgelig har Unicode fortsatt mye å gjøre utenfor Emoji -støtte:
«Det er omtrent 7000 levende menneskelige språk, med varierende nivåer av vitalitet. Mindre enn 100 av disse språkene er godt støttet på datamaskiner, mobiltelefoner og andre enheter, mens all resten risikerer å bli digitalt vanskeligstilte»
Unicode har et adoptere et karakterprogram. Midler hentet fra adopsjoner går mot forskning for å støtte disse digitalt vanskeligstilte språkene.
Mer:
Unicode Emoji av Mark Davis
Unicode vedtar en karakter
Nye emojier for 2017
Morsomme emoji -hacks
Search Emojis: