Wp/nod/ᨲ᩠ᩅᩫᨾᩮᩬᩥᨦ
RichardW57 (talk | contribs) ᨧᩢᨸᩮ᩠ᨶ Wp/nod/ᨲ᩠ᩅᩫᨾᩮᩬᩥᨦ |
(No difference)
|
Revision as of 16:08, 13 May 2018
Template:For {{en:Infobox Writing system |name=Tai Tham |time = c. 1300–present |languages=Northern Thai, Tai Lü, Khün, Blang |fam1=Proto-Sinaitic alphabet |fam2=Phoenician alphabet |fam3=Aramaic alphabet |fam4=Brāhmī |fam5=Pallava |fam6=Mon |children=New Tai Lue |type=Abugida |unicode=U+1A20–U+1AAF |iso15924=Lana |sample=Tai Tham script sample.png |imagesize = 150px }}
Template:Infobox Writing system
The Tai Tham script, Lanna script (Template:Lang-th) or Tua Mueang (Template:Lang-nod, Template:IPA-nod Template:Audio, Template:Lang-khb, Tham, "scripture"), is used for three living languages: Northern Thai (that is, Kham Mueang), Tai Lü and Khün. In addition, the Lanna script is used for Lao Tham (or old Lao) and other dialect variants in Buddhist palm leaves and notebooks. The script is also known as Tham or Yuan script.
The Northern Thai language is a close relative of Thai and member of the Chiang Saeng language family. It is spoken by nearly 6,000,000 people in Northern Thailand and several thousand in Laos of whom few are literate in Lanna script. The script is still read by older monks. Northern Thai has six linguistic tones and Thai only five, making transcription into the Thai alphabet problematic. There is some resurgent interest in the script among younger people, but an added complication is that the modern spoken form, called Kammuang, differs in pronunciation from the older form.[1] There are 670,000 speakers of Tai Lü of whom those born before 1950 are literate in Tham, also known as Old Tai Lue.Template:Citation needed The script has also continued to be taught in the monasteries. The New Tai Lue script is derived from Tham. There are 120,000 speakers of Khün for which Lanna is the only script.
[[ไฟล์:Lanna cm2.jpg|thumb|250px|ป้ายชื่อวัดหม้อคำตวง ตำบลศรีภูมิ อำเภอเมืองเชียงใหม่ จังหวัดเชียงใหม่ เขียนด้วยอักษรธรรมล้านนา
ถอดเป็นอักษรไทย: "วัดหฺมฺ้อฅำทฺวง์"
คำอ่าน: "วัดหม้อคำตวง"]]
อักษรธรรมล้านนา หรือ ตัวเมือง (Template:Lang-nod อักขรธัมม์ล้านนา รฤ ตัวเมือง; Template:Lang-khb, ธรรม, "คัมภีร์") หรือ อักษรยวน ภาษาไทยกลางในอดีตเรียกว่า ไทยเฉียง[2] เป็นอักษรที่ใช้ในสามภาษา ได้แก่ ภาษาไทยถิ่นเหนือ, ภาษาไทลื้อและภาษาเขิน นอกเหนือจากนี้ อักษรล้านนายังใช้กับลาวธรรม (หรือลาวเก่า) และภาษาถิ่นอื่นในคัมภีร์ใบลานพุทธและสมุดบันทึก อักษรนี้ยังเรียก อักษรธรรมหรืออักษรยวน
ภาษาไทยถิ่นเหนือเป็นภาษาใกล้ชิดกับภาษาไทยและเป็นสมาชิกของตระกูลภาษาเชียงแสน มีผู้พูดเกือบ 6,000,000 คนในภาคเหนือของประเทศไทย และหลายพันคนในประเทศลาว ซึ่งมีจำนวนน้อยที่รู้อักษรล้านนา อักษรนี้ยังใช้อยู่ในพระสงฆ์อายุมาก ภาษาไทยถิ่นเหนือมีหกวรรณยุกต์ ขณะที่ภาษาไทยมีห้าวรรณยุกต์ ทำให้การถอดเสียงเป็นอักษรไทยมีปัญหา มีความสนใจในอักษรล้านนาขึ้นมาอีกบ้างในหมู่คนหนุ่มสาว แต่ความยุ่งยากเพิ่มขึ้น คือ แบบภาษาพูดสมัยใหม่ ที่เรียก คำเมือง ออกเสียงต่างจากแบบเก่า[1]
Consonants
Consonants are divided into two groups: main consonants (พยัญชนะหลัก) and added consonants (พยัญชนะเติม). There are 33 main consonants, and there are 15 added consonants. The main consonants are those from Pali. The main consonant group is further divided into two groups: categorized (พยัญชนะวัคค์, vagga) and uncategorized consonants (พยัญชนะอวัคค์, avagga). There are 25 categorized consonants, and there are 8 uncategorized consonants. The added consonant group consists of consonants that have been added to write Tai sounds that do not occur in Pali.
Categorized | |||||||
---|---|---|---|---|---|---|---|
Obstruents | Nasals | ||||||
main | added | main | added | main | added | main | |
kǎ /k/ hiɡh |
khǎ /x/ hiɡh |
khǎ /x/ hiɡh |
ka᷇ /k/ low |
kha᷇ /x/ low |
kha᷇ /x/ low |
nga᷇ /ŋ/ low | |
chǎ /t͡ɕ/ hiɡh |
sǎ /s/ hiɡh |
cha᷇ /t͡ɕ/ low |
sa᷇ /s/ low |
, sa᷇ /s/ low |
nya᷇ /ɲ/ low | ||
la tǎ /t/ hiɡh |
, la thǎ /tʰ/ hiɡh |
da᷇ /d/ mid |
la tha᷇ /tʰ/ low |
la na᷇ /n/ low | |||
tǎ /t/ hiɡh |
thǎ /tʰ/ hiɡh |
ta᷇ /t/ low |
tha᷇ /tʰ/ low |
na᷇ /n/ low | |||
bǎ /b/ mid |
pǎ /p/ hiɡh |
phǎ /pʰ/ hiɡh |
fǎ /f/ hiɡh |
pa᷇ /p/ low |
fa᷇ /f/ low |
pha᷇ /pʰ/ low |
ma᷇ /m/ low |
Uncategorized | |||||||
nya᷇ /ɲ/ low |
yá /j/ mid |
ha᷇ /h/ low |
la᷇ /l/ low |
wa᷇ /w/ low |
|||
sǎ /s/ hiɡh |
sǎ /s/ hiɡh |
sǎ /s/ hiɡh |
|||||
hǎ /h/ hiɡh |
la᷇ /l/ low |
, ǎ /ʔ/ mid |
ha᷇ /h/ low |
, lāe /lɛ̄ː/ |
nā /nāː/ |
sǒr sǒnɡ ho᷇nɡ /sɔ̌ː sɔ̌ːŋ hɔ᷇ːŋ/ |
nya᷇ nya᷇ /ɲa᷇ʔ ɲa᷇ʔ/ |
ra rōnɡ /la᷇.hōːŋ/ |
lu᷇e /lɯ᷇ʔ/ |
lūe /lɯ̄ː/ |
พยัญชนะ
อักษรธรรมล้านนาจัดตามกลุ่มพยัญชนะวรรคตามพยัญชนะภาษาบาลี แบ่งออกเป็น 5 วรรค วรรคละ 5 ตัว เรียกว่า“พยัญชนะวรรค”หรือ“พยัญชนะในวรรค”อีก 8 ตัวไม่จัดอยู่ในวรรคเรียกว่า“พยัญชนะอวรรค”หรือ“พยัญชนะนอกวรรค”หรือ“พยัญชนะเศษวรรค”ส่วนการอ่านออกเสียงเรียกพยัญชนะทั้งหมดนั้น จะเรียกว่า“ตั๋ว”เช่น ตั๋ว กะ/ก/ ตั๋ว ขะ/ข/ ตั๋ว จะ/จ/ เป็นต้น
พยัญชนะปกติ
อักษรไทยที่ปรากฏเป็นการถ่ายอักษรเท่านั้น เสียงจริงของอักษรแสดงไว้ในสัทอักษรสากล ซึ่งอาจจะออกเสียงต่างไปจากอักษรไทย
วัคค์ (วรรค) | |||||||||
---|---|---|---|---|---|---|---|---|---|
ประเภท | อนาสิก | นาสิก | |||||||
หมวด | หลัก | เติม | หลัก | เติม | หลัก | เติม | หลัก | ||
ก วัคค์ | รูป | 20pxᨠ | 20pxᨡ | 20pxᨢ | 20pxᨣ | 20pxᨤ | 20pxᨥ | 20pxᨦ | |
ชื่อ | ก๋ะ | ข๋ะ | ข๋ะ (ฃ๋ะ) | ก๊ะ | คะ (ฅะ) | คะ (ฆะ) | งะ | ||
ถอดอักษร | ก | ข | ฃ | ค | ฅ | ฆ | ง | ||
สัทอักษร | /káʔ/ | /xáʔ/ | /xáʔ/ | /ka᷇ʔ/ | /xa᷇ʔ/ | /xa᷇ʔ/ | /ŋa᷇ʔ/ | ||
อักษร | สูง | สูง | ต่ำ | ||||||
จ วัคค์ | รูป | 20pxᨧ | 20pxᨨ | 20pxᨩ | 20pxᨪ | 20px,20px | 20pxᨬ | ||
ชื่อ | จ๋ะ | ส๋ะ (ฉ๋ะ) | จ๊ะ | ซะ | ซะ (ฌะ) | ญะ | |||
ถอดอักษร | จ | ฉ | ช | ซ | ฌ | ญ | |||
สัทอักษร | /t͡ɕáʔ/ | /sáʔ/ | /t͡ɕa᷇ʔ/ | /sa᷇ʔ/ | /sa᷇ʔ/ | /ɲa᷇ʔ/ | |||
อักษร | สูง | สูง | ต่ำ | ||||||
ฏ วัคค์ | รูป | 20pxᨭ | 20px,20pxᨮ | 20pxᨯ | 20pxᨰ | 20pxᨱ | |||
ชื่อ | หละต๋ะ (หละฏ๋ะ) | หละถ๋ะ (หละฐ๋ะ) | ด๋ะ | หละทะ (หละฒะ) | หละนะ (หละณะ) | ||||
ถอดอักษร | ฏ | ฐ | ฑ,ฎ,ด | ฒ | ณ | ||||
สัทอักษร | /lə.táʔ/ | /lə.tʰáʔ/ | /dáʔ/ | /lə.tʰa᷇ʔ/ | /lə.na᷇ʔ/ | ||||
อักษร | สูง | สูง | กลาง | ต่ำ | |||||
ต วัคค์ | รูป | 20pxᨲ | 20pxᨳ | 20pxᨴ | 20pxᨵ | 20pxᨶ | |||
ชื่อ | ต๋ะ | ถ๋ะ | ต๊ะ | ทะ (ธะ) | นะ | ||||
ถอดอักษร | ต | ถ | ท | ธ | น | ||||
สัทอักษร | /táʔ/ | /tʰáʔ/ | /ta᷇ʔ/ | /tʰa᷇ʔ/ | /na᷇ʔ/ | ||||
อักษร | สูง | สูง | ต่ำ | ต่ำ | |||||
ป วัคค์ | รูป | 20pxᨷ | 20pxᨸ | 20pxᨹ | 20pxᨺ | 20px
ᨻ |
20pxᨼ | 20pxᨽ | 20pxᨾ |
ชื่อ | บ๋ะ | ป๋ะ | ผ๋ะ | ฝ๋ะ | ป๊ะ | ฟะ | พะ (ภะ) | มะ | |
ถอดอักษร | บ | ป | ผ | ฝ | พ | ฟ | ภ | ม | |
สัทอักษร | /báʔ/ | /páʔ/ | /pʰáʔ/ | /fáʔ/ | /pa᷇ʔ/ | /fa᷇ʔ/ | /pʰa᷇ʔ/ | /ma᷇ʔ/ | |
อักษร | กลาง | สูง | ต่ำ | ||||||
อวัคค์ (เศษวรรค) | |||||||||
หมวด | หลัก | เติม | หลัก | เติม | หลัก | เติม | หลัก | ||
อวัคค์ | รูป | 20px ᨿ | 20px ᩀ | 20pxᩁ | 20pxᩃ | 20pxᩅ | |||
ชื่อ | ญะ (ย) | อย๋ะ | ละ, ฮะ (ระ) | ละ | วะ | ||||
ถอดอักษร | ย | อย | ร | ล | ว | ||||
สัทอักษร | /ɲa᷇ʔ/ | /jáʔ/ | /ra᷇ʔ/,/la᷇ʔ/,/ha᷇ʔ/ | /la᷇ʔ/ | /wa᷇ʔ/ | ||||
อักษร | ต่ำ | กลาง | ต่ำ | ต่ำ | ต่ำ | ||||
รูป | 20pxᩆ | 20px ᩇ | 20pxᩈ | ||||||
ชื่อ | ส๋ะ (ศ๋ะ) | ส๋ะ (ษ๋ะ) | ส๋ะ | ||||||
ถอดอักษร | ศ | ษ | ส | ||||||
สัทอักษร | /sáʔ/ | /sáʔ/ | /sáʔ/ | ||||||
อักษร | สูง | สูง | สูง | ||||||
รูป | 20px ᩉ | 20px ᩊ | 20px,20px ᩋ | 20pxᩌ | |||||
ชื่อ | ห๋ะ | ละ (ฬะ) | อ๋ะ | ฮะ | |||||
ถอดอักษร | ห | ฬ | อ | ฮ | |||||
สัทอักษร | /háʔ/ | /la᷇ʔ/ | /ʔáʔ/ | /ha᷇ʔ/ | |||||
อักษร | สูง | ต่ำ | กลาง | ต่ำ |
พยัญชนะซ้อน(พยัญชนะหาง)
พยัญชนะซ้อน (ตัวซ้อน) เป็นพยัญชนะที่ใส่ไว้ใต้พยัญชนะตัวอื่นเพื่อทำหน้าที่อย่างใดอย่างหนึ่งดังนี้ คือ 1. เพื่อห้ามไม่ให้พยัญชนะที่ไปซ้อน (ตัวข่ม) ออกเสียงสระอะ หรือ 2. เพื่อทำหน้าที่เป็นตัวสะกด ซึ่งพยัญชนะที่ล้านนารับมาจากภาษาอื่นตั้งแต่แรกจะมีรูปพยัญชนะซ้อนทุกตัว ยกเว้น 15px กับ 15px เท่านั้นที่ไม่มี พยัญชนะที่มีรูปพยัญชนะซ้อนมีดังต่อไปนี้
พยัญชนะนอกเหนือจากนี้ ซึ่งได้แก่ 150px เป็นพยัญชนะที่ล้านนาประดิษฐ์ขึ้นมาเอง ดังนั้นจึงไม่มีรูปพยัญชนะซ้อน แต่อย่างไรก็ตามเพื่อให้สามารถเขียนคำที่มาจากภาษาต่างประเทศได้ใกล้เคียงกับภาษาเดิมมากที่สุด จึงสมควรมีการประดิษฐ์รูปพยัญชนะซ้อนของ 15px 15px และ 15px ขึ้นมาเพิ่มเติม
พยัญชนะพิเศษ(เฉพาะ)
รูป | 20px ᩍ | 25px
ᩎ |
20pxᩏ | 25pxᩐ | 20pxᩑ | 20pxᩂ | 20px ᩄ |
ชื่อ | อิ๋ แบบบาลี | อี แบบบาลี | อุ๋ แบบบาลี | อู แบบบาลี | เอ แบบบาลี | ลึ | ลือ |
ถอดอักษร | อิ | อี | อุ | อู | เอ | ฤ,ฤๅ (ฤๅ) | ฦ |
สัทอักษร | /íʔ/ | /īː/ | /úʔ/ | /ūː/ | /ēː/ | lɯ᷇ʔ | /lɯ̄ː/ |
รูป | 20px | 30pxᩓ | 20pxᨶᩣ | 30pxᨬ᩠ᨬ | 30pxᩔ | 30px ᩕ | |
ชื่อ | แล | แล แบบไทลื้อ | นา | ญะญะ | ส สองห้อง | ระโฮง | |
ถอดอักษร | แล/และ | นา | ญฺญ | สฺส | ร (ควบกล้ำ) | ||
สัทอักษร | /lɛ̄ː/ | /nāː/ | /n.ɲ/ | /t.s/, /s.s/, /sː/ | /r/, /l/, /ʰ/ |
Vowels
Vowels are written at various locations around their consonant, like Thai.[3] There are special letters for initial vowels, and many vowel combinations.
Pali vowels
Tai Tham | - | - | ||||||
Template:Script | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script,Template:Script, Template:Script | |
IPA | /ʔáʔ/ | /ʔāː/ | /ʔíʔ/ | /ʔīː/ | /ʔúʔ/ | /ʔūː/ | /ʔēː/ | /ʔōː/ |
สระ
สระจม
เป็นสระที่ไม่สามารถออกเสียงได้ด้วยตัวเอง ต้องนำไปผสมกับพยัญชนะก่อนจึงจะสามารถออกเสียงได้เลย ไฟล์:lannachart2.jpg
สระลอย
เป็นสระที่มาจากภาษาบาลี สามารถออกเสียงได้ด้วยตัวเองไม่จำเป็นต้องนำไปผสมกับพยัญชนะก่อน แต่บางครั้งก็มีการนำไปผสมกับพยัญชนะหรือสระแท้ เช่น คำว่า "เอา" สามารถเขียนได้โดยเขียนสระจากภาษาบาลี 'อู' ตามด้วย สระแท้ 'า' คือ ᩐᩣ ไฟล์:lanna_aau.jpg
Tonal markers
mai yo /máj.jɔ́ʔ/ |
mai kho chang /máj.xɔ̌ː.t͡ɕáːŋ/ |
วรรณยุกต์
เนื่องจากล้านนาได้นำเอาระบบอักขรวิธีของมอญมาใช้โดยแทบจะไม่มีการปรับเปลี่ยนเลย และภาษามอญเองก็เป็นภาษาที่ไม่มีวรรณยุกต์ ดังนั้นในอดีตจึงไม่ปรากฏว่ามีการใช้เครื่องหมายวรรณยุกต์ในการเขียนอักษรธรรมล้านนาเลย (เคยมีการถกเถียงกันเรื่องชื่อของล้านนาว่าจริงๆแล้วชื่อ "ล้านนา" หรือ "ลานนา" กันแน่ แต่ในที่สุดก็ได้ข้อสรุปว่า "ล้านนา") จนกระทั่งในระยะหลังเมื่ออิทธิพลของสยามแผ่เข้าไปในล้านนาจึงปรากฏการใช้รูปวรรณยุกต์ในการเขียนอักษรธรรมล้านนา
รูป | 20px᩵ | 40px᩶ |
ชื่อ | ไม้เยาะ | ไม้ขอจ๊าง |
ถอดอักษรชื่อ | ไม้เหยาะ | ไม้ขอช้าง |
ถอดอักษรรูป | ่ | ้ |
สัทอักษร | /máj.jɔ́ʔ/ | /máj.xɔ̌ː.t͡ɕáːŋ/ |
ภาษาไทยถิ่นเหนือสามารถผันได้ 6 เสียง (จริงๆแล้วมีทั้งหมด 7 หรือ 8 เสียง แต่ในแต่ละท้องถิ่นจะใช้เพียง 6 เสียงเท่านั้น) การผันจะใช้การจับคู่กันระหว่างอักษรสูงกับอักษรต่ำจึงทำให้ต้องใช้วรรณยุกต์เพียง 2 รูปเท่านั้น คือ เอก กับ โท (เทียบภาษาไทยกลาง) เช่น
ไฟล์:lannachart4.jpg
การที่มีรูปวรรณยุกต์เพียง 2 รูปนี้ทำให้เกิดปัญหากับอักษรกลาง คือ ไม่สามารถแทนเสียงได้ครบทั้ง 6 เสียง ดังนั้นจึงอาจอนุโลมให้แต่ละรูปศัพท์แทนการออกเสียงได้ 2 เสียง
เสียงวรรณยุกต์สำเนียงเชียงใหม่มี 6 เสียง คือ เสียงจัตวา, เสียงเอก, เสียงโทพิเศษ, เสียงสามัญ, เสียงโท, และเสียงตรี[4]
เสียงวรรณยุกต์ | ตัวอย่าง | การถอดรหัสเสียง | การออกเสียง | ความหมายในภาษาไทย |
---|---|---|---|---|
เสียงจัตวา | ขา | Template:IPA | Template:IPA | ขา |
เสียงเอก | ข่า | Template:IPA | Template:IPA | ข่า |
เสียงโทพิเศษ | ข้า | Template:IPA | Template:IPA | ฆ่า |
เสียงสามัญ | คา | Template:IPA | Template:IPA | หญ้าคา |
เสียงโท | ไฮ่ | Template:IPA | Template:IPA | ไร่ |
เสียงตรี | ฟ้า | Template:IPA | Template:IPA | ฟ้า |
การแสดงเสียงวรรณยุกต์
การแสดงเสียงวรรณยุกต์ของคำเมืองสำเนียงเชียงใหม่
เสียงวรรณยุกต์ | คำเป็น สระยาว | คำเป็น สระยาว ไม้เอก | คำเป็น สระยาว ไม้โท | คำตาย สระสั้น | คำตาย สระยาว |
---|---|---|---|---|---|
อักษรสูง | เสียงจัตวา | เสียงเอก | เสียงโทพิเศษ | เสียงจัตวา | เสียงเอก |
อักษรกลาง | เสียงสามัญ | เสียงเอก | เสียงโทพิเศษ | เสียงจัตวา | เสียงเอก |
อักษรต่ำ | เสียงสามัญ | เสียงโท | เสียงตรี | เสียงตรี | เสียงโท |
Tai Tham and Other Scripts
Categorized letters
Uncategorized letters
|
|
Numerals
Arabic numerals | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
---|---|---|---|---|---|---|---|---|---|---|
Hora digits | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script |
Tham digits | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script |
Thai numerals | ๐ | ๑ | ๒ | ๓ | ๔ | ๕ | ๖ | ๗ | ๘ | ๙ |
Lao numerals | ໐ | ໑ | ໒ | ໓ | ໔ | ໕ | ໖ | ໗ | ໘ | ໙ |
Burmese numerals | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script |
Khmer numerals | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script | Template:Script |
Sanskrit and Pali
Template:Brahmic The Tai Tham script (like all Indic scripts) uses a number of modifications to write Pali and related languages (in particular, Sanskrit). When writing Pali, only 33 consonants and 12 vowels are used.
Categorised (วัคค์ Template:Script Template:IAST)
class | unaspirated unvoiced สิถิลอโฆษะ |
aspirated ธนิตอโฆษะ |
unaspirated voiced สิถิลโฆษะ |
aspirated voiced ธนิตโฆษะ |
nasal นาสิก |
---|---|---|---|---|---|
velar | ká Template:IAST | khá Template:IAST | ka᷇ Template:IAST | kha᷇ Template:IAST | nga᷇ Template:IAST |
palatal | cá Template:IAST | sá Template:IAST | ca᷇ Template:IAST | sa᷇ Template:IAST | nya᷇ Template:IAST |
retroflex | tá Template:IAST | thá Template:IAST | da᷇ Template:IAST | tha᷇ Template:IAST | na᷇ Template:IAST |
dental | tá Template:IAST | thá Template:IAST | ta᷇ Template:IAST | tha᷇ Template:IAST | na᷇ Template:IAST |
labial | pá Template:IAST | phá Template:IAST | pa᷇ Template:IAST | pha᷇ Template:IAST | ma᷇ Template:IAST |
tone class | H | L |
Uncategorised (อวัคค์ Template:Script Template:IAST)
glottal | palatal | retroflex | dental | labial | tonal class |
---|---|---|---|---|---|
nya᷇ Template:IAST | ha᷇ Template:IAST | la᷇ Template:IAST | wa᷇ Template:IAST | L | |
sá Template:IAST | sá Template:IAST | sá Template:IAST | H | ||
há Template:IAST |
อักษรธรรมล้านนาในคอมพิวเตอร์
อักษรธรรมล้านนาได้รับการบรรจุลงในยูนิโคดตั้งแต่รุ่น 5.2 ดังนั้นเราจึงสามารถใช้อักษรธรรมล้านนาในคอมพิวเตอร์ได้โดยที่ไม่ต้องอาศัยช่วงรหัสของอักษรอื่นดังเช่นที่เคยทำกันในอดีตอีกต่อไป ระบบปฏิบัติการที่รองรับยูนิโคดอักษรธรรมล้านนาในตอนนี้ ได้แก่ Ubuntu 11.04 โดยอาศัยฟอนต์แบบโอเพ็นไทป์ (OpenType) ส่วนระบบปฏิบัติการ Windows นั้นยังไม่รองรับยูนิโคดอักษรธรรมล้านนา อย่างไรก็ตาม ถึงแม้ว่า Windows จะยังไม่รองรับยูนิโคดอักษรธรรมล้านนาแต่เราก็สามารถใช้ยูนิโคดอักษรธรรมล้านนาในเว็บเบราว์เซอร์ได้โดยใช้เว็บเบราว์เซอร์ Mozilla Firefox รุ่น 4.0 ขึ้นไป (อาศัยฟอนต์แบบโอเพ็นไทป์) นอกจากนี้แล้วยังสามารถใช้ยูนิโคดอักษรธรรมล้านนาในโปรแกรมสำนักงานได้โดยใช้โปรแกรม OpenOffice รุ่น 3.2 ขึ้นไป (อาศัยฟอนต์ที่มีตาราง Graphite) Template:ผังยูนิโคด ไทธรรม
Unicode
Tai Tham script was added to the Unicode Standard in October, 2009 with the release of version 5.2.
Block
The Unicode block for Tai Tham is U+1A20–U+1AAF:
Template:Unicode chart Tai Tham
Fonts
There are currently a few fonts that support this range. Thai people are used to typing the Thai script by placing a front vowel before a consonant; this might cause incorrect input method for Tai Tham script because the consonant must be always typed before the associated vowel, regardless of the relative written position of the vowel, similar to typing the Khmer, Myanmar or Tamil script.
- A Tai Tham KH New – 244 characters in version 1.000 September 15, 2016
- Ranges: Basic Latin (100); Tai Tham (144)
- OpenType layout tables: Default
- Family: Sans-serif
- Styles: Regular
- Availability: Free download[6]
- A Tai Tham KH – 239 characters in version 2.000 February 27, 2016
- Ranges: Basic Latin (95); Tai Tham (144)
- OpenType layout tables: Default
- Family: Sans-serif
- Styles: Regular
- Availability: Free download[6]
- Tai Tham LN – 244 characters in version 1.000 November 15, 2014
- Ranges: Basic Latin (100); Tai Tham (144)
- OpenType layout tables: Default
- Family: Sans-serif
- Styles: Regular
- Availability: Free download[6]
(The following links are from Alan Wood’s Unicode Resources,[7] which is no longer being maintained.[8])
- Chiangsaen Alif – 318 characters (376 glyphs) in version 1.00 February 24, 2010, initial release
- Ranges: Basic Latin (96); Tai Tham (127); Geometric Shapes (1)
- OpenType layout tables: Latin
- Family: Sans-serif
- Styles: Regular
- Availability: Free download[9]
- Lanna Alif – 318 characters (376 glyphs) in version 1.00 February 24, 2010, initial release
- Ranges: Basic Latin (96); Tai Tham (127); Geometric Shapes (1)
- OpenType layout tables: Latin
- Family: Sans-serif
- Styles: Regular
- Availability: Free download[9]
- Lanna Unicode UI – 374 characters (487 glyphs) in version 0.40 July 14, 2010
- Ranges: Basic Latin (25); Latin-1 Supplement (5); Greek and Coptic (1); Tai Tham (127); Mathematical Operators (1); Geometric Shapes (1)
- OpenType layout tables: Latin
- Family: Sans-serif
- Styles: Regular
- Availability: Free download[10]
- Alan Wood's Tai Tham test page[11]
References
- ↑ 1.0 1.1 Template:Cite book Cite error: Invalid
<ref>
tag; name "Natnapang" defined multiple times with different content - ↑ จิตร ภูมิศักดิ์. ความเป็นมาของคำสยาม, ไทย ลาว และขอม และลักษณะทางสังคมของชื่อชนชาติ. พิมพ์ครั้งที่ 6. กรุงเทพฯ:ชนนิยม. 2556, หน้า 139
- ↑ see examples of syllabic vowels in Ian James' rendition of Lanna, New Lanna at SkyKnowledge.com
- ↑ Gedney, William J., and Thomas J. Hudak. William J. Gedney's Tai Dialect Studies: Glossaries, Texts, and Translations. Ann Arbor, MI: Center for South and Southeast Asian Studies, The University of Michigan, 1997. Print.
- ↑ 5.0 5.1 In Tai Lue
- ↑ 6.0 6.1 6.2 Template:Cite web
- ↑ Template:Cite web
- ↑ Template:Cite web
- ↑ 9.0 9.1 Template:Cite web
- ↑ Template:Cite web
- ↑ Template:Cite web
อ้างอิง
Further reading
- Template:Cite web
- Template:Cite web
- Khamjan, Mala(มาลา คำจันทร์). Kham Mueang Dictionary(พจนานุกรมคำเมือง). Chiang Mai: bookworm, 2008. Template:ISBN.
- Owen, R. Wyn. 2017. A description and linguistic analysis of the Tai Khuen writing system. Journal of the Southeast Asian Linguistics Society 10.1, 140-164.
External links
- ISO/IEC 10646:2003/Amd.5:2008 Universal Multiple-Octet Coded Character Set (UCS) -- Amendment 5: AMENDMENT 5: Tai Tham, Tai Viet, Avestan, Egyptian Hieroglyphs, CJK Unified Ideographs Extension C, and other characters
แหล่งข้อมูลอื่น
- รูปและการออกเสียงของอักษรล้านนา Template:En icon
- สำนักส่งเสริมศิลปวัฒนธรรม มหาวิทยาลัยเชียงใหม่
- Download Font Lanna
Template:Writing systems
Template:List of writing systems
Template:อักษรพราหมี
Template:มรดกภูมิปัญญาชาติ/ภาษา
ลานนา
หมวดหมู่:อักษรในตระกูลอักษรพราหมี
หมวดหมู่:อาณาจักรล้านนา
ᩀᩪᨶᩥᨣᩰᩫ᩠ᨯ (ᩋᩢ᩠ᨦᨠᩕᩥ᩠ᩈ: Unicode) ᨯᩱ᩶ᨾᩣᨲᩕᨮᩣ᩠ᨶᩋᩫ᩠ᨲᩈᩣᩉᨠᩢᨾ᩠ᨾ᩺ᨴᩦ᩵ᨩ᩠ᩅ᩠᩵ᨿᩉᩨ᩶ᨤᩬᨾᨻᩥ᩠ᩅᨴᩮᩬᩥᩁ᩺ᩈᨯᩯ᩠ᨦᨹᩫ᩠ᩃᩓᨧᩢ᩠ᨯᨠᩣ᩠ᩁᨡᩬᩴ᩶ᨤ᩠ᩅᩣ᩠ᨾᨵᩢᨾ᩠ᨾᨯᩣᨴᩦ᩵ᨩᩲ᩶ᨶᩱᩁᨷ᩠ᨿᨷ ᨠᩣ᩠ᩁᨡ᩠ᨿᩁᨡᩬᨦᨽᩣᩈᩣᩈ᩠ᩅ᩵ᩁᩉ᩠ᨿᩲ᩵ᨶᩲᩃᩰᩫ᩠ᨠᨯᩰᩫ᩠ᨿᩀ᩵ᩣ᩠ᨦᨯ᩠ᨿᩅᨠᩢ᩠ᨶ ᩀᩪᨶᩥᨣᩰᩫ᩠ᨯᨷᩕᨠᩬᨷᨴ᩠ᩅ᩠ᨿᩁᩣ᩠ᨷᨠᩣ᩠ᩁᩋᨠ᩠ᨡᩁᨴᩦ᩵ᩈᨯᩯ᩠ᨦᨹᩫ᩠ᩃᨯᩱ᩶ᨾᩣ᩠ᨠᨠ᩠ᩅ᩵ᩣ 100,000 ᨲ᩠ᩅᩫ ᨻᩢᨯ᩠ᨰᨶᩣᨲᩬᩴ᩵ᨿᩬᨯᨾᩣᨧᩣ᩠ᨠᨾᩣᨲᩕᨮᩣ᩠ᨶᩉ᩠ᨾᩪ᩵ᩋᨠ᩠ᨡᩁᩈᩣᨠᩃ (Universal Character Set: UCS) ᩓᨠᩣ᩠ᩁᨲᩦᨻᩥᨾᩛ᩺ᩃᩫ᩠ᨦᨶᩲᩉ᩠ᨶᩢᨦᩈᩨ The Unicode Standard ᨸᩮ᩠ᨶᨹᩯ᩠ᨶᨹᩢ᩠ᨦᩁᩉᩢ᩠ᩈᨻᩮᩬᩥ᩵ᩋᨩᩲ᩶ᨸᩮ᩠ᨶᩁᩣ᩠ᨿᨠᩣ᩠ᩁᩋ᩶ᩣ᩠ᨦᩋᩥ᩠ᨦ ᨶᩬᨠᨧᩣ᩠ᨠᨶᩢ᩠᩶ᨶᨿᩢ᩠ᨦᨾᩦᨠᩣ᩠ᩁᩋᨵᩥᨷᩤ᩠ᨿᩅᩥᨵᩦᨠᩣ᩠ᩁᨴᩦ᩵ᨩᩲ᩶ᨡᩮᩢ᩶ᩣᩁᩉᩢ᩠ᩈᩓᨠᩣ᩠ᩁᨶᩣᩴᩈ᩠ᨶ᩻ᩮᩬᩥᨾᩣᨲᩕᨮᩣ᩠ᨶᨡᩬᨦᨠᩣ᩠ᩁᨡᩮᩢ᩶ᩣᩁᩉᩢ᩠ᩈᩋᨠ᩠ᨡᩁᩋᩦ᩠ᨠᨧᩣᩴᨶ᩠ᩅᩁᨶᩧ᩠᩵ᨦ ᨠᩣ᩠ᩁᩁ᩠ᨿᨦᩃᩣᩴᨯᩢ᩠ᨷᩋᨠ᩠ᨡᩁ ᨠᩫ᩠ᨯᨠᩮᨱ᩠ᨯ᩺ᨡᩬᨦᨠᩣ᩠ᨶᩁ᩠ᩅ᩵ᨾᩓᨠᩣ᩠ᩁᨿᩯ᩠ᨠᩋᨠ᩠ᨡᩁ ᩁ᩠ᩅ᩵ᨾᨻᩱᨳᩧ᩠ᨦᩃᩣᩴᨯᩢ᩠ᨷᨠᩣ᩠ᩁᩈᨯᩯ᩠ᨦᨹᩫ᩠ᩃᨡᩬᨦᩋᨠ᩠ᨡᩁᩈᩬᨦᨴᩥ᩠ᩈ (ᨩᩮ᩠᩵ᨶᩋᨠ᩠ᨡᩁᩋᩣᩉᩕᩢ᩠ᨷᩁᩂᩋᨠ᩠ᨡᩁᩌᩦᨷᩁᩪᨴᩦ᩵ᨡ᩠ᨿᩁᨧᩣ᩠ᨠᨡ᩠ᩅᩣᨻᩱᨪ᩶ᩣ᩠ᨿ)[1]
ᩀᩪᨶᩥᨣᩰᩫ᩠ᨯᨣᩬᨱᨪᩬᩴᩁ᩺ᨴ᩠ᨿᨾ (ᩋᩢ᩠ᨦᨠᩕᩥ᩠ᩈ: Unicode Consortium) ᨸᩮ᩠ᨶᩋᩫᨦ᩠ᨣ᩺ᨠᩬᩁᨷ᩵ᩈ᩠ᩅᩯᨦᩉᩣᨹᩫ᩠ᩃᨠᩣᩴᩁᩱ ᨸᩮ᩠ᨶᨹᩪ᩶ᩁᩢ᩠ᨷᨹᩥ᩠ᨯᨪᩬᨷᨶᩲᨠᩣ᩠ᩁᨻᩢᨯ᩠ᨰᨶᩣᩀᩪᨶᩥᨣᩰᩫ᩠ᨯ
ᨤ᩠ᩅᩣ᩠ᨾᩈᩣᩴᩁᩮᩢ᩠ᨧᨡᩬᨦᩀᩪᨶᩥᨣᩰᩫ᩠ᨯᨯᩱ᩶ᨠᩣ᩠ᩁᩁ᩠ᩅ᩵ᨾᩁᩉᩢ᩠ᩈᩋᨠ᩠ᨡᩁᩉᩖᩣ᩠ᨿᨩᨶᩥ᩠ᨯᩉᩨ᩶ᨸᩮ᩠ᨶᨶᩧ᩠᩵ᨦᨯ᩠ᨿᩅ ᨶᩣᩴᨻᩱᩈᩪ᩵ᨠᩣ᩠ᩁᨩᩲ᩶ᨦᩣ᩠ᨶᩀ᩵ᩣ᩠ᨦᨡ᩠ᩅᩣ᩠ᨦᩓᨾᩦᩍᨴ᩠ᨵᩥᨻᩫ᩠ᩃᨲᩬᩴ᩵ᨠᩣ᩠ᩁᨸᩖᩯᨽᩣᩈᩣᨡᩬᨦᨪᩬᨼ᩠ᨲ᩺ᩅᩯᩁ᩺ᨤᩬᨾᨻᩥ᩠ᩅᨴᩮᩬᩥᩁ᩺ ᩋᩢ᩠᩶ᨶᨯᩱ᩶ᨸᩕᩰᨠᩕᩯ᩠ᨾ[ᨣᩤᩴᨾᩮᩬᩥᨦᨠᩬᩴ᩵ ]ᨧᩢ᩠ᨠᩈᩣᨾᨲ᩠ᨳᨩᩲ᩶ᨯᩱ᩶ᩉᩖᩣ᩠ᨿᨽᩣᩈᩣ ᨾᩣᨲᩕᨮᩣ᩠ᨶᨶᩦ᩶ᨾᩦᨠᩣ᩠ᩁᨶᩣᩴᨻᩱᨩᩲ᩶ᨸᩮ᩠ᨶᨴᩮ᩠ᨣᨶᩰᩃᩰᨿᩦᩉᩖᩢᨠᩉᩖᩣ᩠ᨿᩀ᩵ᩣ᩠ᨦ ᩋᩣᨴᩥ XML ᨽᩣᩈᩣᨩᩅᩤ ᨯᩬᩢᨲᨶᩮᩢ᩠ᨲᨼᩕᩮ᩠ᨾᩅᩮᩥᩁ᩠᩺ᨠ ᩓᩁᨷ᩠ᨿᨷᨷᨭᩥᨷᨲ᩠ᨲᩥᨠᩣ᩠ᩁᩈ᩠ᨾ᩻ᩢ᩠ᨿᩉ᩠ᨾᩲ᩵
ᩀᩪᨶᩥᨣᩰᩫ᩠ᨯᩈᩣᨾᨲ᩠ᨳᨶᩣᩴᨻᩱᨩᩲ᩶ᨦᩣ᩠ᨶᨯᩱ᩶ᨴ᩠ᩅ᩠ᨿᩁᩉᩢ᩠ᩈᩋᨠ᩠ᨡᩁᨷᩯ᩠ᨷᨲ᩵ᩣ᩠ᨦᪧ ᩁᩉᩢ᩠ᩈᩋᨠ᩠ᨡᩁᨴᩦ᩵ᨸᩮ᩠ᨶᨴᩦ᩵ᩁᩪ᩶ᨧᩢ᩠ᨠᨴᩣ᩠ᨠᨴᩦ᩵ᩈᩩᨯᨯᩱ᩶ UTF-8 (ᨩᩲ᩶ 1 ᨷᩱᨲ᩺ᩈᩣᩴᩁᩢ᩠ᨷᩋᨠ᩠ᨡᩁᨴᩩᨠᨲ᩠ᩅᩫᨶᩲᩁᩉᩢ᩠ᩈᩋᩯ᩠ᩈᨠᩦᩓᨾᩦ᩵ᨣ᩵ᩤᩁᩉᩢ᩠ᩈᩉ᩠ᨾᩮᩬᩥᩁᨠᩢ᩠ᨷᨾᩣᨲᩕᨮᩣ᩠ᨶᩋᩯ᩠ᩈᨠᩦ ᩁᩂᨾᩣ᩠ᨠᨠ᩠ᩅ᩵ᩣᨶᩢ᩠᩶ᨶᨧᩫ᩠ᨶᨳᩧ᩠ᨦ 4 ᨷᩱᨲ᩺ᩈᩣᩴᩁᩢ᩠ᨷᩋᨠ᩠ᨡᩁᨷᩯ᩠ᨷᩋᩨ᩠᩵ᨶ) UCS-2 ᨪᩧ᩠᩵ᨦᨷᨧ᩠ᨧᩩᨷᨶ᩠ᨶᩃᩮᩥ᩠ᨠᨩᩲ᩶ᩓ᩠᩶ᩅ (ᨩᩲ᩶ 2 ᨷᩱᨲ᩺ᩈᩣᩴᩁᩢ᩠ᨷᩋᨠ᩠ᨡᩁᨴᩩᨠᨲ᩠ᩅᩫ ᨲᩯ᩵ᨷ᩵ᨣᩕᩬᨷᨣᩃᩩᨾᩋᨠ᩠ᨡᩁᨴᩘ᩠ᩃᩣ᩠ᨿᨶᩱᩀᩪᨶᩥᨣᩰᩫ᩠ᨯ) ᩓ UTF-16 (ᨸᩮ᩠ᨶᩈ᩠ᩅ᩵ᩁᨡ᩠ᨿ᩻ᩣ᩠ᨿ UCS-2 ᨯᩰᩫ᩠ᨿᨩᩲ᩶ 4 ᨷᩱᨲ᩺ᩈᩣᩴᩁᩢ᩠ᨷᨴᩯ᩠ᨶᩁᩉᩢ᩠ᩈᩋᨠ᩠ᨡᩁᨴᩦ᩵ᨡᩣ᩠ᨯᨻᩱᨡᩬᨦ UCS-2)
ᩁᩩ᩵ᩁᩀᩪᨶᩥᨣᩰᩫ᩠ᨯ
ᩁᩩ᩵ᩁ | ᩅᩢ᩠ᨶᨴᩦ᩵ | ᩉ᩠ᨶᩢᨦᩈᩨ | ᨣᩤᩴᩈᩬᨯᨣᩖᩬ᩶ᨦᨠᩢ᩠ᨷ ᩉ᩠ᨾᩪ᩵ᩋᨠ᩠ᨡᩁᩈᩣᨠᩃ (ISO/IEC 10646) |
ᩉ᩠ᨾᩪ᩵ᩋᨠ᩠ᨡᩁ | ᩋᨠ᩠ᨡᩁ | |
---|---|---|---|---|---|---|
ᨧᩣᩴᨶ᩠ᩅᩁ | ᨠᩣ᩠ᩁᨲᩮᩥ᩠᩵ᨾᨴᩦ᩵ᩈᩣᩴᨣᩢ᩠ᨬ | |||||
1.0.0 | ᨲᩩᩃᩣᨣᩫ᩠ᨾ ᨻᩩᨴ᩠ᨵᩈᨠ᩠ᨠᩁᩣ᩠ᨩ 2534 | ISBN 0-201-56788-1 (Vol.1) | 24 | 7,161 | ᨻᩬ᩵ᨦᨲᩫ᩠᩶ᨶᨴ᩠ᩅ᩠ᨿᨠᩢ᩠ᨷᩋᨠ᩠ᨡᩁᩉᩖᩮᩢ᩵ᩣᨶᩦ᩶: ᩋᩣᩉᩕᩢ᩠ᨷ, ᩋᩣᩁ᩺ᨾᩦᨶ᩠ᨿᩮ, ᨷᩮ᩠ᨦᨣᩣ᩠ᩃ, ᨻᩬᩴᨽᩬᩴᨾᩬᩴᨼᩬᩴ, ᨪᩦᩁᩥ᩠ᩃᩃᩥ᩠ᨠ, ᨴᩮᩅᨶᩣᨣᩕᩦ, ᨩᩬᩴᩁ᩠᩺ᨩ᩠ᨿᩮ, ᨠᩕᩦ᩠ᨠᨠᩢ᩠ᨷᨣᩬᨷᨴᩥ᩠ᨠ, ᨣᩩᨩᩁᩣ᩠ᨲ, ᨣᩩᩁ᩠ᨾᩩᨡᩦ, ᩌᩢᨱᨣᩧ᩠ᩃ, ᩌᩦᨷᩕᩪ, ᩌᩥᩁᨣᨶ, ᨣᩢ᩠ᨶᨶᩣᨯᩣ, ᨣᨴᨣᨶ, ᩃᩣ᩠ᩅ, ᩁᩰᨾᩢ᩠ᨶ, ᨾᩣᩃᩣᨿᩣᩃᩢ᩠ᨾ, ᩋᩰᨯ᩠ᨿᩮ[ᨣᩤᩴᨾᩮᩬᩥᨦᨠᩬᩴ᩵ ], ᨴᨾᩥᩊ, ᨴᩮᩃᩪᨣᩪ, ᨴᩱ᩠ᨿ ᩓᨴᩥᨷᩮ᩠ᨲ [2] | |
1.0.1 | ᨾᩥᨳᩩᨶᩣᨿᩫ᩠ᨶ ᨻᩩᨴ᩠ᨵᩈᨠ᩠ᨠᩁᩣ᩠ᨩ 2535 | ISBN 0-201-60845-6 (Vol.2) | 25 | 28,359 | ᨻᩬ᩵ᨦᨾᩦᩋᨠ᩠ᨡᩁᩁᩪᨷᩁ᩠ᩅ᩵ᨾᨧᩦ᩠ᨶᨬᩦ᩵ᨸᩩ᩵ᩁᨠᩮᩢᩣᩉᩖᩦ (CJK Unified Ideographs) 20,902 ᨲ᩠ᩅᩫ [3] | |
1.1 | ᨾᩥᨳᩩᨶᩣᨿᩫ᩠ᨶ ᨻᩩᨴ᩠ᨵᩈᨠ᩠ᨠᩁᩣ᩠ᨩ 2536 | ISO/IEC 10646-1:1993 | 24 | 34,233 | ᨲᩮᩥ᩠᩵ᨾᨻ᩠ᨿᩣᨦ᩠ᨣ᩺ᩌᩢᨱᨣᩧ᩠ᩃᩃᩫ᩠ᨦᨻᩱᩋᩦ᩠ᨠ 4,306 ตัว ᨧᩣ᩠ᨠᩉ᩠ᨾᩪ᩵ᨯᩮᩥ᩠ᨾ 2,350 ᨲ᩠ᩅᩫ ᩓᩋᨠ᩠ᨡᩁᨴᩥᨷᩮ᩠ᨲᨯᩰᩫ᩠ᨶᩐᩣᩋᩬᨠ[4] | |
2.0 | ᨠᩁᨠᨯᩣᨣᩫ᩠ᨾ ᨻᩩᨴ᩠ᨵᩈᨠ᩠ᨠᩁᩣ᩠ᨩ 2539 | ISBN 0-201-48345-9 | ISO/IEC 10646-1:1993 ᨲᩮᩥ᩠᩵ᨾᨡᩬᩴ᩶ᨠᩯ᩶ᨡᩱᨴᩦ᩵ 5, 6, 7 | 25 | 38,950 | ᨻ᩠ᨿᩣᨦ᩠ᨣ᩺[ᨣᩤᩴᨾᩮᩬᩥᨦᨠᩬᩴ᩵ ]ᩌᩢᨱᨠᩧ᩠ᩃᩉ᩠ᨾᩪ᩵ᨯᩮᩥ᩠ᨾᨯᩰᩫ᩠ᨶᩐᩣᩋᩬᨠ ᩓ᩠᩶ᩅᨲᩮᩥ᩠᩵ᨾᨻ᩠ᨿᩣᨦ᩠ᨣ᩺ᩌᩢᨱᨠᩧ᩠ᩃᩉ᩠ᨾᩪ᩵ᩉ᩠ᨾᩲ᩵ 11,619 ᨲ᩠ᩅᩴᨶᩱᨲᩣᩴᩉ᩠ᨶᩯ᩵ᨦᩉ᩠ᨾᩲ᩵ ᩋᨠ᩠ᨡᩁᨴᩥᨷᩮ᩠ᨲᨲᩮᩥ᩠᩵ᨾᨠᩖᩢᨷᨡᩮᩢ᩶ᩣᨴᩦ᩵ᨲᩣᩴᩉ᩠ᨶᩯ᩵ᨦᩉ᩠ᨾᩲ᩵ᨻᩕᩬ᩶ᨾᨠᩢ᩠ᨷᨸᩖ᩠ᨿ᩵ᩁᩋᨠ᩠ᨡᩁᨷᩤ᩠ᨦᨲ᩠ᩅᩫ ᩅᩥᨵᩦᩋᨠ᩠ᨡᩁᨸ᩠ᩃ᩻ᩢᨯ(ᨽᩣᩈᩣᨠᩖᩣ᩠ᨦ: ᨴᩰᩫ᩠ᩇᨴᩯ᩠ᨶ, ᩋᩢ᩠ᨦᨠᩕᩥ᩠ᩈ: surrogate) ᨯᩱ᩶ᨯᩰᩫ᩠ᨶᨸᩕᨠᩣ᩠ᩆᨡᩧ᩠᩶ᨶ
ᩓᨾᩦᨠᩣ᩠ᩁᨠᩣᩴᩉ᩠ᨶᩫᨯᩉᩨ᩶ᨻᩖᩮᩁ[ᨣᩤᩴᨾᩮᩬᩥᨦᨠᩬᩴ᩵ ] 15 ᩓᨻᩖᩮᩁ 16 ᨸᩮ᩠ᨶᨻᩨ᩠᩶ᨶᨾᩦ᩵ᨩᩲ᩶ᨦᩣ᩠ᨶᩈ᩠ᩅ᩵ᩁᨲ᩠ᩅᩴ (Private Use Areas) [5] |
2.1 | ᨻᩂᩇᨽᩣᨣᩫ᩠ᨾ ᨻᩩᨴ᩠ᨵᩈᨠ᩠ᨠᩁᩣ᩠ᨩ 2541 | ISO/IEC 10646-1:1993 ᨲᩮᩥ᩠᩵ᨾᨡᩬᩴ᩶ᨠᩯ᩶ᨡᩱᨴᩦ᩵ 5, 6, 7 ᨠᩢ᩠ᨷᩋᨠ᩠ᨡᩁᩈᩬᨦᨲ᩠ᩅᩫᨧᩣ᩠ᨠᨡᩬᩴ᩶ᨠᩯ᩶ᨡᩱᨴᩦ᩵ 18 | 25 | 38,952 | ᨣᩕᩮᩬᩥ᩵ᨦᩉ᩠ᨾᩣ᩠ᨿᨿᩪᩁᩰᨯᩰᩫ᩠ᨶᨲᩮᩥ᩠᩵ᨾᨡᩮᩢ᩶ᩣᨾᩣ [6] | |
3.0 | ᨠᨬ᩠ᨬᩣᨿᩫ᩠ᨶ ᨻᩩᨴ᩠ᨵᩈᨠ᩠ᨠᩁᩣ᩠ᨩ 2542 | ISBN 0-201-61633-5 | ISO/IEC 10646-1:2000 | 38 | 49,259 | ᨩᩮᩬᩥᩁᩰᨠᩦ, ᩋᩮᨵᩥᩋᩰᨸ᩠ᨿᩮ, ᨡ᩠ᨾ᩻ᩮᩁ, ᨾᩬᨦᨣᩰᩫ᩠ᩃ, ᨻᨾ᩵ᩣ, ᩋᩰᨤᩢ᩠ᨾ, ᩁᩪᩁ , ᩈᩦᩉᩃ, ᨪᩦᩁ᩠ᨿᨠ, ᨵᩤᨶᩣ (ᩋᩢ᩠ᨦᨠᩕᩥ᩠ᩈ: Thaana), Unified Canadian Aboriginal Syllabics ᩓᩋᩦ᩶ ᨲᩮᩥ᩠᩵ᨾᨡᩮᩢ᩶ᩣᨾᩣ ᨩᩮ᩠᩵ᨶᨯ᩠ᨿᩅᨠᩢ᩠ᨷᩁᩪ᩠ᨷᨷᩯ᩠ᨷᩋᨠ᩠ᨡᩁᨷᩕᩮᩃᩖ᩺ [7] |
3.1 | ᨾᩦᨶᩣᨣᩫ᩠ᨾ ᨻᩩᨴ᩠ᨵᩈᨠ᩠ᨠᩁᩣ᩠ᨩ 2544 | ISO/IEC 10646-1:2000
ISO/IEC 10646-2:2001 |
41 | 94,205 | ᨯᩮᨪᩮᩁᩮ᩠ᨴ, ᨠᩰᨵᩥ᩠ᨠ ᩓᩋᩥᨲᩣᩃᩦᨷ᩠ᩅᩫᩁᩣ᩠ᨱ ᨲᩮᩥ᩠᩵ᨾᨡᩮᩢ᩶ᩣᨾᩣ ᨻᩕᩬ᩶ᨾᨠᩢ᩠ᨷᩈᩢᨬ᩠ᨬᩃᩢᨠ᩠ᩇᨱ᩺ᩀ᩵ᩣ᩠ᨦᨯᩫ᩠ᨶᨲᩕᩦᩈ᩠ᨾ᩻ᩢ᩠ᨿᩉ᩠ᨾᩲ᩵ᩓᨯᩫ᩠ᨶᨲᩕᩦᨷᩱᨪᩯ᩠ᨶᨴᩱ᩠ᨶ᩺ ᩓᨲᩮᩥ᩠᩵ᨾᩋᨠ᩠ᨡᩁᩁᩪ᩠ᨷᩁ᩠ᩅ᩵ᨾᨧᩦ᩠ᨶᨬᩦ᩵ᨸᩩ᩵ᩁᨠᩮᩢᩣᩉᩖᩦᩋᩦ᩠ᨠ 42,711 ᨲ᩠ᩅᩫ [8] | |
3.2 | ᨾᩦᨶᩣᨣᩫ᩠ᨾ ᨻᩩᨴ᩠ᨵᩈᨠ᩠ᨠᩁᩣ᩠ᨩ 2545 | ISO/IEC 10646-1:2000 ᨲᩮᩥ᩠᩵ᨾᨡᩬᩴ᩶ᨠᩯ᩶ᨡᩱᨴᩦ᩵ 1
ISO/IEC 10646-2:2001 |
45 | 95,221 | ᨲᩮᩥ᩠᩵ᨾᩋᨠ᩠ᨡᩁᨴᩦ᩵ᨩᩲ᩶ᨶᩲᨼᩥᩃᩥᨷ᩠ᨷᩥᨶ᩠ᩈ᩺: ᨷᩪᩌᩥᨯ, ᩌᩣᨶᩪᨶᩰᩋᩰ, ᨷᩤ᩠ᨿᨷᩤᨿᩥ᩠ᨶ ᩓᨲᩢ᩠ᨠᨷᩢ᩠ᨶᩅᩤ [9] | |
4.0 | ᨾᩮᩇᩣᨿᩫ᩠ᨶ ᨻᩩᨴ᩠ᨵᩈᨠ᩠ᨠᩁᩣ᩠ᨩ 2546 | ISBN 0-321-18578-1 | ISO/IEC 10646:2003 | 52 | 96,447 | ᨪᩱᨷᩕᩢ᩠ᩈ, ᩃᩥ᩠ᨾᨷᩪ, ᩃᩱᨶ᩠ᨿᩮᩁ᩺ᨷᩦ , ᩋᩬᩈᨾᩢ᩠ᨶᨿᩣ, ᨪᩮᩅ᩠ᨿᩁ , ᨴᩱᨲᩲ᩶ᨤᩫ᩠ᨦ ᩓᨿᩪᨠᩣᩁᩥᨲᩥ᩠ᨠ ᨲᩮᩥ᩠᩵ᨾᨡᩮᩢ᩶ᩣᨾᩣᨻᩕᩬ᩶ᨾᨠᩢ᩠ᨷᨹᩯ᩠ᨶᨽᩪᨾᩥᩉᩫ᩠ᨠᨩᩢ᩠᩶ᨶᨡᩬᨦᩋᩦ᩶ᨩᩥ᩠ᨦ [10] |
4.1 | ᨾᩦᨶᩣᨣᩫ᩠ᨾ ᨻᩩᨴ᩠ᨵᩈᨠ᩠ᨠᩁᩣ᩠ᨩ 2548 | ISO/IEC 10646:2003 ᨲᩮᩥ᩠᩵ᨾᨡᩬᩴ᩶ᨠᩯ᩶ᨡᩱᨴᩦ᩵ 1 | 59 | 97,720 | ᩃᩫ᩠ᨶᨲᩣᩁᩣ, ᨣᩖᩤᨣᩰᩃᩥᨲᩥ᩠ᨠ, ᨡᩁᩮᩣᩇ᩠ᨮᩦ, ᨴᩱᩃᩨ᩶ᩉ᩠ᨾᩲ᩵, ᨸᩮᩬᩥᩁ᩺ᨪ᩠ᨿᩮᨠᩮᩢ᩵ᩣ, ᩈᩥᩃᩰᨭᩥᨶᩣᨣᩕᩦ ᩓᨴᩥᨼᩥᨶᩣ᩠ᨣ ᨲᩮᩥ᩠᩵ᨾᨡᩮᩢ᩶ᩣᨾᩣ ᩓᨣᩬᨷᨴᩥ᩠ᨠᨶᩲᩁᩪᨷᨷᩯ᩠ᨷᨴᩦ᩵ᨲ᩵ᩣ᩠ᨦᨧᩣ᩠ᨠᩋᨠ᩠ᨡᨦᨠᩕᩦ᩠ᨠ ᩃᩮ᩠ᨡᨠᩕᩦ᩠ᨠᨷ᩠ᩅᩁᩣ᩠ᨱᩓᩈᩢᨬ᩠ᨬᩃᩢᨠ᩠ᩇᨱ᩺ᩀᩢ᩠᩵ᨦᨯᩫ᩠ᨶᨲᩕᩦᨡᩮᩢ᩶ᩣᨾᩣᨴ᩠ᩅ᩠ᨿ [11] | |
5.0 | ᨠᩁᨠᨯᩣᨣᩫ᩠ᨾ ᨻᩩᨴ᩠ᨵᩈᨠ᩠ᨠᩁᩣ᩠ᨩ 2549 | ISBN 0-321-48091-0 | ISO/IEC 10646:2003 ᨲᩮᩥ᩠᩵ᨾᨡᩬᩴ᩶ᨠᩯ᩶ᨡᩱᨴᩦ᩵ 1, 2 ᨠᩢ᩠ᨷᩋᨠ᩠ᨡᩁᩈᩦ᩵ᨲ᩠ᩅᩫᨧᩣ᩠ᨠᨡᩬᩴ᩶ᨠᩯ᩶ᨡᩱᨴᩦ᩵ 3 | 64 | 99,089 | ᨷᩤᩉᩖᩦ, ᨣᩪᨶᩥᨼᩬᩁ᩠᩺ᨾ, ᩋᩧ᩠ᨶᨣᩰ, ᨹᩢᨠ᩠ᩈ᩺-ᨸᩣ ᩓᨼᩥᨶᩥᨪ᩠ᨿᩮ ᨲᩮᩥ᩠᩵ᨾᨡᩮᩢ᩶ᩣᨾᩣ [12] |
5.1 | ᨾᩮᩇᩣᨿᩫ᩠ᨶ ᨻᩩᨴ᩠ᨵᩈᨠ᩠ᨠᩁᩣ᩠ᨩ 2551 | ISO/IEC 10646:2003 ᨲᩮᩥ᩠᩵ᨾᨡᩬᩴ᩶ᨠᩯ᩶ᨡᩱᨴᩦ᩵ 1, 2, 3, 4 | 75 | 100,713 | ᨣᩤᩁ᩠ᨿᩮ, ᨧᩣ᩠ᨾ, ᨠᩡᩀᩣ, ᩃᩮ᩠ᨷᨩᩣ, ᩃᩱᨪ᩠ᨿᩮ, ᩃᩥᨯ᩠ᨿᩯ, Ol Chiki, ᩁᩮᨩᩢ᩠ᨦ, ᩆᩣᩁᨴᩤ, ᨪᩩᨱ᩠ᨯᩣ ᩓᩅᩱ ᨲᩮᩥ᩠᩵ᨾᨡᩮᩢ᩶ᩣᨾᩣ ᨩᩮ᩠᩵ᨶᨯ᩠ᨿᩅᨠᩢ᩠ᨷᨠᩖᩩ᩵ᨾᩈᩢᨬ᩠ᨬᩃᩢᨠ᩠ᩇᨱ᩺ ᨧᨠ᩠ᨠᨼᩱᩈᨲᩫ᩠ᩈ, ᩉ᩠ᨶ᩶ᩣᨽᩱ᩵ᨶᩫ᩠ᨠᨠᩕᨧᩬᨠ[ᨣᩤᩴᨾᩮᩬᩥᨦᨠᩬᩴ᩵ ] ᩓᩉ᩠ᨶ᩶ᩣᨯᩰᨾᩥᨶᩰ ᨲᩮᩥ᩠᩵ᨾᩋᨠ᩠ᨡᩁᨴᩦ᩵ᩈᩣᩴᨣᩢ᩠ᨬᩈᩣᩴᩁᩢ᩠ᨷ ᩋᨠ᩠ᨡᩁᨻᨾ᩵ᩣ, additions of letters and Scribal abbreviations used in mediaeval manuscripts, and the addition of ß ᨲ᩠ᩅᩫᩉᩖ᩠ᩅᨦ.[13] | |
5.2 | ᨲᩩᩃᩣᨣᩫ᩠ᨾ ᨻᩩᨴ᩠ᨵᩈᨠ᩠ᨠᩁᩣ᩠ᨩ 2552 | ISO/IEC 10646:2003 ᨲᩮᩥ᩠᩵ᨾᨡᩬᩴ᩶ᨠᩯ᩶ᨡᩱᨴᩦ᩵ 1, 2, 3, 4, 5, 6 | 90 | 107,361 | ᩋᩅᩮ᩠ᩈᨲ, ᨷᩤᨾᩩᨾ, ᩌᩱᩁᩰᨠᩖᩥᨼᨼᩥ᩠ᨠ (the Gardiner Set, comprising 1,071 characters), Imperial Aramaic, Inscriptional Pahlavi, Inscriptional Parthian, ᨩᩅᩤ, ᨠᩱᨳᩥ, ᩃᩦᩈᩪ᩵, ᨾᩱᨲᩱᨾᩣᨿᩮ᩠ᨠ, ᩋᩣᩉᩕᩢ᩠ᨷᨲᩱ᩶ᨠᩮᩢ᩵ᩣ, Old Turkic, Samaritan, ᨴᩱᨵᩢᨾ᩠ᨾ᩺ ᩓᨴᩱᩅ᩠ᨿᨯ added. ᨲᩮᩥ᩠᩵ᨾᩋᨠ᩠ᨡᩁᩁᩪᨷᩁ᩠ᩅ᩵ᨾᨧᩦ᩠ᨶᨬᩦ᩵ᨸᩩ᩵ᩁᨠᩮᩢᩣᩉᩖᩦᩋᩦ᩠ᨠ 4,149 ᨲ᩠ᩅᩫ (CJK-C), ᨩᩮ᩠᩵ᨶᨯ᩠ᨿᩅᨠᩢ᩠ᨷᨧᩣᨾᩰᨡ᩠ᨿ᩻ᩣ᩠ᨿᨡᩬᨦᩋᨠ᩠ᨡᩁᩌᩢᨱᨣᩧ᩠ᩃᨷ᩠ᩅᩫᩁᩣ᩠ᨱ ᩓᩋᨠ᩠ᨡᩁᩈᩣᩴᩁᩢ᩠ᨷ ᩋᨠ᩠ᨡᩁᨻᩕᩅᩮᨴ [14] | |
6.0 | ᨲᩩᩃᩣᨣᩫ᩠ᨾ ᨻᩩᨴ᩠ᨵᩈᨠ᩠ᨠᩁᩣ᩠ᨩ 2553 | ISO/IEC 10646:2010 ᨲᩮᩥ᩠᩵ᨾᨣᩕᩮᩬᩥ᩵ᨦᩉ᩠ᨾᩣ᩠ᨿᩈᨠᩩᩃᨦᩮᩥ᩠ᨶᩁᩪᨸᩦᩋᩥ᩠ᨶᨯ᩠ᨿᩮ | 93 | 109,449 | ᨷᩤᨲᩢ᩠ᨠ, ᨻᩕᩣᩉ᩠ᨾᩦ, ᨾᩢ᩠ᨿᨯᩣᩋᩥ᩠ᨠ, ᩈᩢᨬ᩠ᨬᩃᩢᨠ᩠ᩇᨱ᩺ᩉ᩠ᨶ᩶ᩣᨽᩱ᩵ᨻᩬᩢᨠ[ᨣᩤᩴᨾᩮᩬᩥᨦᨠᩬᩴ᩵ ], ᩈᩢᨬ᩠ᨬᩃᩢᨠ᩠ᩇᨱ᩺จราจรᩓᨹᩯ᩠ᨶᨴᩦ᩵, ᩈᩢᨬ᩠ᨬᩃᩢᨠ᩠ᩇᨱ᩺การเล่นแร่แปรธาตุ, ᩋᩦᨾᩰᨲᩥᨣᩬᩁ ᩓᩋᩮᨾᩰᨧᩦ | |
6.1 | ᨾᨠᩁᩣᨣᩫ᩠ᨾ ᨻᩩᨴ᩠ᨵᩈᨠ᩠ᨠᩁᩣ᩠ᨩ 2555 | ISO/IEC 10646:2012 | 100 | 110,181 | ᨲᩮᩥ᩠᩵ᨾᨧᩢ᩠ᨦᨾ, ᩋᨠ᩠ᨡᩁᨾᩮᩁᩰᩋᩮᨣᩢ᩠ᨯᩃᩣ᩠ᨿᨾᩨ, ᩋᨠ᩠ᨡᩁᨾᩮᩁᩰᩋᩮᩌᩱᩁᩰᨠᩖᩥᨼᨼᩥ᩠ᨠ, ᨾᩯ᩠᩶ᩅ, ᩆᩣᩁᨴᩣ, ᩈᩰᩁᩢ᩠ᨦ ᩈᩫ᩠ᨾᨸᩮ᩠ᨦ, ᩓᨲᨠᩕᩦ[16] | |
6.2 | ᨠᨬ᩠ᨬᩣᨿᩫ᩠ᨶ ᨻᩩᨴ᩠ᨵᩈᨠ᩠ᨠᩁᩣ᩠ᨩ 2555 | ISO/IEC 10646:2012 ᨲᩮᩥ᩠᩵ᨾᨣᩕᩮᩬᩥ᩵ᨦᩉ᩠ᨾᩣ᩠ᨿᩃᩦᩁᩣᨲᩮᩥᩁ᩠᩺ᨠ | 100 | 110,182 | ᨣᩕᩮᩬᩥ᩵ᨦᩉ᩠ᨾᩣ᩠ᨿᩃᩦᩁᩣᨲᩮᩥᩁ᩠᩺ᨠ | |
6.3 | ᨠᨬ᩠ᨬᩣᨿᩫ᩠ᨶ ᨻᩩᨴ᩠ᨵᩈᨠ᩠ᨠᩁᩣ᩠ᨩ 2556 | ISO/IEC 10646:2012 ᨲᩮᩥ᩠᩵ᨾ ᪆ ᨲ᩠ᩅᩫ | 110 | 110,187 | ᨲ᩠ᩅᩫᨣᩩᨾᨷᩯ᩠ᨷᩈᩬᨦᨴᩥ᩠ᩈ ᪅ ᨲ᩠ᩅᩫ | |
7.0 | ᨾᩥᨳᩩᨶᩣᨿᩫ᩠ᨶ ᨻᩩᨴ᩠ᨵᩈᨠ᩠ᨠᩁᩣ᩠ᨩ 2557 | ISO/IEC 10646:2012 ᨲᩮᩥ᩠᩵ᨾᨡᩬᩴ᩶ᨠᩯ᩶ᨡᩱᨴᩦ᩵ 1, 2 ᩓᨲᩮᩥ᩠᩵ᨾᨣᩕᩮᩬᩥ᩵ᨦᩉ᩠ᨾᩣ᩠ᨿᩁᩪᨷᩮᩥ᩠ᩃ | 123 | 113,021 | ᨷᩢ᩠ᩈᨪᩣ, ᩋᩯ᩠ᩃᨷᩮᨶ᩠ᨿᩮᨣᩬᨣᩮᨪ᩠ᨿᩮ, ᨯᩪᨸᩖᩬᩴᨿᩢ᩠ᨶ, ᩋᩮ᩠ᩃᨷᩣᨪᩣ᩠ᨶ, ᨣᩕᩢ᩠ᨶᨳ, ᨤᩫ᩠ᨧᨣᩦ, ᨡᩩᨴᩅᨴᩦ, ᩃᩱᨶ᩠ᨿᩮᩁ᩺ᩋᩮ, มหาชนี, ᨾᩣᨱᩦᨠᩦ, ᨾᩮ᩠ᨶᨯᩮ, ᨾᩰᨯᩦ, ᨾᩁᩪ, ᨶᩣᨷᩤᨴᩤᩋ᩠ᨿᩁ, ᩋᩣᩉᩕᩢ᩠ᨷᩉ᩠ᨶᩮᩬᩥᩋᨠᩮᩢ᩵ᩣ, ᨸᩮᩥᩁ᩺ᨾᩥ᩠ᨠᨷ᩠ᩅᩁᩣ᩠ᨱ, ᨸᩣᩌᩮᩢᩣᩉ᩺ᨾᩢ᩠ᨦ, ᨻᩯ᩠ᩃᨾᩱᩁᩣ, Pau cin Hau, Psalter Pahlavi, ᩈᩥᨴ᩠ᨵᩢᨾ, ᨲᩥᩁᩉᩩᨲ, ᩅᩤᩁᩘᨣᩆᩥᨲᩥ, and Dingbats[17] | |
8.0 | ᨾᩥᨳᩩᨶᩣᨿᩫ᩠ᨶ ᨻᩩᨴ᩠ᨵᩈᨠ᩠ᨠᩁᩣ᩠ᨩ 2558 | ISO/IEC 10646:2014 ᨲᩮᩥ᩠᩵ᨾᨡᩬᩴ᩶ᨠᩯ᩶ᨡᩱᨴᩦ᩵ 1 ᩓᨲᩮᩥ᩠᩵ᨾᨣᩕᩮᩬᩥ᩵ᨦᩉ᩠ᨾᩣ᩠ᨿᩃᩣᩁᩦᩓ CJK unified ideographs 9 ᨲ᩠ᩅᩫ ᩓᨲ᩠ᩅᩫᩋᩮᨾᩰᨧᩥ 41 ᨲ᩠ᩅᩫ | 129 | 120,737 | ᨴᩱᩋᩣᩉᩫ᩠ᨾ, ᩌᩱᩁᩰᨠᩖᩥᨼᨼᩥ᩠ᨠᩋᩣᨶᩣᨲᩰᩃ᩠ᨿᩮ, ᩌᩢᨲᩕ, ᨾᩩᩃᨲᩣ᩠ᨶ, ᩌᩢᨦ᩠ᨠᩣᩁᩦᨠᩮᩢ᩵ᩣ, Signwriting, ᩋᨠ᩠ᨡᩁᩁᩪᨷᩁ᩠ᩅ᩵ᨾᨧᩦ᩠ᨶᨬᩦ᩵ᨸᩩ᩵ᩁᨠᩮᩢᩣᩉᩖᩦ (CJK) 5,771 ᨲ᩠ᩅᩫ, ᩋᨠ᩠ᨡᩁᨶᩬ᩠ᨿᩈᩣᩴᩁᩢ᩠ᨷᨩᩮᩬᩥᩁᩰᨠᩦ, ᩓᩋᨠ᩠ᨡᩁᨸᩖ᩠ᨿ᩵ᩁᩈᩦᨡᩬᨦᨹᩥ᩠ᩅᨡᩬᨦᩋᩮᨾᩰᨧᩦ ᪅ ᨲ᩠ᩅᩫ[18] | |
9.0 | ᨾᩥᨳᩩᨶᩣᨿᩫ᩠ᨶ ᨻᩩᨴ᩠ᨵᩈᨠ᩠ᨠᩁᩣ᩠ᨩ 2559 | ISO/IEC 10646:2014 ᨲᩮᩥ᩠᩵ᨾᨡᩬᩴ᩶ᨠᩯ᩶ᨡᩱᨴᩦ᩵ 1, 2, ᩓᨲᩮᩥ᩠᩵ᨾ ᩋᩢ᩠ᨯᩃᩢ᩠ᨾ, ᨶᩮᩅᩤ, ᨣᩕᩮᩬᩥ᩵ᨦᩉ᩠ᨾᩣ᩠ᨿᨴᩦᩅᩦᨬᩦ᩵ᨸᩩ᩵ᩁ ᩓᩋᩮᨾᩰᨧᩦᨠᩢ᩠ᨷᨣᩕᩮᩬᩥ᩵ᨦᩉ᩠ᨾᩣ᩠ᨿ 74 ᨲ᩠ᩅᩫ | 135 | 128,237 | ᩋᩢ᩠ᨯᩃᩢ᩠ᨾ, ᨽᩱᨠ᩠ᩇᩩᨠᩦ, ᨾᩣᩁ᩺ᨩᩮ᩠ᨶ, ᨶᩮᩅᩤ, ᩋᩰᩈᩮ᩠ᨧ, ᨲᩢ᩠ᨶᨠᩢ᩠ᨲ, ᩓᩋᩮᨾᩰᨧᩦ 72 ᨲ᩠ᩅᩫ[19] | |
10.0 | ᨾᩥᨳᩩᨶᩣᨿᩫ᩠ᨶ ᨻᩩᨴ᩠ᨵᩈᨠ᩠ᨠᩁᩣ᩠ᨩ 2560 | ISO/IEC 10646:2017 ᩓᨲᩮᩥ᩠᩵ᨾᩋᩮᨾᩰᨧᩦ 56 ᨲ᩠ᩅᩫ, ᩌᩮᨶ᩠ᨴᩱᨣᨶ 285 ᨲ᩠ᩅᩫ, ᩓᨪᩣᨶᩣᨷᩤᨪᩣᩁ᩺ᩈᩦ᩵ᩃ᩠ᨿᨾᩋᩦ᩠ᨠ ᪃ ᨲ᩠ᩅᩫ | 139 | 136,755 | ᨪᩣᨶᩣᨷᩤᨪᩣᩁ᩺ᩈᩦ᩵ᩃ᩠ᨿᨾ, ᨪᩰᩀᩬᨾᨷᩰ, ᨣᩰᨶ᩠ᨴᩦᩀ᩵ᩣ᩠ᨦᨾᩣᩈᩣᩁᩣ᩠ᨾ, ᩉ᩠ᨶ᩠ᩅᩪ᩵ᨪᩪ, ᩌᩮᨶ᩠ᨴᩱᨣᨶ (ᩌᩥᩁᨣᨶᨴᩦ᩵ᨷ᩵ᨷᨠᨲᩥ), ᩋᨠ᩠ᨡᩁᩁᩪᨷᩁ᩠ᩅ᩵ᨾᨧᩦ᩠ᨶᨬᩦ᩵ᨸᩩ᩵ᩁᨠᩮᩢᩣᩉᩖᩦ (CJK) 7,494 ᨲ᩠ᩅᩫ , ᩓᩋᩮᨾᩰᨧᩦ 56 ᨲ᩠ᩅᩫ[20] |
ᨡᩬᩴ᩶ᨧᩣᩴᨠᩢ᩠ᨯᩓᨷᨬ᩠ᩉᩣ
ᨾᩦᨠᩣ᩠ᩁᨲᩥᩀᩪᨶᩥᨣᩰᩫ᩠ᨯᨠ᩠ᨿ᩵ᩅᨠᩢ᩠ᨷᨷᨬ᩠ᩉᩣᩀ᩵ᩣ᩠ᨦᨴᩮ᩠ᨣᨶᩥ᩠ᨣ ᩓᨡᩬᩴ᩶ᨧᩣᩴᨠᩢ᩠ᨯᨲ᩵ᩣ᩠ᨦ᩻ ᩀ᩵ᩣ᩠ᨦᨯᩱᨯᩦ ᩀᩪᨶᩥᨣᩰᩫ᩠ᨯᨯᩱᨠᩖᩣ᩠ᨿᨸᩮ᩠ᨶᩅᩥᨵᩦᨠᩣ᩠ᩁᨡᩮᩢ᩶ᩣᩁᩉᩢ᩠ᩈᨴᩦ᩵ᨩᩲ᩶ᨠᩢ᩠ᨶᨾᩣ᩠ᨠᨴᩦ᩵ᩈᩩᨯᨶᩲᨠᩣ᩠ᩁᨿᩡᩉᩨ᩶ᨪᩬᨼ᩠᩺ᨲᩅᩯᩁ᩺ᩓᩁᨷ᩠ᨿᨷᨷᨭᩥᨷᨲ᩠ᨲᩥᨠᩣ᩠ᩁᨩᩲ᩶ᨯᩱ᩶ᩉᩖᩣ᩠ᨿᨽᩣᩈᩣᨻᩕᩬ᩶ᨾᪧᨠᩢ᩠ᨶ
ᩁᨷ᩠ᨿᨷᨷᨭᩥᨷᨲ᩠ᨲᩥᨠᩣ᩠ᩁᨠᩕᨠᩪᩃᩅᩥ᩠ᨶᨯᩰᩅ᩠ᩈ᩺ ᨯᩱ᩶ᨠᩯ᩵ᩅᩥ᩠ᨶᨯᩰᩅ᩠ᩈ᩺ᩋᩮ᩠ᨶᨴᩦ, ᩅᩥ᩠ᨶᨯᩰᩅ᩠ᩈ᩺ 2000 ᩓ ᩅᩥ᩠ᨶᨯᩰᩅ᩠ᩈ᩺ᩋᩮᨠ᩠ᩈᨻᩦ ᨩᩲ᩶ᩁᩉᩢ᩠ᩈᩀᩪᨶᩥᨣᩰᩫ᩠ᨯᨯᩰᩫ᩠ᨿᨷᩯ᩠ᨷ UTF-16 ᨶᩲᨠᩣ᩠ᩁᨡᩮᩢ᩶ᩣᩁᩉᩢ᩠ᩈᨡᩬᩴ᩶ᨤ᩠ᩅᩣ᩠ᨾ ᩁᨷ᩠ᨿᨷᨷᨭᩥᨷᨲ᩠ᨲᩥᨠᩣ᩠ᩁᨴᩦ᩵ᩉ᩠ᨾᩮᩬᩥᩁยูนิกซ์ ᨩᩮ᩠᩵ᨶ GNU/Linux BSD ᩓ Mac OS X ᨣᩴᨯᩱ᩶ᨶᩣᩴᩀᩪᨶᩥᨣᩰᩫ᩠ᨯᨷᩯ᩠ᨷ UTF-8 ᨾᩣᨩᩲ᩶ ᨸᩮ᩠ᨶᨻᩨ᩠᩶ᨶᨮᩣᨶᨡᩬᨦᨠᩣ᩠ᩁᨴᩯ᩠ᨶᨡᩬᩴ᩶ᨤ᩠ᩅᩣ᩠ᨾᨴᩦ᩵ᨾᩦᩉᩖᩣ᩠ᨿᨽᩣᩈᩣ
ᨠᩣ᩠ᩁᩁᩬᨦᩁᩢ᩠ᨷᨽᩣᩈᩣᨴᩱ᩠ᨿᨶᩲᩀᩪᨶᩥᨣᩰᩫ᩠ᨯ ᨯᩱ᩶ᩁᩢ᩠ᨷᨠᩣ᩠ᩁᩅᩥᨻᩣᨠ᩠ᩇ᩺ᩅᩥᨧᩣᩁ᩠ᨱ᩺ᨶᩮᩬᩥ᩵ᨦᨧᩣ᩠ᨠᩅ᩵ᩤᩋᩢ᩠ᨶᨯᩢ᩠ᨷᩁ᩠ᨿᨦᨲ᩠ᩅᩫᩋᨠ᩠ᨡᩁ ᨶᩢ᩠᩶ᨶᨷ᩵ᨳᩪᨠᨲᩣ᩠ᨾᨴᩦ᩵ᨣ᩠ᩅᩁᨧᩢ᩠ᨠᨸᩮ᩠ᨶ ᨪᩧ᩠᩵ᨦᨸᩮ᩠ᨶᨻᩕᩰᩬᩡᩀᩪᨶᩥᨣᩰᩫ᩠ᨯᨶᩲᩈ᩠ᩅ᩵ᩁᨽᩣᩈᩣᨴᩱ᩠ᨿᨯᩱ᩶ᩋ᩶ᩣ᩠ᨦᩋᩥ᩠ᨦᩁᩪ᩠ᨷᨷᩯ᩠ᨷᨯᩮᩥ᩠ᨾᨧᩣ᩠ᨠ ᨾᩣᨲᩕᨮᩣ᩠ᨶᨹ᩠ᩃ᩻ᩥᨲᨽᨱ᩠ᨯᩋᩫ᩠ᨲᩈᩣᩉᨠᩢᨾ᩠ᨾ᩺ 620 (TIS-620) ᨴᩦ᩵ᨾᩦᨷᨬ᩠ᩉᩣᨶᩦ᩶ᨩᩮ᩠᩵ᨶᨠᩢ᩠ᨶ ᨧᩧ᩠ᨦᨿᩡᩉᩨ᩶ᨠᩣ᩠ᩁᨴ᩠ᨿᨷᩁ᩠ᨿᨦᩋᩢ᩠ᨶᨯᩢ᩠ᨷᩀᩪᨶᩥᨣᩰᩫ᩠ᨯᩃᩣᩴᨷᩤ᩠ᨠᨡᩧ᩠᩶ᨶ
ᩋ᩶ᩣ᩠ᨦᩋᩥ᩠ᨦ
- ↑ http://www.unicode.org/standard/principles.html#What_Characters
- ↑ http://www.unicode.org/Public/reconstructed/1.0.0/UnicodeData.txt
- ↑ http://www.unicode.org/Public/reconstructed/1.0.1/UnicodeData.txt
- ↑ http://www.unicode.org/Public/1.1-Update/UnicodeData-1.1.5.txt
- ↑ http://www.unicode.org/Public/2.0-Update/UnicodeData-2.0.14.txt
- ↑ http://www.unicode.org/Public/2.1-Update/UnicodeData-2.1.2.txt
- ↑ http://www.unicode.org/Public/3.0-Update/UnicodeData-3.0.0.txt
- ↑ http://www.unicode.org/Public/3.1-Update/UnicodeData-3.1.0.txt
- ↑ http://www.unicode.org/Public/3.2-Update/UnicodeData-3.2.0.txt
- ↑ http://www.unicode.org/Public/4.0-Update/UnicodeData-4.0.0.txt
- ↑ http://www.unicode.org/Public/4.1.0/ucd/UnicodeData.txt
- ↑ http://www.unicode.org/Public/5.0.0/ucd/UnicodeData.txt
- ↑ http://www.unicode.org/Public/5.1.0/ucd/UnicodeData.txt
- ↑ http://www.unicode.org/Public/5.2.0/ucd/UnicodeData.txt
- ↑ http://www.unicode.org/Public/6.0.0/ucd/UnicodeData.txt
- ↑ http://www.unicode.org/Public/6.1.0/ucd/UnicodeData.txt
- ↑ http://www.unicode.org/Public/7.0.0/ucd/UnicodeData.txt
- ↑ http://www.unicode.org/Public/8.0.0/ucd/UnicodeData.txt
- ↑ http://www.unicode.org/Public/9.0.0/ucd/UnicodeData.txt
- ↑ http://www.unicode.org/Public/10.0.0/ucd/UnicodeData.txt
ᩉᩖᩯ᩵ᨦᨡᩬᩴ᩶ᨾᩪᩃᩋᩨ᩠᩵ᨶ
- DecodeUnicode - Unicode WIKI, 50.000 gifs