タイ語では声調符号が二つ以上付くと読む事が出来ないという情報があったのですが、顔文字で声調記号が二つ以上ついた文字が使われています。
なぜこのような入力ができてしまうのでしょうか?
実は、二つ以上の声調符号を用いた読み方があるのかそれとも他の理由があるのかが知りたいです。
こんな顔文字┌(┐ส้้้้้้้้้้้้้้้้้้้้้้้้้้้ਊส้้้้้้้้้้้้้้้้้้้้้้)┐に使われているส้้้้้้้้้้้้้้้้้้้้้้の部分の声調記号についての質問です。
まず、Wikipediaのタイ文字の頁のうちUnicodeの項をご覧ください。
http://ja.wikipedia.org/wiki/%E3%82%BF%E3%82%A4%E6%96%87%E5%AD%97#Unicode
文字コードであるUnicodeでのタイ文字の扱いは、ハングルのように音素文字を組み合わせた一つの音節文字が一つの領域に割り当てられている(ㅇ+ㅏ+ㄴ+ㅎ=않のように)のではなく、字母と付加記号(声調記号や母音記号など)がそれぞれ一つの領域に当てはめられており、それらが組み合わされた形で文字として表示されるようになっているようです。
続いてタイ文字を入力できるサイトで、実際にタイ文字を打ってみることにします。
http://www.tlin.jp/virtualkeyboad.php
キーボード上でLの位置にある「ส」を入力した後、Yの位置にある「อ้(ั)」を続けて何度も入力してみてください。
すると、その画面上では付加記号は「สัั」のように二つまでしか表示されませんが、記号は実際にはさらに付け足されています。試みにその文字の後ろでバックスペースキーを押してもしばらく表記は変わらず、やがて一つに減ったのち無くなります。またその文字を検索してみると、やはり付加記号が上に延長した文字が掲載されたサイトがヒットします。
つまり、この現象はUnicodeのタイ文字入力上の仕様であって、入力画面上では通常の規則通りに表示されるが、Webページ上などでは入力された通りに表示されてしまうのであり、実際の発音に基づいているわけではない、すなわちこの文字自体に意味はないということです。上に挙げたハングルにも同様の文字が見られますし、漢字ではいわゆる幽霊文字や幽霊漢字と呼ばれているものに似ているかもしれません。
ありがとうございます
2012/09/04 17:34:02