MySQL で4バイト UTF-8 の文字を保存する

MySQL で文字コードを UTF-8 すると符号化した文字が3バイト以下には対応しますが、4バイトになると文字がなくなってしまいます。UTF-8 で 4バイトになる文字は次のとおりです。

  • 𠀋 (U+2000B)
  • 𡈽 (U+2123D)
  • 𡌛 (U+2131B)
  • 𡑮 (U+2146E)
  • 𡢽 (U+218BD)
  • 𠮟 (U+20B9F)
  • 𡚴 (U+216B4)
  • 𡸴 (U+21E34)
  • 𣇄 (U+231C4)
  • 𣗄 (U+235C4)
  • 𣜿 (U+2373F)
  • 𣝣 (U+23763)
  • 𣳾 (U+23CFE)
  • 𤟱 (U+247F1)
  • 𥒎 (U+2548E)
  • 𥔎 (U+2550E)
  • 𥝱 (U+25771)
  • 𥧄 (U+259C4)
  • 𥶡 (U+25DA1)
  • 𦫿 (U+26AFF)
  • 𦹀 (U+26E40)
  • 𧃴 (U+270F4)
  • 𧚄 (U+27684)
  • 𨉷 (U+28277)
  • 𨏍 (U+283CD)
  • 𪆐 (U+2A190)
  • 𠂉 (U+20089)
  • 𠂢 (U+200A2)
  • 𠂤 (U+200A4)
  • 𠆢 (U+201A2)
  • 𠈓 (U+20213)
  • 𠌫 (U+2032B)
  • 𠎁 (U+20381)
  • 𠍱 (U+20371)
  • 𠏹 (U+203F9)
  • 𠑊 (U+2044A)
  • 𠔉 (U+20509)
  • 𠗖 (U+205D6)
  • 𠘨 (U+20628)
  • 𠝏 (U+2074F)
  • 𠠇 (U+20807)
  • 𠠺 (U+2083A)
  • 𠢹 (U+208B9)
  • 𠥼 (U+2097C)
  • 𠦝 (U+2099D)
  • 𠫓 (U+20AD3)
  • 𠬝 (U+20B1D)
  • 𠵅 (U+20D45)
  • 𠷡 (U+20DE1)
  • 𠺕 (U+20E95)
  • 𠹭 (U+20E6D)
  • 𠹤 (U+20E64)
  • 𠽟 (U+20F5F)
  • 𡈁 (U+21201)
  • 𡉕 (U+21255)
  • 𡉻 (U+2127B)
  • 𡉴 (U+21274)
  • 𡋤 (U+212E4)
  • 𡋗 (U+212D7)
  • 𡋽 (U+212FD)
  • 𡌶 (U+21336)
  • 𡍄 (U+21344)
  • 𡏄 (U+213C4)
  • 𡑭 (U+2146D)
  • 𡗗 (U+215D7)
  • 𦰩 (U+26C29)
  • 𡙇 (U+21647)
  • 𡜆 (U+21706)
  • 𡝂 (U+21742)
  • 𡧃 (U+219C3)
  • 𡱖 (U+21C56)
  • 𡴭 (U+21D2D)
  • 𡵅 (U+21D45)
  • 𡵸 (U+21D78)
  • 𡵢 (U+21D62)
  • 𡶡 (U+21DA1)
  • 𡶜 (U+21D9C)
  • 𡶒 (U+21D92)
  • 𡶷 (U+21DB7)
  • 𡷠 (U+21DE0)
  • 𡸳 (U+21E33)
  • 𡼞 (U+21F1E)
  • 𡽶 (U+21F76)
  • 𡿺 (U+21FFA)
  • 𢅻 (U+2217B)
  • 𢌞 (U+2231E)
  • 𢎭 (U+223AD)
  • 𢛳 (U+226F3)
  • 𢡛 (U+2285B)
  • 𢢫 (U+228AB)
  • 𢦏 (U+2298F)
  • 𢪸 (U+22AB8)
  • 𢭏 (U+22B4F)
  • 𢭐 (U+22B50)
  • 𢭆 (U+22B46)
  • 𢰝 (U+22C1D)
  • 𢮦 (U+22BA6)
  • 𢰤 (U+22C24)
  • 𢷡 (U+22DE1)
  • 𣇃 (U+231C3)
  • 𣇵 (U+231F5)
  • 𣆶 (U+231B6)
  • 𣍲 (U+23372)
  • 𣏓 (U+233D3)
  • 𣏒 (U+233D2)
  • 𣏐 (U+233D0)
  • 𣏤 (U+233E4)
  • 𣏕 (U+233D5)
  • 𣏚 (U+233DA)
  • 𣏟 (U+233DF)
  • 𣑊 (U+2344A)
  • 𣑑 (U+23451)
  • 𣑋 (U+2344B)
  • 𣑥 (U+23465)
  • 𣓤 (U+234E4)
  • 𣕚 (U+2355A)
  • 𣖔 (U+23594)
  • 𣘹 (U+23639)
  • 𣙇 (U+23647)
  • 𣘸 (U+23638)
  • 𣘺 (U+2363A)
  • 𣜜 (U+2371C)
  • 𣜌 (U+2370C)
  • 𣝤 (U+23764)
  • 𣟿 (U+237FF)
  • 𣟧 (U+237E7)
  • 𣠤 (U+23824)
  • 𣠽 (U+2383D)
  • 𣪘 (U+23A98)
  • 𣱿 (U+23C7F)
  • 𣴀 (U+23D00)
  • 𣵀 (U+23D40)
  • 𣷺 (U+23DFA)
  • 𣷹 (U+23DF9)
  • 𣷓 (U+23DD3)
  • 𣽾 (U+23F7E)
  • 𤂖 (U+24096)
  • 𤄃 (U+24103)
  • 𤇆 (U+241C6)
  • 𤇾 (U+241FE)
  • 𤎼 (U+243BC)
  • 𤘩 (U+24629)
  • 𤚥 (U+246A5)
  • 𤢖 (U+24896)
  • 𤩍 (U+24A4D)
  • 𤭖 (U+24B56)
  • 𤭯 (U+24B6F)
  • 𤰖 (U+24C16)
  • 𤴔 (U+24D14)
  • 𤸎 (U+24E0E)
  • 𤸷 (U+24E37)
  • 𤹪 (U+24E6A)
  • 𤺋 (U+24E8B)
  • 𥁊 (U+2504A)
  • 𥁕 (U+25055)
  • 𥄢 (U+25122)
  • 𥆩 (U+251A9)
  • 𥇥 (U+251E5)
  • 𥇍 (U+251CD)
  • 𥈞 (U+2521E)
  • 𥉌 (U+2524C)
  • 𥐮 (U+2542E)
  • 𥓙 (U+254D9)
  • 𥖧 (U+255A7)
  • 𥞩 (U+257A9)
  • 𥞴 (U+257B4)
  • 𥧔 (U+259D4)
  • 𥫤 (U+25AE4)
  • 𥫣 (U+25AE3)
  • 𥫱 (U+25AF1)
  • 𥮲 (U+25BB2)
  • 𥱋 (U+25C4B)
  • 𥱤 (U+25C64)
  • 𥸮 (U+25E2E)
  • 𥹖 (U+25E56)
  • 𥹥 (U+25E65)
  • 𥹢 (U+25E62)
  • 𥻘 (U+25ED8)
  • 𥻂 (U+25EC2)
  • 𥻨 (U+25EE8)
  • 𥼣 (U+25F23)
  • 𥽜 (U+25F5C)
  • 𥿠 (U+25FE0)
  • 𥿔 (U+25FD4)
  • 𦀌 (U+2600C)
  • 𥿻 (U+25FFB)
  • 𦀗 (U+26017)
  • 𦁠 (U+26060)
  • 𦃭 (U+260ED)
  • 𦉰 (U+26270)
  • 𦊆 (U+26286)
  • 𦍌 (U+2634C)
  • 𣴎 (U+23D0E)
  • 𦐂 (U+26402)
  • 𦙾 (U+2667E)
  • 𦚰 (U+266B0)
  • 𦜝 (U+2671D)
  • 𦣝 (U+268DD)
  • 𦣪 (U+268EA)
  • 𦥑 (U+26951)
  • 𦥯 (U+2696F)
  • 𦧝 (U+269DD)
  • 𦨞 (U+26A1E)
  • 𦩘 (U+26A58)
  • 𦪌 (U+26A8C)
  • 𦪷 (U+26AB7)
  • 𦱳 (U+26C73)
  • 𦳝 (U+26CDD)
  • 𦹥 (U+26E65)
  • 𦾔 (U+26F94)
  • 𦿸 (U+26FF8)
  • 𦿶 (U+26FF6)
  • 𦿷 (U+26FF7)
  • 𧄍 (U+2710D)
  • 𧄹 (U+27139)
  • 𧏛 (U+273DB)
  • 𧏚 (U+273DA)
  • 𧏾 (U+273FE)
  • 𧐐 (U+27410)
  • 𧑉 (U+27449)
  • 𧘕 (U+27615)
  • 𧘔 (U+27614)
  • 𧘱 (U+27631)
  • 𧚓 (U+27693)
  • 𧜎 (U+2770E)
  • 𧜣 (U+27723)
  • 𧝒 (U+27752)
  • 𧦅 (U+27985)
  • 𧪄 (U+27A84)
  • 𧮳 (U+27BB3)
  • 𧮾 (U+27BBE)
  • 𧯇 (U+27BC7)
  • 𧲸 (U+27CB8)
  • 𧶠 (U+27DA0)
  • 𧸐 (U+27E10)
  • 𧾷 (U+27FB7)
  • 𨂊 (U+2808A)
  • 𨂻 (U+280BB)
  • 𨊂 (U+28282)
  • 𨋳 (U+282F3)
  • 𨐌 (U+2840C)
  • 𨑕 (U+28455)
  • 𨕫 (U+2856B)
  • 𨗈 (U+285C8)
  • 𨗉 (U+285C9)
  • 𨛗 (U+286D7)
  • 𨛺 (U+286FA)
  • 𨥉 (U+28949)
  • 𨥆 (U+28946)
  • 𨥫 (U+2896B)
  • 𨦇 (U+28987)
  • 𨦈 (U+28988)
  • 𨦺 (U+289BA)
  • 𨦻 (U+289BB)
  • 𨨞 (U+28A1E)
  • 𨨩 (U+28A29)
  • 𨩱 (U+28A71)
  • 𨩃 (U+28A43)
  • 𨪙 (U+28A99)
  • 𨫍 (U+28ACD)
  • 𨫤 (U+28AE4)
  • 𨫝 (U+28ADD)
  • 𨯁 (U+28BC1)
  • 𨯯 (U+28BEF)
  • 𨴐 (U+28D10)
  • 𨵱 (U+28D71)
  • 𨷻 (U+28DFB)
  • 𨸟 (U+28E1F)
  • 𨸶 (U+28E36)
  • 𨺉 (U+28E89)
  • 𨻫 (U+28EEB)
  • 𨼲 (U+28F32)
  • 𨿸 (U+28FF8)
  • 𩊠 (U+292A0)
  • 𩊱 (U+292B1)
  • 𩒐 (U+29490)
  • 𩗏 (U+295CF)
  • 𩙿 (U+2967F)
  • 𩛰 (U+296F0)
  • 𩜙 (U+29719)
  • 𩝐 (U+29750)
  • 𩣆 (U+298C6)
  • 𩩲 (U+29A72)
  • 𩷛 (U+29DDB)
  • 𩸽 (U+29E3D)
  • 𩸕 (U+29E15)
  • 𩺊 (U+29E8A)
  • 𩹉 (U+29E49)
  • 𩻄 (U+29EC4)
  • 𩻩 (U+29EE9)
  • 𩻛 (U+29EDB)
  • 𩿎 (U+29FCE)
  • 𪀯 (U+2A02F)
  • 𪀚 (U+2A01A)
  • 𪃹 (U+2A0F9)
  • 𪂂 (U+2A082)
  • 𢈘 (U+22218)
  • 𪎌 (U+2A38C)
  • 𪐷 (U+2A437)
  • 𪗱 (U+2A5F1)
  • 𪘂 (U+2A602)
  • 𪘚 (U+2A61A)
  • 𪚲 (U+2A6B2)

バージョンを5.5.3以降の MySQL では、文字コードを utf8mb4 に設定することで、4バイト文字を保存できます。

Comments

コメントする