Podłączyłbym tutaj tylko artykuł z Wikipedii, ponieważ zakres bloków byłby od czasu do czasu aktualizowany, dlatego lepiej jest połączyć coś dynamicznie zmieniającego się ratger tgan, dając statyczną odpowiedź ... en.wikipedia.org/wiki/CJK_Unified_Ideographs
user930067
Odpowiedzi:
104
Może znajdziesz pełną listę za pośrednictwem CJK Unicode FAQ (która zawiera znaki „chiński, japoński i koreański”)
Możesz również chcieć dołączyć U + AC00 - U + D7AF (sylaby Hangul).
Flimm
12
@Flimm: Hangul nie jest częścią chińskiego standardu; Hangul jest koreańczykiem. Koreański język nie używa Hanja ( „Chinese script”), ale rzadko i tylko dla niektórych tradycyjnych rzeczy (takich jak Last nazw, pomników, miejsc ...), które nie mogą być przepisywane w Hangul. OP zapytał konkretnie o język chiński, więc ratownik nie musiał uwzględniać języka Hangul. :-)
omninonsense
1
Lista wydaje się nie obejmować znaków interpunkcyjnych („。”).
Dowiedziałem się, że rozszerzenie A CJK Unified Ideographs wynosi od 3400 do 4 dBf zamiast 3400 do 4 dBf.
Lerner Zhang
48
Unicode ma obecnie 74605 znaków CJK. Znaki CJK obejmują nie tylko znaki używane przez język chiński, ale także japoński Kanji, koreański Hanja i wietnamski Chu Nom . Niektóre znaki CJK nie są znakami chińskimi.
Cześć, czy możesz podać przykład ideogramu CJK (najlepiej z płaszczyzny podstawowej), który nie jest chińskim znakiem? Myślałem, że znaki z innych języków (japoński, koreański), które nie są również chińskimi znakami, pojawiają się w innym bloku (na przykład blok Hangul Jamo, w przypadku koreańskiego) ...
Adam Burley
Spróbuj spojrzeć na „Gukja”, „Kokuji” i „Chữ Nôm”. U + 4E44, 乄, to znak CJK dostępny tylko w języku japońskim.
Ṃųỻịgǻňạcểơửṩ
21
Dokładne zakresy znaków chińskich (z wyjątkiem rozszerzeń) to [\u2E80-\u2FD5\u3190-\u319f\u3400-\u4DBF\u4E00-\u9FCC\uF900-\uFAAD].
CJK Radicals Supplement to blok Unicode zawierający alternatywne, często pozycyjne formy rodników Kangxi. Są one używane jako nagłówki w indeksach słownikowych i innych zbiorach ideogramów CJK zorganizowanych radykalnie.
CJK Compatibility Ideographs to blok Unicode utworzony, aby zawierać znaki Han, które zostały zakodowane w wielu lokalizacjach w innych ustalonych kodowaniach znaków, oprócz przypisań CJK Unified Ideographs, w celu zachowania pełnej zgodności między Unicode i tymi kodowaniami.
Szczegółowe informacje można znaleźć tutaj , a rozszerzenia znajdują się w innych odpowiedziach.
Czy osoba, która odrzuciła tę odpowiedź, mogłaby podać powód?
Lerner Zhang
2
Nie głosowałem przeciw, ale co z rozszerzeniem B, C, D i E?
Suragch
@Suragch Te rozszerzenia zostały poprawnie podane w innych odpowiedziach, dlatego nie muszę ich przepisywać. Wyraźnie oddzieliłem tylko przedziały pomiędzy.
Lerner Zhang
1. zakres suplementu do rodników CJK to 2E80-2EFF 2. Rodniki Kangxi nie są znakami chińskimi, są to elementy graficzne chińskich znaków, są używane specjalnie do wyrażania rodników, np. ⼻ (U + 2F3B) i 彳 (U + 5F73 ), ⻜ (U + 2EDC) i 飞 (U + 98DE) 3. Jeśli myślisz, że kanbun to chińskie znaki, dlaczego nie Ideografy zgodności CJK? Dlaczego nie dołączyć listów i miesięcy CJK?
Voyager
@rambler Dzięki za radę. Myślę, że kiedy analizujemy postać Chinsesa, powinniśmy wziąć pod uwagę Kangxi Radicals i Kanbun. Ideogramy zgodności CJK są dobre, ale załączone litery CJK i miesiące są zbyt rzadkie i nie sądzę, abyśmy je rozważali.
Lerner Zhang
10
Unicode w wersji 11.0.0
W Unicode skrypty chińskie, japońskie i koreańskie (CJK) mają wspólne tło, zwane łącznie znakami CJK.
Zakresy te często zawierają nieprzypisane lub zarezerwowane punkty kodowe (takie jak U + 2E9A , U + 2EF4 - 2EFF),
chińskie znaki
bottom top reference(also have a look at wiki page) block name
4E00 9FEF http://www.unicode.org/charts/PDF/U4E00.pdf CJK Unified Ideographs
3400 4DBF http://www.unicode.org/charts/PDF/U3400.pdf CJK Unified Ideographs Extension A
20000 2A6DF http://www.unicode.org/charts/PDF/U20000.pdf CJK Unified Ideographs Extension B
2A700 2B73F http://www.unicode.org/charts/PDF/U2A700.pdf CJK Unified Ideographs Extension C
2B740 2B81F http://www.unicode.org/charts/PDF/U2B740.pdf CJK Unified Ideographs Extension D
2B820 2CEAF http://www.unicode.org/charts/PDF/U2B820.pdf CJK Unified Ideographs Extension E
2CEB0 2EBEF https://www.unicode.org/charts/PDF/U2CEB0.pdf CJK Unified Ideographs Extension F
3007 3007 https://zh.wiktionary.org/wiki/%E3%80%87 in block CJK Symbols and Punctuation
W bloku CJK Unified Ideographs zauważyłem, że wiele odpowiedzi używa górnej granicy 9FCC, ale U + 9FCD (鿍) jest rzeczywiście chińskim char. Wszystkie znaki w tym bloku to znaki chińskie (używane również w języku japońskim lub koreańskim itp.).
Większość znaków w CJK Unified Ideograohs Ext (z wyjątkiem Ext F, tylko 17% w Ext F to znaki chińskie) to tradycyjne chińskie znaki, które są rzadko używane w Chinach.
Niektóre bloki, takie jak Hangul Compatibility Jamo, zostały porzucone z powodu braku związku z chińskim.
Kangxi Radicals nie jest chińskimi znakami, jest graficznym elementem chińskich znaków, jest używany specjalnie do wyrażania rodników, .eg ⼻ (U + 2F3B) i 彳 (U + 5F73), ⻜ (U + 2EDC) i 飞 (U + 98DE)
Inne popularne znaki interpunkcyjne pojawiają się w języku chińskim
Jest to szeroki zakres, niektóre znaki interpunkcyjne mogą nigdy nie być używane, niektóre znaki interpunkcyjne, takie jak ……”“są używane tak często w chińskim.
0000 007F https://unicode.org/charts/PDF/U0000.pdf C0 Controls and Basic Latin
2000 206F https://unicode.org/charts/PDF/U2000.pdf General Punctuation
……
Istnieje również wiele symboli związanych z Chinami, takich jak symbole heksagramu Yijing lub Kanbun , ale i tak nie jest to temat. Piszę znaki inne niż chińskie w CJK, aby lepiej wyjaśnić, czym są chińskie znaki. Powyższe zakresy obejmują już prawie wszystkie znaki występujące w chińskim piśmie, z wyjątkiem matematyki i innych notacji specjalnych.
Bloki kodu Unicode, które podały inne odpowiedzi, z pewnością obejmują większość chińskich znaków Unicode, ale sprawdź też niektóre z tych innych bloków kodu.
Odpowiedzi:
Może znajdziesz pełną listę za pośrednictwem CJK Unicode FAQ (która zawiera znaki „chiński, japoński i koreański”)
Dokument „ East Asian Script ” wspomina:
Tabela 12-2. Bloki zawierające ideogramy Han
Uwaga: zakresy bloków mogą ewoluować w czasie: najnowszy jest w CJK Unified Ideographs .
Zobacz także Wikipedia:
źródło
Unicode ma obecnie 74605 znaków CJK. Znaki CJK obejmują nie tylko znaki używane przez język chiński, ale także japoński Kanji, koreański Hanja i wietnamski Chu Nom . Niektóre znaki CJK nie są znakami chińskimi.
1) 20941 znaków z bloku CJK Unified Ideographs .
Punkty kodowe od U + 4E00 do U + 9FCC.
2) 6582 znaków z bloku CJKUI ext .
Punkty kodowe od U + 3400 do U + 4DB5 . Unicode 3.0 (1999).
3) 42711 postacie z bloku CJKUI Ext B .
Punkty kodowe U + 20000 do U + 2A6D6. Unicode 3.1 (2001).
3) 4149 znaków z bloku CJKUI Ext C .
Punkty kodowe U + 2A700 do U + 2B734 . Unicode 5.2 (2009).
4) 222 postaci z bloku CJKUI Ext D .
Punkty kodowe od U + 2B740 do U + 2B81D . Unicode 6.0 (2010).
5) Blok CJKUI Ext E.
Wkrótce
Jeśli powyższe nie wystarczy, spójrz na znane problemy . Baw się dobrze =)
źródło
Dokładne zakresy znaków chińskich (z wyjątkiem rozszerzeń) to
[\u2E80-\u2FD5\u3190-\u319f\u3400-\u4DBF\u4E00-\u9FCC\uF900-\uFAAD]
.[\u2e80-\u2fd5]
[\u3190-\u319f]
[\u3400-\u4DBF]
[\u4E00-\u9FCC]
[\uF900-\uFAAD]
Szczegółowe informacje można znaleźć tutaj , a rozszerzenia znajdują się w innych odpowiedziach.
źródło
Unicode w wersji 11.0.0
W Unicode skrypty chińskie, japońskie i koreańskie (CJK) mają wspólne tło, zwane łącznie znakami CJK.
Zakresy te często zawierają nieprzypisane lub zarezerwowane punkty kodowe (takie jak U + 2E9A , U + 2EF4 - 2EFF),
chińskie znaki
Dlatego zakres wynosi
Znaki CJK, ale nigdy nie używane w języku chińskim
Są to Common Han używane tylko w celu zapewnienia zgodności.
Jest prawie niemożliwe, aby pojawiły się w żadnej chińskiej książce, artykule, pismach itp.
wszystkie znaki mają tutaj jeden odpowiadający mu identyczny z glifem chiński znak. Na przykład 金 (U + F90A) i 金 (U + 91D1) są identyczne w Glifie.
Symbole związane z CJK
Inne popularne znaki interpunkcyjne pojawiają się w języku chińskim
Jest to szeroki zakres, niektóre znaki interpunkcyjne mogą nigdy nie być używane, niektóre znaki interpunkcyjne, takie jak
……”“
są używane tak często w chińskim.Istnieje również wiele symboli związanych z Chinami, takich jak symbole heksagramu Yijing lub Kanbun , ale i tak nie jest to temat. Piszę znaki inne niż chińskie w CJK, aby lepiej wyjaśnić, czym są chińskie znaki. Powyższe zakresy obejmują już prawie wszystkie znaki występujące w chińskim piśmie, z wyjątkiem matematyki i innych notacji specjalnych.
Uzupełniający
Symbole i znaki interpunkcyjne CJK
Formy o połowie i pełnej szerokości
Odnosić się
źródło
Bloki kodu Unicode, które podały inne odpowiedzi, z pewnością obejmują większość chińskich znaków Unicode, ale sprawdź też niektóre z tych innych bloków kodu.
Zobacz moją pełniejszą dyskusję tutaj . A ta strona jest wygodne do przeglądania Unicode.
źródło
Podsumowując, wygląda na to, że to one:
źródło