Funbit (funbit) wrote,
Funbit
funbit

Category:

Разбор чтений японских иероглифов по косточкам

Как-то в процессе совершенствования программы для изучения японского у меня возникла идея собрать небольшую статистику по чтениям иероглифов. Например, какое количество кандзи имеет только ON чтения и совсем не имеет KUN чтений? Какие чтения наиболее часто используются, а какие встречаются только у одного кандзи? И так далее. В итоге, кое-что получилось =) Например, если брать выборку из 1945 штук (старый Jouyou набор), то получается следующее:

Всего одно ON чтение имеют 1460 кандзи
2 ON чтения имеют 401 кандзи
3 ON чтения имеют 63 кандзи
4 ON чтения имеют 11 кандзи
5 ON чтений имеют 5 кандзи
5 иероглифов имеют только KUN чтения: 込, 枠, 畑, 峠, 匁
375 иероглифов имеют только ON чтения...

Также, я построил таблицу всех иероглифов, сгруппированных по конкретным чтениям и отсортированных по порядку изучения в школе и по частоте встречаемости. А также таблицу, где можно посмотреть, какие конкретно иероглифы сколько разных ON чтений имеют.



Если навести мышкой на любой иероглиф - можно посмотреть его толкование.

Нужно теперь выучить все уникальные чтения, которые встречаются только у одного кандзи =)

Хотелось бы отметить, что собранная статистика точна лишь на определенный процент, т.к. не учитывает, к примеру, изменения чтения в зависимости от того, какое это сочетание (はん->ぱん, и так далее).

PS. Надо бы придумать что-нибудь еще... Поиграться с KUN чтениями или другими параметрами. Может быть у кого-нибудь есть идеи?

PPS. Google Chrome не совсем корректно отображает таблицу. Но это его проблемы, ибо во всех остальных браузерах всё ок.
Tags: мои статьи, мысли, программирование, японский язык
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 15 comments