WikiSort.ru - Лингвистика

ПОИСК ПО САЙТУ | о проекте

Первые исследования по частоте встречаемости букв в таджикском языке были предприняты в 2001 году[1] и связывались с определениями «наилучшей» раскладки букв на компьютерной клавиатуре и объёма репрезентативной выборки для получения достоверных статистических результатов. Но ниже приведены результаты на основе статистической обработки произведений отдельных поэтов и писателей и сформирована общая картина частотности букв в классической и современной таджикской литературе[2],[3]

Статистика

Статистика частотности букв таджикского языка без учёта пробелов:

РангБукваУпотребленийЧастотностьИнформативность
1А1958360,1650,429
2О1000380,0840,301
3Р870840,0740,277
4И869910,0730,277
5Н810610,0680,265
6Д801820,0680,263
7У552820,0470,206
8Б527170,0450,200
9М496750,0420,192
10Т423250,0360,172
11С323920,0270,142
12К321050,0270,141
13Ш308610,0260,137
14Ҳ301750,0250,135
15З288350,0240,131
16Е252840,0210,118
17Г221900,0190,108
18В187550,0160,095
19Х182480,0150,093
20Л146940,0120,079
21Ӯ139670,0120,076
22Ф129760,0110,071
23П124250,0100,069
24Ч100000,0080,058
25Ҷ87480,0070,052
26Й84470,0070,051
27Ӣ78740,0070,048
28Я68700,0060,043
29Ё64540,0050,041
30Қ46500,0040,031
31Ғ27340,0020,020
32Э15030,0010,012
33Ъ14880,0010,012
34Ж8670,0010,008
35Ю5740,0000,005
Сумма118430714,36


Статистика частотности букв таджикского языка с учётом пробела:

РангБукваУпотребленийЧастотностьИнформативность
1Пробел2659830,1830,449
2А1958360,1350,390
3О1000380,0690,266
4Р870840,0600,244
5И869910,0600,243
6Н810610,0560,233
7Д801820,0550,231
8У552820,0380,180
9Б527170,0360,174
10М496750,0340,167
11Т423250,0290,149
12С323920,0220,122
13К321050,0220,122
14Ш308610,0210,118
15Ҳ301750,0210,116
16З288350,0200,112
17Е252840,0170,102
18Г221900,0150,092
19В187550,0130,081
20Х182480,0130,079
21Л146940,0100,067
22Ӯ139670,0100,065
23Ф129760,0090,061
24П124250,0090,059
25Ч100000,0070,050
26Ҷ87480,0060,044
27Й84470,0060,043
28Ӣ78740,0050,041
29Я68700,0050,037
30Ё64540,0040,035
31Қ46500,0030,027
32Ғ27340,0020,017
33Э15030,0010,010
34Ъ14880,0010,010
35Ж8670,0010,006
36Ю5740,0000,004
Сумма145029014,25

Примечания

  1. Усманов З. Д., Солиев О. М. Проблема раскладки символов на компьютерной клавиатуре — Душанбе: Ирфон, 2010, 104 с.
  2. Усманов З. Д., Косимов А. А. Частотность букв таджикской литературы — Доклады Академии наук Республики Таджикистан, 2015, т.58, № 2, с. 112—115
  3. Косимов А. А. Басомади такроршавии ҳарфҳои адабиёти тоҷик — Маҷаллаи «Шафақ», Нашрияи Кумиҷроияи Ҳизби Халқии Демократии Тоҷикистон дар шаҳри Хуҷанд, 24.11.2015, № 21, с. 2.

Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".

Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.

Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .




Текст в блоке "Читать" взят с сайта "Википедия" и доступен по лицензии Creative Commons Attribution-ShareAlike; в отдельных случаях могут действовать дополнительные условия.

Другой контент может иметь иную лицензию. Перед использованием материалов сайта WikiSort.ru внимательно изучите правила лицензирования конкретных элементов наполнения сайта.

2019-2024
WikiSort.ru - проект по пересортировке и дополнению контента Википедии