Лингвистический анализ: Методы статистического анализа исторических текстов (часть 2) (Анатолий Фоменко)
Общая статистика
Длина текста | 1810019 знаков |
Длина диалогов | 16821 знаков |
Слов в произведении (СВП) | 207982 слов |
Приблизительно страниц | 1006 стр. |
Средняя длина слова | 5.55 знаков |
Предложений в произведении (ПВП) | 27878 предл. |
Средняя длина предложения (СДП) | 61.94 знаков |
Доля диалогов в тексте | 0.93 % |
Доля авторского текста | 99.07 % |
СДП диалогов | 28.99 знаков |
СДП авторского текста | 13.83 знаков |
|
Максимальный фрагмент авторского текста - 213610 знаков (в страницах - примерно 119, начинается где-то с 149 страницы) |
Активный словарный запас
Использовано уникальных слов | 27554 | |
Активный словарный запас (АСЗ) | 23220 | |
Активный не словарный запас (АНСЗ) | 4334 | |
Удельный АСЗ на 3000 слов текста | 1211.88 | 203587 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 3090.39 | 360451 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 16844.80 | 68265 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1605) наблюдается примерно на 933 странице |
Минимальный УАСЗ-3000 (426) наблюдается примерно на 846 странице |
|
Буквы и знаки препинания
Всего букв | 1116010 букв |
Всего знаков препинания | 233758 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, запятая | 26170 | 125.83 |
. точка | 40458 | 194.53 |
- тире | 115271 | 554.24 |
? вопросительный знак | 484 | 2.33 |
! восклицательный знак | 161 | 0.77 |
... многоточие | 27339 | 131.45 |
!.. восклицательный знак с многоточием | 0 | 0.00 |
?.. вопросительный знак с многоточием | 16 | 0.08 |
!!! тройной восклицательный знак | 0 | 0.00 |
?! вопросительный знак с восклицанием | 10 | 0.05 |
" кавычка | 9777 | 47.01 |
() скобки | 7584 | 36.46 |
: двоеточие | 2211 | 10.63 |
; точка с запятой | 4277 | 20.56 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 91090 | 8.16 |
Б | 16117 | 1.44 |
В | 56071 | 5.02 |
Г | 23017 | 2.06 |
Д | 30920 | 2.77 |
Е-Ё | 93465 | 8.37 |
Ж | 23017 | 2.06 |
З | 16066 | 1.44 |
И-Й | 117997 | 10.57 |
К | 41220 | 3.69 |
Л | 42560 | 3.81 |
М | 36808 | 3.30 |
Н | 75161 | 6.73 |
О | 117281 | 10.51 |
П | 28372 | 2.54 |
Р | 60490 | 5.42 |
С | 64474 | 5.78 |
Т | 67064 | 6.01 |
У | 19834 | 1.78 |
Ф | 4225 | 0.38 |
Х | 10864 | 0.97 |
Ц | 7193 | 0.64 |
Ч | 11893 | 1.07 |
Ш | 4260 | 0.38 |
Щ | 3060 | 0.27 |
Ь-Ъ | 13853 | 1.24 |
Ы | 19148 | 1.72 |
Э | 5436 | 0.49 |
Ю | 5988 | 0.54 |
Я | 24290 | 2.18 |
|
Части речи
Определенных частей речи (ОЧР) | 195210 слов |
Не определенных частей речи (НОЧР) | 12772 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Существительное | 83779 | 42.917 |
Глагол | 8051 | 11.058 |
Местоимение-существительное | 8051 | 4.124 |
Предлог | 21373 | 11.946 |
Союз | 12455 | 6 |
Прилагательное | 21373 | 10.949 |
Наречие | 8080 | 4.139 |
Местоимение-прилагательное | 5721 | 2.931 |
Частица | 4846 | 2.482 |
Местоименное наречие | 1694 | 0.868 |
Числительное | 996 | 0.510 |
Числительное-прилагательное | 1440 | 0.738 |
Междометие | 1831 | 0.938 |
Часть композита - сложного слова | 37 | 0.019 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Существительное | Глагол | Местоимение-существительное | Предлог | Союз | Прилагательное | Наречие | Местоимение-прилагательное | Частица | Местоименное наречие | Числительное | Числительное-прилагательное | Междометие | Часть композита - сложного слова |
Существительное | 167.02 | 51.86 | 14.54 | 63.49 | 36.05 | 40.34 | 17.66 | 9.98 | 9.97 | 3.68 | 1.57 | 3.57 | 9.34 | 0.12 |
Глагол | 29.07 | 9.37 | 5.62 | 26.68 | 9.22 | 12.94 | 7.43 | 3.91 | 3.39 | 1.55 | 0.82 | 0.57 | 0.00 | 0.01 |
Местоимение-существительное | 11.19 | 13.13 | 0.85 | 2.29 | 2.21 | 3.33 | 3.49 | 0.78 | 3.34 | 0.36 | 0.11 | 0.14 | 0.01 | 0.00 |
Предлог | 73.17 | 2.24 | 8.06 | 2.74 | 1.56 | 17.83 | 1.32 | 8.32 | 0.50 | 0.59 | 1.20 | 1.86 | 0.03 | 0.04 |
Союз | 24.17 | 8.00 | 4.28 | 6.24 | 2.30 | 8.24 | 3.67 | 2.35 | 2.85 | 0.95 | 0.23 | 0.51 | 0.01 | 0.01 |
Прилагательное | 83.13 | 2.60 | 1.45 | 3.58 | 4.60 | 11.51 | 0.97 | 0.44 | 0.41 | 0.36 | 0.18 | 0.26 | 0.00 | 0.01 |
Наречие | 5.71 | 11.66 | 2.43 | 6.16 | 2.80 | 5.59 | 3.41 | 1.23 | 1.62 | 0.48 | 0.22 | 0.07 | 0.00 | 0.01 |
Местоимение-прилагательное | 15.74 | 2.06 | 1.49 | 1.65 | 1.27 | 3.74 | 0.69 | 0.85 | 1.22 | 0.11 | 0.39 | 0.10 | 0.00 | 0.01 |
Частица | 7.53 | 6.29 | 0.72 | 4.14 | 0.70 | 1.99 | 1.30 | 0.92 | 0.70 | 0.32 | 0.15 | 0.07 | 0.00 | 0.00 |
Местоименное наречие | 1.75 | 1.68 | 0.94 | 0.67 | 1.39 | 0.58 | 0.75 | 0.14 | 0.61 | 0.09 | 0.06 | 0.03 | 0.00 | 0.00 |
Числительное | 3.14 | 0.25 | 0.07 | 0.11 | 0.06 | 1.14 | 0.12 | 0.11 | 0.02 | 0.01 | 0.06 | 0.02 | 0.00 | 0.00 |
Числительное-прилагательное | 5.09 | 0.11 | 0.11 | 0.10 | 0.28 | 1.44 | 0.04 | 0.03 | 0.03 | 0.01 | 0.09 | 0.05 | 0.00 | 0.00 |
Междометие | 2.42 | 1.33 | 0.68 | 1.60 | 1.37 | 0.70 | 0.53 | 0.25 | 0.16 | 0.17 | 0.04 | 0.13 | 0.00 | 0.00 |
Часть композита - сложного слова | 0.06 | 0.01 | 0.00 | 0.00 | 0.00 | 0.12 | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Существительное | 35.05 | 41.77 | 41.75 | 41.29 | 43.00 |
Глагол | 8.06 | 12.80 | 14.55 | 13.56 | 12.70 |
Местоимение-существительное | 6.15 | 5.98 | 4.40 | 4.28 | 3.28 |
Предлог | 14.51 | 9.41 | 11.85 | 12.57 | 11.84 |
Союз | 7.59 | 5.75 | 5.30 | 5.36 | 6.04 |
Прилагательное | 11.38 | 11.25 | 10.54 | 11.33 | 12.18 |
Наречие | 6.48 | 4.54 | 4.21 | 4.43 | 4.07 |
Местоимение-прилагательное | 3.50 | 3.16 | 2.51 | 3.02 | 2.70 |
Частица | 1.68 | 3.14 | 3.10 | 2.44 | 2.36 |
Местоименное наречие | 2.66 | 0.96 | 0.67 | 0.66 | 0.53 |
Числительное | 0.41 | 0.48 | 0.51 | 0.43 | 0.60 |
Числительное-прилагательное | 2.46 | 0.74 | 0.56 | 0.59 | 0.53 |
Междометие | 0.00 | 0.01 | 0.03 | 0.03 | 0.16 |
Часть композита - сложного слова | 0.07 | 0.02 | 0.02 | 0.01 | 0.00 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Существительное | 42.77 | 42.29 | 42.24 | 42.82 | 41.57 |
Глагол | 11.87 | 11.86 | 11.46 | 11.33 | 10.87 |
Местоимение-существительное | 3.15 | 3.66 | 3.52 | 3.87 | 4.18 |
Предлог | 13.59 | 12.89 | 13.72 | 13.38 | 13.90 |
Союз | 6.03 | 6.49 | 6.04 | 6.48 | 6.70 |
Прилагательное | 11.57 | 11.68 | 11.72 | 11.32 | 11.38 |
Наречие | 3.53 | 3.51 | 3.91 | 3.41 | 3.78 |
Местоимение-прилагательное | 2.95 | 3.14 | 2.82 | 2.76 | 3.02 |
Частица | 2.56 | 2.63 | 2.41 | 2.65 | 2.31 |
Местоименное наречие | 0.63 | 0.57 | 0.63 | 0.56 | 0.78 |
Числительное | 0.68 | 0.52 | 0.56 | 0.56 | 0.70 |
Числительное-прилагательное | 0.54 | 0.56 | 0.65 | 0.60 | 0.48 |
Междометие | 0.12 | 0.20 | 0.30 | 0.21 | 0.31 |
Часть композита - сложного слова | 0.02 | 0.00 | 0.02 | 0.03 | 0.03 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Существительное | 41.46 | 41.68 | 41.20 | 39.88 | 40.31 |
Глагол | 11.24 | 10.73 | 10.23 | 10.36 | 11.66 |
Местоимение-существительное | 4.00 | 3.88 | 4.15 | 3.76 | 3.90 |
Предлог | 13.50 | 13.04 | 13.33 | 13.81 | 14.43 |
Союз | 6.45 | 7.69 | 7.47 | 7.33 | 7.02 |
Прилагательное | 11.56 | 11.42 | 11.35 | 11.94 | 11.35 |
Наречие | 3.69 | 3.73 | 3.90 | 3.70 | 3.48 |
Местоимение-прилагательное | 3.26 | 3.15 | 3.53 | 3.23 | 3.17 |
Частица | 2.74 | 2.61 | 2.78 | 3.50 | 2.94 |
Местоименное наречие | 0.58 | 0.67 | 0.60 | 0.94 | 0.46 |
Числительное | 0.52 | 0.45 | 0.66 | 0.51 | 0.36 |
Числительное-прилагательное | 0.52 | 0.59 | 0.37 | 0.56 | 0.59 |
Междометие | 0.43 | 0.30 | 0.43 | 0.49 | 0.26 |
Часть композита - сложного слова | 0.04 | 0.05 | 0.00 | 0.00 | 0.05 |
Последние комментарии
11 часов 38 минут назад
11 часов 57 минут назад
12 часов 5 минут назад
12 часов 7 минут назад
12 часов 10 минут назад
12 часов 27 минут назад