Лингвистический анализ: Методы статистического анализа исторических текстов (часть 2) (Анатолий Фоменко)



Общая статистика

Длина текста1810019 знаков
Длина диалогов16821 знаков
Слов в произведении (СВП)207982 слов
Приблизительно страниц1006 стр.
Средняя длина слова5.55 знаков
Предложений в произведении (ПВП)27878 предл.
Средняя длина предложения (СДП)61.94 знаков
Доля диалогов в тексте0.93 %
Доля авторского текста99.07 %
СДП диалогов28.99 знаков
СДП авторского текста13.83 знаков
Использование диалогов по тексту книги № 14752: Методы статистического анализа исторических текстов (часть 2) (Анатолий Фоменко)
Максимальный фрагмент авторского текста - 213610 знаков (в страницах - примерно 119, начинается где-то с 149 страницы)

Активный словарный запас

Использовано уникальных слов27554
Активный словарный запас (АСЗ)23220
Активный не словарный запас (АНСЗ)4334
Удельный АСЗ на 3000 слов текста1211.88203587 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста3090.39360451 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста16844.8068265 место в рейтинге УАСЗ-100000
Удельный АСЗ-3000 книги № 14752: Методы статистического анализа исторических текстов (часть 2) (Анатолий Фоменко)
Максимальный УАСЗ-3000 (1605) наблюдается примерно на 933 странице
Минимальный УАСЗ-3000 (426) наблюдается примерно на 846 странице
Рост АСЗ книги № 14752: Методы статистического анализа исторических текстов (часть 2) (Анатолий Фоменко)

Буквы и знаки препинания

Всего букв1116010 букв
Всего знаков препинания233758 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, запятая26170125.83
. точка40458194.53
- тире115271554.24
? вопросительный знак4842.33
! восклицательный знак1610.77
... многоточие27339131.45
!.. восклицательный знак с многоточием00.00
?.. вопросительный знак с многоточием160.08
!!! тройной восклицательный знак00.00
?! вопросительный знак с восклицанием100.05
" кавычка977747.01
() скобки758436.46
: двоеточие221110.63
; точка с запятой427720.56
БукваКол-во (шт.)Частота использования (в %)
А910908.16
Б161171.44
В560715.02
Г230172.06
Д309202.77
Е-Ё934658.37
Ж230172.06
З160661.44
И-Й11799710.57
К412203.69
Л425603.81
М368083.30
Н751616.73
О11728110.51
П283722.54
Р604905.42
С644745.78
Т670646.01
У198341.78
Ф42250.38
Х108640.97
Ц71930.64
Ч118931.07
Ш42600.38
Щ30600.27
Ь-Ъ138531.24
Ы191481.72
Э54360.49
Ю59880.54
Я242902.18
Диаграма использования букв книги № 14752: Методы статистического анализа исторических текстов (часть 2) (Анатолий Фоменко)

Части речи

Определенных частей речи (ОЧР)195210 слов
Не определенных частей речи (НОЧР)12772 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Существительное8377942.917
Глагол805111.058
Местоимение-существительное80514.124
Предлог2137311.946
Союз124556
Прилагательное2137310.949
Наречие80804.139
Местоимение-прилагательное57212.931
Частица48462.482
Местоименное наречие16940.868
Числительное9960.510
Числительное-прилагательное14400.738
Междометие18310.938
Часть композита - сложного слова370.019

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

СуществительноеГлаголМестоимение-существительноеПредлогСоюзПрилагательноеНаречиеМестоимение-прилагательноеЧастицаМестоименное наречиеЧислительноеЧислительное-прилагательноеМеждометиеЧасть композита - сложного слова
Существительное167.0251.8614.5463.4936.0540.3417.669.989.973.681.573.579.340.12
Глагол29.079.375.6226.689.2212.947.433.913.391.550.820.570.000.01
Местоимение-существительное11.1913.130.852.292.213.333.490.783.340.360.110.140.010.00
Предлог73.172.248.062.741.5617.831.328.320.500.591.201.860.030.04
Союз24.178.004.286.242.308.243.672.352.850.950.230.510.010.01
Прилагательное83.132.601.453.584.6011.510.970.440.410.360.180.260.000.01
Наречие5.7111.662.436.162.805.593.411.231.620.480.220.070.000.01
Местоимение-прилагательное15.742.061.491.651.273.740.690.851.220.110.390.100.000.01
Частица7.536.290.724.140.701.991.300.920.700.320.150.070.000.00
Местоименное наречие1.751.680.940.671.390.580.750.140.610.090.060.030.000.00
Числительное3.140.250.070.110.061.140.120.110.020.010.060.020.000.00
Числительное-прилагательное5.090.110.110.100.281.440.040.030.030.010.090.050.000.00
Междометие2.421.330.681.601.370.700.530.250.160.170.040.130.000.00
Часть композита - сложного слова0.060.010.000.000.000.120.000.000.000.010.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Существительное35.0541.7741.7541.2943.00
Глагол8.0612.8014.5513.5612.70
Местоимение-существительное6.155.984.404.283.28
Предлог14.519.4111.8512.5711.84
Союз7.595.755.305.366.04
Прилагательное11.3811.2510.5411.3312.18
Наречие6.484.544.214.434.07
Местоимение-прилагательное3.503.162.513.022.70
Частица1.683.143.102.442.36
Местоименное наречие2.660.960.670.660.53
Числительное0.410.480.510.430.60
Числительное-прилагательное2.460.740.560.590.53
Междометие0.000.010.030.030.16
Часть композита - сложного слова0.070.020.020.010.00

Номер слова в предложении
678910
Существительное42.7742.2942.2442.8241.57
Глагол11.8711.8611.4611.3310.87
Местоимение-существительное3.153.663.523.874.18
Предлог13.5912.8913.7213.3813.90
Союз6.036.496.046.486.70
Прилагательное11.5711.6811.7211.3211.38
Наречие3.533.513.913.413.78
Местоимение-прилагательное2.953.142.822.763.02
Частица2.562.632.412.652.31
Местоименное наречие0.630.570.630.560.78
Числительное0.680.520.560.560.70
Числительное-прилагательное0.540.560.650.600.48
Междометие0.120.200.300.210.31
Часть композита - сложного слова0.020.000.020.030.03

Номер слова в предложении
1112131415
Существительное41.4641.6841.2039.8840.31
Глагол11.2410.7310.2310.3611.66
Местоимение-существительное4.003.884.153.763.90
Предлог13.5013.0413.3313.8114.43
Союз6.457.697.477.337.02
Прилагательное11.5611.4211.3511.9411.35
Наречие3.693.733.903.703.48
Местоимение-прилагательное3.263.153.533.233.17
Частица2.742.612.783.502.94
Местоименное наречие0.580.670.600.940.46
Числительное0.520.450.660.510.36
Числительное-прилагательное0.520.590.370.560.59
Междометие0.430.300.430.490.26
Часть композита - сложного слова0.040.050.000.000.05