Лингвистический анализ: Приключения Тома Сойера (Марк Твен)



Общая статистика

Длина текста421945 знаков
Длина диалогов117446 знаков
Слов в произведении (СВП)67906 слов
Приблизительно страниц235 стр.
Средняя длина слова4.91 знаков
Предложений в произведении (ПВП)5413 предл.
Средняя длина предложения (СДП)75.23 знаков
Доля диалогов в тексте27.83 %
Доля авторского текста72.17 %
СДП диалогов83.19 знаков
СДП авторского текста109.39 знаков
Использование диалогов по тексту книги № 7989: Приключения Тома Сойера (Марк Твен)
Максимальный фрагмент авторского текста - 21404 знаков (в страницах - примерно 12, начинается где-то с 141 страницы)

Активный словарный запас

Использовано уникальных слов15705
Активный словарный запас (АСЗ)15560
Активный не словарный запас (АНСЗ)145
Удельный АСЗ на 3000 слов текста1447.72332826 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста3788.01311977 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста0.00
Удельный АСЗ-3000 книги № 7989: Приключения Тома Сойера (Марк Твен)
Максимальный УАСЗ-3000 (1725) наблюдается примерно на 131 странице
Минимальный УАСЗ-3000 (1228) наблюдается примерно на 117 странице
Рост АСЗ книги № 7989: Приключения Тома Сойера (Марк Твен)

Буквы и знаки препинания

Всего букв333356 букв
Всего знаков препинания15248 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, запятая8021118.12
. точка409160.25
- тире6439.47
? вопросительный знак5327.83
! восклицательный знак102415.08
... многоточие00.00
!.. восклицательный знак с многоточием240.35
?.. вопросительный знак с многоточием90.13
!!! тройной восклицательный знак00.00
?! вопросительный знак с восклицанием00.00
" кавычка00.00
() скобки550.81
: двоеточие5187.63
; точка с запятой3314.87
БукваКол-во (шт.)Частота использования (в %)
А263087.89
Б63911.92
В137654.13
Г65911.98
Д111823.35
Е-Ё280588.42
Ж65911.98
З53871.62
И-Й260467.81
К122583.68
Л167325.02
М108543.26
Н205906.18
О3751011.25
П87772.63
Р135004.05
С169165.07
Т214266.43
У104643.14
Ф3090.09
Х28970.87
Ц11820.35
Ч54091.62
Ш30530.92
Щ10750.32
Ь-Ъ73602.21
Ы63111.89
Э11240.34
Ю17570.53
Я65751.97
Диаграма использования букв книги № 7989: Приключения Тома Сойера (Марк Твен)

Части речи

Определенных частей речи (ОЧР)67875 слов
Не определенных частей речи (НОЧР)31 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Существительное1575223.207
Глагол793119.531
Местоимение-существительное793111.685
Предлог39459.543
Союз682010
Прилагательное39455.812
Наречие42466.256
Местоимение-прилагательное32434.778
Частица39105.761
Местоименное наречие15352.262
Числительное4720.695
Числительное-прилагательное1310.193
Междометие1390.205
Часть композита - сложного слова170.025

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

СуществительноеГлаголМестоимение-существительноеПредлогСоюзПрилагательноеНаречиеМестоимение-прилагательноеЧастицаМестоименное наречиеЧислительноеЧислительное-прилагательноеМеждометиеЧасть композита - сложного слова
Существительное40.8847.5021.1327.5842.1410.2513.579.4110.535.751.620.840.740.12
Глагол34.1522.5626.7137.4122.1010.9513.4510.0311.734.520.960.220.520.01
Местоимение-существительное14.0141.478.197.909.275.7010.373.9911.683.480.410.100.270.00
Предлог47.961.3819.340.461.069.960.3112.730.060.041.610.400.010.10
Союз14.5122.8818.678.624.363.988.835.208.713.870.690.040.120.00
Прилагательное40.432.761.681.684.354.490.740.680.590.400.210.030.100.00
Наречие4.8021.556.294.807.103.316.231.495.261.240.350.010.090.01
Местоимение-прилагательное22.575.223.591.831.655.891.721.492.501.000.290.010.000.00
Частица5.8023.787.253.593.301.934.662.093.481.430.210.030.060.00
Местоименное наречие1.505.133.311.224.200.712.390.412.770.850.120.000.000.00
Числительное3.850.590.100.190.470.710.190.120.060.000.460.220.000.00
Числительное-прилагательное1.000.190.130.090.150.150.070.000.100.000.030.010.000.00
Междометие0.340.310.440.060.340.090.030.130.130.030.000.000.150.00
Часть композита - сложного слова0.250.000.000.000.000.000.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Существительное15.1518.1619.2820.7523.38
Глагол9.0125.0023.6724.0121.05
Местоимение-существительное20.6515.8514.0411.0611.68
Предлог8.425.768.3910.0210.31
Союз15.655.867.678.7310.11
Прилагательное3.003.454.075.475.50
Наречие8.957.337.566.885.09
Местоимение-прилагательное3.634.464.504.715.12
Частица9.189.667.655.595.02
Местоименное наречие4.032.711.681.852.13
Числительное0.700.960.750.690.38
Числительное-прилагательное0.190.580.620.090.15
Междометие1.430.180.130.120.08
Часть композита - сложного слова0.000.060.000.050.03

Номер слова в предложении
678910
Существительное23.3223.5723.1824.1223.91
Глагол19.7019.7819.5118.9120.18
Местоимение-существительное10.2610.2910.9910.3510.09
Предлог10.249.8010.8210.0910.85
Союз11.0910.4711.2611.3311.29
Прилагательное6.066.345.786.126.27
Наречие6.145.795.186.054.98
Местоимение-прилагательное5.204.825.044.664.90
Частица4.845.735.145.254.86
Местоименное наречие1.992.282.271.891.97
Числительное0.800.790.670.800.44
Числительное-прилагательное0.190.120.100.260.08
Междометие0.080.210.070.150.16
Часть композита - сложного слова0.080.000.000.040.00

Номер слова в предложении
1112131415
Существительное21.5323.1523.8623.3324.48
Глагол19.7219.7017.3718.2819.48
Местоимение-существительное10.489.929.4710.4010.69
Предлог10.9210.9811.3611.5510.63
Союз11.0110.2112.0912.2410.37
Прилагательное7.037.486.496.156.14
Наречие5.136.045.235.524.93
Местоимение-прилагательное5.315.325.134.665.06
Частица5.794.125.815.005.12
Местоименное наречие1.991.972.411.722.21
Числительное0.710.910.470.860.63
Числительное-прилагательное0.130.140.100.230.00
Междометие0.220.050.210.000.13
Часть композита - сложного слова0.040.000.000.060.13