Лингвистический анализ: Приключения Тома Сойера (Марк Твен)
Общая статистика
Длина текста | 421945 знаков |
Длина диалогов | 117446 знаков |
Слов в произведении (СВП) | 67906 слов |
Приблизительно страниц | 235 стр. |
Средняя длина слова | 4.91 знаков |
Предложений в произведении (ПВП) | 5413 предл. |
Средняя длина предложения (СДП) | 75.23 знаков |
Доля диалогов в тексте | 27.83 % |
Доля авторского текста | 72.17 % |
СДП диалогов | 83.19 знаков |
СДП авторского текста | 109.39 знаков |
|
Максимальный фрагмент авторского текста - 21404 знаков (в страницах - примерно 12, начинается где-то с 141 страницы) |
Активный словарный запас
Использовано уникальных слов | 15705 | |
Активный словарный запас (АСЗ) | 15560 | |
Активный не словарный запас (АНСЗ) | 145 | |
Удельный АСЗ на 3000 слов текста | 1447.72 | 332826 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 3788.01 | 311977 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 0.00 | |
|
Максимальный УАСЗ-3000 (1725) наблюдается примерно на 131 странице |
Минимальный УАСЗ-3000 (1228) наблюдается примерно на 117 странице |
|
Буквы и знаки препинания
Всего букв | 333356 букв |
Всего знаков препинания | 15248 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, запятая | 8021 | 118.12 |
. точка | 4091 | 60.25 |
- тире | 643 | 9.47 |
? вопросительный знак | 532 | 7.83 |
! восклицательный знак | 1024 | 15.08 |
... многоточие | 0 | 0.00 |
!.. восклицательный знак с многоточием | 24 | 0.35 |
?.. вопросительный знак с многоточием | 9 | 0.13 |
!!! тройной восклицательный знак | 0 | 0.00 |
?! вопросительный знак с восклицанием | 0 | 0.00 |
" кавычка | 0 | 0.00 |
() скобки | 55 | 0.81 |
: двоеточие | 518 | 7.63 |
; точка с запятой | 331 | 4.87 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 26308 | 7.89 |
Б | 6391 | 1.92 |
В | 13765 | 4.13 |
Г | 6591 | 1.98 |
Д | 11182 | 3.35 |
Е-Ё | 28058 | 8.42 |
Ж | 6591 | 1.98 |
З | 5387 | 1.62 |
И-Й | 26046 | 7.81 |
К | 12258 | 3.68 |
Л | 16732 | 5.02 |
М | 10854 | 3.26 |
Н | 20590 | 6.18 |
О | 37510 | 11.25 |
П | 8777 | 2.63 |
Р | 13500 | 4.05 |
С | 16916 | 5.07 |
Т | 21426 | 6.43 |
У | 10464 | 3.14 |
Ф | 309 | 0.09 |
Х | 2897 | 0.87 |
Ц | 1182 | 0.35 |
Ч | 5409 | 1.62 |
Ш | 3053 | 0.92 |
Щ | 1075 | 0.32 |
Ь-Ъ | 7360 | 2.21 |
Ы | 6311 | 1.89 |
Э | 1124 | 0.34 |
Ю | 1757 | 0.53 |
Я | 6575 | 1.97 |
|
Части речи
Определенных частей речи (ОЧР) | 67875 слов |
Не определенных частей речи (НОЧР) | 31 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Существительное | 15752 | 23.207 |
Глагол | 7931 | 19.531 |
Местоимение-существительное | 7931 | 11.685 |
Предлог | 3945 | 9.543 |
Союз | 6820 | 10 |
Прилагательное | 3945 | 5.812 |
Наречие | 4246 | 6.256 |
Местоимение-прилагательное | 3243 | 4.778 |
Частица | 3910 | 5.761 |
Местоименное наречие | 1535 | 2.262 |
Числительное | 472 | 0.695 |
Числительное-прилагательное | 131 | 0.193 |
Междометие | 139 | 0.205 |
Часть композита - сложного слова | 17 | 0.025 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Существительное | Глагол | Местоимение-существительное | Предлог | Союз | Прилагательное | Наречие | Местоимение-прилагательное | Частица | Местоименное наречие | Числительное | Числительное-прилагательное | Междометие | Часть композита - сложного слова |
Существительное | 40.88 | 47.50 | 21.13 | 27.58 | 42.14 | 10.25 | 13.57 | 9.41 | 10.53 | 5.75 | 1.62 | 0.84 | 0.74 | 0.12 |
Глагол | 34.15 | 22.56 | 26.71 | 37.41 | 22.10 | 10.95 | 13.45 | 10.03 | 11.73 | 4.52 | 0.96 | 0.22 | 0.52 | 0.01 |
Местоимение-существительное | 14.01 | 41.47 | 8.19 | 7.90 | 9.27 | 5.70 | 10.37 | 3.99 | 11.68 | 3.48 | 0.41 | 0.10 | 0.27 | 0.00 |
Предлог | 47.96 | 1.38 | 19.34 | 0.46 | 1.06 | 9.96 | 0.31 | 12.73 | 0.06 | 0.04 | 1.61 | 0.40 | 0.01 | 0.10 |
Союз | 14.51 | 22.88 | 18.67 | 8.62 | 4.36 | 3.98 | 8.83 | 5.20 | 8.71 | 3.87 | 0.69 | 0.04 | 0.12 | 0.00 |
Прилагательное | 40.43 | 2.76 | 1.68 | 1.68 | 4.35 | 4.49 | 0.74 | 0.68 | 0.59 | 0.40 | 0.21 | 0.03 | 0.10 | 0.00 |
Наречие | 4.80 | 21.55 | 6.29 | 4.80 | 7.10 | 3.31 | 6.23 | 1.49 | 5.26 | 1.24 | 0.35 | 0.01 | 0.09 | 0.01 |
Местоимение-прилагательное | 22.57 | 5.22 | 3.59 | 1.83 | 1.65 | 5.89 | 1.72 | 1.49 | 2.50 | 1.00 | 0.29 | 0.01 | 0.00 | 0.00 |
Частица | 5.80 | 23.78 | 7.25 | 3.59 | 3.30 | 1.93 | 4.66 | 2.09 | 3.48 | 1.43 | 0.21 | 0.03 | 0.06 | 0.00 |
Местоименное наречие | 1.50 | 5.13 | 3.31 | 1.22 | 4.20 | 0.71 | 2.39 | 0.41 | 2.77 | 0.85 | 0.12 | 0.00 | 0.00 | 0.00 |
Числительное | 3.85 | 0.59 | 0.10 | 0.19 | 0.47 | 0.71 | 0.19 | 0.12 | 0.06 | 0.00 | 0.46 | 0.22 | 0.00 | 0.00 |
Числительное-прилагательное | 1.00 | 0.19 | 0.13 | 0.09 | 0.15 | 0.15 | 0.07 | 0.00 | 0.10 | 0.00 | 0.03 | 0.01 | 0.00 | 0.00 |
Междометие | 0.34 | 0.31 | 0.44 | 0.06 | 0.34 | 0.09 | 0.03 | 0.13 | 0.13 | 0.03 | 0.00 | 0.00 | 0.15 | 0.00 |
Часть композита - сложного слова | 0.25 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Существительное | 15.15 | 18.16 | 19.28 | 20.75 | 23.38 |
Глагол | 9.01 | 25.00 | 23.67 | 24.01 | 21.05 |
Местоимение-существительное | 20.65 | 15.85 | 14.04 | 11.06 | 11.68 |
Предлог | 8.42 | 5.76 | 8.39 | 10.02 | 10.31 |
Союз | 15.65 | 5.86 | 7.67 | 8.73 | 10.11 |
Прилагательное | 3.00 | 3.45 | 4.07 | 5.47 | 5.50 |
Наречие | 8.95 | 7.33 | 7.56 | 6.88 | 5.09 |
Местоимение-прилагательное | 3.63 | 4.46 | 4.50 | 4.71 | 5.12 |
Частица | 9.18 | 9.66 | 7.65 | 5.59 | 5.02 |
Местоименное наречие | 4.03 | 2.71 | 1.68 | 1.85 | 2.13 |
Числительное | 0.70 | 0.96 | 0.75 | 0.69 | 0.38 |
Числительное-прилагательное | 0.19 | 0.58 | 0.62 | 0.09 | 0.15 |
Междометие | 1.43 | 0.18 | 0.13 | 0.12 | 0.08 |
Часть композита - сложного слова | 0.00 | 0.06 | 0.00 | 0.05 | 0.03 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Существительное | 23.32 | 23.57 | 23.18 | 24.12 | 23.91 |
Глагол | 19.70 | 19.78 | 19.51 | 18.91 | 20.18 |
Местоимение-существительное | 10.26 | 10.29 | 10.99 | 10.35 | 10.09 |
Предлог | 10.24 | 9.80 | 10.82 | 10.09 | 10.85 |
Союз | 11.09 | 10.47 | 11.26 | 11.33 | 11.29 |
Прилагательное | 6.06 | 6.34 | 5.78 | 6.12 | 6.27 |
Наречие | 6.14 | 5.79 | 5.18 | 6.05 | 4.98 |
Местоимение-прилагательное | 5.20 | 4.82 | 5.04 | 4.66 | 4.90 |
Частица | 4.84 | 5.73 | 5.14 | 5.25 | 4.86 |
Местоименное наречие | 1.99 | 2.28 | 2.27 | 1.89 | 1.97 |
Числительное | 0.80 | 0.79 | 0.67 | 0.80 | 0.44 |
Числительное-прилагательное | 0.19 | 0.12 | 0.10 | 0.26 | 0.08 |
Междометие | 0.08 | 0.21 | 0.07 | 0.15 | 0.16 |
Часть композита - сложного слова | 0.08 | 0.00 | 0.00 | 0.04 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Существительное | 21.53 | 23.15 | 23.86 | 23.33 | 24.48 |
Глагол | 19.72 | 19.70 | 17.37 | 18.28 | 19.48 |
Местоимение-существительное | 10.48 | 9.92 | 9.47 | 10.40 | 10.69 |
Предлог | 10.92 | 10.98 | 11.36 | 11.55 | 10.63 |
Союз | 11.01 | 10.21 | 12.09 | 12.24 | 10.37 |
Прилагательное | 7.03 | 7.48 | 6.49 | 6.15 | 6.14 |
Наречие | 5.13 | 6.04 | 5.23 | 5.52 | 4.93 |
Местоимение-прилагательное | 5.31 | 5.32 | 5.13 | 4.66 | 5.06 |
Частица | 5.79 | 4.12 | 5.81 | 5.00 | 5.12 |
Местоименное наречие | 1.99 | 1.97 | 2.41 | 1.72 | 2.21 |
Числительное | 0.71 | 0.91 | 0.47 | 0.86 | 0.63 |
Числительное-прилагательное | 0.13 | 0.14 | 0.10 | 0.23 | 0.00 |
Междометие | 0.22 | 0.05 | 0.21 | 0.00 | 0.13 |
Часть композита - сложного слова | 0.04 | 0.00 | 0.00 | 0.06 | 0.13 |
Последние комментарии