Лингвистический анализ: Приключения Тома Сойера. Приключения Гекльберри Финна (Марк Твен)
Общая статистика
Длина текста | 969147 знаков |
Длина диалогов | 305806 знаков |
Слов в произведении (СВП) | 162554 слов |
Приблизительно страниц | 539 стр. |
Средняя длина слова | 4.67 знаков |
Предложений в произведении (ПВП) | 11746 предл. |
Средняя длина предложения (СДП) | 79.79 знаков |
Доля диалогов в тексте | 31.55 % |
Доля авторского текста | 68.45 % |
СДП диалогов | 94.95 знаков |
СДП авторского текста | 122.37 знаков |
|
Максимальный фрагмент авторского текста - 21773 знаков (в страницах - примерно 12, начинается где-то с 141 страницы) |
Активный словарный запас
Использовано уникальных слов | 24496 | |
Активный словарный запас (АСЗ) | 24154 | |
Активный не словарный запас (АНСЗ) | 342 | |
Удельный АСЗ на 3000 слов текста | 1307.63 | 247543 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 3326.34 | 227095 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 17784.11 | 35050 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1775) наблюдается примерно на 530 странице |
Минимальный УАСЗ-3000 (1027) наблюдается примерно на 404 странице |
|
Буквы и знаки препинания
Всего букв | 758573 букв |
Всего знаков препинания | 36712 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, запятая | 20093 | 123.61 |
. точка | 8505 | 52.32 |
- тире | 1832 | 11.27 |
? вопросительный знак | 1319 | 8.11 |
! восклицательный знак | 2076 | 12.77 |
... многоточие | 1 | 0.01 |
!.. восклицательный знак с многоточием | 32 | 0.20 |
?.. вопросительный знак с многоточием | 12 | 0.07 |
!!! тройной восклицательный знак | 5 | 0.03 |
?! вопросительный знак с восклицанием | 5 | 0.03 |
" кавычка | 0 | 0.00 |
() скобки | 87 | 0.54 |
: двоеточие | 1473 | 9.06 |
; точка с запятой | 1272 | 7.83 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 61094 | 8.05 |
Б | 14132 | 1.86 |
В | 30453 | 4.01 |
Г | 15384 | 2.03 |
Д | 26113 | 3.44 |
Е-Ё | 62887 | 8.29 |
Ж | 15384 | 2.03 |
З | 11935 | 1.57 |
И-Й | 57293 | 7.55 |
К | 27855 | 3.67 |
Л | 38165 | 5.03 |
М | 24495 | 3.23 |
Н | 44927 | 5.92 |
О | 86864 | 11.45 |
П | 20920 | 2.76 |
Р | 30568 | 4.03 |
С | 38270 | 5.04 |
Т | 50351 | 6.64 |
У | 23841 | 3.14 |
Ф | 648 | 0.09 |
Х | 6294 | 0.83 |
Ц | 2482 | 0.33 |
Ч | 12439 | 1.64 |
Ш | 6712 | 0.88 |
Щ | 2134 | 0.28 |
Ь-Ъ | 17257 | 2.27 |
Ы | 13821 | 1.82 |
Э | 2847 | 0.38 |
Ю | 3880 | 0.51 |
Я | 16331 | 2.15 |
|
Части речи
Определенных частей речи (ОЧР) | 162491 слов |
Не определенных частей речи (НОЧР) | 63 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Существительное | 33096 | 20.368 |
Глагол | 20499 | 19.764 |
Местоимение-существительное | 20499 | 12.615 |
Предлог | 7114 | 9.331 |
Союз | 18807 | 12 |
Прилагательное | 7114 | 4.378 |
Наречие | 10349 | 6.369 |
Местоимение-прилагательное | 7839 | 4.824 |
Частица | 10873 | 6.691 |
Местоименное наречие | 4736 | 2.915 |
Числительное | 1291 | 0.795 |
Числительное-прилагательное | 302 | 0.186 |
Междометие | 288 | 0.177 |
Часть композита - сложного слова | 20 | 0.012 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Существительное | Глагол | Местоимение-существительное | Предлог | Союз | Прилагательное | Наречие | Местоимение-прилагательное | Частица | Местоименное наречие | Числительное | Числительное-прилагательное | Междометие | Часть композита - сложного слова |
Существительное | 31.26 | 39.04 | 19.87 | 24.36 | 42.41 | 6.99 | 11.21 | 8.02 | 11.30 | 6.22 | 1.71 | 0.74 | 0.49 | 0.05 |
Глагол | 30.17 | 22.06 | 26.24 | 35.26 | 30.81 | 8.15 | 14.52 | 9.31 | 13.16 | 6.14 | 1.05 | 0.21 | 0.56 | 0.01 |
Местоимение-существительное | 11.66 | 44.49 | 11.05 | 9.01 | 10.23 | 4.28 | 11.15 | 4.98 | 13.88 | 4.63 | 0.51 | 0.10 | 0.17 | 0.01 |
Предлог | 47.95 | 1.06 | 20.06 | 0.65 | 1.38 | 7.75 | 0.25 | 11.61 | 0.09 | 0.02 | 2.01 | 0.39 | 0.04 | 0.06 |
Союз | 15.14 | 27.28 | 22.25 | 8.74 | 5.50 | 3.46 | 9.72 | 6.44 | 10.66 | 5.54 | 0.84 | 0.07 | 0.10 | 0.00 |
Прилагательное | 28.43 | 2.20 | 1.62 | 1.43 | 4.23 | 2.92 | 0.71 | 0.65 | 0.93 | 0.43 | 0.15 | 0.02 | 0.06 | 0.00 |
Наречие | 4.90 | 19.81 | 6.72 | 5.35 | 7.98 | 2.74 | 6.09 | 1.86 | 6.00 | 1.77 | 0.38 | 0.01 | 0.06 | 0.01 |
Местоимение-прилагательное | 21.21 | 6.30 | 3.84 | 2.03 | 2.07 | 4.49 | 2.07 | 1.85 | 2.79 | 1.19 | 0.31 | 0.04 | 0.04 | 0.00 |
Частица | 5.54 | 27.61 | 9.24 | 4.34 | 4.42 | 1.56 | 5.04 | 2.57 | 4.23 | 1.99 | 0.27 | 0.04 | 0.05 | 0.00 |
Местоименное наречие | 2.09 | 6.81 | 4.44 | 1.62 | 5.53 | 0.73 | 2.58 | 0.68 | 3.50 | 1.04 | 0.10 | 0.01 | 0.01 | 0.00 |
Числительное | 3.94 | 0.59 | 0.31 | 0.41 | 0.73 | 0.52 | 0.27 | 0.15 | 0.13 | 0.09 | 0.58 | 0.22 | 0.01 | 0.00 |
Числительное-прилагательное | 1.02 | 0.17 | 0.10 | 0.05 | 0.17 | 0.12 | 0.05 | 0.02 | 0.09 | 0.03 | 0.02 | 0.01 | 0.00 | 0.00 |
Междометие | 0.25 | 0.22 | 0.40 | 0.05 | 0.28 | 0.06 | 0.03 | 0.10 | 0.17 | 0.04 | 0.00 | 0.00 | 0.18 | 0.00 |
Часть композита - сложного слова | 0.12 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Существительное | 12.99 | 15.24 | 17.17 | 18.87 | 19.90 |
Глагол | 10.12 | 23.64 | 22.16 | 23.34 | 21.48 |
Местоимение-существительное | 21.81 | 17.60 | 15.63 | 12.73 | 11.79 |
Предлог | 7.23 | 6.13 | 8.19 | 9.18 | 10.16 |
Союз | 17.97 | 6.99 | 9.11 | 9.42 | 11.39 |
Прилагательное | 2.19 | 2.82 | 3.24 | 4.31 | 4.52 |
Наречие | 6.94 | 7.32 | 7.22 | 6.76 | 5.80 |
Местоимение-прилагательное | 3.87 | 5.08 | 4.84 | 4.78 | 5.12 |
Частица | 10.17 | 10.10 | 8.67 | 7.22 | 6.54 |
Местоименное наречие | 4.90 | 3.41 | 2.45 | 2.43 | 2.40 |
Числительное | 0.48 | 0.94 | 0.66 | 0.72 | 0.70 |
Числительное-прилагательное | 0.20 | 0.56 | 0.55 | 0.12 | 0.15 |
Междометие | 1.12 | 0.13 | 0.10 | 0.10 | 0.05 |
Часть композита - сложного слова | 0.00 | 0.04 | 0.01 | 0.03 | 0.01 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Существительное | 20.84 | 20.81 | 20.34 | 20.86 | 20.82 |
Глагол | 19.89 | 19.45 | 19.78 | 18.75 | 19.74 |
Местоимение-существительное | 11.31 | 11.07 | 11.84 | 11.26 | 10.86 |
Предлог | 9.90 | 10.14 | 10.47 | 10.00 | 11.21 |
Союз | 11.50 | 11.97 | 11.67 | 12.71 | 12.39 |
Прилагательное | 5.17 | 4.85 | 4.87 | 4.99 | 4.71 |
Наречие | 6.31 | 5.89 | 5.90 | 6.18 | 5.49 |
Местоимение-прилагательное | 5.11 | 5.03 | 4.97 | 4.86 | 4.72 |
Частица | 6.36 | 7.01 | 6.54 | 6.25 | 6.08 |
Местоименное наречие | 2.52 | 2.57 | 2.60 | 2.93 | 2.88 |
Числительное | 0.79 | 0.95 | 0.88 | 0.92 | 0.80 |
Числительное-прилагательное | 0.18 | 0.10 | 0.08 | 0.16 | 0.17 |
Междометие | 0.08 | 0.15 | 0.05 | 0.09 | 0.14 |
Часть композита - сложного слова | 0.03 | 0.00 | 0.00 | 0.03 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Существительное | 19.75 | 20.52 | 19.93 | 20.36 | 20.41 |
Глагол | 18.65 | 18.85 | 18.31 | 18.87 | 19.03 |
Местоимение-существительное | 11.58 | 10.50 | 10.90 | 11.18 | 11.12 |
Предлог | 10.55 | 10.76 | 10.76 | 11.44 | 10.83 |
Союз | 12.87 | 11.78 | 12.80 | 12.16 | 12.52 |
Прилагательное | 5.46 | 5.68 | 5.33 | 4.80 | 5.10 |
Наречие | 5.68 | 6.25 | 5.78 | 6.44 | 5.85 |
Местоимение-прилагательное | 4.94 | 5.70 | 5.61 | 4.89 | 5.29 |
Частица | 6.82 | 6.23 | 6.86 | 6.07 | 6.03 |
Местоименное наречие | 2.64 | 2.75 | 2.61 | 2.69 | 2.82 |
Числительное | 0.76 | 0.77 | 0.88 | 0.78 | 0.83 |
Числительное-прилагательное | 0.12 | 0.11 | 0.08 | 0.22 | 0.07 |
Междометие | 0.16 | 0.11 | 0.14 | 0.09 | 0.05 |
Часть композита - сложного слова | 0.02 | 0.00 | 0.00 | 0.02 | 0.05 |
Последние комментарии
6 часов 7 минут назад
11 часов 11 минут назад
19 часов 8 секунд назад
21 часов 30 минут назад
21 часов 38 минут назад
2 дней 8 часов назад