Лингвистический анализ: Приключения Тома Сойера и Гекльберри Финна. Большой сборник (Марк Твен)
Общая статистика
Длина текста | 1288031 знаков |
Длина диалогов | 455112 знаков |
Слов в произведении (СВП) | 213911 слов |
Приблизительно страниц | 716 стр. |
Средняя длина слова | 4.72 знаков |
Предложений в произведении (ПВП) | 16406 предл. |
Средняя длина предложения (СДП) | 75.77 знаков |
Доля диалогов в тексте | 35.33 % |
Доля авторского текста | 64.67 % |
СДП диалогов | 88.93 знаков |
СДП авторского текста | 109.62 знаков |
|
Максимальный фрагмент авторского текста - 21784 знаков (в страницах - примерно 12, начинается где-то с 141 страницы) |
Активный словарный запас
Использовано уникальных слов | 29920 | |
Активный словарный запас (АСЗ) | 29416 | |
Активный не словарный запас (АНСЗ) | 504 | |
Удельный АСЗ на 3000 слов текста | 1329.49 | 306292 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 3385.71 | 277902 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 18186.28 | 55838 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1742) наблюдается примерно на 709 странице |
Минимальный УАСЗ-3000 (1092) наблюдается примерно на 602 странице |
|
Буквы и знаки препинания
Всего букв | 1010347 букв |
Всего знаков препинания | 49019 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, запятая | 26315 | 123.02 |
. точка | 12568 | 58.75 |
- тире | 2926 | 13.68 |
? вопросительный знак | 1882 | 8.80 |
! восклицательный знак | 2787 | 13.03 |
... многоточие | 0 | 0.00 |
!.. восклицательный знак с многоточием | 40 | 0.19 |
?.. вопросительный знак с многоточием | 14 | 0.07 |
!!! тройной восклицательный знак | 9 | 0.04 |
?! вопросительный знак с восклицанием | 9 | 0.04 |
" кавычка | 79 | 0.37 |
() скобки | 103 | 0.48 |
: двоеточие | 1579 | 7.38 |
; точка с запятой | 708 | 3.31 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 80437 | 7.96 |
Б | 18462 | 1.83 |
В | 40681 | 4.03 |
Г | 19672 | 1.95 |
Д | 34375 | 3.40 |
Е-Ё | 83086 | 8.22 |
Ж | 19672 | 1.95 |
З | 16272 | 1.61 |
И-Й | 77001 | 7.62 |
К | 35089 | 3.47 |
Л | 50822 | 5.03 |
М | 34412 | 3.41 |
Н | 61674 | 6.10 |
О | 114847 | 11.37 |
П | 27601 | 2.73 |
Р | 40730 | 4.03 |
С | 52643 | 5.21 |
Т | 66710 | 6.60 |
У | 31240 | 3.09 |
Ф | 962 | 0.10 |
Х | 8326 | 0.82 |
Ц | 3183 | 0.32 |
Ч | 16809 | 1.66 |
Ш | 8991 | 0.89 |
Щ | 2833 | 0.28 |
Ь-Ъ | 22673 | 2.24 |
Ы | 19107 | 1.89 |
Э | 3788 | 0.37 |
Ю | 5424 | 0.54 |
Я | 21502 | 2.13 |
|
Части речи
Определенных частей речи (ОЧР) | 213768 слов |
Не определенных частей речи (НОЧР) | 143 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Существительное | 44785 | 20.950 |
Глагол | 27949 | 19.720 |
Местоимение-существительное | 27949 | 13.074 |
Предлог | 10136 | 9.263 |
Союз | 23900 | 11 |
Прилагательное | 10136 | 4.742 |
Наречие | 13749 | 6.432 |
Местоимение-прилагательное | 10457 | 4.892 |
Частица | 13057 | 6.108 |
Местоименное наречие | 5427 | 2.539 |
Числительное | 1633 | 0.764 |
Числительное-прилагательное | 335 | 0.157 |
Междометие | 367 | 0.172 |
Часть композита - сложного слова | 16 | 0.007 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Существительное | Глагол | Местоимение-существительное | Предлог | Союз | Прилагательное | Наречие | Местоимение-прилагательное | Частица | Местоименное наречие | Числительное | Числительное-прилагательное | Междометие | Часть композита - сложного слова |
Существительное | 33.74 | 40.50 | 21.63 | 24.24 | 42.55 | 7.46 | 11.78 | 8.66 | 10.51 | 5.94 | 1.39 | 0.44 | 0.64 | 0.02 |
Глагол | 31.50 | 22.15 | 29.63 | 35.13 | 28.62 | 8.61 | 13.64 | 9.89 | 11.25 | 5.08 | 1.10 | 0.17 | 0.42 | 0.00 |
Местоимение-существительное | 12.89 | 45.44 | 10.07 | 9.46 | 10.62 | 5.44 | 12.54 | 5.19 | 14.07 | 4.17 | 0.58 | 0.07 | 0.22 | 0.01 |
Предлог | 46.85 | 1.07 | 19.84 | 0.51 | 1.45 | 7.86 | 0.34 | 12.11 | 0.16 | 0.04 | 1.87 | 0.47 | 0.04 | 0.03 |
Союз | 14.46 | 25.52 | 23.82 | 8.53 | 5.44 | 3.63 | 9.61 | 5.74 | 9.58 | 4.65 | 0.67 | 0.10 | 0.06 | 0.00 |
Прилагательное | 29.92 | 2.94 | 1.82 | 1.67 | 4.65 | 3.32 | 0.88 | 0.65 | 0.85 | 0.44 | 0.19 | 0.02 | 0.05 | 0.00 |
Наречие | 4.99 | 20.56 | 7.35 | 5.12 | 7.50 | 2.94 | 6.36 | 1.94 | 5.42 | 1.50 | 0.51 | 0.03 | 0.07 | 0.00 |
Местоимение-прилагательное | 22.07 | 6.34 | 3.96 | 2.06 | 1.97 | 4.88 | 2.05 | 1.51 | 2.54 | 1.11 | 0.39 | 0.02 | 0.02 | 0.00 |
Частица | 5.79 | 26.29 | 7.77 | 4.02 | 3.59 | 1.82 | 4.35 | 2.20 | 3.33 | 1.57 | 0.30 | 0.02 | 0.03 | 0.00 |
Местоименное наречие | 1.90 | 5.45 | 4.27 | 1.49 | 4.35 | 0.79 | 2.48 | 0.72 | 3.01 | 0.81 | 0.10 | 0.00 | 0.01 | 0.00 |
Числительное | 4.31 | 0.54 | 0.18 | 0.27 | 0.62 | 0.45 | 0.22 | 0.13 | 0.14 | 0.02 | 0.53 | 0.22 | 0.00 | 0.00 |
Числительное-прилагательное | 0.78 | 0.17 | 0.06 | 0.07 | 0.13 | 0.11 | 0.05 | 0.03 | 0.12 | 0.03 | 0.01 | 0.00 | 0.00 | 0.00 |
Междометие | 0.24 | 0.22 | 0.34 | 0.06 | 0.32 | 0.10 | 0.02 | 0.14 | 0.09 | 0.02 | 0.00 | 0.00 | 0.15 | 0.00 |
Часть композита - сложного слова | 0.06 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Существительное | 13.41 | 15.63 | 17.50 | 19.37 | 21.41 |
Глагол | 9.05 | 24.08 | 24.28 | 23.82 | 21.11 |
Местоимение-существительное | 22.29 | 18.76 | 15.56 | 13.14 | 12.52 |
Предлог | 7.96 | 5.67 | 8.37 | 9.49 | 10.03 |
Союз | 17.38 | 6.61 | 8.04 | 9.70 | 10.60 |
Прилагательное | 2.14 | 2.97 | 3.59 | 4.58 | 4.95 |
Наречие | 8.17 | 7.90 | 7.38 | 6.35 | 6.09 |
Местоимение-прилагательное | 3.85 | 4.91 | 4.59 | 4.65 | 5.08 |
Частица | 8.97 | 8.99 | 7.53 | 6.07 | 5.14 |
Местоименное наречие | 4.90 | 3.09 | 2.00 | 1.90 | 1.99 |
Числительное | 0.50 | 0.82 | 0.73 | 0.76 | 0.91 |
Числительное-прилагательное | 0.11 | 0.39 | 0.30 | 0.11 | 0.09 |
Междометие | 1.28 | 0.18 | 0.14 | 0.05 | 0.05 |
Часть композита - сложного слова | 0.00 | 0.01 | 0.01 | 0.01 | 0.02 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Существительное | 21.10 | 21.91 | 21.07 | 21.91 | 21.67 |
Глагол | 20.19 | 19.06 | 19.78 | 19.17 | 19.05 |
Местоимение-существительное | 11.78 | 11.33 | 11.76 | 11.30 | 11.15 |
Предлог | 9.87 | 10.11 | 10.04 | 10.57 | 10.48 |
Союз | 12.25 | 12.62 | 11.94 | 12.04 | 12.09 |
Прилагательное | 5.17 | 5.26 | 5.15 | 4.94 | 5.28 |
Наречие | 6.13 | 5.46 | 5.68 | 5.97 | 6.21 |
Местоимение-прилагательное | 5.09 | 4.75 | 5.32 | 5.01 | 5.32 |
Частица | 5.13 | 6.04 | 5.76 | 5.63 | 5.46 |
Местоименное наречие | 2.34 | 2.29 | 2.52 | 2.40 | 2.33 |
Числительное | 0.71 | 0.85 | 0.82 | 0.85 | 0.71 |
Числительное-прилагательное | 0.15 | 0.18 | 0.08 | 0.14 | 0.12 |
Междометие | 0.07 | 0.12 | 0.08 | 0.07 | 0.12 |
Часть композита - сложного слова | 0.02 | 0.02 | 0.00 | 0.01 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Существительное | 21.41 | 21.20 | 21.40 | 20.53 | 22.23 |
Глагол | 19.30 | 19.32 | 18.28 | 18.63 | 18.31 |
Местоимение-существительное | 10.75 | 11.26 | 11.48 | 11.88 | 11.97 |
Предлог | 10.33 | 10.38 | 10.54 | 11.22 | 10.57 |
Союз | 12.33 | 12.01 | 12.36 | 12.68 | 12.23 |
Прилагательное | 5.06 | 5.41 | 5.13 | 5.31 | 5.13 |
Наречие | 6.20 | 5.90 | 5.72 | 5.57 | 5.46 |
Местоимение-прилагательное | 5.47 | 5.60 | 5.08 | 5.25 | 5.20 |
Частица | 5.75 | 5.50 | 6.51 | 5.72 | 5.56 |
Местоименное наречие | 2.34 | 2.35 | 2.42 | 2.10 | 2.37 |
Числительное | 0.82 | 0.84 | 0.75 | 0.89 | 0.84 |
Числительное-прилагательное | 0.12 | 0.19 | 0.13 | 0.18 | 0.08 |
Междометие | 0.11 | 0.04 | 0.21 | 0.04 | 0.06 |
Часть композита - сложного слова | 0.01 | 0.00 | 0.00 | 0.02 | 0.00 |
Последние комментарии
12 минут 12 секунд назад
34 минут 54 секунд назад
35 минут 27 секунд назад
38 минут 7 секунд назад
48 минут 30 секунд назад
51 минут 11 секунд назад