Лингвистический анализ: Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт (Алекс Дж. Гатман)
Общая статистика
Длина текста | 478306 знаков |
Длина диалогов | 20915 знаков |
Слов в произведении (СВП) | 64133 слов |
Приблизительно страниц | 266 стр. |
Средняя длина слова | 6.09 знаков |
Предложений в произведении (ПВП) | 4416 предл. |
Средняя длина предложения (СДП) | 105.38 знаков |
Доля диалогов в тексте | 4.37 % |
Доля авторского текста | 95.63 % |
СДП диалогов | 118.52 знаков |
СДП авторского текста | 108.64 знаков |
|
Максимальный фрагмент авторского текста - 65852 знаков (в страницах - примерно 37, начинается где-то с 142 страницы) |
Активный словарный запас
Использовано уникальных слов | 12421 | |
Активный словарный запас (АСЗ) | 11517 | |
Активный не словарный запас (АНСЗ) | 904 | |
Удельный АСЗ на 3000 слов текста | 1379.03 | 34139 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 3454.75 | 366028 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 0.00 | |
|
Максимальный УАСЗ-3000 (1671) наблюдается примерно на 249 странице |
Минимальный УАСЗ-3000 (1110) наблюдается примерно на 91 странице |
|
Буквы и знаки препинания
Всего букв | 382697 букв |
Всего знаков препинания | 12781 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, запятая | 6055 | 94.41 |
. точка | 4492 | 70.04 |
- тире | 680 | 10.60 |
? вопросительный знак | 303 | 4.72 |
! восклицательный знак | 35 | 0.55 |
... многоточие | 0 | 0.00 |
!.. восклицательный знак с многоточием | 0 | 0.00 |
?.. вопросительный знак с многоточием | 1 | 0.02 |
!!! тройной восклицательный знак | 0 | 0.00 |
?! вопросительный знак с восклицанием | 0 | 0.00 |
" кавычка | 0 | 0.00 |
() скобки | 756 | 11.79 |
: двоеточие | 369 | 5.75 |
; точка с запятой | 90 | 1.40 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 29431 | 7.69 |
Б | 5839 | 1.53 |
В | 16480 | 4.31 |
Г | 5299 | 1.38 |
Д | 11478 | 3.00 |
Е-Ё | 33602 | 8.78 |
Ж | 5299 | 1.38 |
З | 6609 | 1.73 |
И-Й | 34032 | 8.89 |
К | 11588 | 3.03 |
Л | 14549 | 3.80 |
М | 13297 | 3.47 |
Н | 27177 | 7.10 |
О | 41037 | 10.72 |
П | 10932 | 2.86 |
Р | 17610 | 4.60 |
С | 20118 | 5.26 |
Т | 27372 | 7.15 |
У | 8584 | 2.24 |
Ф | 975 | 0.25 |
Х | 4120 | 1.08 |
Ц | 1831 | 0.48 |
Ч | 5872 | 1.53 |
Ш | 2080 | 0.54 |
Щ | 1414 | 0.37 |
Ь-Ъ | 6773 | 1.77 |
Ы | 9509 | 2.48 |
Э | 1653 | 0.43 |
Ю | 2679 | 0.70 |
Я | 7449 | 1.95 |
|
Части речи
Определенных частей речи (ОЧР) | 62257 слов |
Не определенных частей речи (НОЧР) | 1876 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Существительное | 21074 | 33.850 |
Глагол | 4458 | 15.732 |
Местоимение-существительное | 4458 | 7.161 |
Предлог | 6030 | 11.713 |
Союз | 4846 | 8 |
Прилагательное | 6030 | 9.686 |
Наречие | 2848 | 4.575 |
Местоимение-прилагательное | 3237 | 5.199 |
Частица | 1729 | 2.777 |
Местоименное наречие | 490 | 0.787 |
Числительное | 349 | 0.561 |
Числительное-прилагательное | 98 | 0.157 |
Междометие | 11 | 0.018 |
Часть композита - сложного слова | 1 | 0.002 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Существительное | Глагол | Местоимение-существительное | Предлог | Союз | Прилагательное | Наречие | Местоимение-прилагательное | Частица | Местоименное наречие | Числительное | Числительное-прилагательное | Междометие | Часть композита - сложного слова |
Существительное | 94.82 | 52.68 | 20.38 | 58.23 | 38.94 | 29.62 | 15.13 | 17.60 | 6.63 | 3.00 | 0.92 | 0.42 | 0.10 | 0.02 |
Глагол | 39.03 | 21.81 | 10.89 | 32.48 | 11.45 | 16.08 | 8.56 | 8.19 | 5.98 | 1.14 | 1.57 | 0.10 | 0.03 | 0.00 |
Местоимение-существительное | 11.00 | 27.37 | 2.60 | 2.99 | 7.95 | 5.30 | 6.71 | 1.62 | 5.30 | 0.47 | 0.21 | 0.08 | 0.00 | 0.00 |
Предлог | 63.37 | 2.89 | 14.83 | 1.67 | 1.59 | 15.18 | 0.95 | 14.23 | 0.10 | 0.18 | 1.38 | 0.75 | 0.02 | 0.00 |
Союз | 18.99 | 13.62 | 10.94 | 6.91 | 3.34 | 8.37 | 4.98 | 5.28 | 3.97 | 0.88 | 0.45 | 0.10 | 0.02 | 0.00 |
Прилагательное | 70.40 | 4.26 | 1.72 | 5.94 | 5.91 | 5.67 | 1.14 | 0.69 | 0.55 | 0.40 | 0.16 | 0.02 | 0.00 | 0.00 |
Наречие | 3.87 | 15.85 | 3.57 | 3.42 | 3.57 | 7.66 | 3.79 | 1.28 | 2.22 | 0.26 | 0.22 | 0.02 | 0.02 | 0.00 |
Местоимение-прилагательное | 28.56 | 5.32 | 3.21 | 2.96 | 1.77 | 5.45 | 1.64 | 1.00 | 1.33 | 0.18 | 0.50 | 0.10 | 0.00 | 0.00 |
Частица | 3.16 | 11.66 | 2.39 | 1.82 | 1.06 | 1.72 | 1.91 | 1.75 | 0.92 | 1.19 | 0.19 | 0.00 | 0.00 | 0.00 |
Местоименное наречие | 0.58 | 1.41 | 0.98 | 0.40 | 1.99 | 0.55 | 0.82 | 0.22 | 0.75 | 0.16 | 0.00 | 0.00 | 0.00 | 0.00 |
Числительное | 3.49 | 0.37 | 0.03 | 0.21 | 0.18 | 1.16 | 0.10 | 0.08 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Числительное-прилагательное | 1.08 | 0.06 | 0.05 | 0.08 | 0.10 | 0.11 | 0.02 | 0.03 | 0.03 | 0.02 | 0.00 | 0.00 | 0.00 | 0.00 |
Междометие | 0.13 | 0.00 | 0.02 | 0.03 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Часть композита - сложного слова | 0.02 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Существительное | 18.71 | 31.49 | 32.26 | 31.35 | 32.22 |
Глагол | 11.25 | 16.95 | 19.94 | 19.74 | 19.44 |
Местоимение-существительное | 10.74 | 11.60 | 10.00 | 9.53 | 7.58 |
Предлог | 16.82 | 9.26 | 10.68 | 11.38 | 10.54 |
Союз | 17.19 | 5.07 | 5.42 | 5.31 | 6.15 |
Прилагательное | 6.83 | 8.04 | 7.89 | 9.06 | 11.03 |
Наречие | 7.04 | 4.82 | 5.06 | 3.91 | 4.10 |
Местоимение-прилагательное | 6.71 | 5.42 | 4.76 | 5.34 | 5.04 |
Частица | 2.50 | 4.87 | 3.00 | 3.13 | 2.53 |
Местоименное наречие | 1.61 | 0.92 | 0.33 | 0.47 | 0.49 |
Числительное | 0.33 | 0.90 | 0.56 | 0.63 | 0.84 |
Числительное-прилагательное | 0.26 | 0.65 | 0.10 | 0.13 | 0.05 |
Междометие | 0.00 | 0.02 | 0.00 | 0.03 | 0.00 |
Часть композита - сложного слова | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Существительное | 33.30 | 33.98 | 33.84 | 32.00 | 33.17 |
Глагол | 16.77 | 17.08 | 15.46 | 15.84 | 16.52 |
Местоимение-существительное | 6.30 | 5.34 | 5.23 | 7.01 | 5.65 |
Предлог | 12.41 | 12.21 | 12.90 | 12.02 | 12.51 |
Союз | 6.73 | 6.13 | 8.25 | 8.34 | 8.57 |
Прилагательное | 10.86 | 10.33 | 9.61 | 10.63 | 10.04 |
Наречие | 4.31 | 4.84 | 4.71 | 4.82 | 4.46 |
Местоимение-прилагательное | 5.29 | 5.52 | 5.70 | 5.43 | 4.83 |
Частица | 2.42 | 2.93 | 2.65 | 2.33 | 2.74 |
Местоименное наречие | 0.68 | 0.70 | 0.83 | 0.71 | 0.75 |
Числительное | 0.90 | 0.85 | 0.74 | 0.68 | 0.62 |
Числительное-прилагательное | 0.03 | 0.09 | 0.06 | 0.13 | 0.10 |
Междометие | 0.00 | 0.00 | 0.03 | 0.06 | 0.03 |
Часть композита - сложного слова | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Существительное | 33.98 | 31.53 | 34.19 | 31.81 | 32.33 |
Глагол | 15.32 | 14.64 | 15.17 | 15.10 | 13.93 |
Местоимение-существительное | 5.82 | 6.99 | 6.08 | 5.65 | 7.22 |
Предлог | 11.89 | 11.80 | 12.25 | 14.43 | 13.07 |
Союз | 8.06 | 9.51 | 8.78 | 8.26 | 7.73 |
Прилагательное | 12.04 | 11.96 | 9.90 | 11.54 | 11.08 |
Наречие | 3.79 | 4.42 | 4.24 | 4.27 | 4.22 |
Местоимение-прилагательное | 4.75 | 4.46 | 4.84 | 5.27 | 6.41 |
Частица | 3.02 | 3.20 | 2.78 | 2.37 | 2.75 |
Местоименное наречие | 0.77 | 0.99 | 0.94 | 0.38 | 0.76 |
Числительное | 0.41 | 0.47 | 0.51 | 0.81 | 0.46 |
Числительное-прилагательное | 0.15 | 0.04 | 0.30 | 0.05 | 0.05 |
Междометие | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Часть композита - сложного слова | 0.00 | 0.00 | 0.00 | 0.05 | 0.00 |
Последние комментарии
1 час 30 минут назад
1 час 59 минут назад
2 часов 5 минут назад
3 часов 40 минут назад
5 часов 8 минут назад
6 часов 48 минут назад