Лингвистический анализ: Фундаментальные алгоритмы и структуры данных в Delphi (Джулиан Бакнелл)
Общая статистика
Длина текста | 1081091 знаков |
Длина диалогов | 840 знаков |
Слов в произведении (СВП) | 140295 слов |
Приблизительно страниц | 601 стр. |
Средняя длина слова | 6.24 знаков |
Предложений в произведении (ПВП) | 7107 предл. |
Средняя длина предложения (СДП) | 149.14 знаков |
Доля диалогов в тексте | 0.08 % |
Доля авторского текста | 99.92 % |
СДП диалогов | 419.50 знаков |
СДП авторского текста | 105.36 знаков |
|
Максимальный фрагмент авторского текста - 246078 знаков (в страницах - примерно 137, начинается где-то с 166 страницы) |
Активный словарный запас
Использовано уникальных слов | 12882 | |
Активный словарный запас (АСЗ) | 10601 | |
Активный не словарный запас (АНСЗ) | 2281 | |
Удельный АСЗ на 3000 слов текста | 1043.42 | 123724 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 2383.33 | 127207 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 10534.40 | 36574 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1505) наблюдается примерно на 4 странице |
Минимальный УАСЗ-3000 (757) наблюдается примерно на 342 странице |
|
Буквы и знаки препинания
Всего букв | 699964 букв |
Всего знаков препинания | 41607 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, запятая | 11545 | 82.29 |
. точка | 10069 | 71.77 |
- тире | 2666 | 19.00 |
? вопросительный знак | 212 | 1.51 |
! восклицательный знак | 28 | 0.20 |
... многоточие | 29 | 0.21 |
!.. восклицательный знак с многоточием | 0 | 0.00 |
?.. вопросительный знак с многоточием | 1 | 0.01 |
!!! тройной восклицательный знак | 0 | 0.00 |
?! вопросительный знак с восклицанием | 0 | 0.00 |
" кавычка | 866 | 6.17 |
() скобки | 4412 | 31.45 |
: двоеточие | 4584 | 32.67 |
; точка с запятой | 7195 | 51.28 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 49894 | 7.13 |
Б | 10335 | 1.48 |
В | 31898 | 4.56 |
Г | 8875 | 1.27 |
Д | 22006 | 3.14 |
Е-Ё | 65313 | 9.33 |
Ж | 8875 | 1.27 |
З | 13322 | 1.90 |
И-Й | 59849 | 8.55 |
К | 21132 | 3.02 |
Л | 30803 | 4.40 |
М | 24634 | 3.52 |
Н | 46191 | 6.60 |
О | 74763 | 10.68 |
П | 22114 | 3.16 |
Р | 32765 | 4.68 |
С | 39072 | 5.58 |
Т | 46451 | 6.64 |
У | 17314 | 2.47 |
Ф | 1762 | 0.25 |
Х | 6067 | 0.87 |
Ц | 3537 | 0.51 |
Ч | 11013 | 1.57 |
Ш | 2711 | 0.39 |
Щ | 2803 | 0.40 |
Ь-Ъ | 12042 | 1.72 |
Ы | 14897 | 2.13 |
Э | 3986 | 0.57 |
Ю | 3966 | 0.57 |
Я | 15204 | 2.17 |
|
Части речи
Определенных частей речи (ОЧР) | 111584 слов |
Не определенных частей речи (НОЧР) | 28711 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Существительное | 40709 | 36.483 |
Глагол | 5181 | 15.503 |
Местоимение-существительное | 5181 | 4.643 |
Предлог | 10921 | 11.525 |
Союз | 7945 | 7 |
Прилагательное | 10921 | 9.787 |
Наречие | 6392 | 5.728 |
Местоимение-прилагательное | 5034 | 4.511 |
Частица | 2743 | 2.458 |
Местоименное наречие | 591 | 0.530 |
Числительное | 1032 | 0.925 |
Числительное-прилагательное | 859 | 0.770 |
Междометие | 4 | 0.004 |
Часть композита - сложного слова | 14 | 0.013 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Существительное | Глагол | Местоимение-существительное | Предлог | Союз | Прилагательное | Наречие | Местоимение-прилагательное | Частица | Местоименное наречие | Числительное | Числительное-прилагательное | Междометие | Часть композита - сложного слова |
Существительное | 110.59 | 59.88 | 14.09 | 59.10 | 39.47 | 29.34 | 23.09 | 16.29 | 5.87 | 2.43 | 2.11 | 2.50 | 0.02 | 0.04 |
Глагол | 48.73 | 16.67 | 7.26 | 29.10 | 10.32 | 18.52 | 7.92 | 6.37 | 5.87 | 0.73 | 2.62 | 0.91 | 0.00 | 0.01 |
Местоимение-существительное | 10.34 | 14.59 | 1.16 | 2.81 | 3.46 | 3.76 | 4.68 | 0.97 | 4.01 | 0.30 | 0.24 | 0.10 | 0.00 | 0.01 |
Предлог | 61.74 | 4.10 | 10.72 | 1.39 | 1.42 | 17.95 | 1.01 | 12.37 | 0.17 | 0.10 | 1.84 | 2.37 | 0.01 | 0.06 |
Союз | 16.90 | 13.07 | 6.20 | 8.34 | 3.50 | 6.52 | 7.30 | 3.56 | 3.56 | 0.46 | 0.81 | 0.98 | 0.00 | 0.00 |
Прилагательное | 73.63 | 4.81 | 1.18 | 3.55 | 4.38 | 7.00 | 1.44 | 0.69 | 0.42 | 0.31 | 0.23 | 0.22 | 0.00 | 0.00 |
Наречие | 5.21 | 24.43 | 2.48 | 5.16 | 3.81 | 5.95 | 5.23 | 2.06 | 1.94 | 0.27 | 0.55 | 0.19 | 0.00 | 0.00 |
Местоимение-прилагательное | 23.61 | 5.68 | 1.62 | 2.58 | 1.84 | 4.34 | 2.46 | 0.83 | 1.42 | 0.10 | 0.46 | 0.16 | 0.01 | 0.00 |
Частица | 3.32 | 9.77 | 0.87 | 2.06 | 0.87 | 1.96 | 3.09 | 1.40 | 0.47 | 0.47 | 0.24 | 0.06 | 0.00 | 0.00 |
Местоименное наречие | 0.47 | 0.94 | 0.58 | 0.49 | 0.90 | 0.25 | 0.71 | 0.12 | 0.73 | 0.08 | 0.02 | 0.00 | 0.00 | 0.00 |
Числительное | 5.21 | 0.48 | 0.12 | 0.10 | 0.64 | 1.90 | 0.23 | 0.36 | 0.04 | 0.02 | 0.03 | 0.13 | 0.00 | 0.00 |
Числительное-прилагательное | 4.96 | 0.61 | 0.15 | 0.55 | 0.60 | 0.34 | 0.11 | 0.10 | 0.06 | 0.02 | 0.12 | 0.08 | 0.00 | 0.00 |
Междометие | 0.02 | 0.00 | 0.00 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 |
Часть композита - сложного слова | 0.09 | 0.00 | 0.00 | 0.00 | 0.00 | 0.04 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Существительное | 22.10 | 36.91 | 36.17 | 34.69 | 36.55 |
Глагол | 9.56 | 14.71 | 18.10 | 19.48 | 18.38 |
Местоимение-существительное | 7.27 | 9.39 | 6.60 | 5.19 | 4.14 |
Предлог | 20.00 | 8.59 | 9.89 | 10.84 | 10.68 |
Союз | 13.95 | 5.61 | 5.70 | 5.34 | 5.47 |
Прилагательное | 5.56 | 7.48 | 8.25 | 10.17 | 10.00 |
Наречие | 10.05 | 4.82 | 6.56 | 5.84 | 5.68 |
Местоимение-прилагательное | 6.42 | 5.06 | 4.20 | 4.12 | 4.36 |
Частица | 1.31 | 4.39 | 2.71 | 2.18 | 2.70 |
Местоименное наречие | 1.93 | 0.46 | 0.27 | 0.37 | 0.54 |
Числительное | 0.29 | 0.83 | 0.87 | 1.02 | 1.02 |
Числительное-прилагательное | 1.55 | 1.71 | 0.68 | 0.75 | 0.48 |
Междометие | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 |
Часть композита - сложного слова | 0.00 | 0.02 | 0.00 | 0.02 | 0.02 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Существительное | 36.43 | 36.14 | 36.80 | 35.72 | 36.90 |
Глагол | 17.58 | 16.55 | 16.76 | 16.14 | 15.11 |
Местоимение-существительное | 4.44 | 4.04 | 3.36 | 4.04 | 3.64 |
Предлог | 10.96 | 11.42 | 11.78 | 12.38 | 13.14 |
Союз | 6.10 | 6.06 | 6.53 | 6.75 | 7.43 |
Прилагательное | 10.20 | 10.58 | 9.98 | 10.77 | 9.61 |
Наречие | 5.51 | 5.64 | 5.18 | 5.23 | 5.24 |
Местоимение-прилагательное | 4.48 | 4.75 | 4.79 | 4.81 | 4.47 |
Частица | 2.18 | 2.78 | 2.66 | 2.23 | 2.47 |
Местоименное наречие | 0.49 | 0.44 | 0.43 | 0.44 | 0.42 |
Числительное | 1.19 | 0.99 | 1.15 | 0.75 | 1.03 |
Числительное-прилагательное | 0.43 | 0.61 | 0.55 | 0.68 | 0.54 |
Междометие | 0.00 | 0.00 | 0.00 | 0.02 | 0.00 |
Часть композита - сложного слова | 0.00 | 0.00 | 0.04 | 0.02 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Существительное | 35.84 | 35.01 | 35.23 | 35.24 | 34.23 |
Глагол | 15.00 | 14.90 | 15.34 | 14.82 | 14.89 |
Местоимение-существительное | 4.38 | 4.47 | 4.01 | 5.08 | 4.65 |
Предлог | 11.92 | 12.22 | 11.36 | 12.08 | 11.89 |
Союз | 8.06 | 8.03 | 7.92 | 7.98 | 8.13 |
Прилагательное | 9.77 | 9.75 | 10.50 | 9.71 | 10.31 |
Наречие | 5.26 | 5.67 | 6.13 | 5.47 | 5.59 |
Местоимение-прилагательное | 5.16 | 5.10 | 4.55 | 4.53 | 5.73 |
Частица | 2.23 | 2.71 | 2.45 | 2.93 | 2.47 |
Местоименное наречие | 0.70 | 0.49 | 0.57 | 0.52 | 0.54 |
Числительное | 1.08 | 0.99 | 1.26 | 0.85 | 1.15 |
Числительное-прилагательное | 0.58 | 0.66 | 0.63 | 0.78 | 0.43 |
Междометие | 0.03 | 0.00 | 0.00 | 0.00 | 0.00 |
Часть композита - сложного слова | 0.00 | 0.00 | 0.06 | 0.00 | 0.00 |
Последние комментарии
1 час 10 минут назад
4 часов 52 минут назад
5 часов 13 минут назад
6 часов 7 минут назад
9 часов 5 минут назад
9 часов 7 минут назад