Лингвистический анализ: Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт (Алекс Дж. Гатман)



Общая статистика

Длина текста478306 знаков
Длина диалогов20915 знаков
Слов в произведении (СВП)64133 слов
Приблизительно страниц266 стр.
Средняя длина слова6.09 знаков
Предложений в произведении (ПВП)4416 предл.
Средняя длина предложения (СДП)105.38 знаков
Доля диалогов в тексте4.37 %
Доля авторского текста95.63 %
СДП диалогов118.52 знаков
СДП авторского текста108.64 знаков
Использование диалогов по тексту книги № 639743: Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт (Алекс Дж. Гатман)
Максимальный фрагмент авторского текста - 65852 знаков (в страницах - примерно 37, начинается где-то с 142 страницы)

Активный словарный запас

Использовано уникальных слов12421
Активный словарный запас (АСЗ)11517
Активный не словарный запас (АНСЗ)904
Удельный АСЗ на 3000 слов текста1379.0334139 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста3454.75366028 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста0.00
Удельный АСЗ-3000 книги № 639743: Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт (Алекс Дж. Гатман)
Максимальный УАСЗ-3000 (1671) наблюдается примерно на 249 странице
Минимальный УАСЗ-3000 (1110) наблюдается примерно на 91 странице
Рост АСЗ книги № 639743: Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт (Алекс Дж. Гатман)

Буквы и знаки препинания

Всего букв382697 букв
Всего знаков препинания12781 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, запятая605594.41
. точка449270.04
- тире68010.60
? вопросительный знак3034.72
! восклицательный знак350.55
... многоточие00.00
!.. восклицательный знак с многоточием00.00
?.. вопросительный знак с многоточием10.02
!!! тройной восклицательный знак00.00
?! вопросительный знак с восклицанием00.00
" кавычка00.00
() скобки75611.79
: двоеточие3695.75
; точка с запятой901.40
БукваКол-во (шт.)Частота использования (в %)
А294317.69
Б58391.53
В164804.31
Г52991.38
Д114783.00
Е-Ё336028.78
Ж52991.38
З66091.73
И-Й340328.89
К115883.03
Л145493.80
М132973.47
Н271777.10
О4103710.72
П109322.86
Р176104.60
С201185.26
Т273727.15
У85842.24
Ф9750.25
Х41201.08
Ц18310.48
Ч58721.53
Ш20800.54
Щ14140.37
Ь-Ъ67731.77
Ы95092.48
Э16530.43
Ю26790.70
Я74491.95
Диаграма использования букв книги № 639743: Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт (Алекс Дж. Гатман)

Части речи

Определенных частей речи (ОЧР)62257 слов
Не определенных частей речи (НОЧР)1876 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Существительное2107433.850
Глагол445815.732
Местоимение-существительное44587.161
Предлог603011.713
Союз48468
Прилагательное60309.686
Наречие28484.575
Местоимение-прилагательное32375.199
Частица17292.777
Местоименное наречие4900.787
Числительное3490.561
Числительное-прилагательное980.157
Междометие110.018
Часть композита - сложного слова10.002

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

СуществительноеГлаголМестоимение-существительноеПредлогСоюзПрилагательноеНаречиеМестоимение-прилагательноеЧастицаМестоименное наречиеЧислительноеЧислительное-прилагательноеМеждометиеЧасть композита - сложного слова
Существительное94.8252.6820.3858.2338.9429.6215.1317.606.633.000.920.420.100.02
Глагол39.0321.8110.8932.4811.4516.088.568.195.981.141.570.100.030.00
Местоимение-существительное11.0027.372.602.997.955.306.711.625.300.470.210.080.000.00
Предлог63.372.8914.831.671.5915.180.9514.230.100.181.380.750.020.00
Союз18.9913.6210.946.913.348.374.985.283.970.880.450.100.020.00
Прилагательное70.404.261.725.945.915.671.140.690.550.400.160.020.000.00
Наречие3.8715.853.573.423.577.663.791.282.220.260.220.020.020.00
Местоимение-прилагательное28.565.323.212.961.775.451.641.001.330.180.500.100.000.00
Частица3.1611.662.391.821.061.721.911.750.921.190.190.000.000.00
Местоименное наречие0.581.410.980.401.990.550.820.220.750.160.000.000.000.00
Числительное3.490.370.030.210.181.160.100.080.000.000.000.000.000.00
Числительное-прилагательное1.080.060.050.080.100.110.020.030.030.020.000.000.000.00
Междометие0.130.000.020.030.000.000.000.000.000.000.000.000.000.00
Часть композита - сложного слова0.020.000.000.000.000.000.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Существительное18.7131.4932.2631.3532.22
Глагол11.2516.9519.9419.7419.44
Местоимение-существительное10.7411.6010.009.537.58
Предлог16.829.2610.6811.3810.54
Союз17.195.075.425.316.15
Прилагательное6.838.047.899.0611.03
Наречие7.044.825.063.914.10
Местоимение-прилагательное6.715.424.765.345.04
Частица2.504.873.003.132.53
Местоименное наречие1.610.920.330.470.49
Числительное0.330.900.560.630.84
Числительное-прилагательное0.260.650.100.130.05
Междометие0.000.020.000.030.00
Часть композита - сложного слова0.000.000.000.000.00

Номер слова в предложении
678910
Существительное33.3033.9833.8432.0033.17
Глагол16.7717.0815.4615.8416.52
Местоимение-существительное6.305.345.237.015.65
Предлог12.4112.2112.9012.0212.51
Союз6.736.138.258.348.57
Прилагательное10.8610.339.6110.6310.04
Наречие4.314.844.714.824.46
Местоимение-прилагательное5.295.525.705.434.83
Частица2.422.932.652.332.74
Местоименное наречие0.680.700.830.710.75
Числительное0.900.850.740.680.62
Числительное-прилагательное0.030.090.060.130.10
Междометие0.000.000.030.060.03
Часть композита - сложного слова0.000.000.000.000.00

Номер слова в предложении
1112131415
Существительное33.9831.5334.1931.8132.33
Глагол15.3214.6415.1715.1013.93
Местоимение-существительное5.826.996.085.657.22
Предлог11.8911.8012.2514.4313.07
Союз8.069.518.788.267.73
Прилагательное12.0411.969.9011.5411.08
Наречие3.794.424.244.274.22
Местоимение-прилагательное4.754.464.845.276.41
Частица3.023.202.782.372.75
Местоименное наречие0.770.990.940.380.76
Числительное0.410.470.510.810.46
Числительное-прилагательное0.150.040.300.050.05
Междометие0.000.000.000.000.00
Часть композита - сложного слова0.000.000.000.050.00