
Ваша оценкаЛюбимое слово Набокова - лиловый. Что может рассказать статистика о наших любимых авторах
Рецензии
Olga_Wood13 марта 2019 г.Теорема "Цвет настроения"
Читать далееДано.
Самые популярные и читаемые произведения.
Плодотворные авторы разных стран.
Тысячи фанфиков.
Миллионы слов.Цель.
Вычислить, действительно ли женское письмо отличается от мужского?
Рассчитать, можно ли распознать истинного автора под псевдонимом?
Разгадать, правда ли, что у писателей имеются любимые/популярные слова?
Определить, на самом ли деле английский английский отличается от американского английского?
И прочие насущные вопросы.Решение.
1. Берём журналиста с подвешенным языком, с навыками мягкого изложения сути, с задатками статистика, но который умеет сидеть на месте и делать рутинную работу.
2. Формулируем животрепещущие вопросы (см. цель), которые никого в современном мире пока не интересуют.
3. Находим многочисленные подборки популярных и знаменитых произведений. Составляем необходимую выборку из избыточной информации. Несанкционированно скачиваем выбранные книги и забиваем свободную память компьютера миллионами букв.
4. Таким же способом приобретаем необходимые для эксперимента масштабные фанфики (которые по объёму сравнятся с романами) по конкретным фандомам.
5. С помощью сторонних программ и нескольких теорий пытаемся ответить на вышестоящие вопросы, проводя в ожидании обработки внушительного количества информации бо́льшую часть времени, пытаясь в этот момент выразить очередную мысль.
6. Получив итоговые данные и ответив на вопросы, переходим к части, когда читателю необходимо предоставить наглядность, эстетичность и убедительность извлечённых сведений.
7. К каждому информационному сравнению прикладываем отображённые графики, которые подкрепят серьёзность и необычность проводимого исследования.Вывод.
В ходе испытания слова огнём и современными технологиями получилось ответить на все поставленные вопросы и вычислить любимое слово Набокова. Также из полученной информации сформулировать полноценное и законченное произведение, которое в достаточной мере удовлетворяет читательским потребностям. Удалось повысить интерес к рассматриваемой области для дальнейшего изучения новоявленных вопросов.44646
majj-s1 июля 2021 г.Она зарыдала, он ухмыльнулся
Читать далееЛУЧШАЯ
КНИГА
О КНИГАХ
WALL STREET JOURNAL
Я не была бы так категорична, хороших книг о чтении много, собственно - плохих-то и нет, потому что пишут их сплошь фанатики, которые дышат книгами как воздухом, а когда пером пишущего водит подлинная страсть, результат не может быть плох по определению (хотя бы даже перо сменила клавиатура). Лучшим на все времена все равно останется кингово "Как писать книги" потому что это Стивен Кинг, дети, и, ну вы понимаете.
Однако не могу не согласиться, книга хороша. Может ли статистическое исследование быть увлекательным, как детектив или приключенческий роман? Может, если автор его Бен Блатт, колумнист, книжный обозреватель "Бостон Глоуб" и "Уолл-стрит Джорнал", известный тем, что применил методы статистического анализа к художественной литературе, и результаты оказались впечатляющими.
Почему нужно избегать на письме не только прилагательных, но и наречий, и слов, выражающих превосходную степень. Почему слово "очень" и восклицательные знаки враги текста? Есть ли реальные гендерные различия в литературе и если есть, то чем женская литература в реальности отличается от мужской? Каковы любимые слова и выражения знаменитых писателей?
Ну, о Набокове вам известно из названия, это связано с его детской еще синестезией, о том, что у Курта Воннегута "такие дела" тоже можно было бы догадаться, и вообще, он из тех писателей, что любят анафору (повтор одного и того же слова на протяжении какого-то отрывка текста), в то время, как Томас Пинчон, напротив, практически никогда не начинает следующее предложение с того же слова, что предыдущее.
Отчего англоязычные американские книги "громче" британских. Как Гарри Поттер повлиял на интеграцию британского английского в американский английский. Как меняется объем книг, составляющих серию, в зависимости от ее популярности. Метод Мостеллера-Уоллеса для определения авторства по стилю и метод Флеша-Кинкейда для определения уровня сложности текста.
А вот знаете ли вы, что в современной литературе призерами премий становятся все более простые, чтобы не сказать примитивные книги, это мир глупеет или полку читающих прибывает (определяем работоспособность системы по самому слабому звену). А что "Гроздья гнева" Стейнбека по Флешу-Кинкейду имеют рейтинг всего 4,2, что не мешает книге быть великой.
Что такое клишированные выражения и так ли необходимо избегать их любой ценой? Какими предложениями начинаются успешные книги и какими заканчиваются, что можно сказать о книге, только взглянув на обложку, и много других замечательно интересных вещей, о которых вы, ручаюсь, не раз задумывались, чтобы спустя секунду забыть.
А он не забывает, дотошно и поначалу даже кажется нудновато, отыскивает ответы, анализируя тысячи книг: классических признанно великих и просто популярных. И даже сетевых фанфиков, когда это нужно для дела. Затем аккуратно вносит данные в таблицы, строит диаграммы и графики - всего этого особенно много в начале книги, и порой хочется сказать: Да верю я тебе, дружище, давай уже по существу. И тут ты, читатель, будешь неправ, "Любимое слово Набокова - лиловый" не просто развлекательный нонфикшн, но серьезное исследование nobless oblige.
Библиография в конце книги подлинная золотоносная жила для книжного червя, вроде нас с вами. А человек, равнодушный к чтению за подобное исследование и не возьмется, правда ведь?
42544
sq8 июля 2021 г.Читать далееКнига рассчитана на потенциальных писателей. Точнее, на англоязычных потенциальных писателей. Видимо, поэтому из русского заглавия (WHAT THE NUMBERS REVEAL ABOUT THE CLASSICS, BESTSELLERS, AND OUR OWN WRITING) исчезло 'and our own writing'. И это правильно.
Оказывается, наречия на '-ly' многие хорошие писатели использовать не рекомендуют.
Мне хорошо объяснили, что ремесло писателя -- сущий ад. Например, издатель может заранее потребовать, чтобы все книги длинной серии имели по 9 глав и 216 или 217 страниц. 215 ему, видите ли, мало, а 218 -- много.
Предложения нельзя заканчивать многоточием. Нельзя использовать восклицательные знаки. Просто возмутительно!..Ну что ж, спасибо, что предупредили. В следующей жизни 42 раза подумаю, прежде чем ступать на стезю писательства.
В этой жизни я потенциальный читатель. Когда пишу по-английски, беззастенчиво пользуюсь наречиями на '-ly' и буду делать так впредь.И тем не менее в целом книга мне понравилась.
Некоторые главы представляют собой литературоведческое исследование и экскурсы в издательское дело. Другие чисто лингвистические, разве что лингвисты обычно исследуют не только родной язык, а много разных. Впрочем, я не сильно удивился, что для американского лингвиста в качестве иностранного языка выступает британский вариант всё того же английского.
Данные всех глав опираются на статистические подсчёты, благо сегодня любой может прошерстить сто миллионов слов за несколько минут. Все эти числа повышают доверие к выводам Бена Блатта.
Да и вообще мне нравятся книжки с картинками, в особенности если картинки представляют собой таблицы, графики и диаграммы. Вот типичная картинка:
Это количество лет обучения в школе, которое требуется, чтобы понять книгу. (Посчитано по индексу удобочитаемости Флеша-Кинкейда.)
Есть мнение, что с годами кто-то тупеет: либо писатели, либо читатели. С мнением можно спорить, но не хочется, когда они подкреплены такими картинками. Подозреваю, что дело в читателях. Писатели же вынуждены поставлять то, что народ в состоянии схавать.Переводчик потрудился на славу и даже больше, чем требовалось. Поскольку контекст исключительно английский, по-моему, надо было и оставить некоторые слова английскими, а то во многих случаях непонятно, что имеется в виду.
Вот, к примеру, слово "пожала" отнесено к женскому лексикону. И что она пожала? Плечами? Плоды усилий? Собрала урожай зерновых и зернобобовых? Думаю, там было 'shrugged'.
Слово "действительно" отнесено к коротким. Уж не знаю, какое слово было в оригинале, но в переводе оно не то чтобы такое уж короткое.
А уж то, что 'the' значит "тот", а 'a' = "некий", для меня чистое откровение.Как и положено в серьёзном исследовании, в конце приведены все использованные выборки. Желающие могут пересчитать.
Хорошая книга. И не только для начинающих писателей, а вообще хорошая.16396
booky_wife28 января 2020 г.Читать далееМожно ли написать книгу из 50-ти односложных слов? А за всю книгу употребить лишь единожды местоимение "она" (ответ ищите в конце поста)? Есть ли разница между женским и мужским стилем письма?
.
Если вы любите забавные факты о литературе и строгие статистические цифры, то эта книга - находка для вас. Она вся состоит из необычных идей, воплощений, подсчетов, диаграмм, таблиц и графиков. Есть где разгуляться.
.
Например:
Рэй Брэдбери чаще многих других авторов употребляет названия пряностей в своих текстах, больше всего - мяты, лакрицы и лимона
Слово "лиловый" хотя бы единожды встречается во всех 8 романах Набокова
У Уильяма Фолкнера в романе "Шум и ярость" есть предложения, состоящие из 1400 слов
Книги с низким содержанием наречий чаще становятся великими (кстати, Стивен Кинг в "Как писать книги" говорит о своей нелюбви к наречиям и попадает по количеству их употребления в статистику автора этой книги)
*Отличившимся автором, у которого абсолютно все персонажи мужские (даже животные) становится Джон Толкин со своим "Хоббитом": в книге 1900 раз употреблено местоимение "он", а "она" - всего 1 раз!
.
На мой вкус, книга суховата, но таков жанр, выбранный автором: он действительно очень серьезно и кропотливо подошел как к выбору запросов, так и предоставлению результатов своих статистических исследований.Но в целом полюбопытствовать - очень даже забавно!
15423
Hareru14 июня 2021 г.Читать далееСтатистика стала неотъемлемой частью жизни. Какую рекламу подсунуть пользователю, какие товары пользуются спросом, какие заголовки более кликабельные. Защита диплома не мыслима без проверки на антиплагиат. Проанализировать любой текст занимает секунды, а волшебная комбинация Ctrl+F поможет за секунды найти что угодно.
Автор провел колоссальную работу, анализируя по разным аспектам более 1500 книг и тонны фанфиков.
Очень интересен раздел, где проводится анализ книг, написанных в соавторстве. Можно вычислить сколько процентов написал сам автором, а сколько написано соавтором.
Можно ли вычислить писателей под псевдонимами (Бахман, Гэлбрейт), проследить стилистические закономерности любого автора, выявить пол писателя?Чем отличаются фанфики от бестселлеров New York Times?
По проценту занимаемой площади на обложке имени писателя можно сказать о популярности автора.
Писатели неосознанно в текстах используют любимые слова, с которыми у них приятные ассоциации. У Брэдбери это специи и связанные с ними воспоминания из детства, походы в гости к бабушке и чтения на кухне этикеток специй.
Книга не учит как правильно писать и каких ошибок не надо делать. Показаны правили, их исключения и как это работает в общем массиве.
13219
bukvoedka24 марта 2019 г.Читать далееВзгляд на литературные произведения с точки зрения статистики читать довольно любопытно, хотя и необязательно. Кто из писателей чаще всего использует наречия? Какие любимые слова у Набокова и Кинга? У кого больше восклицательных предложений? У какой книги самое длинное первое предложение? Можно ли определить настоящее имя автора, публикующего часть своих книг под псевдонимом?
Большая часть этой информации, в том числе таблицы и графики, бесполезная. Пониманию произведения она ничего не даёт: такой задачи автор перед собой не ставил. Но читать набор математических фактов о разных книгах нескучно.13584
Ohmarinamarina7 января 2020 г.Читать далееЗачем вы читаете нон-фикшн? Если ваша цель расширить горизонты, закрепить новые навыки или разобраться в бесконечно далекой от вас сфере науки или искусства, книга Бена Блатта - не для вас. Если же вы готовы просто развлечься без претензии на саморазвитие, быть может, эта книга вам подойдет.
«Книга о словах, которая как ни парадоксально, написана цифрами» — краткая аннотация автора к «Любимому слову Набокова – лиловый». Лучшей характеристики для его занимательного и немного несерьезного исследования, пожалуй, не придумать.
Используя современные технологии обработки больших данных (Big Data) и методы статистического анализа, американский журналист Бен Блатт препарирует великие и не очень тексты в надежде обнаружить технический рецепт успеха, который гарантирует книге попадание в категорию бестселлеров.К примеру, Блатт выясняет, существует ли зависимость между частотой использования клише и штампов и «степенью величия текста». На первый взгляд, этот вопрос высосан из пальца, а ответ на него очевиден. Ведь тексты признанных мастеров должны быть оригинальнее и самобытнее, чем сочинения их менее удачливых коллег. Но не спешите с выводами. Не все так просто, как может показаться. Отдельные заключения Блатта, подкрепленные цифрами, очень неожиданны.
Одна из самых занятных глав книги посвящена гендерным стереотипам в литературе. Блатт не только анализирует лексические и стилистические различия текстов писателей-женщин и писателей-мужчин, но и выявляет книжные штампы, сопутствующие описаниям персонажей в зависимости от их половой принадлежности. Так, Блатт обнаруживает, что писательницы в два раза чаще используют глагол «перебивать» в отношении героев-мужчин. В то же время мужчины-литераторы в пять с половиной раз чаще употребляют его для описания женских действий. Согласитесь, открытие забавное, хоть и абсолютно бесполезное. Как и выводы Блатта о том, что для изображения женского поведения литераторы обоих полов чаще всего используют слова «кричать», «шептать», «улыбаться». Однако, когда дело касается мужчин, в тех же ситуациях употребляются глаголы «орать», «бормотать» и «ухмыляться».
Интересующимся чисто техническими аспектами литературного мастерства наверняка понравится та часть книги, в которой Блатт уличает авторитетов вроде Стивена Кинга или Чака Паланика, проводящих мастер-классы на тему «как писать хорошо», в игнорировании своих же советов. Как выясняется, иногда мастера так же далеки от соблюдения собственных рекомендаций как первоклассники от решения логарифмических уравнений.
Рассказывая о своих находках, Блатт подспудно делится любопытными фактами из жизни писателей. Из его книги можно узнать, например, что Владимир Набоков был синестетом. То есть обладал феноменом восприятия, при котором чувства буквально смешиваются, и человек может осязать вкусы, видеть цвета эмоций или слышать запахи. Набокову же в большей степени был свойственен «цветной слух». Именно поэтому одно из любимых слов Набокова «лиловый» в его текстах используется не только для визуальных, но и для звуковых описаний.
Вот еще одна милая история со страниц книги Блатта. Однажды кто-то из журналистов попросил Рэя Брэдберри назвать его любимые слова. Писатель серьезно задумался, а потом выделил два слова: «ветхий» и «корица». Вразумительно объяснить иррациональную любовь к прилагательному «ветхий» он не смог. А вот пристрастие к «корице» списал на силу детских впечатлений от бабушкиной кухни, заставленной многочисленными баночками со специями.
Оказывается, писатель был удивительно точен в ответе на вопрос журналиста. Блатт в своем исследовании подтвердил слова Брэдбери. Проанализировав «программные» тексты 50 топовых англоязычных авторов (от Агаты Кристи до Джейн Остин), Блатт выявил, что никто из них не использовал слово «ветхий» чаще, чем Брэдбери. А по употреблению слова «корица» Брэдбери оказался вторым. Более того, он стал лидером по упоминанию в своих произведениях мяты, мускатного ореха, лакрицы и лимона, и вторым по частоте включения в свои тексты слов «мелисса» и «ваниль». Вот вам и детские воспоминания!
Такого рода занятными фактами и нашпигована книга Блатта. Этакий глянцевый журнал на литературную тему в книжной обложке. Но для того, чтобы получить от этого «глянца» максимальное удовольствие, читателю потребуется некоторая базовая подготовка.
Во-первых, нужно «быть на ты» с англоязычными авторами, причем как с классиками (Джейн Остин, Чарльз Диккенс), так и с современными прозаиками (Чак Паланик, Тони Моррисон) и жанровыми писателями (Стивен Кинг, Джоан Роулинг). На 99,9% книга посвящена именно англоязычной литературе. И пусть вас не обманывает фамилия Набокова в названии. Она там появилась лишь потому, что он тоже много писал по-английски. Американцы наравне с нами считают литератора своим национальным достоянием.
Во-вторых, неплохо иметь представление об элементарных основах статистики, а именно: понимать сущность терминов «выборка», «репрезентативность выборки», «корреляция», «медианное значение показателя» и так далее. Эти нехитрые познания существенно упростят чтение и позволят оценить достоверность результатов исследования Блатта. А еще нужно любить инфографику, которой насыщена книга, и не лениться ее «читать».
Итак, если вы увлечены англоязычной литературой, а статистические выкладки вас не пугают, приятый вечер с Беном Блаттом вам гарантирован.
11601
ELiashkovich30 апреля 2019 г.Читать далееКнига посвящена статистическому анализу литературных произведений. Чтобы приманить русскоязычного читателя, в название вынесли фамилию Набокова, но вообще вам следует знать, что книга только про англоязычных авторов (причем в основном современных). Если вы не в курсе, чем отличаются друг от друга Мартин Эмис, Ли Чайлд, Дин Кунц и Дебора Харкнесс, читать будет скучновато. Лично я не в курсе, потому и поставил "3".
Работа состоит из девяти глав. Каждая, в принципе, содержит какой-то интересный факт или тезис: например, автор установил интересную зависимость между раскрученностью писателя и размером его фамилии на обложке, а также установил, какой длины должно быть оптимальное стартовое предложение. Еще он разобрался с тем, следуют ли писатели собственным советам и узнал, какое слово является любимым у каждого из них. Понравилась глава про гендерный анализ — оказывается, компьютер легко может установить по тексту, человек какого пола его написал.
И вот вроде есть эти интересные факты, и бросить книгу не хочется, а все-таки как-то она не цепляет. Уж слишком мимо большинство реалий. Поэтому лишь 3/5.
P.S. Очень хотел бы прочитать что-то подобное по европейским авторам.
11561
january_vixen19 июня 2022 г.Совсем не про Набокова
Читать далееДолго ходила вокруг книги, в итоге попалась за копейки и это было чудесное приобретение.
Издание: хорошая плотная бумага, много графиков, все вставки лилового цвета, есть хлястик.
Текст: несколько глав казались затянутыми, но тем не менее очень интересные исследования текста.
Кому читать: скорее любителям англоязычной литературы в оригинале, так как разбираются такие авторы и употребление английских слов. Читала параллельно сборник рассказов по механике глава из книги - рассказ - глава - рассказ, было занимательно сразу выискивать закономерности, о которых пишет автор.
Итог: крайне специфичная книга, но мне доставила массу удовольствия и осталась в домашней коллекции.
7384
radiobed2 января 2019 г.Читать далееЯ, признаюсь, не такой уж фанат статистического анализа, но когда на обложке мой взгляд зацепился за фамилию Набоков, мне тут же стало интересно, а что же там такое спрятано в этом тексте. А много чего - графики, таблицы, методы, по которым они были рассчитаны. Выборка произведений достаточно необычная: Эрнест Хемингуэй и Эрика Джеймс (хотя тут ясно, что самое любимое слово - БОГИНЯ), Стивен Кинг и Герман Мелвилл и многие многие другие. Для удобства в конце есть список "тестируемых" книг, что очень удобно, можно расширить свой список "хочу прочитать". Лично для меня было удивительно, что Джоан Роулинг даже под псевдонимом оказалась узнаваема своим набором часто используемых слов. Про Кинга сказать нечего, много слухов ходит о том, что есть у него некие литературные рабы, но цифры, статистика говорят обратное. Эта книга оказалось очень занимательной и ненапряжной даже с учетом таблиц и графиков, которые было интересно изучать под чашечку какао первым днем зимы. Может быть, в школьные годы меня бы заинтриговало задание по математике, которое было бы привязано к произведениям Бунина или Булгакова.
7338