Рецензия на книгу
Everybody Lies: Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are
Seth Stephens-Davidowitz
timquo26 января 2021 г.По мере чтения текста я все больше и больше симпатизировал автору: в начале книги он предстает влюбленным в цифры аналитиком, который посредством текста хочет заразить и поделиться своей одержимостью. Он искренне очарован идеей описания и жизни, и людей числами, он очарован задачей, ключ к которой будто бы можно найти где-то между правильными запросами в гугл и достаточно сложными математическими функциями. В общем, такой милый чудак с неловким чувством юмора и нездоровой одержимостью своей работой:
«Большую часть прошлого года я прожил отшельником. Только я и мой компьютер. Я жил в фешенебельной части Нью-Йорка и почти не выходил на улицу. На мой взгляд, эта книга — мой magnum opus, лучшее, что я сотворил в жизни. И я был готов пожертвовать всем, чтобы все сделать правильно. Я хотел отшлифовать каждое слово в этой книге.»
И вот тем более неловко было в процессе чтения признаться себе, что книга совсем не удалась, а те редкие моменты, в которые ее чтение доставляет удовольствие, не имеют ничего общего с заявленной темой: это или небольшие фрагменты случайных данных, которые некоторым читателям могут показаться забавными, или главы-отступления с рассказами о людях, которые местами талантливо работают с данными. Всему этому тексту не помогает и то, что первая глава книги максимально заряжена ключевыми словами и попытками изобразить фонтанирующий избыток материала, интересных фактов и уникальных источников информации. Но вот примерно к сотой странице, когда Стивенс-Давидовиц уже 3-й (третий) раз обращается к одному и тому же, ну, допустим, «факту», что — равно как мужчины втайне поголовно обеспокоены размерами своих половых органов, также и женщины чрезвычайно обеспокоены своим интимным запахом — к этому моменту становится понятно, что, с такими популяризаторами как Сет Стивенс-Давидовиц, Big Data и Data Science могут обойтись без критиков.
Перед прочтением книги я пробежался по обзорам текста и списал большое количество негативных отзывов на ханжество — подумаешь, в книге по «большим данным» каждый второй факт рассказывает про запросы на порно-сайтах — надо же автору чем-то развлекать читателя? Проблемой же, к сожалению, оказалось не то, что в книге есть анекдотические факты о сексуальных предпочтениях, скажем, индусов. Проблема в том, что кроме этих то ли шуток, то ли фактов в книге нет вообще ничего:
«Например, известно ли вам, что в Индии большинство поисковых запросов начинается со слов «мой муж хочет...». Например: «Мой муж хочет, чтобы я кормила его грудью».Этот запрос распространен в Индии гораздо больше, чем в других странах. Кроме того, уровень поиска по порносайтам изображений, где женщина кормит мужчину грудью, в Индии и Бангладеш в четыре раза выше, чем в любой другой стране. Я, конечно, никогда и не подозревал ни о чем подобном до того, как увидел эти данные.»
Так, например, уже третья глава книги посвящена восхищению Джеффом Седером, который даже будучи знакомым автора книги звучит и выглядит как человек, который в жизни не слышал словосочетания big data: он просто замерял размеры внутренних органов скаковых лошадей с помощью самодельного УЗИ, пока случайно не нашел «золотую» закономерность: оказывается, что чем больше левый желудочек лошади и чем меньше ее селезенка — с тем большей уверенностью можно сказать, что перед нами будущий чемпион. Ну что же. Доказательной выборкой этого фрагмента книги является ровно один конь. То есть мало того, что представленный рассказ не имеет ровно никакого отношения к big data (очевидно, что Джефф Седер со своим самодельным УЗИ аппаратом не объездил всю страну, а ограничился, в лучшем случае, парой тысяч экземпляров), но и имеет смехотворную доказательную базу. И даже на это можно было бы закрыть глаза, будь этот рассказ исключением из книги; но, к сожалению, буквально каждому примеру автора хочется задать ряд вопросов. Вопросов, задать которые, будучи научным публицистом, должен был сам автор (на худой конец — его редакторы; ведь у этой книги были редакторы?). Но в какой-то момент становится очевидно, что Сету Стивенс-Давидовицу интереснее проигнорировать неудобные моменты работы с данными и просто подогнать выборку под какой-нибудь более сенсационный вывод. Научные принципы, подвиньтесь, здесь человек пытается написать еще одну «Фрикономику».
Возвращаясь к вышеупомянутому Джеффу Седеру и его «лошадиной френологии» — конечно, автор не просто так избавляет читателя от лишних подробностей. Просто даже самый поверхностный поиск информации о нем выдает портрет отнюдь не талантливого гения аналитики в мире лошадиных бегов, а самого заурядного сельского фрика, о котором вряд ли слышал хоть кто-то за пределами читателей этой книги. А еще у Джеффа Седера вполне себе стандартный для торговца воздухом сайт, на котором можно насладиться схожей с автором книги аналитикой данных, рекомендую: eqb-точка-ком.
Беря в руки книгу, подобную этой, я изначально не жду от нее откровений: пусть вечернее чтение окажется чуть более полезным чем просмотр ситкома или разгадывание судоку. Но, к сожалению, книга «Все лгут. Поисковики, Big Data и Интернет знают о вас все» не справилась даже с этой задачей — грамотный научный редактор оставил бы от этого текста страниц 10 материала, а остальное вернул своему словоохотливому автору. Книга не справляется даже со своей минимальной планкой: говорить правду — а потому и обсуждать здесь в общем-то больше нечего. (Но и других проблем у книги хватает.)
7709