Что общего между Big Data и вечным двигателем, или Пустобрехи vs Мошенники

 
Статьи
Что общего между Big Data и вечным двигателем, или Пустобрехи vs Мошенники
То, что ныне позиционируется менеджменту корпораций под маркетинговым лейблом Big Data — от наколдованной победы Трампа черной мессой Cambridge Analytica, до палантирских пророчеств даты смерти фейсбучных юзеров, — чистая ерунда.

1. «Когда я слышу о культуре, я взвожу курок».

Цитата (ложно) приписывается одному из наиболее результативных маркетологов переходной эпохи (между Лениным и Стивом Джобсом).

Он же, кстати говоря, и архитектор современных масс медиа.
Эти ваши CNN и «Первые каналы», Дмитрий Киселев и Опра Уинфри, «Санта-Барбара» и «Моя прекрасная няня» — истоки  обратной перемоткой собираются у шинели Геббельса.

2. Так вот, к Big Data.

Результаты эксперимента сотрудников Snob.ru с выкачкой своих персональных данных из ВКонтакте, серия цитат:

 

«... «ВКонтакте» все же знает нас не так хорошо, как мы думали. Соцсеть часто заблуждается насчет места жительства пользователей — определила верно только в двух случаях из восьми — и их предпочтений. В список интересов попадают совершенно нерелевантные темы, «ВКонтакте» удалось угадать хобби только одной из участниц исследования. Разбивка интересов похожа на астрологический прогноз — обо всем и ни о чем…»

«... «ВКонтакте» думает, что я живу в ОВД. А мой парень — на трамвайных путях. Нашла фото членов, которые мне присылали незнакомые мужчины, хотя я удаляла переписку…»

«... ВК знает, куда я хожу за продуктами, но почему-то решил, что я работаю в блочно-модульной котельной. О себе я не узнала ничего нового…»

Трагикомический диссонанс — сияющих на страницах поп-СМИ волшебных замков Big Data, — и скудости реальных фоточленов, — сам по себе почва для иронии преблагодатнейшая.

Но продолжим.
 

3. Теперь — про Facebook из Republic:

«... В середине 2018 года ⁠New York Times составила подборку из семи «жутких» патентов Facebook, которые дают возможность отследить ⁠практически ⁠любую информацию ⁠о пользователях: где они живут и с кем проводят время, ⁠в кого влюбляются и каких политиков и бренды обсуждают. Один из алгоритмов соцсети, на который она подала заявку, способен предсказать вероятность судьбоносных моментов в жизни юзера, например, вступление в брак, рождение ребенка или смерть. ... Эта патентная заявка была подана еще в 2012 году (с целью более точной настройки пользовательской рекламы), но неясно, реализовала ли компания описанные в ней идеи.»

Конец цитаты.

Таким образом, уже с 2012 года, по компетентному мнению журналистов NYT, Facebook может составить конкуренцию цыганкам, хиромантам и астрологам.

Предскажет суженого, пресечение «линии жизни», etc.

Будучи притом не в состоянии справиться с банальными утечками данных.

Вероятно, еще немного «разработок», и не за горами вывод на рынок гарантированного суперхита — вроде снятия венца безбрачия Искусственным Интеллектом.

Читаем далее:

«Вице-президент Facebook Аллен Ло, глава подразделения интеллектуальной собственности, подчеркивал, что большинство технологий, упомянутых в патентах, никогда не были и не будут включены ни в один из продуктов соцсети…»

Ого. А — что так?

Зачем «разрабатывать» и патентовать цыганско-астрологический хайтек (тратя много денег на соответствующие «разработки»), если монетизации не предполагается даже теоретически?

Чтобы некие абстрактные конкуренты не «разработали»?

А им тогда это зачем — при отсутствии, опять-таки, монетизации?

4. Перелетим в родные снежные палестины.

Про официально зарегистрированный фейл Яндекса в магии Big Data:

«Подразделение «Яндекса» Yandex Data Factory (YDF), созданное для аналитики больших данных на заказ, перестало искать новых клиентов.»

Причина?

Ясный день, — плохие заказчики:

«... они не обладали чистыми данными, нужными для обработки, говорит человек, знакомый с несколькими экс-сотрудниками Yandex Data Factory...»

Значит, фейсбучные магистры бигдатности говорят, что мол не сильно нам эти «технологии» и нужны («зелен виноград»).

Яндексным — не повезло с заказчиками.

А на самом деле?

Как обычно, все дело в волшебных пузырьках.

В данном случае — в их высосанности из пальца.
 

5. Процитируем вывод из системного текста собственного авторства:

«... Колоссальные, титанические массивы тщательно собираемых данных — на поверку оказываются чистым цифровым мусором...

… рынок «торговли пользовательскими данными» вполне гомеоморфен рынку астрологических прогнозов, технического анализа, лозоходства, и гаданий по руке.

Спросите, а как же там примеры в статьях про дикий рост всего? В результате, мол, хитро-магических бигдатно-машинлерненных святой водой окроплённых денежных жертвоприношений бигдатным духам?

В двух словах — а) врут, б) «после того — не значит вследствие того», в) микс…»
(Мифология тотальной слежки. Почему это не работает)

Еще автоцитата:

«… Хотите поспорить? Лучше поиграем в доказательную медицину.

Пришлите нам (хотя бы один) пример, в рамках которого кто-то маленький стал большим и удержал это преимущество, не отличаясь от конкурентов ничем по сути, кроме высокого скилла в виртуозных манипуляциях с клиентскими данными.

В любой отрасли, в любой стране, в любое время.

Всего лишь один пример. Но только с цифрами, Карл!
Скучные, примитивные, верифицируемые цифры....»
(О глупости «персонализации», и сбора информации о клиентах тоже)

За три года с момента публикации ни одним Карлом ничего не предъявлено.
 

6. Выводы.

То, что ныне позиционируется менеджменту корпораций под маркетинговым лейблом Big Data — от наколдованной победы Трампа черной мессой Cambridge Analytica, до палантирских пророчеств даты смерти фейсбучных юзеров, — чистая ерунда.

Люди, которые ее проповедуют, либо некомпетентные речекряки (журналисты и «ИТ-энтузиасты»), либо мошенники — кто ее обещает.

Про журналистов и так все ясно, а вот касательно ИТ-мошенников  пару слов отдельно.
 

7. Корни проблемы уходят в 70-е года прошлого века, когда была целенаправленно утоплена целая область научного знания.

Нечастый, надо отметить, в истории точных наук кейс, когда налицо явная деградация — без войн, революций, эпидемий и природных катастроф, а сугубо под дегенеративным влиянием «групп интересов».

Времена Святейшей Инквизиции и Index Librorum Prohibitorum давно прошли?

Современные медиа-инквизиторы научились на ошибках предшественников, и работают куда тоньше.

Упразднение научной кибернетики открыло дорогу фейерверку мультимиллиардных ИТ-панацей — от ископаемых ERP-систем до сверхсовременных «блокчейнов» и «Искусственных Интеллектов».

Ну и, разумеется, бигдат.
 

8. При этом, господа, в отношении Big Data речь не идет об организованном мошенничестве (по модельному образцу биткoйнa).

Все куда интереснее.
 

9. Каждая отдельно взятая особь из множества Big Data энтузиастов доподлинно осведомлена — как о собственной некомпетентности, так и о бесполезности собственного «продукта» (если вообще что-то есть).

Но: ровно в силу той же некомпетентности, каждый отдельно взятый Big Data-продвигатель (БП) не способен осознать, что и остальные «коллеги по опасному бизнесу» — такие же.

Равно как и их «продукты».

Каждый отдельный БП? отчаянно боящийся обнажить собственную никчемность, уверен, что невежественный пустобрех — только он сам.

А остальные, стало быть, «гуру» — настоящие. А ихняя «бигдата», стало быть, работает.

Ну или, по крайней мере, «разработки» идут куда-то в правильную сторону.

Помните — про «голого короля»?
 

10. В заключение.

Выше речь шла о Big Data как о рекламном лейбле, — типовом представителе целого веера хайтек-панам, монетизирующих некомпетентность менеджмента корпораций.

Научный фундамент того, что впоследствии было промаркировано «Big Data», — математическая статистика, теоретическая разработка которой была в целом завершена к концу Второй мировой.

Однако — очередная автоцитата:

«... В материалах популярных СМИ о могуществе больших данных крайне редко сообщается, что сырьем для анализа должны быть идеально согласованные, нормализованные, отфильтрованные, и, в итоге, — достоверные в математическом смысле данные.

А если исходные данные этим критериям не удовлетворяют, то… Базовый принцип кибернетики: «мусор на входе — мусор на выходе»…»
(Современная ИТ-мода с позиции скептического инвестора)

Ровно на этом этом и споткнулся Яндекс со своей YDF: имея возможность привлечь самых толковых математиков и программистов, он не смог решить проблему «мусора на входе».

Точнее, открывая сеанс бигдатной магии, Яндекс эту проблему даже не смог идентифицировать (помните про деградацию?).

Решить он ее не сможет тем более.

Помимо причин, очевидных из предыдущего («Почему не стреляли? — Во-первых, не было патронов…»), есть еще одна.

Сия проблема уже эффективно решена в рамках парадигмы IEM System.

Замкнутый инфоконтейнер IEM System (инфосфера Дайсона) — первый в истории надежный источник качественных данных о деятельности предприятия, пригодный для эффективного применения математических методологий Big Data, и транслирующий эти данные 24х7х365 в режиме реального времени.
 

11. А также — последний.

Потому что IEM System — единственное решение; так же, как через две точки можно провести единственную прямую.

December 21, 2018