Датафикация
Датафика́ция (англ. datafication), трансформация в данные аспектов мира, которые ранее не были определены количественно; сопровождается инфраструктурными, дискурсивными и социальными трансформациями. Учёные из различных дисциплин – медиаисследований, социологии, политической науки и других смежных полей – используют этот термин, чтобы говорить о том, что происходит, когда данные становятся частью социальных процессов.
Историю датафикации следует рассматривать в контексте более продолжительной социальной истории статистики (Beer. 2016). И. Хакинг и Т. Портер сходятся в том, что исторический период «лавины чисел» (avalanche of numbers) приходится примерно на промежуток между 1820 и 1840 гг. (Hacking. 1991; Porter. 1986). Именно это время можно определить как период растущего энтузиазма по отношению к роли статистики в решении социальных и экономических проблем, возникающих перед национальными государствами. Исторически датафикацию можно связать с увеличением компьютерных мощностей по обработке всё большего количества набора цифровых данных – процесс, разворачивающийся с конца 1990-х гг. Хотя экономические, политические и идеологические истоки датафикации обнаруживают в разных периодах – в колониальную эпоху или в 1970-х гг., когда получили распространение персональные компьютеры, – консенсуса по вопросу периодизации датафикации не существует.
В настоящее время феномен датафикации тесно связан с распространением больших данных (big data). Несмотря на популярность этого термина, объяснить его значение достаточно сложно. С одной стороны, есть известное определение больших данных посредством 4V: volume (объём), velocity (скорость), variety (разнообразие) и veracity (достоверность). С другой стороны, когда исследователи Р. Китчин и Г. Макардл пытались с помощью этого определения оценить уже существующие наборы данных, которые часто считаются «большими данными», то обнаружили ряд нестыковок – нередко наборы данных соответствуют одним общепринятым характеристикам, но не соответствуют другим, а сами качества зачастую достаточно расплывчаты. Основной вывод их работы заключается в следующем: большим данным как понятию свойственна онтологическая нестабильность (Kitchin. 2016). Это означает, что понять, чем же всё-таки являются большие данные и в чём состоит их онтология, представляется затруднительным, если полагаться на определения, которыми пользуются люди из бизнеса и части академического сообщества.
Изначально исследователи К. Кьюкиер и В. Майер-Шёнбергер ввели термин «датафикация» в качестве нейтрального описания данных как ресурса, из которого теперь возможно извлекать всё новую информацию о действиях, смыслах, сообществах и причинах социальных явлений (Cukier. 2013). Идея исследователей основывалась на позитивистском понимании данных. По их мнению, связанная с большими данными возможность собрать данные обо всём, тем самым упразднив разделение между выборкой и генеральной совокупностью в классической статистике, приблизит знание к «истинному». Близкое к такому пониманию суждение высказал в 2008 г. журналист К. Андерсон, написавший, что бум больших данных знаменует «конец теории» в исследовательской практике: теперь данные могут начать говорить «сами за себя» (Anderson. 2008).
Подобный оптимистичный и позитивистский подход к данным сегодня подвергается критике. В своей статье, ставшей одной из основополагающих для поля critical data studies, дана бойд и К. Кроуфорд понимают большие данные как культурный, технологический и исследовательский феномен (Boyd. 2012). Для них важно, что большие данные обладают собственной мифологией. Это значит, что в отношении больших данных есть социальные ожидания, в рамках которых они понимаются как феномен, несущий смыслы нейтральности, объективности, источника истинного знания. В работе они подробно детализируют и раскрывают эти черты мифологии больших данных, а также объясняют, почему для социальных исследований датафикации важно относиться к ней критически.
Существуют и иные концептуализации, предлагающие анализировать дискурсы вокруг больших данных с точки зрения анализа идеологий. Так, Й. ван Дейк называет веру в большие данные как источник истинного, объективного и потенциально бесконечного знания «датаизмом» (dataism), расположенным в двойственном статусе между научной парадигмой и идеологией. По её мнению, датаизм – «широко распространённая вера в объективную количественную оценку и потенциальное отслеживание всех видов человеческого поведения и социальности с помощью технологий онлайн-медиа» (Dijck J. van. 2014. P. 198). Целью работ, подобных тексту ван Дейк, является анализ идей и дискурсов, стоящих за распространением больших данных.
В глобальной научной литературе также формируется поле исследований данных и датафикации – data studies, к которым иногда прибавляется уточнение critical, чтобы подчеркнуть критическое отношение к большим данным в противовес технооптимистическому и позитивистскому. Основной академический журнал для этого поля – Big Data & Society, однако публикации по теме датафикации выходят и в журналах по медиаисследованиям, социологии, антропологии, исследованиям науки и технологии.
Авторы термина «датафикация» работали с метафорой данных как особого природного ресурса – о больших данных в СМИ говорят как о «новой нефти» или «золотой жиле» (Puschmann. 2014). По ряду причин такая метафора часто подвергается критике. Во-первых, утверждается, что данные производятся в социальных контекстах и потому могут быть подвержены искажениям, на что ресурсная метафора указать неспособна (Nafus. 2014). Во-вторых, такая метафора не позволяет учитывать, что при работе с данными нужно принимать во внимание правовые и этические соображения. В-третьих, указывается, что эта метафора игнорирует выполняемую людьми работу, необходимую для сбора, анализа и поддержания актуальности больших объёмов данных (Kerssens. 2019).
Датафикация изучается прежде всего в разрезе конкретных сфер, которые меняются из-за производства и обращения к данным со стороны различных акторов и институтов. Такая литература касается, к примеру, датафикации городской среды, образования, социального обеспечения, права, исследований из тех или иных дисциплин, медицины и т. д. В подобных работах делается упор на то, что нового приносит датафикация в эти области деятельности.
К примеру, в редакторском введении к специальному выпуску журнала Learning, Media, and Technology о датафикации образования Ю. Ярке и А. Брейтер указывают на то, как данные изменили институт образования (Jarke. 2019). Метрики и основанные на данных технологические решения используются для оценки преподавателей, студентов и администраторов, образовательная политика выстраивается на основании рейтингов международных институтов, создаются новые формы наблюдения и надзора за участниками образовательного процесса. Такие глобальные изменения также меняют и практики вовлечённых в образовательные процессы акторов.
Другое направление исследований связано с попыткой историзировать данные как феномен, анализировать их в диахронической перспективе. Показательным примером такой работы служит книга социолога Д. Бира «Взгляд данных: капитализм, власть и восприятие» («Data Gaze: Capitalism, Power, and Perception», 2019), где он исторически и социологически тематизирует отношения между такими понятиями, как власть, капитализм, метрики и данные (Beer. 2019). Другим примером схожей работы служит работа К. Купмана «Как мы стали нашими данными: генеалогия информационной личности» («How We Became our Data: A Genealogy of the Informational Person», 2019), где, обращаясь к методу генеалогического анализа М. Фуко, он исследует, как данные трансформируют человеческую субъективность, какие новые отношения между «я» и «данными» формируются в этом процессе (Koopman. 2019). Такие работы объединены темой историзации (больших) данных как феномена и зачастую обращаются к тому, как датафикация переопределяет отношения власти и человеческое самопонимание.
Ещё один аспект исторических и социологических подходов к данным – фокус на экономических трансформациях. Это работы, посвящённые как роли данных в доцифровых секторах, так и анализу трансформаций, порождённых социальными платформами. Для описания этих трансформаций авторы обращаются к таким концептуальным рамкам, как «надзорный капитализм» (Zuboff. 2019), «капитализм платформ» (Срничек. 2019), «капитализм данных» (West. 2019), «коммуникативный капитализм» (Dean. 2005). Авторы этих терминов различным образом тематизируют историю роли датафикации в экономике, отношение с капитализмом как таковым, роль пользователей и больших IT-компаний. Многие из них сходятся в том, что датафикация сильно изменяет капитализм, создавая новые рынки и меняя уже существующие.