Как Big Data могут спасти социологию в Казахстане

В последнее время в мире все большее распространение получает Big Data. Что это такое? Это огромный массив данных, который был создан вследствие технологических инноваций. Сюда входят и биллинговые архивы сотовых компаний, которые позволяют наблюдать количество и регулярность коммуникаций абонентов на протяжении многих лет, данные активности в социальных сетях и поисковых запросов в сети, материалы видеонаблюдения в общественных местах, архивы личных записей кадровых отделов крупных компаний.

Что дает использование этих данных? Они позволяют сделать феноменальные прорывы во многих областях. Уже сегодня все успешные компании считаются с феноменом Big Data, который становится основой для конкуренции, поддерживает рост производительности и инноваций.

Нужно сказать, есть несколько ключевых условий для того, чтобы «большие данные» были полезны. Во-первых, для хранения огромного массива информации нужна инфраструктура, во-вторых, другим важным вопросом является качество собранного материала. Кроме этого, в ряде развитых стран на повестке дня сегодня стоят вопросы конфиденциальности - Big Data могут содержать ряд персонально идентифицируемых данных. Главная задача в этом контексте - добиться такой анонимизации данных, которая позволяла бы однозначно идентифи­цировать каждое наблюдение, но при этом делала невозможным получение доступа к персональным данным.

Наверное, наиболее ярким примером успешного использования Big Data являются избирательные кампании Барака Обамы 2008 и 2012 годов. Анализ более чем 80 переменных, характеризующих местоположение потенциальных избирателей, их социально-экономические черты, образцы поведения и потребления, взгляды и мнения, а также поведенческое моделирование оказали заметное влияние на исход выборов. Собранный массив данных стоимостью $100 млн долларов обеспечил бы невероятно глубокое социальное, политическое и экономическое понимание американского общества, если бы стал доступен для исследователей.

Появление и использование Big Data в анализе поведенческих стратегий населения для социологов с самого начала представлялось большим вызовом. Многие исследователи из других сфер, которые активно используют Big Data в своей деятельности, стали вести речь о конце теории. Сами социологи констатировали: наука стала «коммерческой», а новации, если и случаются, то не в науке, а в организациях, главной задачей которых является генерирование прибыли. Зачастую кризис связывали и с тем, что появление нового класса эмпирических данных дало свободу от посреднического участия человека, ошибок неподготовленного интервьюера, возможной неискренности респондента при ответе на вопросы, методологических трудностей доступа исследователей к определенным группам. Тем не менее, на сегодняшний день в среде западных социологов есть понимание того, что «большие данные» в любом случае требуют участия теоретиков - Big Data не могут говорить за себя, они требуют интерпретации, знания контекста и предмета.

В развитии Big Data стали видеть возможности для становления таких новых направлений науки как «общественная социология» - это фактически способ наладить отношения с обществом за пределами академии. Речь идет об открытом, публичном диалоге с использованием цифровых технологий и способности вскрывать социальные проблемы по мере их появления. Ученые-теоретики понимают, что «большие данные» открывают большие научные возможности. Обогащая науку, они позволяют заметно расширить диапазон других агентов, претендующих на собственное понимание «социального».

В Казахстане, как и в целом на постсоветском пространстве, основной вопрос в контексте «больших данных» будет обращен к их качеству и надежности, системности их сбора и цифровизации. В России, например, предприняли попытку использовать государственные данные, локализованные до индивида (пациент больницы/события (преступление) и т.д.) или, по крайней мере, до уровня субъекта учета (школа, суд и т.д.) и пришли к неутешительному выводу - перемещаясь наверх данные «агрегируются без возможности последующей дезагрегации». В итоге на уровне федерации в целом невозможно увидеть статистику детальнее чем по регионам.

Предположу, что в Казахстане ситуация аналогичная: огромный массив данных, который является результатом бесконечной бумажной волокиты госслужащих, в итоге остается не нужным. Для эффективного использования данных они должны быть унифицированы и системно внесены в единую базу, к которой при необходимости могли бы обращаться как сотрудники соответствующих органов, так и исследователи. Такие попытки в Казахстане, кстати, уже осуществляются. В июле этого года, например, комитет по правовой статистике и специальным учетам Генеральной прокуратуры реализовал интеграцию информационных систем правоохранительных органов с психо- и наркобазами министерства здравоохранения.

Еще одна проблема «больших данных» в Казахстане – это наличие специалистов. Вице-министр образования и науки Эльмира Субханбердиева на пятом Центрально-Азиатском симпозиуме сообщила о том, что в стране на сегодняшний день уже не хватает 5 тысяч IT-специалистов. Проблема - не уникальна: исследователи отмечают, к 2018 году только США могут столкнуться с нехваткой 140-190 тыс человек с глубокими аналитическими навыками и 1,5 млн менеджеров и аналитиков, обладающих ноу-хау для использования «больших данных» в процессе принятия эффективных решений.

Отдельный вопрос - это наличие доступа к Big Data со стороны исследователей и аналитиков. «Большие данные», предоставленные в различные аналитические структуры, могли бы послужить одним из наиболее важных инструментов подготовки эффективных программ развития. Эта проблема особенно актуализируется в связи с тем, что сегодня в Казахстане, как в целом на всем постсоветском пространстве, методы проведения социологических опросов и точность полученных данных вызывают сомнения. Некоторые исследователи считают, что в странах, где еще не сформировано гражданское общество, население не проявляет высокий уровень сознательности, а также присутствуют опасения высказать точку зрения, которая не является социально одобряемой, данные количественных исследований не могут быть объективными.

Российские социологи, рассуждая о кризисе социологической науки, отмечают, что она находится в самом неприглядном состоянии - речь идет как об организационной стороне дела, так и в целом о развитии самой социологии, её теории и методологии. При этом «полураспад» сообщества социологов заметно мешает формировать в стране действенное гражданское общество, аргументированный гражданский дискурс, не позволяет вносить вклад в «нормализацию» функционирования СМИ и в управление страной. Безусловно, данный тезис можно применить и к нашим реалиям - и у нас социологи со скепсисом воспринимают данные друг друга.

В этом случае отличным решением было бы комбинирование Big Data и социологических исследований, поскольку «большие данные», заменяя собой традиционный сбор информации, сулят огромные научные возможности. Так социологам уже нет необходимости собирать данные о поведении населения, и акцент смещается на их анализ, интерпретацию, субъективный смысл того или иного действия. На сегодняшний день уже существует ряд удачных примеров совмещения подходов - например, «Большое британское обследование классов». В этом гибридном проекте совмещены вполне обычное опросное социальное исследование (передающее отчеты о действиях) с широкомасштабной сетевой платформой, предоставленной Би-Би-Си, где пользователям задают массу вопросов об их экономическом, социальном и культурном капитале.

В заключении отмечу: часть западных ученых считает, что до сих пор нет полного понимания того, какое влияние стремительное развитие Big Data окажет на традиционные исследовательские методы, но только совместное их использование поможет сделать научные разработки более богатыми и нюансированными.

vlast.kz