Big Data: аналитика больших данных в строительной отрасли
Big Data: Big Data Analytics in the Construction Industry
Michael A. Berger, Technical Researcher, Paul A. Mathe), Staff Research Scientist, Head of Integrated Building Systems Department, Member of ASHRAE, Travis Walter, Technical Researcher, Lawrence Berkeley National Laboratory, Berkley, California
Keywords: Big Data, digitalization, information technologies
Accumulation, processing, analysis of energy Big Data in the construction industry is becoming more and more relevant and demanded. This is facilitated by such drivers as the latest market trends, new technologies and political and economic aspects. Big Data is a real lode of information, allowing for the design engineers, installation and commissioning organizations, operators, energy and resources suppliers to make more informed decisions on the basis of available data throughout all stages of a building life cycle, including design, operation and modernization.
Накопление, обработка, анализ энергетических больших данных (Big Data) в строительной отрасли становится все более актуальным и востребованным. Этому способствуют такие катализаторы, как последние тенденции рынка, новые технологии и политико-экономические аспекты. Большие данные – настоящий кладезь информации, который позволяет инженерам-проектировщикам, организациям по монтажу и вводу в эксплуатацию, эксплуатирующим организациям, энерго- и ресурсоснабжающим организациям принимать более взвешенные решения на основании имеющихся данных на всех этапах жизненного цикла зданий, включая проектирование, эксплуатации и модернизацию.
BIGDATA: АНАЛИТИКА БОЛЬШИХ ДАННЫХ В СТРОИТЕЛЬНОЙ ОТРАСЛИ
Накопление, обработка, анализ энергетических больших данных (Big Data) в строительной отрасли становятся все более актуальными и востребованными. Этому способствуют такие катализаторы, как последние тенденции рынка, новые технологии и политико-экономические аспекты. Большие данные – настоящий кладезь информации, который позволяет инженерам-проектировщикам, организациям по монтажу и вводу в эксплуатацию, эксплуатирующим организациям, энерго- и ресурсоснабжающим организациям принимать более взвешенные решения на основании имеющихся данных на всех этапах жизненного цикла зданий, включая проектирование, эксплуатацию и модернизацию.
Среди инженеров-проектировщиков и специалистов по энергоэффективности все большую заинтересованность вызывает использование и анализ реальных данных для принятия того или иного решения. Для такого анализа используется ряд инструментов, которые позволяют обрабатывать данные либо по отдельному зданию, либо по множеству зданий. Наиболее известным является инструмент Energy Star Portfolio Manager. База данных по эффективности зданий (Building Performance Database, BPD) Департамента энергетики США является крупнейшим общедоступным источником данных по энергетическим характеристикам коммерческих и жилых зданий в Соединенных Штатах, собранных из федеральных, региональных и местных государственных организаций, предприятий ЖКХ и частных организаций.
#терминология |
Big Data (большие данные) – понятие относится к числу немногих, имеющих вполне достоверную дату рождения – 3 сентября 2008 года, когда вышел специальный номер старейшего британского научного журнала Nature, посвященный поиску ответа на вопрос «Как могут повлиять на будущее науки технологии, открывающие возможности работы с большими объемами данных?». Специаль- Роль данных в науке стала предметом обсуждения очень давно – первым об обработке данных еще в XVIII веке писал английский астроном Томас Симпсон в труде «О преимуществах использования чисел в астрономических наблюдениях», но только в конце прошлого столетия интерес к этой теме приобрел заметную остроту, а на передний план обработка данных вышла в конце прошлого века, когда обнаружилось, что компьютерные методы могут применяться практически во всех науках, от археологии до ядерной физики. Как следствие, заметно меняются и сами научные методы. Не случайно появился неологизм libratory, образованный от слов library (библиотека) и laboratory (лаборатория), который отражает изменения, касающиеся представления о том, что можно считать результатом исследования. До сих пор на суд коллег редставлялись Из статьи Леонида Черняка «Большие данные – новая теория и практика», журнал «Открытые системы. СУБД», 2011, № 10. |
BPD предоставляет как обезличенные данные по энергопотреблению и энергетическим характеристикам коммерческих и жилых зданий, так и аналитические инструменты для их обработки и использования поставщикам энергетических услуг, владельцам и управляющим компаниям объектов недвижимости, законодательным органам и энергетическим консультантам с конечной целью принятия решений по проектам модернизации и повышения энергоэффективности. Интерфейс BPD бесплатен и предлагает широкие возможности анализа данных.
Данная статья рассматривает некоторые перспективы и потенциальные риски, связанные с доступностью для пользователей больших объемов данных по зданиям, и объясняет, как можно эффективно использовать такие данные и инструменты статистического анализа для поддержки принятия решений профессионалами энергетической отрасли.
Перспектива: сравнительный анализ и проверка работоспособности
BPD предлагает набор инструментов, разработанных в помощь профессионалам энергетической отрасли, поддерживающий сравнительный анализ зданий и проверку работоспособности по результатам моделирования зданий. Пользователи могут изучать доступные данные по географическим регионам и сравнивать физические и эксплуатационные характеристики для лучшего понимания рыночных условий и тенденций в области энергоэффективности. Интерфейс позволяет пользователям задавать наборы данных, которые представляют собой группы зданий с похожими характеристиками, через выбор ряда фильтров: по климатическим регионам, типу объекта, площади здания и различным параметрам инженерных систем, таким как тип освещения, тип ОВК и т. д.
Руководство ASHRAE по энергетическому аудиту коммерческих зданий Procedures for Commercial Building Energy Audits и новый стандарт аудита коммерческих зданий ASHRAE 211 P Standard for Commercial Building Audits рекомендуют проводить сравнительный энергетический анализ в качестве одного из самых первых этапов аудита. Рассмотрим случай проведения оценки офисного здания в Сиэтле энергетическим аудитором. Он может открыть сайт BPD и начать сравнительный анализ, выбрав набор данных, охватывающий все офисные здания в штате Вашингтон, а затем выборочно настроить набор данных, исходя из характеристик здания и доступных данных.
Рис. 1. Гистограммы исходной EUI для:
A) офисных зданий в штате Вашингтон;
B) больших (> 100 000 кв. футов) офисных зданий в Сиэтле
Инструмент BPD Explore Histogram можно использовать для визуального представления наиболее важных характеристик здания – площади, энергетической оценки Energy Star Rating, интенсивности использования энергии (energy use intensity, EUI). На рис. 1А пользователь видит, что медианное значение EUI (интенсивность использования энергии) для офисов в штате Вашингтон составляет 163 кБТЕ/(фут2•год), или 1 851 МДж/(м2•год), с интерквартильным диапазоном 125–213 кБТЕ/(фут2•год), или 1 420–2 419 МДж/(м2•год)2.
Далее пользователь может дополнительно настроить свой набор данных, чтобы выполнить более целевое сравнение. Например, он может указать набор данных, включающий в себя только офисные здания Сиэтла площадью более 100 000 кв. футов (9 290 м2). На рис. 1B показана гистограмма исходной EUI для данного более целевого набора данных, включающего в себя 242 здания, с медианным значением EUI 171 кБТЕ/(фут2•год), или 1 942 МДж/(м2•год), и интерквартильным диапазоном 163–213 кБТЕ/(фут2•год), или 1 851–2 419 МДж/(м2•год).
Кроме того, аудитор может захотеть задокументировать изменения EUI в зависимости от возраста основных фондов. Инструмент просмотра таблицы BPD Explore Table позволяет пользователям создать таблицу, в которой активный набор данных будет сгруппирован по какой--либо одной характеристике, и предлагает статистические данные по другой переменной для каждой получившейся подгруппы. В табл. 1 показан образец экспортированной таблицы для больших офисов в Сиэтле, сгруппированной по году постройки и проанализированной по исходной величине EUI.
Таблица 1
Образец таблицы исходных EUI для больших офисов в Сиэтле
с группировкой по возрасту основных фондов
Похожее исследование можно провести для других факторов, затрагивающих энергопотребление, включая тип системы вентиляции и кондиционирования воздуха и часы работы. Табличный инструмент может помочь отсечь избыточные различия в использовании энергии внутри набора данных, выделить системы здания, требующие дальнейшего анализа, и позволяет экспортировать таблицу для включения в документацию аудита по сравнительному анализу.
Эти инструменты визуализации данных вместе с высоким уровнем пользовательской настройки набора данных дают пользователю беспрецедентные возможности сравнения зданий между собой и подтверждения соответствия оценок их моделирования правдоподобным диапазонам, где все основано на реальных данных наблюдений.
Риск: потенциально нерепрезентативные данные
Команда BPD собирает, актуализирует3 и объединяет данные из различных источников со всей страны; коллективные данные собираются без учета репрезентативности. Таким образом, BPD не является статистически репрезентативной по национальному фонду зданий. Кроме того, база данных постоянно растет, новые источники данных регулярно добавляются, а старые по возможности обновляются. Предыдущая работа исследовала репрезентативность BPD посредством сравнения базы данных с национальным репрезентативным Анализом энергопотребления коммерческих зданий (CBECS) и Анализом жилищного энергопотребления (RECS), оба из которых включены в BPD4, и выявила, что некоторые регионы и типы зданий представлены в BPD избыточно. Это, а также беспрецедентный уровень обеспечиваемой BPD детализации означает, что одни сравнительные группы будут богаты данными, а в других зданий может вообще не быть. В одних сравнительных группах могут быть большие объемы данных о системах здания, а в других – только энергетические данные. Также имеется возможность выбора смещения основных данных, так как организации, собирающие и вносящие энергетические данные зданий в BPD, могли с большей вероятностью фокусироваться на энергоэффективности и сравнительном анализе.
Методы сравнения наборов данных |
BPD предлагает три метода сравнения наборов данных:
Эти методы доступны на вкладке сравнения (Compare) в веб-интерфейсе BPD. Визуальное сравнение гистограмм Метод актуарного анализа Этот метод был разработан таким образом, чтобы обеспечивать возможность сравнения числовых значений любых двух наборов данных; таким образом, его результаты очень сильно зависят от базовых данных. Например, если входные наборы данных имеют высокий статистический разброс, расчетное распределение расхождений будет более неопределенным. Это означает, что малый набор данных с большим числом аномальных значений может исказить полученное распределение. Кроме того, этот метод не учитывает основные различия в каждом попарном сравнении; Метод регрессионного анализа |
Пользователи должны помнить об этом при изучении базы данных, так как сравнение здания с другими в BPD не обязательно соответствует точной позиции этого здания относительно всех зданий страны. В этом плане BPD не подходит для анализов, критически зависящих от статистической выборки, например национальных или региональных оценок полного энергопотребления.
Перспектива: эффективное использование больших данных для анализа влияния технологий
Помимо сравнительного анализа сопоставимых зданий, большие наборы данных, такие как BPD, позволяют проводить основанный на данных анализ энергетического влияния изменяющихся характеристик здания или систем. BPD предлагает три метода сравнительного анализа (см. врезку «Методы сравнения наборов данных»). В разделах ниже представлены
примеры такого анализа наборов данных по жилым и коммерческим зданиям.
Пример 1. Одноквартирные жилые дома в штате Огайо. Наш первый пример набора данных содержит одноквартирные дома в Огайо. Этот набор данных в BPD содержит 2245 зданий и будет называться Набор данных 1.
Сравнение здания без охлаждения и здания с центральным кондиционером.
Рис. 2. Сравнение наборов данных 1a и 1b по электрической EUI:
A) наложенные гистограммы наборов данных 1a (фиолетовый) и 1b (желтый);
B) гистограмма различий, рассчитанная с использованием метода актуарного анализа;
C) гистограмма различий, рассчитанная с использованием метода регрессионного анализа
Давайте рассмотрим случай использования энергоснабжающей организацией, которая хочет оценить влияние центральной системы кондиционирования воздуха на потребление электрической энергии в доме, чтобы лучше продавать свои услуги клиентам. Пользователь может создать два набора данных и непосредственно сравнить расход электроэнергии потребителями из Набора данных 1 с кондиционированием воздуха и без него. Набор данных 1а содержит только здания из Набора данных 1, для которых тип охлаждения имеет значение «Без охлаж-дения» (309 домов). Точно так же Набор данных 1b содержит только дома с типом охлаждения «Центральное кондиционирование воздуха» (ЦКВ); этот набор данных содержит 1287 домов.
Рис. 2А показывает, что медианная электрическая EUI для домов без охлаждения составляет 10 кБТЕ/(фут2•год), или 114 МДж/(м2•год), а медианное значение для домов с ЦКВ составляет 17 кБТЕ/(фут2•год), или 193 МДж/(м2•год), что соответствует увеличению на 70 %. Это соответствует результатам актуарного анализа, который показал, что EUI в ЦКВ увеличилась на 63 %; однако результаты регрессионного анализа указывают на меньшее увеличение EUI – всего 43 %. Регрессионный анализ пытается учесть другие характеристики здания, включая тип системы отопления, число пользователей, типы окон и т. д., и заявляет, что основные факторы приводят к тому, что актуарные и медианные различия переоценивают влияние ЦКВ.
Сравнение окон с одинарным и двойным остеклением
Похожим образом рассмотрим профессионала в области энергетических услуг, который заинтересован в эмпирических доказательствах влияния окон с двойным остеклением на исходную EUI. Для этого пользователь должен создать два набора данных. Набор данных 1с содержит только здания из Набора данных 1, для которых тип остекления имеет значение «Одинарное» (79 домов). Набор данных 1d содержит только здания, для которых тип остекления имеет значение «Двойное» (433 дома).
Рис. 3. Сравнение наборов данных 1c и 1d по исходной EUI:
A) наложенные гистограммы наборов данных 1c (фиолетовый) и 1d (желтый);
B) гистограмма разницы, рассчитанная при помощи метода актуарного анализа;
C) гистограмма разницы, рассчитанная при помощи метода регрессионного анализа
Рис. 3a показывает, что медианная EUI для домов с одинарным остеклением составляет 90 кБТЕ/(фут2•год), или 1 022 МДж/(м2•год), а медианное значение для домов с двойным остеклением составляет 89 кБТЕ/(фут2•год), или 1011 МДж/(м2•год), что соответствует уменьшению на 1 %. Результаты актуарного анализа (рис. 3b) показывают, что окна с двойным остеклением увеличивают EUI на 3 %. И наконец, как показано на рис. 3с, регрессионный анализ подсчитал 2 %-ное уменьшение EUI при переходе от окон с одинарным остеклением к окнам с двойным. Эти результаты демонстрируют неопределенность, или «шум», который может возникнуть в ходе анализа данных наблюдений. Профессионал в области энергетических услуг должен толковать эти результаты как не доказывающие существенного снижения энергопотребления домов в Огайо при переходе на окна с двойным остеклением.
Пример 2. Офисы в Калифорнии.
Похожий анализ можно выполнить и для коммерческих зданий. Давайте используем набор данных по офисным зданиям в Калифорнии, который мы назовем Набор данных 2. Набор данных 2 содержит 3 448 зданий.
Сравнение систем с постоянным (CAV) и переменным (VAV) расходом воздуха. Рассмотрим управляющего портфелем объектов недвижимости, который желает лучше понять влияние модернизации с переходом от систем управления ОВК с постоянным расходом воздуха (CAV) на более эффективные системы с переменным расходом воздуха (VAV). Пользователь может определить наборы данных 2a и 2b так, чтобы они включали в себя только здания с системами CAV и VAV соответственно. Набор данных 2a содержит 71 здание, а Набор данных 2b – 104 здания.
На рис. 4 показаны достоверные и интуитивные результаты, где оба метода, визуального сравнения и актуарного анализа, показывают 22 %-ное снижение исходной EUI при переходе от CAV к VAV, а регрессионный метод показывает 27 %-ное уменьшение исходной EUI.
Рис. 4. Сравнение наборов данных 2а и 2b по исходной EUI:
A) наложенные гистограммы Наборов данных 2а (фиолетовый) и 2b (желтый);
B) гистограмма разницы, рассчитанная при помощи метода актуарного анализа;
C) гистограмма разницы, рассчитанная при помощи метода регрессионного анализа
Риск: ошибочное толкование результатов сравнения
Такие инструменты, как BPD, вкладывают в руки пользователя мощные аналитические методы и большие объемы данных по зданиям; однако сложность и глубина этих инструментов могут сбить пользователя с толку. Ключ, позволяющий пользователям подготавливать репрезентативные наборы данных, дающие надежные и достоверные результаты, заключается в понимании физических принципов зданий и основ науки о данных. Это особенно верно при сравнении наборов данных.
#терминология |
Аналитика больших данных (Big Data Analytics). С течением времени компьютерные приложения становятся все ближе к реальному миру во всем его многообразии, отсюда рост объемов входных данных и отсюда же потребность в их аналитике, причем в режиме, максимально приближенном к реальному времени. Конвергенция этих двух тенденций привела к возникновению направления Из статьи Леонида Черняка «Большие данные – новая теория и |
Рассмотрим пример пользователя, который желает понять влияние перевода своих торговых зданий (все они находятся в климатической зоне 3B) со старых люминесцентных ламп T12 на новые, более эффективные T8. Пользователь может быстро сделать две сопоставимые группы; в первую будут входить все торговые здания в климатической зоне 3В с лампами Т12, а во вторую – идентичные здания, но с лампами Т8. Сравнение медиан гистограмм обоих
наборов данных для исходных EUI показывает, что здания с лампами Т8 используют на 58 % больше энергии, чем с лампами Т12. Актуарный метод сравнения дает похожий результат – на 60 % больше энергии. Наконец, регрессионный метод дает увеличение энергопотребления на 15 % при переходе на Т8, что все еще является контринтуитивным, но намного ближе к ожидаемому.
Для того чтобы понять и избежать таких проблем, как эти, пользователь должен всегда исследовать сходства и различия своих двух наборов данных, чтобы понять, данные какого объема и качества входят в каждый из них. BPD не содержит все данные по всем системам и характеристикам зданий, что делает критичным точное понимание того, какие данные используются для оценки различий.
Поля данных по торговым зданиям, заслуживающие исследования, включают в себя часы работы, площадь и количество людей, так как существенные различия в этих наборах данных могут объяснить неинтуитивные результаты. На рис. 5 показано, как основные данные по торговым зданиям с лампами Т8 указывают в среднем на увеличение площади в 4,7 раза, 54 % больше людей и 44 % больше рабочих часов, чем в торговых зданиях с лампами Т12. Эти существенные различия между наборами данных в некоторой мере учитываются регрессионной моделью, но не визуальным сравнением гистограмм или методом актуарного сравнения.
Рис. 5. Наложенные гистограммы ламп Т12 (фиолетовый)
и Т8 (желтый) в торговых зданиях в Калифорнии для А) площади;
B) числа людей; C) рабочих часов в неделю
Выводы
Хотя BPD является крупнейшим общедоступным набором данных в своем роде и использует мощные методы статистического анализа, для предотвращения неверного толкования данных требуется надлежащее понимание основных данных и строительных технологий. Общая мера предосторожности для анализа данных наблюдений заключается в том, что основные различия наборов данных, а также недостающие данные могут ввести неосведомленного пользователя в заблуждение. Эти ловушки можно преодолеть при помощи тщательного исследования доступных данных и фундаментального понимания принципов энергопотреб-ления здания.
База данных по эффективности зданий дает пользователям набор инструментов для проведения основанных на реальных данных исследований и анализа высокодетализированных и настраиваемых наборов данных. Эти инструменты могут использоваться практиками в области энергетики зданий для сравнительного анализа данных, проверки достоверности результатов симуляций и моделей с реальными данными и сравнения наборов данных при помощи статистических методов для лучшего понимания энергопотребления зданий.
Статья опубликована в журнале “Энергосбережение” за №6'2019
Статьи по теме
- Цифровизируйся или умирай - новый лозунг современности
- Цифровые решения и ответственное водопользование
Сантехника №1'2022 - Центр управления комплекса городского хозяйства Москвы
Энергосбережение №8'2022 - «Умный многоквартирный дом» или цифровизация все ближе
АВОК №5'2023 - Энергоэффективные здания в России: настоящее и будущее. К двадцатилетнему юбилею монографии «Энергоэффективные здания»
АВОК №1'2024 - Умные технологии Москвы – энергоэффективного города: 41-я конференция
АВОК №7'2024 - Перспективы дигитализации в отрасли приборного учета
Энергосбережение №7'2024 - Москва – энергоэффективная столица России
Энергосбережение №8'2016 - Искусственный интеллект управления энергетический инфраструктурой среды обитания человека
Энергосбережение №2'2020 - Современные информационные технологии и их аппаратное обеспечение в задачах управления системами электроснабжения
Энергосбережение №6'1999
Подписка на журналы