原文:
www.kdnuggets.com/2022/03/data-science-make-clean-energy-equitable.html
图片由 Pedro Henrique Santos 提供,来源于 Unsplash
数据科学在应对气候变化的斗争中扮演着越来越重要的角色。它可以用于预测清洁能源系统的供需情况,以及 确定 哪些建筑物需要进行能源效率升级。当我们运用数据科学开发应对气候变化的创新解决方案时,我们应该小心不要复制或加剧现有的不平等,或创造新的不平等。
1. Google 网络安全证书 - 快速进入网络安全职业生涯
2. Google 数据分析专业证书 - 提升你的数据分析技能
3. Google IT 支持专业证书 - 支持你所在组织的 IT
气候变化的影响,从极端天气到严重干旱,将在最贫困、最缺乏应对能力的国家和社区中造成更大冲击。不幸的是,我们正在开发的许多解决方案也存在不公平性。仍使用煤炭和煤油烹饪的贫困家庭无法负担太阳能屋顶和节能家电。低收入父母在工作和育儿之间疲于奔命,几乎没有时间去充电站充电,且可能没有车库或车道在家充电。
当我们使用数据科学来帮助应对气候变化时,我们应该寻求既环保又公平的解决方案。例如,许多社区没有可靠的公共交通。根据蒂埃拉·比尔斯博士,加州大学洛杉矶分校土木与环境工程助理教授,关于交通需求的数据通常不可用或不准确,尤其是对老年人或残疾人等面临出行问题的群体。新的地理定位数据源和直接从用户处收集出行偏好的方法可以提供更全面的交通需求图景。数据科学可以帮助我们优化路线规划,并为服务不足的地区创建按需公交线路和拼车匹配服务。
数据科学支持公平解决方案的另一个领域是清洁、可靠能源的获取。全球有高达 7.6 亿人缺乏电力,还有更多人经历频繁的中断。根据能源专家马新博士,TotalEnergies Ventures 亚太平台总监,数据科学的进步可以帮助我们扩展和民主化能源获取。例如,微电网和小型电网可以通过实现小规模的本地发电,为偏远和服务不足的社区提供能源,而不依赖于传统电网。数据科学用于基于天气模式预测能源供应,并监测和优化太阳能电池板和电池的状态。近年来,微电网和小型电网已经为全球超过 1100 万人提供了电力。
这些例子来源于我主持的去年秋季的C3E 会议,展示了数据科学的深思熟虑的使用如何支持公平的清洁能源解决方案。3 月 7 日,讨论将继续由我的同事珍妮·萨卡尔博士在全球女性数据科学会议上主持,该会议将在斯坦福大学和在线进行。以下是这些小组讨论启发的一些教训,关于数据科学家如何帮助将公平付诸实践。
1) 考虑公平的多个维度。 过去,推动公平的努力通常集中在为人们提供平等的资源和机会。然而,当人们起点不平等时,平等的访问权很少能带来公平的结果。公平是一个更广泛的框架,部分关注利益和负担如何在不同群体(如种族、收入、性别等)以及地理区域(如城乡差异、全球北方与南方)之间分配。它还考虑了人们的行动能力,提出诸如:在决策时谁被代表?人们是否有权力改变他们的情况和塑造他们的社区?在用公平的视角查看数据集时,询问被测量的内容、由谁测量以及目的是什么,以及数据中包含了谁而不包含谁。同样,边缘化群体在数据科学和数据驱动决策中的代表性也至关重要,以确保他们参与会影响他们社区的决策。
2) 理解你想解决的问题的人性方面。 在任何数据科学项目开始时,明确表达你的目标很重要,而不仅仅是收集一堆数据并套用算法。如果你不了解你试图解决的问题的人类影响,你就无法制定公平的响应。例如,劳伦斯伯克利国家实验室的研究人员正在处理屋顶太阳能安装的数据。只有将这个数据集与人口统计数据结合,他们才得以洞察公平问题,例如谁在(或不在)安装太阳能,原因是什么,以及哪些障碍阻碍了在太阳能渗透较少的群体中的采用。
3) 留意“数据沙漠”并努力纠正它们。 如果人们在我们关于某个问题的数据中没有被代表,他们在解决方案设计时将会是隐形的。例如,如果你正在开发清洁能源系统的供需模型,但没有关于偏远农村地区的电力需求的数据,结果系统可能不适合这些地区。有一些有效的技术方法来处理稀疏或混乱的数据,但我们不应该仅仅通过统计技术来修补数据沙漠。相反,我们需要确保数据收集代表所有相关的人和地方。我们需要广泛思考如何获取更多、更好的数据,并推动私营、研究和政府部门的数据开放。这通常需要精心设计的利益相关者和社区参与。
4) 认识到现有数据的局限性。 数据展示了人们在现有资源和限制下的行为,而不是他们理想中想要或需要的东西,或是在不同激励下会做的事情。例如,电力供应不稳定的地区可能因缺乏需求而表现出低能源使用,而不是因为人们不安装电器或参与其他活动,如果他们能保证获得稳定的电力供应,他们可能会这样做。我们不应该假设人们现在的行为就是他们在一个更公平的世界中希望采取的方式。
5) 小心不要通过大数据掩盖不平等现象。 尽管大数据现在非常流行,但它并不是我们唯一应该关注的尺度。不平等问题往往是局部的、细节性的。这些微小的信号可能在庞大的数据集中被忽略。例如,通勤者的平均旅行时间可能掩盖了那些唯一的出行选择是两小时多阶段旅程的异常情况。你可以通过使用分解数据的技术来避免掩盖不平等现象,从而尽可能地精细化数据。例如,BEAM 模型等基于代理的模型可以让你在个体层面上查看人们的行为和偏好。
6) 寻找创新的方法来收集社区需求的数据。 边缘化群体通常在现有数据来源中代表性不足。寻找创造性的方法来收集这些社区的定量和定性数据,并收集他们对数据收集和分析过程的意见。新的数据收集工具如移动应用和在线调查可以提供帮助,但要小心技术工具不会进一步忽视那些接入有限的人群。直接与边缘化群体接触,与关键利益相关者和社区成员合作,以了解他们对要问的问题、要收集的数据和要设计的解决方案的看法,这是至关重要的。
这些只是我们可以利用数据科学以更公平的方式应对气候变化的一些方法。目前,存在大量的“公平洗牌”现象。组织声称考虑公平性,但实际上并未真正挑战现状。相反,公平性需要在整个数据科学过程中占据核心地位,从数据收集和问题分析到解决方案设计和实施。这是我们如何建设一个既更环保又更公正的世界的方法。
Margot Gerritsen 博士 是斯坦福大学能源资源工程系的教授。她是数据科学中的女性(WiDS)的共同创始人和联合主任,该计划旨在激励和教育全球的数据科学家,无论性别如何,并支持该领域的女性。如果你想深入了解如何利用数据科学以公平的方式应对气候变化等关键问题,WiDS 邀请你参加他们 2022 年 3 月 7 日在斯坦福大学及全球线上举办的年度会议。