找回密码
 立即注册
首页 业界区 安全 读数据科学伦理:概念、技术和警世故事11伦理部署 ...

读数据科学伦理:概念、技术和警世故事11伦理部署

佴莘莘 2025-5-31 23:03:02

1. 伦理部署

1.1. 谁有权访问系统

  • 1.1.1. 谁有权使用部署系统
  • 1.1.2. 选择限制访问可能会赋权给授予访问权的人
1.2. 区别对待他人的伦理规范(基于已有的预测、诚信和监督)​,以及数据科学部署引发的非预期后果

  • 1.2.1. 失业是关键问题之一
1.3. Waymo汽车

  • 1.3.1. 是谷歌母公司字母表(Alphabet)下的无人驾驶汽车公司
  • 1.3.2. 政府收到了无数投诉,投诉内容从发生事故到自动驾驶汽车可能引发的失业问题不等,应有尽有
2. 系统访问

2.1. 基于多种原因,仅有特定的人或者地区有权访问系统
2.2. 访问受限

  • 2.2.1. 由于数据固有的敏感性和私人性,各类组织需要限制对数据的访问权
  • 2.2.1.1. 在处理个人和敏感数据时,受限访问必不可少
  • 2.2.1.2. 除了明显的机密性、完整性和访问控制措施之外,拥有一个记录数据访问的日志系统也至关重要
  • 2.2.1.3. 公司也可能有意决定让某些用户或地区有权访问系统的一部分
  • 2.2.2. 新闻网站和社交媒体平台通常会筛选新闻,以推出(预测)你想要阅读的新闻,从而隐藏与你的观点不同的新闻,即形成回声室
  • 2.2.2.1. 你的想法是一方面,你是否知情此算法的存在以及算法的运作方式是另一方面
  • 2.2.2.2. 人们可以选择随机添加其他新闻,而不是让用户阅读为他们量身定做的新闻—打破潜在的文化和智能的隔离,或者可以完全关闭筛选功能
  • 2.2.3. 可解释的人工智能领域
  • 2.2.3.1. 对于单一预测模型和数据实例而言,有许多不同的解释—它们似乎同样有效、长度相同,并且都是反事实的
  • 2.2.3.2. 对于企业来说,一种解释可能比另一种解释更方便
  1. >  2.2.3.2.1. 第一种解释表明模型具有明显的歧视偏见,第二种则没有>  2.2.3.2.2. 公司老板可能更倾向于第二种解释,而非第一种解释
复制代码

  • 2.2.3.3. 内部解释的透明度以及对模型主体解释的透明度两者皆有助于约束新权力
  • 2.2.4. 某些人可能一直无法访问系统
  • 2.2.4.1. 在数据收集阶段和部署阶段,对不使用智能手机的用户存有偏见
  • 2.2.5. 某些数据科学技术存在如此严重、可能不合乎伦理的问题,因此需要非常严格地控制其访问权限
  • 2.2.5.1. 人脸识别技术是此类技术之一,可能会被滥用:通过识别个人身份限制个人权利、跟踪陌生人,或追踪不知情的顾客
  • 2.2.6. 决定谁能访问系统的高自由度为使用数据科学的公司和政府提供了一种新型权力
  • 2.2.6.1. 所作决策的透明度、动机和伦理考量至关重要
2.3. 因人而异的数据内容

  • 2.3.1. 公司也可能拒绝对某些用户提供访问权限,因为系统可能会违反特定用户的条例
  • 2.3.2. 许多新闻网站无心遵守《通用数据保护条例》​,也没有加强保护非欧洲用户的隐私,而是选择采取简单的方法—屏蔽欧洲用户
  • 2.3.3. 优步对苹果手机进行“指纹识别”​,这样即使被抹除痕迹,手机也会得到唯一的标识符
3. 预测差异性与结果差异性

3.1. 基于数据的价格差异化

  • 3.1.1. 基于数据科学系统的预测,我们分析了对人们的不同待遇
  • 3.1.1.1. 在旅游行业,差别定价是一种很常见、公认的做法
  • 3.1.1.2. 经常订机票的用户都知道机票的价格并非一成不变,以及根据空座和预订时间的不同,同一航班上的乘客可能会支付不同的价格
  • 3.1.2. 瓦里安(Varian)发现,在一个允许出现版本控制的新市场中,以不同价格提供不同版本的商品会增加整体盈利(以消费者剩余和生产者剩余计算)​
  • 3.1.3. 伦理问题
  • 3.1.3.1. 第一个问题是敏感属性
  1. >  3.1.3.1.1. 基于敏感属性,这一做法可能会导致价格差别>  3.1.3.1.2. 除了定价,同样的推理也广泛适用于所有基于预测的待遇
复制代码

  • 3.1.3.2. 第二个公平问题与隐私是否使用了个人数据做出这些预测?
  • 3.1.3.3. 第三个是透明问题
  1. >  3.1.3.3.1. 消费者需要清楚不同的待遇:如果满足了整体福利增长的条件,就会出现消费者剩余>  3.1.3.3.2. 如果这种差异随后被外界(如记者)揭露,可能会导致更多的伦理问题和名誉损失
复制代码

  • 3.1.4. 伦理讨论将决定你的数据科学平衡,以及你的客户是否应在不同的预测中得到不同的待遇
  • 3.1.5. 公开差异化出现的过程,确保不歧视敏感群体,并考虑对数据和模型主体隐私的影响
3.2. 行为修正与预测成真

  • 3.2.1. 使用行为修正技术,这会激励平台“预测成真”​
  • 3.2.2. 无论是为了实现目标而使用消费者的数据,还是采取行为修正技术,消费者甚至对这种潜在的伤害性做法视而不见,除非平台明确告知他们这些机制的存在
4. 人脸识别

4.1. 人脸识别软件现在是、将来也可能永远是一个伦理焦点,尤其是在讨论谁有权使用此类软件时
4.2. 鉴于授予访问权限这一权力,透明公开的流程必不可少,并需清楚告知决策和决策过程
4.3. 政策应落实为明显有效的措施,违反政策的人应承担不良后果

  • 4.3.1. 承担责任
5. 诚实和换脸技术

5.1. 在数字时代之前,造谣宣传活动就已存在

  • 5.1.1. 数字和社交媒体的兴起让某些人操纵和分享这种存心欺骗的信息变得易如反掌
  • 5.1.2. 深度伪造技术的新功能可以轻松更改视频材料,这些逼真的材料几乎与真实可靠的材料别无二致
5.2. 动摇我的不是因为你欺骗了我,而是我不再信任你

  • 5.2.1. 尼采(Nietzsche)
  • 5.2.2. 深度伪造技术可能引发的负面影响,我们可能不会再相信视频录像或录制的演讲
5.3. 创建于2017年的换脸(FaceSwap)是一个流行的开源工具

  • 5.3.1. 从技术上看,该工具使用了两个深度自动编码器(编码器部分是共享的)
  • 5.3.2. 这个编码器会将图像映射到一个共享的潜在空间表征(latent representation),然后每个独立的解码器会区分人物的身份与面部表情
  • 5.3.3. 其结果是一张互换的脸:最初的身份配上伪装者的表情和姿态
  • 5.3.4. 这种廉价且相对容易使用的技术可以应用于公开的视频(或语音)记录,以冒充他人
5.4. 深度伪造技术基于深度学习可以创造看似真实实则伪造的视频

  • 5.4.1. 最流行的深度伪造技术类型是视频中的人脸互换,这一技术保留了原始图像的表情、姿势和背景
  • 5.4.2. 基于深度学习的深度伪造技术已经被用于制作了无数虚假视频,只是为了无厘头搞笑,这项技术有时也应用于娱乐产业的专业领域
  • 5.4.3. 在娱乐界,当真人演员无法参演时,这项技术可应用于电影
  • 5.4.4. 欺诈行为和色情影片也会利用此项技术
  • 5.4.5. 用深度伪造技术制作的复仇式色情影片也会对很多人造成很大的伤害
5.5. 深度伪造技术似乎确实是一种促进虚假信息宣传的有效工具

  • 5.5.1. 在政治活动中,含虚假陈述的假新闻可将对手置于不利地位
5.6. 可以使用深度伪造技术检测模型解决此类问题,同时让公众了解深度伪造技术的存在及其风险

  • 5.6.1. 研究也表明,读写教育有助于抵挡虚假信息
5.7. 深度伪造技术促进了对其他检测假视频方法的探索

  • 5.7.1. 水印或区块链可能会进一步帮助验证视频是否真实
  • 5.7.2. 控制深度伪造技术的法规和行为准则也开始出现
  • 5.7.3. 认知也是一种预防形式

来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
您需要登录后才可以回帖 登录 | 立即注册