The Data Science Task Force: Mission PR

Posted by Gloomymoon on 2024-08-14

专业精神(PR)

在技术活动中,数据科学家应以负责任的方式行事,为本专业争光。其中一个方面是积极主动地寻求利益,进行积极的研发,并以负责和符合道德规范的方式开展工作。文献[1]概括性的阐述了其中的许多内容。本领域将重点介绍数据科学家特别关注的相关问题。

范围能力
  • 能力的含义以及展示能力。
  • 获得与数据科学家特别相关的能力。
  • 获取专业知识/掌握或扩展能力,期刊、会议、课程、网络研讨会的作用。
  • 技术变革及其对能力的影响。
  • 专业协会在持续业务发展和专业活动中的作用。
  • 认识支撑数据科学专业方法的知识范围。
  • 展示支撑当前或持续的数据科学专业方法的技能。
  • 建立一套自信、有效和专业的数据科学方法,并有能力保持这种方法。
子领域
PR-可持续职业发展-T1
PR-沟通-T1
PR-团队合作-T1
PR-经济考量-T2
PR-隐私与保密-T1
PR-伦理考量-T1
PR-法律考量-T2
PR-知识产权-E
PR-关于自动化-E

PR-可持续职业发展-T1

专业性的本质体现在能够胜任数据科学某些方面的工作,专业人员富有责任来承担他们能够胜任的任务。因此,向利益相关者(如雇主)持续展示和证明专业能力信息是有意义的。

知识

  • 能力的含义以及展示能力。
  • 获取专业知识/掌握或扩展能力:期刊、会议、课程、网络研讨会的作用。
  • 技术变革及其对能力的影响。
  • 专业协会在可持续职业发展和专业活动中的作用。

技能

  • 说明保持能力对专业的数据科学家的重要性。
  • 说明专业人员通常会采取哪些步骤来扩展能力或掌握知识,并结识后者的优势。
  • 论证专业协会再支持职业发展中的重要作用。

品行

  • 积极主动、充满热情的认识到数据科学是一个瞬息万变的领域,与时俱进以及了解如何与时俱进至关重要。

PR-沟通-T1

在各种情况下,数据科学家都需要与不同受众进行交流,这种交流可能是口头的、书面的或电子的。数据科学需要经常就该专业可以发挥的作用进行讨论,交流数据科学过程的多个方面,传达可能导致的变化和结果或提供新的见解。能够阐明变革的必要性并对变革的结果保持敏感是该专业重要的特质。这些专业活动可能需要能够就某些情况下的局限性进行讨论,并提出研究活动的建议。

数据科学家的交流必须以及与证据的决策方法为基础,在机器学习和自动化的背景下,这一点尤为重要,因为决策的原因需要充分阐述。

机器学习发展的一个重要结果是,机器能够理解自然语言(因此也能理解语音输入),从而可用于机器人、文字处理器或智能搜索引擎(如Siri、Cortana、Google Assistant、Alexa)等领域。

知识

  • 不同的交流形式(书面、口头、电子)及其有效使用。
  • 与数据科学相关的技术文献。
  • 与数据科学交流相关的受众,包括小型团体、大型团体、专家和非专家、年轻群体、高级管理人员、机器,以及每种情况下有效交流的要素。

技能

  • 评估与数据科学各方面相关的技术文献。
  • 为同事编写技术文档,指导技术开发。
  • 为对数据科学感兴趣的各类受众制作演示文稿。
  • 为高级管理人员编制情况报告,概述数据科学调查所产生的重大举措,包括必要时与管理改革相关的问题。

品行
T1:

  • 根据相关技术的变化进行调整,知道如何有效地进行调整,并对新的发展机会保持警觉。
  • 积极主动,自我激励,确定新学习和新体验的意义。
  • 准确并看待自己在知识方面的长处和短处。

PR-团队合作-T1

数据科学家通常是一个团队的成员,可能需要担任团队领导,或支持团队工作。了解不同团队角色的性质以及团队的动态非常重要。在团队合作方面,数据科学家通常不仅需要能够与使用不同工具的数据科学家合作,而且需要能够与不同问题解决者合作。

知识

  • 团队选择,团队成员的能力和技能需要互补。
  • 团队动态和团队纪律。
  • 有效团队运作的要素。

技能

  • 概述处理团队内部冲突情况的步骤。
  • 总结在选择团队进行特定数据科学研究时需要考虑的因素。
  • 认识到数据科学研究团队领导应具备的素质。

品行

  • 尊重他人,善于合作,对团队组建和运作中的敏感问题采取适当的行动。
  • 愿意与他人合作并采取适当行动,在与他人合作是摒弃不重要的分歧。

PR-经济考量-T2

数据科学家应证明自己的立场以及所从事活动的类型是正确的。

知识

  • 高质量数据集机器维护的成本和价值。
  • 数据科学活动的成本说明。
  • 项目成本估算。
  • 数据科学的提升效果。
  • 数据科学活动的自动化。

技能

  • 评估数据集对组织的价值,同时考虑维护的成本要求。
  • 论证组织应定期收集那些数据,涉及相关的数据收集流程,确定应包含的属性和收集形式,并注重质量。
  • 评估为特定目的收集高质量数据的成本(一般为资源成本)。
  • 证明在组织内创建数据科学活动的和理想,并量化其成本。
  • 推断组织开展特定调查研究项目的价值。
  • 检测开展内部调研所需的资源,并与外包此类活动进行比较。
  • 评估与特定活动自动化相关的成本。

品行

  • 重视数据科学活动的相关成本,并采取适当的行为妥善使用。

PR-隐私与保密-T1

获取数据的方式多种多样,可以方位数据库、使用调查或问卷、采取各种手段获取某些资源,甚至可以开发并使用物联网、专业传感器、视频捕捉和监控系统。虽然获取各种信息非常重要,但是专业人员必须合法地获取信息,确保信息的准确性,保护个人、组织和其他群里的权利。

注意该子域与数据隐私知识领域的关系。

知识

  • 信息自由。
  • 数据保护法规,包括《通用数据保护条例》(GDPR)。
  • 隐私立法。
  • 数据保密的方法。
  • 对隐私和保密的威胁。
  • 国际层面。

技能

  • 说明维护数据机密性的技术机制。
  • 比较不同国家的隐私立法,强调各种差异引发的问题。
  • 认识到使用视频、语音和人脸识别软件所产生的隐私和保密问题。
  • 参照国际标准,总结特定隐私立法的适用环境。

品行

  • 负责维护隐私和保密性,确保对数据科学活动的信心。
  • 负责任地使用深度学习,因为在很多问题上深度学习的能力超出了所需。
  • 以合作和道德的方式致力于解决深度伪造有关的社会和政治问题。

背景问题

  • 与隐私和安全相关的法律框架因国家而异。

PR-伦理考量-T1

伦理问题对于所有参与计算和信息活动的人来说都至关重要,这一点在《ACM 道德与职业行为准则》中已有广泛论述。这些活动秉持如下基本观点,即专业人士指应承担他们能够胜任的任务,即便如此,他们在执行该类任务时应体现出掌握各种实践经验。保持或提高能力至关重要,提高对法律和道德问题的认识必须成为数据科学家工作的基础。专业人士应将与其决策相关的伦理问题视为一个非常重要的起点,使他们能够认识到自己是“独立的、符合伦理的代理人”。

知识

  • 与能力和保持能力有关的伦理问题。
  • 与数据及其使用相关的保密问题。
  • 《通用数据保护条例》(GDPR)。
  • 数据(包括样本数据)需要真正代表某种情况。
  • 对数据和算法中的偏见及其可能性质的认识,检查和避免偏见的机制。
  • 算法透明度和问责制。

技能

  • 说明数据科学家可能超出其能力范围的一系列情况,并确定缓解这些情况的步骤。
  • 展示确定数据集或算法无偏见的技术。
  • 讨论加入数据科学领域专业人员网络的好处。

品行

  • 对与收集和使用数据相关的深层伦理问题做出回应。
  • 对偏见问题做出反应,并积极设法消除偏见。
  • 在推动数据科学发展的过程中自我指导、自我激励。

PR-法律考量-T2

近年来,计算机犯罪的数量和严重程度都在持续增加。在许多情况下,犯罪分子给许多组织带来了破坏甚至是混乱。他们的威胁不容忽视,专业人士必须采取措施应对可能出现的严重破坏。在许多情况下,法律已经做出调整以应对这些趋势,但这是一个不断变化和调整的领域。

知识

  • 与数据科学相关的计算机犯罪。
  • 网络安全。
  • 预防犯罪。
  • 侦查犯罪活动的机制,包括采取不同方法的必要性。
  • 恢复机制和保持100%运行。
  • 打击计算机犯罪的法律。

技能

  • 评估一系列侦查既定形式犯罪活动的机制。
  • 说明采用多种不同方法应对威胁的可取性。

品行

  • 在面对可能的犯罪情况时,具备责任心和职业道德,但态度警觉、关系他人。

背景问题

  • 各国的法律框架可能有所不同。

PR-知识产权-E

知识产权(IPR),如版权、专利、外观设计、商标和著作人身权(Moral rights),旨在保护人类思想创造物的创造者或所有者。著作人身权包括创造者作为知识产权的署名权(IP),以及避免创造物受到贬损的权利。对于数据科学家来说,需要保护的对象(可能方式不同)包括软件、设计(包括图形用户界面(GUI))、数据集、著作人身权和名誉。商业秘密也可能与此相关。

知识

  • 专利、版权、商标、商业秘密、著作人身权。
  • 哪些与数据科学相关的知识产权可以保护,哪些不能保护,以及有哪些保护类型可供选择。
  • 可以和不可以获得法律保护的数据科学相关知识产权的类型以及可获得的保护类型。
  • 与知识产权、知识产权所有权、知识产权的地域相关的法规,包括国际协定的影响和知识产权的时限问题。
  • 自动归属和需要注册的知识产权种类,包括获得注册知识产权的程序概述。
  • 侵犯他人权利和有效利用受保护知识产权的可能性。

技能

  • 描述与数据科学家相关的知识产权类型。
  • 论证专利、版权、外观设计和商标之间的区别,并说明它们在数据科学中的应用。
  • 说明商业秘密在数据科学中的作用。
  • 说明知识产权注册所涉及的程序。
  • 解释与知识产权所有权和著作人身权有关的问题。
  • 评估使用受保护知识产权所涉及的风险,以及有效克服这些风险的方法。

品行

  • 对知识产权的存在和重要性,以及知识产权带来的责任和机遇有敏锐的反应。

背景问题

  • 各国在处理与知识产权相关的道德和法律框架方面的周全性和适应性各不相同,专利律师通常可以提供更多建议。
PR-关于自动化-E

自动化常常会引起人们对失业的担忧,一般来说,也会引起人们对机器不合理行为的担忧。专业人士应寻求对机器行为的解释,相关问题是《关于算法透明度和问责制的声明》[2]和《实现算法透明化和问责制》[3]的主题。自动化可能会用于可造成严重损失的危急情况下,这时人们通常期望机器按照与人类行为相一致的道德规范运行。

知识

  • 自动化及其优势和理由。
  • 危急情况下自动化面临的特殊问题。
  • 算法的透明度和问责制。

技能

  • 向非技术人士解释在特定情况下自动决策的程度。
  • 分析自动化对设计要求的影响,深入了解机器自主做出的决定。
  • 论证自动化在不同情况下的优势。
  • 确定确保决策系统可审计所需的步骤。

品行

  • 对自动化及其对就业的影响问题保持敏感。
  • 以尊重和道德的方式处理自动化问题。

参考资料

[1]: 《ACM道德与职业行为准则》,由ACM于2018年7月17日发布。
[2]: 《关于算法透明度和问责制的声明》,ACM美国公共政策委员会和ACM欧洲政策委员会,2017年。
[3]:《实现算法透明化和问责制》,Communications of the ACM vol 60 no 9 page 5,2017年9月。