Facebook 的新学术研究 API 开放抢先体验

本周,少数学术研究团队将获得 Facebook 的一个新工具,该工具旨在聚合全球最大社交网络上近乎普遍的实时数据。

当谈到谁可以访问 Facebook 数据以及如何访问时,这家现在被称为 Meta 的公司仍然感受到 2018 年剑桥分析丑闻的影响,在该丑闻中,一家政治咨询公司收集了数百万不知情的 Facebook 用户的个人数据,以建立详细的个人资料。潜在选民。该公司在随后的三年中关闭了数千个 API,现在才开始恢复学术研究的广泛访问。

facebook-oversight-scrutiny
facebook-oversight-scrutiny

TechCrunch 预览了 Facebook 的新学术研究 API,并与 Facebook 产品经理 Kiran Jagadeesh 进行了交谈,他与 Facebook 开放研究与透明度 (FORT) 团队一起领导了该项目。

“这只是开始,”Jagadeesh 告诉 TechCrunch,将 Researcher API 描述为它最终希望提供的工具包的测试版。该 API 于今年在 F8 上首次发布,基于 Python 并在 JupyterLab 中运行,这是一个开源笔记本界面

鉴于 Facebook 过去的许多隐私问题,新的 Researcher API 带有一些初始警告。首先,API 将仅通过邀请制系统提供给一小群成熟的学术研究人员。该公司计划在 2022 年 2 月将访问范围扩大到最初的测试组之外,将试验的反馈纳入更广泛的面向所有学者的发布。

另一个预防措施:研究人员 API 在一个非常受控的环境中运行,Jagadeesh 将其描述为“数字洁净室”。可以访问 API 的学术研究人员可以通过 Facebook VPN 进入环境,收集数据和处理数字,但无法导出原始数据——只能导出分析。

这个想法是为了保护用户隐私并防止任何被分析的数据被重新识别,但考虑到 Researcher API 收集的所有公共数据已经在那里漂浮,但这种限制可能会以错误的方式影响公司的一些批评者很难用 Facebook 的现有工具进行汇总和分析。

在发布时,API 将提供对四个实时 Facebook 数据的访问:页面、群组、事件和帖子。在每种情况下,该工具最初只会从公共数据中提取,并且仅从美国和欧盟内部的来源中提取。对于群组和页面,至少需要一名管理员位于受支持的国家/地区,才能通过 API 提供该数据。

通过该工具,研究人员可以使用情感分析等方法来分析大量原始文本,情感分析会跟踪人们通过针对给定主题的演讲所表达的效价和情绪。除了包含大部分可用数据的基于文本的帖子之外,研究人员还可以访问相关信息,例如群组和页面描述、它们的创建日期以及帖子反应。

不会包含原始图像等多媒体数据,也不会包含评论或用户人口统计数据(年龄、性别等)。该 API 也不会从 Instagram 收集任何数据,尽管 Jagadeesh 认识到该平台对研究人员非常有价值,并且该团队正在探索提供 Instagram 数据的方法。

FORT 团队希望与学术研究人员密切合作,开发和构建当前的工具,Jagadeesh 将其描述为正在进行的工作。虽然 Meta 表示其最初的学术合作伙伴尚未确定,但该公司已邀请来自全球 23 家学术机构的研究人员加入进来。

已完成团队入职流程并同意其隐私政策的研究人员于 11 月 15 日星期一获得访问权限。Facebook 要求任何访问该研究的人同意隐私限制,包括不得重新识别数据中的特定个人。

研究 API 目前仅适用于少数学术机构,但 FORT 团队计划探索授予其他团体的访问权限,包括记者。目标是创建一个公共路线图,让研究人员和记者能够透明地了解团队的工作方向。

该公司在研究界有很多建立信任的工作要做。 8 月,Facebook 切断了隶属于纽约大学“民主网络安全”项目的两名著名研究人员对广告数据的访问,这引起了许多学者和监管机构的谴责。这些研究人员专注于通过名为 Ad Observer 的可选浏览器工具跟踪错误信息和政治广告。 9 月,Facebook 向一群名为 Social Science One 的精英研究人员道歉,因为他们向他们提供了不完整的数据——这一错误破坏了数月的工作和分析。

发表回复