Reddit 将更新网络标准以阻止自动网站抓取

社交媒体平台 Reddit 周二表示，将更新平台使用的网络标准，以阻止从其网站自动抓取数据，此前有报道称人工智能初创公司正在绕过该规则为其系统收集内容。

此举正值人工智能公司被指控抄袭出版商的内容创建人工智能摘要，无需注明来源或征求许可。

Reddit 表示将更新 Robots 排除协议（即“robots.txt”），这是一项被广泛接受的标准，用于确定网站哪些部分可以允许被抓取。

该公司还表示，将继续采用速率限制技术，即控制来自特定实体的请求数量，并将阻止未知机器人和爬虫在其网站上抓取数据（收集和保存原始信息）。

（如需了解当天的热门科技新闻，订阅关注我们的科技时事通讯《今日缓存》

最近，robots.txt 已成为出版商使用的关键工具，以防止科技公司免费使用其内容来训练人工智能算法并创建针对某些搜索查询的摘要。

上周，内容授权初创公司 TollBit 致出版商的一封信中表示，有几家人工智能公司正在绕过网络标准来抓取出版商网站的内容。

此前《连线》杂志的一项调查发现，人工智能搜索初创公司 Perplexity 很可能绕过了通过 robots.txt 阻止其网络爬虫的努力。

今年 6 月初，商业媒体出版商《福布斯》指控 Perplexity 剽窃其调查报道并将其用于生成式 AI 系统，且未给予署名。

Reddit 周二表示，研究人员和互联网档案馆等组织将继续可以非商业用途访问其内容。

2024-06-26 04:33:20
1719380500

Tags: Reddit, Reddit 数据抓取, reddit 更新至网络标准, reddit 最新更新, reddit 网络标准, reddit 阻止网站抓取, reddit 阻止自动网站抓取, 将更新网络标准以阻止自动网站抓取

近期新闻

阿平厄丹自助餐厅厨房里的“米德尔布兰德”（更新）

June 29, 2024

拜登与特朗普首场辩论6大热点，包括巴勒斯坦问题

June 29, 2024

Omroep Flevoland – 新闻 – 当下流行的“迪拜酒吧”似乎在乌尔克也很受欢迎：“已经售罄”

June 29, 2024

2 个追踪他人 WA 号码的应用程序，简单又合法

June 29, 2024

RMC：科曼暂时离开 EC

June 29, 2024

查尔科洪水过后开展疫苗接种活动 – El Sol de Toluca

June 29, 2024

Reddit 将更新网络标准以阻止自动网站抓取

Related

相关新闻

阿平厄丹自助餐厅厨房里的“米德尔布兰德”（更新）

拜登与特朗普首场辩论6大热点，包括巴勒斯坦问题

Omroep Flevoland – 新闻 – 当下流行的“迪拜酒吧”似乎在乌尔克也很受欢迎：“已经售罄”

2 个追踪他人 WA 号码的应用程序，简单又合法

RMC：科曼暂时离开 EC

查尔科洪水过后开展疫苗接种活动 – El Sol de Toluca

鲍德温驳回过失杀人指控的动议被驳回

今年秋冬季你需要接种的疫苗

博加茨重返波士顿，全场起立鼓掌，并播放致敬视频

无线耳机最超值的选择

过渡到 YouTube Music

特朗普称移民正在抢走“黑人的工作”。经济学家不同意这种看法。

Leave a Reply Cancel reply

近期新闻

阿平厄丹自助餐厅厨房里的“米德尔布兰德”（更新）

拜登与特朗普首场辩论6大热点，包括巴勒斯坦问题

Omroep Flevoland – 新闻 – 当下流行的“迪拜酒吧”似乎在乌尔克也很受欢迎：“已经售罄”

2 个追踪他人 WA 号码的应用程序，简单又合法

RMC：科曼暂时离开 EC

查尔科洪水过后开展疫苗接种活动 – El Sol de Toluca

编辑精选

信息

More Interesting News

阿平厄丹自助餐厅厨房里的“米德尔布兰德”（更新）

拜登与特朗普首场辩论6大热点，包括巴勒斯坦问题

Reddit 将更新网络标准以阻止自动网站抓取

Share this:

Related

相关新闻

Leave a Reply Cancel reply

近期新闻​

编辑精选​

Tags

信息

More Interesting News

近期新闻

编辑精选